返回广场

RAG 2.0 与长上下文:什么时候该检索,什么时候该直接塞上下文

别再把所有资料都塞进模型窗口。真正高效的做法,是判断任务类型后再决定走检索还是走长上下文。

唐纪
5 天前
2.9k 阅读0 评论

很多团队在 2026 还在讨论“RAG 会不会被长上下文取代”。其实这不是二选一的问题,而是一个任务匹配问题:不同任务适合不同的信息组织方式。

长上下文最适合哪些场景

当用户一次性上传一份完整文档,希望模型做总结、抽取、改写或对比时,长上下文天然体验更好。

因为任务目标集中、资料边界明确,模型更容易在一个连续语境里完成输出。

RAG 仍然不可替代的场景

当知识更新频繁、资料来源分散、版本跨度大时,RAG 依然是更稳的结构。尤其是企业内部知识库、工单系统、SOP 文档和政策类文件,只靠长上下文很容易带入过期资料。

RAG 的优势不只是检索命中率,更在于能把“来源”一起给出来。

真正实用的策略:混合模式

先对任务做路由:单文档任务走长上下文,多来源问题走检索;如果问题跨多份资料,再让 RAG 把结果汇总成一个压缩上下文给模型。

这会比“所有任务都用一个方案”更稳,也更便于优化成本。

别忽略索引质量

很多团队以为 RAG 不好用,是因为检索本身不行。实际上问题往往出在切分粒度、元数据设计、命名混乱和时间版本没有治理。

RAG 2.0 的重点,不是换个向量库,而是把知识整理得更适合被找到。

写评论

读者评论

0

暂无评论,来分享你的看法吧