很久没聊 RAG 了，随便说点。 RAG 里的分块技术，某种程度上看起来确实显得越来越过时了。不是说完全抛弃不要，只是分块带来的弊端越来越明显，多高超的技巧都救不回来“信息完整度”的缺失。当然总有上下文窗口不够的情况，完整的大型文档丢进去，确实吃不下怎么办？凉拌。你就用最简单粗暴的方法，按长度来，丢过去做点预处理，总结，然后差不多行了。这种方法下，切割的问题依然存在，会有把完

#RAG #分块技术 #信息完整度 #上下文窗口 #预处理 #切割问题

相关新闻

艾略特

1周前

论文来了。名字叫 MSA，Memory Sparse Attention。一句话说清楚它是什么：让大模型原生拥有超长记忆。不是外挂检索，不是暴力扩窗口，而是把「记忆」直接长进了注意力机制里，端到端训练。过去的方案为什么不行？ RAG 的本质是「开卷考试」。模型自己不记东西，全靠现场翻笔记。翻得准不准要看检索质量，翻得快不快要看数据量。一旦信息分散在几十份文档里、需要跨文档推理，就抓瞎了。

Bryan

2周前

RAG 是不是要死了？感觉直接让 AI 生成若干个相关 term 去做全文搜索效果更好

dontbesilent

2周前

公众号的 AI 分身，效果真的还可以知识库 RAG 来源于：我的公众号➕推文系统提示词是 claude code 帮我一键写的

毒猫猫🤔

2周前

我一直认为：研究多 Agent 团队结构是邪路研究记忆、知识结构、上下文管理，和工作流就行了。非要说的话加个异步并发大模型本来就只有一个，上下文窗口和文件记忆都是流动的生搬人类的组织结构就只会学到中层病。要透过现象看本质。Agent 编排更像操作系统，而不是人类组织结构

辛宝Otto-Web Worker Podcast

4个月前

node.js ai sdk ，在后续发布的 v6 中会增加 rerank 的相关方法，在此之前，做 rag 的 rerank 时候需要用普通的对话模型，或者使用 api 来封装