#记忆功能

宝玉
2周前
ChatGPT 和 Claude 都有记忆功能,但两者实现原理截然不同。 以前研究 Claude Code 的时候,发现它不是基于 RAG 而是基于 grep 工具使用正则检索代码,没想到 Anthropic 把这一点进一步发扬光大,在 Claude 网页版的记忆功能中,也是基于实时搜索来做的,跟 ChatGPT 的记忆功能思路完全不一样。 ChatGPT 的记忆模式是自动化、魔法般的个性记忆,不需要用户提醒,自动的悄悄记录用户的使用细节。所以以前经常有提示词让 ChatGPT 根据对自己的记忆来描述自己或者画像。 当新开对话,ChatGPT 会把对用户的记忆作为上下文一起发给模型,让你觉得 GPT 很懂你。当然有时候也会因为错误的记忆导致一些混乱,尤其是多人共用账号的情况。 Claude的记忆模式是基于检索的,每次新开对话,都没有任何任何历史记忆,只有当你明确告诉 Claude 需要用到某条记忆内容,它才会从真实的历史记录中精准提取信息。 Claude的记忆功能分为两种:一是基于关键词搜索历史对话,二是以时间线为索引检索近期聊天。 Claude 这种设计很自然地适合专业用户——尤其是程序员、研究人员或科技爱好者。他们通常有清晰的意图,知道自己什么时候需要AI调用记忆。 而相对的,ChatGPT构建的并非历史记录检索,而是一种自动生成的用户画像。这种模式无需用户主动操作,也更符合大众消费产品的使用直觉:一切皆自动,一切皆便利。 对于这两种不同的记忆模式很难说孰优孰劣,各有优缺点。其实我个人还偏好 Claude 的一点,按需检索,而不会收到历史记录影响。 也许更好的模式是两者结合。
宝玉
5个月前
划重点:知道 Deep Research 智能体的架构后怎么更好的使用 这里课代表帮你划一下重点: 有记忆 这意味着中间结果会被保存下来。所以每次扣子空间的任务,你不仅可以看最终的网页,还可以看一些中间结果的 Markdow 等其他文件,这些文件有时候也会包含有价值的信息 有安全过滤 这意味着你就不用想着用它做什么模型不允许做的事情,基本上是徒劳的 有最强模型 由于 Deep Research 对模型能力要求特别高,这意味着各家都会用自己最强的模型出来做这件事,比如OpenAI 刚推出 Deep Research 时,它就是用的当时最新最强的 o3 模型,所以有些对模型能力要求高的任务,也可以让 Deep Research 来做,比如我就常用 Deep Research 分析代码库、参考代码库写一个 MCP 服务之类的,效果比普通对话模型效果还好。 有工具 这意味着它有一些特别的能力,比如代码执行、浏览器、PDF 解析、网页制作等,说明你可以借助它的一些工具来做一些报告之外的事情。比如我曾借助 OpenAI Deep Research 的 PDF 解析工具的能力,来帮我把 PDF 解析成 Markdown,甚至完整的翻译成中文。 特别值得一提的是,OpenAI 和 Gemini 的 Deep Research,只能使用默认的几个工具,但是像扣子空间,它的工具接入了 MCP 扩展,也就意味着可以接入现在火爆的 MCP 生态。比如说你要出行规划,就可以加上高德地图和墨迹天气的 MCP 扩展,让出行规划既能考虑天气因素,又能考虑交通拥堵、道路施工情况。 扣子空间不仅有官方的 MCP 扩展,比如官方 MCP 刚上新了水滴信用、音乐生成,另外你还可以自定义 MCP,「扣子开发平台」商店千余插件,个人无限 DIY 工作流,均可发布至「扣子空间」,让无限海量的MCP 为你的 Deep Research 任务所用。 除了这些 Deep Research 独有的功能,还不可忽视我们在使用 对话类 AI 应用时两个重要的元素:输入和输出。 输入: Deep Research 并非只能输入文本,你还可以输入URL、图片、PDF 等其他格式的内容 输出: 不同家的 Deep Research 支持的输出也不同,比如 OpenAI 的 Deep Research 只能输出 Markdown,Gemini 能将结果到处到 Google Docs,扣子空间则可以生成可交互的网页、图表,还可以生成 PPT。在扣子空间,你要是让它处理 PDF,还能拿到提取的文本文件。 当我们知道 Deep Research 的这些“秘密”之后,就不用再局限于用它去写个调研报告,还可以用它做很多其他事。