openai deep research vs google deep research: 如果美国和中国明天突然决定停止一切相互贸易,哪个国家会面临更大的麻烦?|结论:openai更deep,google更broad,看谁更适合你。 why:一方面这是当前的特点话题,意义重大,值得思考;另一方面,两个DR报告呈现出完全不同的特征,而且相当有代表性,可以看出两个DR的特点。 原始报告太长,都是2万字左右。所以,我用gpt-4.5对两份报告的内容进行了“压缩”。我仔细看了一下,报告结构和内容要点都高度保留(人类要做到这一点可不容易),读总结可以快速了解两份报告的结论,包括对比二者对同一个prompt的应对差异。 图1-2是openai DR的总结;图3是google DR的总结。 我的总结:openai的DR报告更deep,报告内容字数略少于google,但是全文都紧密围绕问题本身,从GDP影响、就业、科技产业链、供应链中断、消费品价格这些角度深度分析; 对比之下,google的DR报告更broad,报告字数略多于前者,但是全文铺的很广,具体分析部分只占报告全文很小一部分; openai DR的这个“deep”特点,充分利用了o3模型的强大推理能力,指令跟随能力,强调智能体的基础模型本身的智能。 google DR的这个“broad”特点,充分展示了google search的原生search index,访问网站数量数百个,参考网站100多个,是前者的近10倍! 在主题研究这件事上,到底你需要deep,还是需要broad?研究报告质量、研究目标的完成度,多大程度上取决于智能本身,或者搜索资料的资料,这是我们需要持续在实践中观察、思考和总结的。 两份原始报告的link,我放在评论区。有空大家可以细细阅读。
claude团队揭秘:ai大脑不用英文也不用中文思考,而是靠“思维语言”。|这证明了英语学习/教育失败的根本原因? llm用什么语言“思考”?中文?英文? 都不是。 llms的思考,使用的不是中文或英文这样的自然语言,而是一种超越自然语言的“思维语言”。anthropic的最新研究,用实验方式首次证明了这一点,这是理解llm内部黑箱的一个巨大突破。 在llm内部,不同语言共享同一个概念空间。不论是中文、英文还是法语,这些自然语言都只是这个更深层次“思维语言”的表面形式而已。 举个例子,你用英语教llm一个概念,它能用中文流利地表达出来;你用中文教它,它一样能在英文里准确使用。语言不同,但背后的概念是一样的。 anthropic的实验很有意思:面对同一个问题,不论你用英语问(the opposite of "small" is),是中文问(“小”的反义词是),还是用法语问(le contraire de "petit" est),llm实际上都在用自己跨语言共享的特征来思考,在同一个共享的概念空间里思考,然后再把结果翻译为对应的英文、中文或法语输出给你。 对人类学习的启示? 如果你同时理解llm和人脑的运作原理,不难想到以下几点: - 人脑也不是通过中文或英文这样的自然语言思考的,而是一种更为底层、更为通用的“思维语言”; - 中文和英文只是表面差异,真正重要的是思维语言本身的运动(俗称”思考“); - 概念、事实性知识砖块和心理模型等心理表征,这些才是思维语言真正的词汇。概念语言先于自然语言。如果你掌握的思维词汇太少,不论你说哪种语言,都没法深度思考。 昨天读到anthropic的这篇文章,我心情激动。毕竟早在一年前,我就在twitter和公众号文章里多次表达这样的观点。 于是,双语对照版本文章奉上,祝你阅读愉快~
search vs deep research,AI 搜索的三个层级:使用 ChatGPT 时,什么时候用gpt-4o+search,什么时候用 o3-mini+search,什么时候用 o3+deep research? AI 搜索的三个层级: level1 gpt-4o+search:搜索信息、综合多个信息源内容,给出一个整体回答; level 2 o3-mini+search:level 1+推理过程;如果问题是需要思考的,需要多步骤的推理过程,最终给出一个权衡、分析后的结果,就用o3-mini; level 3 o3+deep research:level 2 + 难度为研究级别,输出结果为千字~万字的研究报告; 换一个角度: 如果一个问题是人工用几分钟可以解决的,用 gpt-4o+search就够了; 如果一个问题是人工用几十分钟可以解决的,用o3-mini+search; 如果一个问题是人工用几个小时、甚至几天才能解决的,用 deep research。 底层模型的区别: 除了产品设计/system instruction 上的区别,主要区别在底层模型。 gpt-4o 是预训练范式的知识模型,上下文窗口 128k,输出长度 16k;强在语言理解; o3-mini 是强化学习范式下的推理模型,上下文窗口 200k,输出长度100k;作为蒸馏模型,语言能力是低于 gpt-4o 的,但是强在推理;而推理模型+search = magic。 deep research 则是 agent 范式下的产物的。相对于o3-mini,它是满血 o3,语言能力更强;相对于gpt-4o,推理能力碾压。作为独立的 AI agent,异步处理任务。它会向你提出 clarifying question,和你明确需求。 一旦需求明确,就成了“飞毛腿导弹”——发射后不管。它会用几分钟到几十分钟时间帮你独立完成这一研究任务。 AI 搜索这件事,仅仅不到一年的时间,已经发展到这个程度,相当令人震惊。
mark 一下:youtube 频道今天开始有“收入”了🤣 一个感叹,同样的内容,写文章狗都不看(我的公众号阅读量破 1千都难);录成视频,虽然长度接近 1 小时,竟然筛选/吸引了一群注意力这么强的关注者,想不到啊🤣 回顾过程,总结下经验教训,防止忘了 (Twitter 是极好的笔记本): - 上一个Deep Research 视频发布前,我的 youtube 上只有 100 个关注;这个视频带来了 3000 多关注; - 这个视频比较长,有50 分钟,但是播放数据还可以:有接近 50000 播放,纯时长 4300 小时; - 但是平均播放时长只有 5 分钟;这是要迭代的点:在内容开头点明价值,多少召唤一点注意力🤣; - 第一次做视频头图;头图一般耗时 5-10 分钟,最趁手的是 figma,这个时间得花; - deep research 这一个视频,就让频道达到了 youtube 开通partner program 的标准(1000 关注,3000 播放时长);本来不想申请的,但觉得还是试试看,不能懒。结果意想不到地顺利。2 -3 天就全部审核完了(我本来以为要几周),然后今天就开始有广告展示收入了。 - 本来的计划是一周发一个视频;w2501 (25 年第一周)因为做跨年直播,加上嗓子疼咳嗽要生病的样子,就没发;w2502的视频昨天发了,分享一个 prompt。结果视频更长了,变成了 54 分钟 🤣 - 剪辑上随缘,用剪映app;录音上摆烂,deep research 视频用mac 内置的话筒,prompt视频用了dji mic mini。 25 年的计划,是坚持视频形式分享,争取养成习惯。 p.s. 我对youtube 频道的愿景,是成为阿星探店那样的youtuber(观看时轻松愉快,给大家带来快乐。虽然我讲的是知识性内容,可能不那么“美味” 🤣
中文互联网的耻辱柱:“穷人追求多巴胺,富人追求内啡肽” 让我们一次性彻底弄明白“多巴胺”是怎么回事。毕竟,健康的多巴胺回路,才是人生幸福、学霸养成的关键。 === 大部分人都在网上都看到过这个言论:“穷人追求多巴胺,富人追求内啡肽”。抖音和视频号里的追求流量的自媒体这么说,甚至很多知识大 V ,甚至罗胖都在书里面这么说(见图)。 这句话里面只有 14 个字,但是基本上每个字都错了,而且错的离谱。什么是多巴胺?人脑有几条多巴胺回路?成瘾是怎么回事?人在学习和运动时的“快乐”是多巴胺还是内啡肽?这些都是基础的事实性信息,但是网上大 V 基本全说错了。因为都没有基本的知识储备,反而像人体蜈蚣一样无脑传递 5678 手错误信息。 诺大一个中文互联网,竟然让如此重要的概念,犯下如此巨大的事实性错误。但凡有一个人看一眼 wikipedia 的多巴胺词条,都不可能这么离大谱。 什么是多巴胺? 多巴胺是大脑中的一种神经递质,很重要:它在调节情绪、奖励和快感感觉、以及运动功能等方面起着关键作用。因此,多巴胺也被称为“快乐分子”。 这些是人人都知道的。但是,不少人对多巴胺的认识和理解就仅限于此了,他们接下来对多巴胺的解读就纯属幻觉了(哎,人类有啥资格嘲笑 ChatGPT 的幻觉呢)。 多巴胺真的是“万恶之首”吗? 因为多巴胺是大脑成瘾机制的关键物质,所以,有些知识大 V不经大脑就把多巴胺看成万恶之首,然后为了挑起对立,激发读者的情绪反应,进一步发展出“穷人追求多巴胺,富人追求内啡肽”这种既笨且坏的傻x观点,蛊惑了很多无辜的读者,成了追求流量屡试不爽的法宝级言论。 认识多巴胺对人的影响,关键得理解一个概念:多巴胺回路。大脑中有几条多巴胺回路?分别对应人类的哪些活动,哪些现象?这些回路对人的影响分别是什么? 人脑中有多条多巴胺回路,但主要有三条(见图)。 前额叶多巴胺回路(中脑-皮质回路 Mesocortical pathway):从 [[腹侧被盖区]](Ventral tegmental area, VTA)开始,到达[[前额叶皮质]](Prefrontal cortex)。这条路径与认知功能,如决策、注意力、解决问题和社会行为有关。 动物脑多巴胺回路(中脑-边缘系统回路 Mesolimbic pathway):同样起始于腹侧被盖区,但是它连接到边缘系统,包括海马(Hippocampus)、[[杏仁核]](Amygdala)和[[伏隔核]](Nucleus accumbens)。这条路径与奖励感知、动机和情绪有很大关联,有时也被称为“[[奖励回路]]”。 黑质-纹状体路径(Nigrostriatal pathway):这条路径起始于脑干的[[黑质]](Substantia nigra)部分,终止于[[纹状体]](Striatum)。这条路径主要与运动控制相关,[[帕金森病]](Parkinson's disease)就是因为这个区域的多巴胺神经元退化造成的。 前额叶多巴胺回路 vs 动物脑多巴胺回路 简单说,当我们谈论多巴胺时,关键在于认识这两条回路:前额叶多巴胺回路,动物脑多巴胺回路。 人是追求奖赏、逃避惩罚的动物,而奖赏的背后都是多巴胺。但是,不同多巴胺回路所带来的奖赏,性质是完全不同的,我称之为“优质多巴胺”和“劣质多巴胺”。多巴胺本身并非罪恶之源,但是,不同性质的多巴胺,让有的人直上天堂,有的人直下地狱。 优质多巴胺来自前额叶参与,主要来自运动、阅读、学习、思考和解决问题等活动,这种活动通常更“慢”,给人带来健康向上的愉悦和快乐感受。 劣质多巴胺则不需要主动和深入的人类认知活动参与,直接刺激动物脑即可,主要来自短视频、网文、疯狂购物、网络上无脑谩骂等活动。在短视频的刺激下,VTA与杏仁核等边缘系统组织形成了“动物脑多巴胺回路”,疯狂供应这种劣质多巴胺。 顺嘴说一句,关于内啡肽,那玩意的意思是“体内吗啡”,在极端运动情况下才会分泌,让人感觉不到疼痛。跟通常的人类活动无关,完全是被人拿来跟“坏分子”多巴胺强行建立对立用的。 来自多巴胺的启发 麻雀不是坏鸟(不需要赶尽杀绝),多巴胺也不是“坏分子” 。你的快乐来自多巴胺,你的成瘾也还是因为多巴胺。 所以,关键只有一点:让自己和孩子获取持续稳定的好的多巴胺来源。通过读书、运动、人际交往互动、爱等来源获取优质多巴胺,减少对抖音、短屎频、游戏、爽文、心灵鸡汤、知识鸡汤等劣质多巴胺来源的依赖。 长文版本👇: [抖音大脑,与劣质多巴胺的狂飙时代]()