向阳乔木2025-03-09 09:34:05“OpenAI的计划是从GPT-5开始,把直觉模型和思考模型统一起来,由系统自己决定是否开启深度思考。” 有意思,真的从人大脑运作角度统一起来了。 系统1:快思考,传统大模型(GPT4.5、Deepseek V3 ) 系统2:慢思考,推理模型(O1-pro、Deepseek R1) 脑科学和计算机科学,互相启发~
宝玉2025-03-04 08:59:12GPT-4.5 会带来推理模型的升级 想象一下,每个 AI 模型都是一名努力学习的学生。每个学生的能力有高有低,有的懂得多,有的懂得少。这张图片就像是一场考试的成绩单,展示了不同的“学生”(模型)在高难度考试(GPQA基准测试,类似博士水平的知识问答)中的表现。 在图片中,我们能清楚看到: - 最底层的基础模型(Base Models),类似于那些还没学会“如何思考”、只掌握了大量知识却不善于运
九原客2025-03-01 23:07:53最近两三周给很多客户反复提及的忠告: 用模型一定要用最好的那个,如果想省钱,请在你的场景下微调,而不是用一个低能力的通用模型,然后试图靠 Prompt 或者工程努力去拯救它。 比如 DeepSeek 的那一堆蒸馏模型是很好的场景级推理模型的Base,但是不要直接用,真的很差。
向阳乔木2025-02-27 17:11:39如果真想只记住一个Prompt框架,未来快速套用的话,推荐RTF,简单清晰实用: 角色(Role)- 任务(Task)- 格式(Format) 在优秀推理模型中,甚至角色都不用设定。 直接描述你的任务(Task)和输出格式(Format)即可 简化成TF模型,记忆点是“TF boy?”
StLi2025-02-14 06:11:31OpenAI发布如何运用推理模型的官方最佳实践,非常富有参考价值。 使用Deep Research围绕这篇指南做了一个泛化分析,将议题扩展到推理模型的普遍性使用技术。 看了报告,真的是获益良多。以下是报告摘要: OpenAI的推理类模型(如O1、O3)遵循一系列最佳实践,包括清晰简洁的提示、避免多余的链式推理指令、使用结构化输入、提供必要的背景信息等。模型擅长逻辑推理、数学运算和代码分析,并