宝玉2025-03-04 08:59:12GPT-4.5 会带来推理模型的升级 想象一下,每个 AI 模型都是一名努力学习的学生。每个学生的能力有高有低,有的懂得多,有的懂得少。这张图片就像是一场考试的成绩单,展示了不同的“学生”(模型)在高难度考试(GPQA基准测试,类似博士水平的知识问答)中的表现。 在图片中,我们能清楚看到: - 最底层的基础模型(Base Models),类似于那些还没学会“如何思考”、只掌握了大量知识却不善于运
九原客2025-03-01 23:07:53最近两三周给很多客户反复提及的忠告: 用模型一定要用最好的那个,如果想省钱,请在你的场景下微调,而不是用一个低能力的通用模型,然后试图靠 Prompt 或者工程努力去拯救它。 比如 DeepSeek 的那一堆蒸馏模型是很好的场景级推理模型的Base,但是不要直接用,真的很差。
StLi2025-02-14 06:11:31OpenAI发布如何运用推理模型的官方最佳实践,非常富有参考价值。 使用Deep Research围绕这篇指南做了一个泛化分析,将议题扩展到推理模型的普遍性使用技术。 看了报告,真的是获益良多。以下是报告摘要: OpenAI的推理类模型(如O1、O3)遵循一系列最佳实践,包括清晰简洁的提示、避免多余的链式推理指令、使用结构化输入、提供必要的背景信息等。模型擅长逻辑推理、数学运算和代码分析,并
yesterday2025-02-13 13:31:17AI coding 的时候,如果想用推理模型,有条件尽量还是 o1 . 不用推理尽量还是 claude sonnet 3.5 . 这个黄金组合搭配到目前为止还没有一个能动摇的(你有 o3 的话也行) 我知道是人都想省点钱,我也会切换别的模型,但哪怕是 deepseek 满血版,在多个文件里跳来跳去,该出的错,那可怕的幻觉还是一个都不会少。 你不怕麻烦可以开一堆窗口,结合着用。想省事,提高效