orange.ai
18小时前
x-orange.ai
orange.ai
18小时前
orange.ai
1天前
这几天使用 DeepSeek R1 过程中,有一个问题让我百思不得其解: 为什么一个针对数学和推理优化的模型,却有着极高的文学造诣? 而且这种文学造诣不止是中文,在英文领域 R1 也超过了 Claude,拿下了创意写作榜第一。 这个问题我思考了好几天,直到前几天看到了一篇 Google 的最新论文,于是,我终于可以回答这个问题了。 于是写下这篇文章作为完整的记录。
orange.ai
3天前
orange.ai
3天前
orange.ai
4天前
硅基流动上线了 DeepSeek R1 终于有个稳定的 R1 API 可以调用了。 - 但是免费用户是用不了的 - 需要完成支付宝刷脸实名认证,付费充值后解锁 R1 和 V3 - 我还发现一个问题,R1 如果不写 System Prompt 的话,它是不会思考的,随便写也不行,效果跟官方差距很大 正确的 Prompt 见第二条
orange.ai
5天前
orange.ai
1周前
orange.ai
1周前
看到有人说 DeepSeek 和 字节的 research culture 比较像。。。 要笑掉大牙了 梁文锋能做出来的东西,张一鸣砸钱也未必能做出来。 这两家公司唯一比较像的就是不需要融资,没有短期压力。 但是字节团队那么多,也没做出来R1,这是很说明问题的。 字节没有资金压力,但是字节团队是有短期OKR压力的。 这也是为什么字节要成立 Seed Edge 研究计划。 就是要布局长远,防止陷入局部最优。 什么是局部最优呢? 就是豆包可以花100倍的人力,把豆包的各种场景的写作都用SFT优化到很好。 R1直接启动深度思考,达成中文写作断档第一。 还有当时准备各种数据在 GPT 3.5 微调,等 GPT4 出来就直接无用功了。 技术的降维打击是非常无情的,只是不会经常发生罢了。
orange.ai
1周前
orange.ai
1周前
R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法超越 o1 自己。 背景信息: Aider 支持使用一对模型进行编码 架构师模型被要求描述如何解决编码问题。思考/推理模型通常在这个角色中表现良好。 编辑器模型接收到架构师的设计方案,并被要求生成特定的代码编辑指令,以将这些更改应用到现有的源文件中。
orange.ai
1周前
orange.ai
2周前
orange.ai
3周前
《AI 编程蓝皮书》正式发布! 我的好朋友AI产品黄叔最近两个月都在沉迷 AI 编程,每天沉浸式学习和开发3小时以上。 这周他终于把所有的学习和开发心得,用飞书文档总结了出来。 于是就有了这本 《AI 编程蓝皮书》,今天,我们一起把它送给每一位想入门 AI 编程的同学。 - 整本蓝皮书有5万字,真正从0基础开始,一步一步手地教。 - 它完全免费,所以它不需要夸张的表述让你激情下单。 - 如果你没兴趣,它也不想引发你的焦虑。 我非常支持黄叔,有幸和黄叔、归藏老师一起发布它。 AI 编程是我们共同看到的一个崭新的机会,希望把这个机会传播给有准备的人。 这是一本朴素的书,我们朴素地希望这本书能帮到你。 如果你觉得有帮助,也希望你转发给有需要的朋友。
orange.ai
3周前
orange.ai
4周前
orange.ai
1个月前
orange.ai
1个月前
orange.ai
1个月前
orange.ai
1个月前
orange.ai
1个月前