Simon
4天前
Simon
4天前
orange.ai
1周前
看到有人说 DeepSeek 和 字节的 research culture 比较像。。。 要笑掉大牙了 梁文锋能做出来的东西,张一鸣砸钱也未必能做出来。 这两家公司唯一比较像的就是不需要融资,没有短期压力。 但是字节团队那么多,也没做出来R1,这是很说明问题的。 字节没有资金压力,但是字节团队是有短期OKR压力的。 这也是为什么字节要成立 Seed Edge 研究计划。 就是要布局长远,防止陷入局部最优。 什么是局部最优呢? 就是豆包可以花100倍的人力,把豆包的各种场景的写作都用SFT优化到很好。 R1直接启动深度思考,达成中文写作断档第一。 还有当时准备各种数据在 GPT 3.5 微调,等 GPT4 出来就直接无用功了。 技术的降维打击是非常无情的,只是不会经常发生罢了。
orange.ai
1周前
R1+Sonnet:我们加起来才是最强的! 在 Aider 的最新多语言基准测试中测试中,R1+Sonnet 超越 o1 拿下第一。 R1 作为架构师, Claude Sonnet 作为编辑器,在 aider 多语言基准测试中设定了新的 SOTA(最先进技术水平)64.0%。 不仅超过了之前 o1 的 SOTA 总体成本还降低了 14 倍。 这件事很神奇,因为使用 o1+ Sonnet 无法超越 o1 自己。 背景信息: Aider 支持使用一对模型进行编码 架构师模型被要求描述如何解决编码问题。思考/推理模型通常在这个角色中表现良好。 编辑器模型接收到架构师的设计方案,并被要求生成特定的代码编辑指令,以将这些更改应用到现有的源文件中。
Jacobson🌎🌸贴贴BOT
1周前
ben
1周前
椎名晴樹
1周前