宝玉2025-06-17 22:11:54Gergely Orosz: 除了谷歌之外,还有哪家大型公司**没有**把Sonnet作为他们主要的代码模型吗? 我听说,甚至连Meta公司都已经从Llama内部转用了Sonnet! Anthropic的确创造了一个不可思议的奇迹:如今大部分科技公司编程时默认使用的模型居然都是他们家的。 令人特别意外的是,Meta居然发现: 即使是专门用自家代码库微调训练过的Llama模型,效果仍然不如*
Gorden Sun2025-06-17 19:38:12MiniMax-M1:MiniMax开源的推理模型 分80K和40K两个版本,这里的80K和40K是指推理消耗的最大token数。456B总参数,激活参数45.9B。评分超过旧版DeepSeek R1和Qwen3-235B-A22B。 在线使用: 模型: Github: