年前发布的几个国产新模型的竞技场排名出来了 排名最高的,没想到是第一次打榜的...豆包(Seed 2.0) Seed2.0不仅拿下了国内综合第一,还在全球总榜里冲进了前10。其他几家新模型,GLM5、文心5、Qwen3.5、Kimi K2.5,紧跟着排在了16 17 18 19 名。 特别值得一提的是,Seed2.0视觉能力更是仅次于 Gemini 的三个版本,排名全球第4。考虑到Seed2.0比 Gemini 的输入成本低5倍左右,这个模型在多模态理解方面是个巨大的降本增效神器。 具体来看各项测试: Expert(专业能力),Kimi排名最高,第10。Seed第11,GLM、qwen、ernie比较靠后。 Hard Prompt(高难度指令处理),Seed第8,其他家都在20名开外。 Coding能力,Seed第7,Kimi第12。其他家在后面。这项最令人意外,因为它比的是全语言、全场景的综合编程能力,在WebDev榜单排名前列的GLM5反而落在后面。 Math(数学)上,又是Kimi最高第8,Seed第10,这俩排在前面。 Creative Writing(创意写作),最高的GLM5只排第22,跟体感也比较接近,理科生偏科了。 指令遵循和长文本测试,国产模型都不太理想,最好成绩都是十几名,还需要努力。 这么看下来,Kimi k2.5有几项能力还是比较突出的,但不知为何总排名落在了后面。 Seed 2.0 pro也已经接入了豆包「专家」模式。相比以前豆包一直在用的中小杯模型,智商终于有救了。这个事情意义很大,毕竟豆包是我们身边的家人朋友们用的最多的AI产品了。
Orange AI
1个月前
Orange AI
1个月前
龙虾作者为什么选择 OpenAI? Clawdbot —> OpenClaw 这个改名已经预示了一切。 Peter 在 Claude 要求改名后,去问 Sam 能不能用 OpenClaw,Sam 说没事,你尽管用。 这就是格局的差异。 Peter 吐槽说 A 社只有法务部会发邮件联系他 甚至都没争取过 这是 Peter 的官方博客通知: OpenClaw、OpenAI 与未来 | Peter Steinberger Peter Steinberger —— 2026年2月15日 摘要(tl;dr): 我将加入 OpenAI,致力于将“智能体(agents)”普及给每一个人。OpenClaw 将移交给基金会管理,并保持开源与独立。 过去的一个月简直像旋风一样。我从未预料到我的这个练手项目(playground project)会掀起如此大的波澜。互联网再次变得有些不可思议,看到我的作品能激励全球这么多的人,这种感觉真的非常奇妙。 无数的可能性在我面前展开,无数人试图把我推向不同的方向:给我建议、询问如何投资、或是打探我的下一步计划。用“应接不暇”来形容这种状态都有些保守了。 当我开始探索 AI 时,我的目标只是寻找乐趣并启发他人。而现在,这只“龙虾(lobster)”正在席卷全球。我的下一个使命是构建一个连我妈妈都能轻松使用的智能体。这需要更深层次的变革,需要更多关于安全性的思考,以及接触最前沿的模型和研究成果。 没错,我完全可以预见到 OpenClaw 能够成长为一家巨大的公司。但是,这对我来说并没有太大的吸引力。我骨子里是一个“构建者(builder)”。我已经玩过“开公司”这套游戏了——我为此倾注了 13 年的心血并受益匪浅。我现在想要的是改变世界,而不是建立一家大公司。而与 OpenAI 联手,是将这一切普及给每个人的最快途径。 上周我在旧金山与各大实验室进行了交流,接触到了顶尖的人才和尚未发布的科研成果,这一切都极具启发性。我想感谢本周与我交谈过的所有人,也为这些机会感到自豪。 对我而言,OpenClaw 保持开源并拥有蓬勃发展的自由一直至关重要。最终,我觉得 OpenAI 是继续推进我的愿景并扩大其影响力的最佳场所。与那里的人交流得越多,我就越清楚地意识到我们有着共同的愿景。 围绕 OpenClaw 形成的社区充满魔力,OpenAI 已经做出了郑重承诺,支持我继续投入时间,并且已经开始资助该项目。为了使其具备更规范的架构,我正努力将其转变为一个基金会。它将继续作为思想者、黑客和希望掌控自身数据的人们的阵地,目标是支持更多的模型和公司。 就我个人而言,我非常兴奋能加入 OpenAI,成为 AI 研发最前沿的一员,并继续与大家一起构建未来。 The claw is the law.
Orange AI
1个月前
龙虾作者 Peter 官宣加入 OpenAI Clawdbot —> OpenClaw 这个改名已经预示了一切。 Peter 在 Claude 要求改名后,去问 Sam 能不能用 OpenClaw,Sam 说没事,你尽管用。 这就是格局的差异。 这是 Peter 的官方博客通知: OpenClaw、OpenAI 与未来 | Peter Steinberger Peter Steinberger —— 2026年2月15日 摘要(tl;dr): 我将加入 OpenAI,致力于将“智能体(agents)”普及给每一个人。OpenClaw 将移交给基金会管理,并保持开源与独立。 过去的一个月简直像旋风一样。我从未预料到我的这个练手项目(playground project)会掀起如此大的波澜。互联网再次变得有些不可思议,看到我的作品能激励全球这么多的人,这种感觉真的非常奇妙。 无数的可能性在我面前展开,无数人试图把我推向不同的方向:给我建议、询问如何投资、或是打探我的下一步计划。用“应接不暇”来形容这种状态都有些保守了。 当我开始探索 AI 时,我的目标只是寻找乐趣并启发他人。而现在,这只“龙虾(lobster)”正在席卷全球。我的下一个使命是构建一个连我妈妈都能轻松使用的智能体。这需要更深层次的变革,需要更多关于安全性的思考,以及接触最前沿的模型和研究成果。 没错,我完全可以预见到 OpenClaw 能够成长为一家巨大的公司。但是,这对我来说并没有太大的吸引力。我骨子里是一个“构建者(builder)”。我已经玩过“开公司”这套游戏了——我为此倾注了 13 年的心血并受益匪浅。我现在想要的是改变世界,而不是建立一家大公司。而与 OpenAI 联手,是将这一切普及给每个人的最快途径。 上周我在旧金山与各大实验室进行了交流,接触到了顶尖的人才和尚未发布的科研成果,这一切都极具启发性。我想感谢本周与我交谈过的所有人,也为这些机会感到自豪。 对我而言,OpenClaw 保持开源并拥有蓬勃发展的自由一直至关重要。最终,我觉得 OpenAI 是继续推进我的愿景并扩大其影响力的最佳场所。与那里的人交流得越多,我就越清楚地意识到我们有着共同的愿景。 围绕 OpenClaw 形成的社区充满魔力,OpenAI 已经做出了郑重承诺,支持我继续投入时间,并且已经开始资助该项目。为了使其具备更规范的架构,我正努力将其转变为一个基金会。它将继续作为思想者、黑客和希望掌控自身数据的人们的阵地,目标是支持更多的模型和公司。 就我个人而言,我非常兴奋能加入 OpenAI,成为 AI 研发最前沿的一员,并继续与大家一起构建未来。 The claw is the law.