虽然感觉中长篇claude opus应该不敌gemini，还是整一个测试一下

#Claude #Gemini #AI模型对比 #性能测试 #中性

相关新闻

宝玉

7小时前

Claude 现在能直接在对话里画图表了 Claude 新增可视化功能：用户在聊天过程中，Claude 可以直接生成交互式图表和示意图，无需跳转到其他工具，也不用写代码导出。这项功能目前以 Beta 形式上线，所有套餐均可使用，包括免费用户。此前 Claude 的 Artifacts 功能已经支持生成代码和网页预览，但可视化内容通常需要用户主动要求生成一个独立的 Artifacts。

Gorden Sun

17小时前

Reka Edge：开源最佳多模态小模型 7B大小，评分超过Qwen 3.5 9B，且更省token、速度更快。Reka的创始成员很多来自谷歌DeepMind，所以继承了很多Gemini的多模态经验。模型：

henu王凯

23小时前

非常推荐看下Claude官方分享他们公司只有1个营销人员如何通过使用Claude Code等来高效工作的案例分享，下面的PDF是Claude分享他们不同team使用Claude的不同点，都值得细看。看完我突然明白了Claude C

黄赟

23小时前

捕虾队，第四十师，成立 DK，《计算机科学艺术》的作者，近日开始“震惊震惊”… 原因是 Claude 把他几周没干完的活轻松搞定老爷子这回改口称赞，看的出一个非常重要的信号普通非程序员用户如今与大模型带来的红利之间就差一个啊哈瞬间这个瞬间点燃就靠——小龙虾一个庞大的生态即将崛起[加油]

黄赟

1天前

越来越喜欢 AutoClip 这个 AI 自动切片神器魔改成 Claude 中转当底座模型，配合阿里百炼的 ASR，完美的自动化做粗切再次改造之后，切 Lex Fridman 和龙虾之父 Peter 长达 3 个小时的片子，也不在话下搭配涛哥家 0.4倍率 Claude 中转：下一步再把字幕给它配进去

关联事件

AI高考数学测试：O3意外落后，Gemini夺冠引发热议

在近期的AI高考数学测试中，O3虽然未降智，但却屈居第四，未能进入前三名，引发了广泛的质疑与讨论。此次测试不仅使用了O3，还引入了其他模型的API进行统一评估，并加入了人气模型Gemini 2.5 Pro。结果显示，国内多款模型在推理能力上有显著提升，基本都能考上130分以上，其中Gemini在客观题测试中表现最佳。随着AI数学能力的提升，未来的测试结果可能会趋于满分，导致各模型之间的区分度降低。这一现象引发了对AI发展趋势的深入探讨，尤其是在教育领域的应用前景。