AI国际象棋赛4强出炉，基本没有冷门 o4-mini o3 Gemini 2.5 Pro Grok 4 可惜淘汰了Claude Opus 4.我还想看看他跟grok 4的对决明天半决赛

#AI国际象棋赛 #四强 #Gemini 2.5 Pro #Grok 4 #Claude Opus 4

相关新闻

Gorden Sun

4个月前

Step-Audio-R1：能推理的音频模型延长推理时间可以提升推理效果，音频理解能力超过Gemini 2.5 Pro，接近Gemini 3。模型：

Meathill

4个月前

Gemini 3 还是有点厉害，一个 4.5 Sonnet 和 Gemini 2.5 Pro 困扰了好几天的问题，被 Gemini 结局了。

Tony出海

4个月前

Gemini 2.5 Pro 降智太严重了，属于弱智了都

howie.serious

4个月前

gpt-5.1 的指令跟随能力，达到了新高度。指定“只用8个汉字回复”，gpt-5.1的正确率是100%，而gemini 2.5 pro和sonnet 4.5都是50%左右。（英文版用6个单词，考虑到单词和单词语义承载能力的差异，增加到8个单词。实际上8-12都可以）

宝玉

4个月前

提示词分享：帮助在 Hacker News 或者 Reddit 这样的讨论贴中提取精华内容。最佳模型：Gemini 2.5 Pro 使用方法： - 做成 Gem 或者 Project，让提示词作为instruction - 复制完整的讨论内容（纯文本即可）粘贴进 Gem 或者 Project ----- Prompt Start ---- 角色定位：Hacker News 洞察家与社区编辑

AI国际象棋赛4强出炉，基本没有冷门 o4-mini o3 Gemini 2.5 Pro Grok 4 可惜淘汰了Claude Opus 4.我还想看看他跟grok 4的对决 明天半决赛

相关新闻

AI国际象棋赛4强出炉，基本没有冷门 o4-mini o3 Gemini 2.5 Pro Grok 4 可惜淘汰了Claude Opus 4.我还想看看他跟grok 4的对决明天半决赛