Jesse Lau 遁一子

Jesse Lau 遁一子

0 关注者

1天前

AI国际象棋赛4强出炉,基本没有冷门 o4-mini o3 Gemini 2.5 Pro Grok 4 可惜淘汰了Claude Opus 4.我还想看看他跟grok 4的对决 明天半决赛

#AI国际象棋赛 #四强 #Gemini 2.5 Pro #Grok 4 #Claude Opus 4

相关新闻

placeholder

Gorden Sun

1天前

结果出来了,获胜的是: o4-mini o3 Gemini 2.5 Pro Grok 4 除了Claude爆冷,其他都算正常

placeholder

meng shao

2天前

最近非常喜欢的「信息卡」风格,今天感觉磨出来一套稳定的提示词,现在用 Gemini 2.5 Pro 和 Grok 3 可以稳定复现下图效果。 晚上我再继续测国内的 Kimi K2、Qwen3 和 GLM-4.5 等,Claude 4 基本可以免测录取 😄 测试通过后,明早发出来给大家。

placeholder

Gorden Sun

2天前

今晚1点半,首届AI国际象棋大赛将在YouTube直播,你觉得哪些会进四强? 我的预判: 第一组:DeepSeek R1(其实o4 mini赢面更大,但是我支持DS) 第二组:Claude Opus 4(谷歌的2个模型都分配了更强的对手,应该要团灭) 第三组:Grok 4(Flash:我打宿傩?) 第四组:o3(K2得惨败吧,但往好了想,万一赢了就牛逼了)

placeholder

AI Will

2天前

Min Choi分享了一份很棒的工作流程: 实时研究/搜索 → Grok 4 规划与推理 → Grok 4 Heavy 编码 → Claude Code w/ Subagents 编写测试用例 → Grok 4 运行测试用例 → Codex 调试 → Grok 4 收藏这个。

placeholder

盐粒 Yanli

5天前

k2 在很多方面更接近于第一版的 r1,不算是很好的模型。qwen3.1 非常好,不仅拆分了 reasoning 模型(这在很多场景下是 trouble maker),质量上乘(趋近于 Gemini 2.5 pro),而且 MoE 架构+non-reasoning+Cerebras 可以非常快,甚至还很便宜

© 2025 news.news. All rights reserved. 0.08021 秒. v1.0.42
我的评论