k2 在很多方面更接近于第一版的 r1，不算是很好的模型。qwen3.1 非常好，不仅拆分了 reasoning 模型（这在很多场景下是 trouble maker），质量上乘（趋近于 Gemini 2.5 pro），而且 MoE 架构+non-reasoning+Cerebras 可以非常快，甚至还很便宜

#K2 #R1 #qwen3.1 #reasoning模型 #Gemini 2.5 Pro

相关新闻

Gorden Sun

4个月前

Step-Audio-R1：能推理的音频模型延长推理时间可以提升推理效果，音频理解能力超过Gemini 2.5 Pro，接近Gemini 3。模型：

Meathill

4个月前

Gemini 3 还是有点厉害，一个 4.5 Sonnet 和 Gemini 2.5 Pro 困扰了好几天的问题，被 Gemini 结局了。

Orange AI

4个月前

kimi k2 写代码真的还可以，我的 Claude code now 项目终于能继续更新了

Tony出海

4个月前

Gemini 2.5 Pro 降智太严重了，属于弱智了都

howie.serious

4个月前

gpt-5.1 的指令跟随能力，达到了新高度。指定“只用8个汉字回复”，gpt-5.1的正确率是100%，而gemini 2.5 pro和sonnet 4.5都是50%左右。（英文版用6个单词，考虑到单词和单词语义承载能力的差异，增加到8个单词。实际上8-12都可以）

关联事件

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议

869

在新德里举行的活动中，OpenAI宣布即将推出o3-Pro模型，取代现有的o1-Pro模型，旨在提升ChatGPT的推理能力和功能。同时，OpenAI还发布了ChatGPT高级语音模式的升级，新增了自然停顿、重音处理、同理心表达和双向自动翻译等功能。这一更新已向所有付费用户开放，预计将进一步增强ChatGPT的用户体验和市场竞争力。随着用户基数的不断扩大，OpenAI的这些新功能引发了广泛关注，尤其是在人工智能语音交互领域的应用潜力。