Gemini 2.5 Pro 国际数学奥林匹克 IMO 2025 的 report 我愿认真读一百遍的 system prompt Report 公布了核心方法 self-verification pipeline, 并在report中附上了详细的prompt。其中 self-verification中的 verifier 扮演重要角色：生成 Bug Report，这一角色把 pipel

#Gemini 2.5 Pro #IMO 2025 #self-verification pipeline #system prompt #Bug Report

相关新闻

Gorden Sun

4个月前

Step-Audio-R1：能推理的音频模型延长推理时间可以提升推理效果，音频理解能力超过Gemini 2.5 Pro，接近Gemini 3。模型：

Meathill

4个月前

Gemini 3 还是有点厉害，一个 4.5 Sonnet 和 Gemini 2.5 Pro 困扰了好几天的问题，被 Gemini 结局了。

Tony出海

4个月前

Gemini 2.5 Pro 降智太严重了，属于弱智了都

howie.serious

4个月前

gpt-5.1 的指令跟随能力，达到了新高度。指定“只用8个汉字回复”，gpt-5.1的正确率是100%，而gemini 2.5 pro和sonnet 4.5都是50%左右。（英文版用6个单词，考虑到单词和单词语义承载能力的差异，增加到8个单词。实际上8-12都可以）

宝玉

4个月前

提示词分享：帮助在 Hacker News 或者 Reddit 这样的讨论贴中提取精华内容。最佳模型：Gemini 2.5 Pro 使用方法： - 做成 Gem 或者 Project，让提示词作为instruction - 复制完整的讨论内容（纯文本即可）粘贴进 Gem 或者 Project ----- Prompt Start ---- 角色定位：Hacker News 洞察家与社区编辑

关联事件

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议

869

在新德里举行的活动中，OpenAI宣布即将推出o3-Pro模型，取代现有的o1-Pro模型，旨在提升ChatGPT的推理能力和功能。同时，OpenAI还发布了ChatGPT高级语音模式的升级，新增了自然停顿、重音处理、同理心表达和双向自动翻译等功能。这一更新已向所有付费用户开放，预计将进一步增强ChatGPT的用户体验和市场竞争力。随着用户基数的不断扩大，OpenAI的这些新功能引发了广泛关注，尤其是在人工智能语音交互领域的应用潜力。