马东锡 NLP

马东锡 NLP

0 关注者

1周前

Gemini 2.5 Pro 国际数学奥林匹克 IMO 2025 的 report 我愿认真读一百遍的 system prompt Report 公布了核心方法 self-verification pipeline, 并在report中附上了详细的prompt。 其中 self-verification中 的 verifier 扮演重要角色:生成 Bug Report,这一角色把 pipeline 中的 solver 和 verifier 区分开来,同时 verifier 承担着每次迭代的中转。 Pipleline中的每个step都详细公布了prompt,这种级别的system prompt的格式与条理,值得读一百遍。

相关新闻

关联事件