1个月前

google IMO 24用的是alphaproof和geometry,这次用的是Gemini DeepThink “借助深度思考,一种增强的推理模式,我们的模型可以同时探索和结合多种可能的解决方案,然后再给出明确的答案。 我们还使用更多多步骤推理、解决问题和定理证明数据的RL技术对它进行了培训。”