2025-06-18 21:02:14
Google昨天发布的Gemini 2.5技术报告里最有意思的一部分内容,提到有一位独立开发者让Gemini游玩并通关了《宝可梦 蓝》,展示了Gemini强大的长期规划和解决复杂任务的能力。 有一个有意思的点在于,在游戏中有时会遇到“软锁”的死胡同,导致玩家无法脱离,经过4个小时尝试多种方法,Gemini创造性的想到使用“飞翔”技能来逃脱,这是一个连人类玩家都难以预料的解决方案。 不过Gemini并不是直接从原始像素中理解Game Boy屏幕上的信息,而是依赖于将屏幕信息转换为文本描述。 而且Gemini有时会产生幻觉,比如将其他宝可梦游戏里的“TEA”道具混淆到当前游戏中,导致长时间固执的寻找这个不存在的物品。 另外当游戏中宝可梦生命值或能力点数较低时,模型会进入一种“恐慌”模式,反腐思考需要治疗或者逃离,导致其推理能力明显下降,甚至忘了使用可用的工具。
2025-06-18 14:06:48
2025-06-18 12:26:00