Gorden Sun 0 关注者 关注 2周前 Gemini 3 Flash引入视觉推理能力 采用“思考-行动-观察”的循环分析机制,而不是普通的一次性静态扫描。 Think (思考):分析用户指令与初始图像,规划多步骤的视觉分析方案; Act (行动):生成并执行Python代码,对图像进行主动操作(如放大、切割)或提取里面的数据做分析; Observe (观察):将处理后的图像或结果追加到上下文,结合新视角进行二次确认,再生成最终回答。 前往原网页查看