一文看懂谷歌 Genie 3：AI 生成世界这一周对 AI 的用户和开发者来说，绝对是劲爆的一周。Cloud4 上新，OpenAI 连发两款开源模型，接着发布了 GPT 5。但 GPT 5 没有震撼我，真正让我震撼的，是谷歌 DeepMind 团队发布的 Genie 3 世界模型。那种感觉，有点像当年第一次见到 ChatGPT 的时刻，心跳加速，眼前一亮。 Genie 3 是谷歌 DeepM

#谷歌DeepMind #Genie 3 #世界模型 #AI生成 #虚拟环境

相关新闻

Andy Stewart

2个月前

你们要的二次元美女，还要啥美女？啥美女都可以生成 😂

Andy Stewart

2个月前

这是一个AI生成的视频，视频中有证据，看你找得到不 🙄

向阳乔木

2个月前

为什么一定要做自己的产品？大家经常聊“睡后收入”。但没人告诉你：睡后收入的本质，不是钱自己会来，是你变贵了。什么叫变贵？就是你做一次的东西，可以卖一百次、一千次。你写一篇文章，可以被搜索到一万次，帮助很多人。你录一个课程，可以被购买三年。你做一个模板，可以被下载无数遍。你没有睡后收入，不是因为你不够努力。是因为你做的事情，只能卖一次。你的时间在卖，你的

Gorden Sun

2个月前

RynnVLA-002：整合的视觉-语言-行动和世界模型阿里达摩院开源的模型，整合了VLA的世界模型。世界模型用于生成场景图片，VLA模型用于生成动作，同时也支撑世界模型生成图片。除了用于可交互的世界场景外，更适用于机器人任务。在评测数据集的表现上，接近闭源模型。模型：

RamenPanda

2个月前

谷歌 DeepMind 正在加速实现打造“机器人 Android”的雄心。他们刚刚聘请了波士顿动力（Boston Dynamics）前首席技术官 Aaron Saunders——正是他主导了 Atlas 和 Spot 的硬件工程。 DeepMind 希望 Gemini 能成为一个“通用大脑”，可以被所有机器人直接使用：人形、四足、轮式……就像 Android 当年统一了手机生态一样。谷歌

关联事件

谷歌Deep Research：AI操作系统雏形？

145

谷歌开源Deep Research系统，利用LangGraph Agent和Gemini API实现动态网络搜索和迭代式信息反思，旨在帮助用户从海量信息中获取高质量资料。该系统支持不同搜索力度，允许用户控制搜索的广度和深度。社区积极探索其功能和应用，有用户体验后认为其预演了“AI操作系统”的形态，使自然语言成为操作系统的主入口。项目持续发展，展示了良好的Agent架构和搜索策略，旨在通过AI驱动为用户提供智能搜索和深度研究的解决方案，其潜力已引起广泛关注。