时政
财经
科技
虚拟货币
其他
登录
#谷歌DeepMind
关注
RamenPanda
4周前
谷歌 DeepMind 正在加速实现打造“机器人 Android”的雄心。 他们刚刚聘请了波士顿动力(Boston Dynamics)前首席技术官 Aaron Saunders——正是他主导了 Atlas 和 Spot 的硬件工程。 DeepMind 希望 Gemini 能成为一个“通用大脑”,可以被所有机器人直接使用:人形、四足、轮式……就像 Android 当年统一了手机生态一样。 谷歌已经发布了 Gemini Robotics 1.5(视觉-语言-动作模型 VLA),并在 Apptronik 的 Apollo 应用测试平台上进行了实测。 如果 Gemini 真正做到开箱即用(plug-and-play),那么未来造一个智能机器人,可能就会像造一台 Android 手机一样简单。 这也意味着,未来几年机器人行业的增长速度,很可能会远远超出我们的预期。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#谷歌DeepMind
#机器人Android
#Aaron Saunders
#Gemini Robotics 1.5
#机器人行业增长
分享
评论 0
0
Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试
1个月前
11月17日,谷歌DeepMind与谷歌研究团队联合发布了新一代人工智能天气预报模型WeatherNext 2。 这款产品带来了两大核心突破:速度提升8倍,且能提供每小时分辨率的预报——这意味着在单个芯片上,模型可在不到一分钟内生成数百种可能的天气情景,而传统超级计算机完成同类任务需数小时。 在精度上,WeatherNext 2在温度、风力、湿度等99.9%的天气变量上超越了前代,预报时效覆盖0至15天。 目前,它已应用于谷歌搜索、AI助手Gemini、Pixel手机天气功能及Google Maps平台的天气API,并将于未来几周内整合到Google Maps中,为用户提供实时、精细的天气服务。 特别值得关注的是其对短期灾害的预测能力。在提前三天预报热带风暴路径时,新模型比上一代提前了约24小时。DeepMind研究员Akib Uddin指出,每小时一次的预报对能源交易员、农业从业者等行业尤为关键:“更精细的数据让决策更精准,比如风电场可据此调整发电计划,能源公司能优化调度。” 这一突破源于DeepMind开发的“功能生成网络”。传统模型通常针对单一气象要素(如温度、风速)训练,而新方法可通过学习各要素间的关联,直接预测复杂系统,例如区域热浪蔓延或风电场功率波动。 当然,技术仍有提升空间。DeepMind科学家Ferran Alet坦言,由于训练数据在极端天气场景(如异常降雨、暴雪)中存在缺口,模型对此类事件的预测能力还有待加强。“这是我们持续改进的方向。” 目前,WeatherNext 2已通过Google Cloud的Vertex AI、BigQuery和Earth Engine向企业与研究机构开放。这一领域的竞争正日趋激烈,包括NVIDIA、微软、AccuWeather及华为等公司均在布局AI天气预报系统。 从个人手机上的天气图标,到企业的决策支持工具,WeatherNext 2正用技术改变人类与自然的互动方式。它不仅是一次技术迭代,更预示着AI在气候服务领域的广阔应用——通过数据驱动的精细化预测,我们正逐步从“被动应对”转向“主动规划”,让科技更贴近生活的每一个细节。
#谷歌DeepMind
#WeatherNext 2
#AI天气预报
#灾害预测
#技术突破
分享
评论 0
0
池建强
4个月前
一文看懂谷歌 Genie 3:AI 生成世界 这一周对 AI 的用户和开发者来说,绝对是劲爆的一周。Cloud4 上新,OpenAI 连发两款开源模型,接着发布了 GPT 5。但 GPT 5 没有震撼我,真正让我震撼的,是谷歌 DeepMind 团队发布的 Genie 3 世界模型。那种感觉,有点像当年第一次见到 ChatGPT 的时刻,心跳加速,眼前一亮。 Genie 3 是谷歌 DeepMind 团队发布的第三代世界模型。它最大的特点是可以通过自然语言,实时生成一个动态、可交互的虚拟环境。你可以像玩游戏一样在这个世界里自由探索、互动,画面达到 720p 分辨率、每秒 24 帧,并且能持续几分钟保持场景和物理的一致性。比如你输入“在下雨的森林里漫步”,Genie 3 就能立刻生成一个逼真的雨林世界,你可以在里面自由移动,环境会根据你的行为实时变化。 它还能模拟真实世界的物理规律,比如水流、光影、天气变化,甚至能生成复杂的生态系统和历史场景。你还可以用文本提示改变世界事件,比如让天气突然转晴、添加新的角色或物体。这种“可提示的世界事件”让虚拟世界的可玩性和想象空间大大提升。 Meta 首席 AI 科学家杨立昆一直认为 GPT 并不是通往 AGI 的终极路径,世界模型才是。 那什么是世界模型?就是能够理解世界的物理规律,能够预测下一个环境、下一个画面会发生什么。当你让 AI 在这个世界里“运行”时,它能做出反应,这叫世界模型。 这次发布的宣传片一开头,就是多重宇宙的既视感,各种画面轮番上阵。我们看到的,并不是游戏,也不是视频,而是一个个可以生成的世界。这些世界,我们可以用一句话创造,世界生成后,还可以在里面行走、移动,系统会给你反馈,你能看到更多的画面和场景。 最关键的是,它的“一致性”做得非常好。现在展示的画面分辨率是 720P,帧率 24fps。在移动过程中,无论左看右看,还是绕一圈再回来,画面都和之前保持一致。这说明它有“记忆”能力——这非常关键。人之所以能感知世界的连贯性,本质上就是因为有记忆。如果 AI 也能在生成过程中拥有记忆,这个世界就真的能“建立”起来。 视频里讲到了一个刷房子的例子,让人印象深刻:你在墙上刷上蓝色涂料,转身去别的地方,再转回来,墙上的痕迹还在。这说明它记住了你的操作。而且整个生成过程,每一步移动时的画面都不是提前渲染好的 3D,而是实时生成的,这就有意思了。 再比如玩游戏时,它能生成无限多的场景。我们现在玩的游戏,世界都是提前搭好的“模”。但如果是生成式的,而且始终保持一致性,那就能创造一个全新的世界。 用户可以通过自然语言实时对系统做出干预,包括时间地点人物事件等等。 与前代产品相比,这次发布的 Genie 3 在分辨率、实时交互、场景一致性等方面都有质的飞跃。它不仅适合做游戏、动画、小说场景的生成,更被视为未来训练智能体(AI agent)的理想平台。比如,研究人员可以让机器人在 Genie 3 生成的世界里反复练习各种任务,极大提升 AI 的学习效率和泛化能力。 Genie 1 是 2024 年 2 月发布的,当时团队发了一篇论文,数据集是 20 万小时的互联网公开游戏数据。用大量无标注的游戏数据训练,生成了一个 110 亿参数的模型。那时的模型还很简陋,生成的画面一看就很粗糙,但已经有了初步的交互形态,可以玩,可以转动视角等等。 2024 年 12 月,Genie 2 发布,分辨率提升到 360P,画面和交互性都在持续进步。 刚发布的就是 Genie 3 了。 这个想象空间还是非常大的,以后也许做游戏直接使用 prompt 生成一个游戏。在游戏里,我们还可以随时修改和设计游戏角色,内容,玩法等等。就像现在人人可以 vibe coding 一样,也许未来人人也可以成为游戏设计师。 除了游戏,我们还可以学习各种历史场景,模拟危险救援,实现模型推演,做各种现实世界里没法做的模拟训练和预测,想想是不是很刺激? 目前 Genie 3 还处在初级阶段,只能支持几分钟的连续互动,动作空间和多智能体交互能力有限,地理精度也尚未完全还原真实世界。但即便如此,它已经被视为生成式 AI 和虚拟世界建模领域的一次重大突破,未来有望在教育、科研、娱乐等多个领域落地应用。 这个方向,我感觉已经跑通了。也许很快,国内的大厂就会跟进,或者说,相关技术已经在酝酿之中。
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#谷歌DeepMind
#Genie 3
#世界模型
#AI生成
#虚拟环境
分享
评论 0
0
罗翔
9个月前
这两天硅谷炸了! 谷歌DeepMind 实验室凌晨突发论文,新一代Al诊疗系统已能通过血检数据,在3秒内揪出13种早期癌症,准确率吊打三甲主任医师!更震撼的是,这套系统昨夜已通过FDA绿色通道,下周起在纽约长老会医院试运行。这不是科幻!我翻遍37页技术白皮书发现三个细思极恐的细节:① AI不仅会看病,还能从基因层面预判你未来5年患癌概率 ② 系统内置"谎言过滤器",能捕捉患者隐瞒的病史③ 诊疗费仅为人工的1/20,但每年需支付999美元"AI使用年费"朋友圈的肿瘤科医生彻夜未眠。北京协和的张主任凌晨三点发长文:"我们苦读15年的知识,正在被算法批量淘汰。“而华尔街早已狂欢,昨夜医疗 Al概念股集体暴涨230%,高盛预言:未来5年全球将有800万医生转行!这场风暴比我们想象得更猛烈!
#硅谷
#谷歌DeepMind
#Al诊疗系统
#血检
#早期癌症
#FDA绿色通道
#纽约长老会医院
#技术白皮书
#AI发展
分享
评论 0
0
宝玉
9个月前
据说是谷歌 DeepMind 的打乒乓球的机器人,它不仅能击球——还能学习、适应并有策略地比赛。
#谷歌DeepMind
#乒乓球机器人
#机器学习
#人工智能
#策略比赛
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞