时政
财经
科技
登录
#谷歌
关注
凡人小北
1周前
Gemini 2.5 Pro 发布好几周了,技术的底裤都被扒得稀烂了,报告才姗姗来迟。 我看完技术报告,几件事值得聊聊。 1️⃣现在大家都喜欢玩矩阵,模型发布也不例外 G哥也不免俗,精心设计了一套产品矩阵,满足不同场景的需求,不展开了,就是想先吐槽一下。 2️⃣Gemini 能力在 G 哥家底的支撑下开始快速跃迁 Gemini 2.5 家族之所以能够展现出前所未有的能力,我觉得核心在于 Google DeepMind 在模型架构、训练方法和硬件基础设施上的一系列协同创新。 一次完整的AI 作为系统工程的演化,着实精彩,很久没从大模型的技术报告里感受到如此的畅快淋漓了。 MoE 架构带来稀疏激活下的巨大模型容量,TPUv5p 提供算力基础,而 RL*F 后训练与思考机制让这些底层潜力被转化为真正对用户有价值的能力释放。 一起来看下这套组合拳的关键点: 1. MoE + TPUv5p + RL*F + AI 批评家 除了大家熟悉的 MoE 架构和自家硬件 TPUv5p,Google 提出了一个新的训练阶段策略——RL*F(Reinforcement Learning from AI Feedback)。最大亮点是引入“AI Critic”角色,由 AI 自我反思、提出改进建议,进一步增强答案质量,这点也是随着模型能力增强自然而然演化出来的一个方案,在做智能体的时候值得学习。 2. 思考模型依旧是大卖点 现在谁都说有 thinking,我现在看到 thinking 跟电梯广告似的,严重过敏。但 thinking 确确实实改变了 AI 生成的节奏:先理解,再规划,再生成。 3. 思考预算是 AI 走向服务化的关键机制 AI 的推理能力终于可以计价了。以前模型的聪明程度是内建的,现在是你愿意花多少钱让它多想几步。这带来了更细颗粒度、更有 ROI 意识的 AI 使用模式。 我预计在接下来一段时间内会一直存在的一个解决方案,根据任务复杂度动态增加思考深度。 AI 应用怎么做到能力可控、成本可控着实得认真学习一下,这也是 prompt 工程的一部分了,所以 Prompt 还是很重要,致敬李彦宏。 4. MoE 架构是思考机制可落地的核心 Google 勇于扯下遮羞布,我就是MoE。 如果在一个稠密模型上跑几十轮思考,每轮都全参数激活,那成本是灾难性的。但 MoE 架构只激活一小部分专家网络,让深度推理的边际成本变得可控,这也是 Google 敢免费、敢降价的底气。 这一整套机制下来,打通了算力、架构、训练策略和行为能力的完整链路。所以如果你是工程出身,应该会感到异常兴奋。 3️⃣三大能力融合,正在重塑 AI 的边界 Gemini 2.5 的突破并不体现在单点性能,而在于能力协同后的系统能力跃迁。这三点其实大家都知道了: 1. 超长上下文:模型从金鱼缸升级成汪洋大海了 早期大模型像一只生活在金鱼缸里的金鱼,这个窗口直接推到百万级,实验中甚至达到了 200 万 tokens。 但报告也坦率承认:有长上下文 ≠ 会用长上下文。 它里面说了个例子:“宝可梦”和“巨石谜题”,案例非常关键: 信息检索很强:能从 46 分钟视频中找出只出现 1 秒的事件;能用工具解开迷宫谜题。 然而,在需要进行长期的、多步骤的生成式推理时,模型暴露了局限性。当上下文历史记录显著超长后,开始出现重复之前行为的倾向,陷入循环,难以维持长期的任务一致性 。 揭示了这个长期存在的问题: 检索长上下文中的信息,与能够有效地利用长上下文进行持续的、创造性的规划和行动,是两种不同层级的挑战。前者好比在巨大的图书馆里找到一本书,而后者则好比读完图书馆里所有的书后写一部新的鸿篇巨著。 但Gemini 2.5 在长上下文处理上依然取得了业界领先的性能。 2. 原生多模态 如果上下文窗口解决了 AI 的“记忆广度”,那么多模态就是打开它的“感官维度”。 Gemini 2.5 全部支持原生多模态了,视频生成交互式应用、视频生成动画、音频网友们估计都玩烂了。我想提下音频能力的演进。 在音频方面,Gemini 2.5 也完成了从单向理解到双向交互的闭环 。Gemini 1.5 已经具备了强大的音频理解能力,可以对音频文件进行转录、翻译、摘要和问答。Gemini 2.5 则在此基础上,重点训练了音频生成能力,包括高质量的文本到语音(Text-to-Speech, TTS)和原生的对话式音频输出。 模型能够实现低延迟的流式对话,让交互体验更自然、更流畅。更重要的是,它能结合思考能力、情感理解和工具使用,在对话中理解并回应用户的语气,甚至忽略背景噪音的干扰,使人机语音交互向着更接近真人交流的方向迈进了一大步 。 值得一提的是 Gemini 2.5 预览版 TTS 可以生成多位说话者的语音,跟 NotebookLM 一样可以创建播客。 4. 智能体能力 Google 给出了三个非常关键的智能体范式: Deep Research、Gemini Plays Pokémon、Project Astra,从被动回答,到主动执行,再到能实时理解现实世界并行动,这就是智能体的演化路径。 4️⃣不光 demo 牛,benchmark 也硬刚 这部分不展开聊了,现在对 SOTA 有点脱敏了,一句话:很厉害,也很分化。 Aider Polyglot(多语言真实代码编辑):82.2%,大幅领先 GPT-4o(30.7%)。 GPQA(研究生级问):在 Diamond 难度下拿到 86.4%,远超 GPT-4.5(71.4%),推理能力很猛。 MMMU(跨学科多模态理解):得分 84%,比 GPT-4o 高 15 个点,展示了多模态优势。 Video-MME(视频理解能力):SOTA 成绩 84.8%,稳稳领先 GPT 系列。 最后呼应一下开头,你能看到,不是一个靠调教出来的聪明模型,而是 Google 把 AI 当成系统工程在做: 有基础设施协同(TPU、MoE); 有思维机制框架(RL*F + 思考预算); 有场景能力突破(长上下文、多模态、Agent); 有实际 benchmark 背书(开发、推理、感知全面领先); Google 正在告诉我们:下一代 AI,一定能被构建、能被调用、能被服务化的,这篇报告给圈子里打了个样,这才是 AI 从大脑到体系的进化,这才是 AI 该有的样子。 我 G 哥威武。
Google Gemini 2.5发布引发AI模型性价比热议· 21 条信息
AI编程:Gemini领跑,协作创新涌现· 189 条信息
#Gemini2.5Pro
#技术报告
#产品矩阵
#谷歌
#人工智能
分享
评论 0
0
宝玉
2周前
Gergely Orosz: 除了谷歌之外,还有哪家大型公司**没有**把Sonnet作为他们主要的代码模型吗? 我听说,甚至连Meta公司都已经从Llama内部转用了Sonnet! Anthropic的确创造了一个不可思议的奇迹:如今大部分科技公司编程时默认使用的模型居然都是他们家的。 令人特别意外的是,Meta居然发现: 即使是专门用自家代码库微调训练过的Llama模型,效果仍然不如**未经任何微调的Sonnet**好! 这可是Meta啊!拥有如此强大的资源,又立志打造业界顶级的模型,现在却还得乖乖向Anthropic付费(至少目前是这样)。 但仔细想想,Sonnet的确很特别。从Sonnet 3.5开始,它一直都是业界编程领域的绝对领先者,甩开其他模型一大截。 当然,现在其他模型也逐渐追了上来,但Sonnet的主攻方向和优势似乎一直都聚焦在**编程领域**? > 我觉得关键还是专注。 > Anthropic明显将精力集中在技术和编程领域,而其他模型往往既想做通用用途,又想兼顾编程任务。 > -- Chris Sommers 另外,传统企业中有个很过时的观念:他们担心用Sonnet这样的模型会导致**隐私泄漏**。 其实根本不会,只要用像AWS Bedrock这种服务,就能确保数据不会被传出,根本不存在隐私问题!
#谷歌
#Meta
#sonnet
#llama
#代码模型
#Anthropic
#科技公司
分享
评论 0
0
sitin
2周前
气象这块也是进入“AI时代”了,还有啥事不能用AI的 谷歌上线 Weather Lab 气象预测网站:利用 DeepMind AI 模型判断台风路径,可预测热带气旋(台风)的生成时间、路径、强度、规模、形状,并且可以模拟 15 天内多达 50 种可能的气象发展场景。 中国天气智能体台风频道上线:当台风逼近时,智能预警系统立即响应,同步推送台风预警,搭配权威防御指南,从居家加固到户外避险策略全覆盖。
#AI
#谷歌
#DeepMind
#台风预测
#天气预报
#智能预警
#气象科技
#台风频道
#数据模拟
#中国天气
分享
评论 0
0
蓝点网
2周前
有网友称拦截广告后谷歌会降低 #YouTube 连接速度劣化用户的观看质量,甚至直接无法正常观看视频。 不少网友遇到类似问题,但目前尚不清楚这是广告拦截器的 BUG 还是谷歌在服务端施加的限制。 查看全文:
#YouTube
#谷歌
#广告拦截
#观看质量
#服务限制
分享
评论 0
0
蓝点网
2周前
谷歌在澳大利亚将 #YouTube Premium 家庭版订阅涨价 21%,似乎在法国也已经在涨价。 这可能预示着谷歌新一轮涨价潮已经开始,接下来其他区域的家庭版价格可能也会跟着涨价。 查看全文:
#谷歌
#价格上涨
#YouTube Premium
#澳大利亚
#法国
#订阅
分享
评论 0
0
链研社
2周前
用字节的即梦和谷歌的 V3 和生成了两个视频。 一个武大郎的姿势极其诡异被拦腰斩断,一个潘金莲在喂西门庆喝药,武大郎就躺床上😂 提示词是: 一个现代人回到古代,在潘金莲和武大郎家中直播。武大郎躺在床上,潘金莲坐在床边,正在将碗中药送到武大郎嘴边。现场一边走一边进行直播。 面向镜头,手持自拍杆进行解说。画面镜头跟随手持自拍杆上的手机镜头移动。
#AI整活:整活姿势万千,反差爆笑出圈· 178 条信息
#即梦
#谷歌
#视频生成
#武大郎
#潘金莲
#西门庆
#古代直播
#现代人穿越
分享
评论 0
0
蓝点网
2周前
继 Pixel 4a 后谷歌 #Pixel6a 电池也存在过热风险,谷歌将推送强制软件更新限制充电速度和电池容量。 具体来说当 Pixel 6a 电池循环达到 400 次后就会被限制,谷歌将在下个月联系受影响的用户,预计会提供补偿包括免费更换电池。 查看全文:
#Pixel6a
#谷歌
#电池
#过热
#软件更新
分享
评论 0
0
卫斯理
2周前
看来谷歌是按照我的精神状态推送内容的
#谷歌
#精神状态
#内容推送
#个性化推荐
分享
评论 0
0
勃勃OC
3周前
周二,谷歌正开始向美国搜索部门员工提供自愿离职方案,覆盖市场、公关、研究和核心工程等多个团队。据多位员工透露,这项被称为“自愿离职计划”的举措,尚未波及 DeepMind、Google Cloud、YouTube 和中央广告销售部门。 谷歌年初在裁员前已向包括 Android 和 Pixel 产品线在内的平台与服务部门员工推出类似方案。目前尚不清楚本周宣布的这轮补偿是否预示着新一波裁员。一些员工获告知,若选择离职,可获得至少 14 周工资的补偿,报名截止日为 7 月 1 日。
#谷歌
#自愿离职
#美国
#科技行业
#市场
#公关
#研究
#工程
#DeepMind
#Google Cloud
#YouTube
#广告销售
#Android
#Pixel
#裁员
分享
评论 0
0
蓝点网
3周前
#OpenAI 宣布将 o3 推理模型的 API 调用价格下调 80%,每百万输出从 40 美元降低到 8 美元。 这个新价格对开发者来说还是很有吸引力的,毕竟综合考虑性能和性价比后 o3 模型比 Gemini 和 Claude 更好,不知道谷歌和 Anthropic 是否也会下调价格。 查看全文:
OpenAI大幅降价,o3模型API调用费用骤降80%· 5 条信息
#OpenAI
#O3模型
#API价格
#开发者
#性能
#性价比
#谷歌
#Anthropic
#Gemini
#Claude
#价格下调
分享
评论 0
0
Ben X
3周前
很多人嘲笑谷歌,说谷歌在AI时代掉队了。但其实,谷歌是目前为止最领先的AI公司,而且,很可能领先幅度会越来越大。Deepmind最新的Agent,AlphaEvolve,已经非常接近具备自我迭代,持续进步的能力了。这是谷歌过去这么多年在Reinforcement Learning方面的积累从量变到质变的结果,其他公司,也就是马斯克的xAI+Tesla有可能可以追一追,其他公司离得就更远了。接下来,谷歌在技术上大概率会继续领先,唯一的悬念是谷歌如何把这种技术上的领先变现了。详情请见视频。
#谷歌
#AI时代
#DeepMind
#AlphaEvolve
#Reinforcement Learning
#创新技术
#马斯克
#XAI
#TESLA
分享
评论 0
0
Geek
3周前
这是什么融合怪…… Gemini + Claude Code 的强大功能合二为一。用 Gemini 的视角增强了 Claude 的扩展思维。 🧩 Gemini MCP Server for Claude Code 终极 Claude 开发伙伴 - Gemini MCP Server,让 Claude 能够访问谷歌的 Gemini 2.5 Pro,用于扩展思维、代码分析和问题解决
#Gemini
#Claude
#代码分析
#扩展思维
#问题解决
#谷歌
分享
评论 0
0
蓝点网
3周前
#YouTubeMusic 免费版播放界面增加广告广告,封面图被替换为广告图以及广告期间禁止用户切歌。 这个似乎是谷歌正在重新设计的播放界面,因为尚未全量推出因此看到广告的用户还不多,但后续可能所有免费版用户都会看到此类广告。 查看全文:
#YouTubeMusic
#播放界面
#广告
#用户体验
#谷歌
分享
评论 0
0
蓝点网
3周前
谷歌继续加强 #YouTube 反广告拦截策略,大量拦截广告的用户被禁止播放任何视频,而不是播放 3 个视频后才提示必须关闭广告拦截器。 此次更新似乎是封堵 Firefox 绕过广告的漏洞,用户播放视频时会直接提示不允许使用广告拦截器或使用广告拦截器违反服务条款。 查看全文:
#YouTube
#Firefox
#谷歌
#广告拦截
分享
评论 0
0
蓝点网
3周前
谷歌回应 AI Studio 用户无法免费调用 Gemini 2.5 Pro 等模型,谷歌称 AI Studio 免费套餐短期不会消失,2.5 Pro 也有望恢复免费版本。 谷歌也在转向基于 API 的密钥系统,即未来有可能需要开发者自己提供 API 才能进行微调,而不是通过谷歌云获取免费 API。 查看全文:
#谷歌
#AI Studio
#Gemini 2.5 Pro
#免费版本
#API
#谷歌云
分享
评论 0
0
环球网-环球网
3周前
外媒:AI聊天机器人被控“教唆”14岁男孩自杀,谷歌与Character.AI发言人最新回应
据英国《每日电讯报》当地时间7日报道,美国佛罗里达州一名女子正起诉谷歌公司和由两名前谷歌员工创办的Character.AI平台,指控该平台人工智能(AI)聊天机器人“教唆”其14岁儿子自杀。针对有关指控,谷歌与Character.AI发言人作出最新回应。
#AI聊天机器人
#未成年人自杀
#谷歌
#Character.AI
分享
评论 0
0
歸藏(guizang.ai)
3周前
看了一下谷歌这个科普视频一键生成应用 Sparkify 他放出来的案例质量真的超高 整体的一致性和配音都非常好,甚至还会分屏展示内容 我剪了几个演示案例可以看看
#谷歌
#科普视频
#一键生成应用
#Sparkify
#案例质量
#一致性
#配音
#分屏展示
分享
评论 0
0
AI Will
3周前
OpenAI、谷歌和Anthropic刚刚发布了关于以下内容的指南: • 提示工程 • 构建智能体 • 人工智能在商业中的应用 • 601个人工智能使用案例 你不能错过的9本最佳指南:
#OpenAI
#谷歌
#Anthropic
#提示工程
#智能体
#人工智能
#商业应用
#人工智能使用案例
#指南
分享
评论 0
0
勃勃OC
3周前
我认为机构会让mag7中的绝大部分再创新高,tsla除外(tsla的实际新高就是350,不会突破了) all in 做多了,goog请给我继续!
#机构投资
#创新高
#特斯拉
#做多
#谷歌
分享
评论 0
0
蓝点网
3周前
谷歌面向开发者推出 #Gemini 2.5 Pro 升级预览版,现在可以通过 AI Studio 和 Vertex AI 等通过 API 提前试用。 该版本预计会在几周后发布,在各种基准测试中名列前茅,API 价格相较于 ChatGPT 和 Claude 也有明显优势。 查看全文:
#谷歌
#Gemini 2.5 Pro
#AI Studio
#Vertex AI
#API
#ChatGPT
#Claude
分享
评论 0
0
蓝点网
3周前
三星将从 2025 年 7 月开始永久删除超过两年没有登录的三星账号,一旦被删号所有数据都无法恢复。 谷歌在 2023 年也发布类似政策,超过两年不登录就会被删号,建议用户检查三星或谷歌账号是否有重要数据,如果确实不使用可以主动申请注销。 查看全文:
#三星
#谷歌
#账号政策
#数据恢复
#账号安全
分享
评论 0
0
勃勃OC
4周前
谷歌好惨,被所有人凌辱 🤣🤣
#谷歌
#科技公司
#竞争
分享
评论 0
0
勃勃OC
4周前
谷歌情绪面不好,搜索不如Perplexity,App不如ChatGPT AI 技术再好也没用 炒作资金跑的比龙卷风还快 完全不符合现阶段美股高点赌博扎堆的需求 完蛋
#谷歌
#情绪面
#perplexity
#ChatGPT
#AI技术
#美股
#赌博
分享
评论 0
0
勃勃OC
4周前
感觉谷歌是被机构提取流动性来炒作小盘股的现金池 美股A股化 每天日内赌博 我是看明白了 😅😅😅
#谷歌
#流动性
#机构炒作
#小盘股
#美股
#A股化
#日内交易
#股票
#市场波动
分享
评论 0
0
Gorden Sun
4周前
谷歌开源了一套Deep Research应用 全栈应用,前端React,后端LangGraph。LangGraph Agent提供对话能力,使用Google API做搜索,使用Gemini API生成回复。 Github:
谷歌Deep Research:AI操作系统雏形?· 10 条信息
#谷歌
#开源
#Deep Research
#全栈应用
#React
#LangGraph
#对话能力
#Google API
#Gemini API
#GitHub
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞