科技事件跟踪,实时事件跟踪- 第36页 news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

智能推荐信息源

由 AI 根据您的兴趣偏好筛选

2个月前

来自 X 账号 TestingCatalog 的爆料：Google 在 Gemini 企业版（Gemini Enterprise）里新增多智能体「自动做研究」模式 Google 正在 Gemini for Enterprise 里打造一个多智能体系统。你给它一个主题，再配上一套评估标准，它就能自己生成一大堆点子，然后拉起一整支智能体团队，像打锦标赛一样一轮轮评审这些点子。这个系统一次可以连续干活大约 40 分钟。对一个面向普通企业用户的产品来说，这已经是非常长的一次连续推理过程了。在这 40 分钟结束时，用户会收到一大串点子清单，按你一开始设定的标准从优到劣排好名。整个规模也不小：系统一次能产出大约 100 个点子。对每一个点子，你都能拿到： - 一个概览 - 一个更详细的说明 - 一份点评总结 - 一份完整长评 - 以及一份专门的「锦标赛表现报告」（tournament performance report）这个「表现报告」还是一个单独的输出，可以单独打开慢慢看。所有生成出来的点子都是可选择的，你可以点进任意一个，继续深入展开。在当前的内测版本里，Google 看起来内置了三个智能体，其中有两个就是搭在这个多智能体「锦标赛」系统之上的。第一个叫 “Idea Generation”（创意生成）在这个模式里，你只要给一个主题，这个智能体就会启动整套多智能体工作流，用「锦标赛式评估」（tournament-style evaluation）来生成和排序各种相关点子。（所谓锦标赛式，就是不断让方案互相“对决”，胜出的留下，弱的被淘汰）第二个叫 “Co-scientist”（联合科学家）这个则更偏向科研和研究场景。你可以指定一个研究主题，再提供一些额外数据，然后一整个智能体团队会先生成研究方向和方案，再用同样的锦标赛机制去评估这些想法，只是这次会更强调科研和科学探索的需求。这里最有意思的一点，是它背后明显投入了非常夸张的算力。允许智能体在一个任务上连续工作大约 40 分钟，这在现在的大多数智能体工具里都算是「豪华配置」了。在整个 40 分钟里，系统会不断迭代这个问题，不停生成、筛选、打分、重组。目前，这一切都还只出现在 Gemini for Enterprise 里，属于内部开发阶段，对普通用户是隐藏的，还没有以正式功能形式对外开放。跟现有的智能体实现相比，这一套看起来是个明显的前进一大步。就算是那些已经带浏览器模式的高级智能体，通常也会受限于上下文窗口和时间预算（time budget）。而这次，Google 的做法，是直接把一大块算力「摆在台面上」给企业客户用，做成一个正儿八经的前端产品界面。这也和所谓的「Level 3 AI」的概念非常契合：这一层级的 AI 智能体，被描述为可以在同一个问题上持续工作一段较长时间。（这里的 Level 3 并不是统一标准，更像是行业里对“能长时间连续工作的智能体”的一种非正式分级说法）从这个角度看，让智能体在单个任务上跑满 40 分钟，是一个非常典型、甚至偏激进的例子。在实际使用中，这套系统输出的核心是「被充分筛选和精炼过的点子集合」。但它们远不只是随手抛出来的一堆建议，而是可以视为一组结构化的研究方向：在你给定的数据和问题背景下，这些方向有可能真正指向高价值的洞见。所以，Google 正在推进这种极其强力的智能体能力，专门服务于组织、公司和研究团队，这件事本身非常耐人寻味。等这项功能真正对外发布时，很可能会是一次不小的跃迁，尤其是如果这些智能体最终由 Gemini 3 Pro 来驱动的话。现在，Gemini 3 Pro 还没有进入 Gemini Enterprise，所以目前还不清楚这些实验性智能体背后具体用的是哪一个模型。这里依然有很多东西需要测试和验证。当你把一个提示词（prompt）提交给这套系统时，它首先会给出一份「计划做什么」的概要：会在哪些维度上评估、打算从哪些方向出发生成和筛选点子。只有在你确认这份概要之后，系统才会真正启动那次「大任务」。这相当于在烧一大笔算力之前，先和你对齐「我到底打算怎么理解你的问题」。除了多智能体锦标赛工作流之外，Gemini Enterprise 里还有另一个智能体，叫 “chat with your docs”（和文档聊天），它配了一套独立的 UI。这个智能体允许用户上传大小最高 30MB 的 PDF，然后面向这些文档进行专门对话。这个功能同样属于 Gemini Enterprise 的一部分，目前还没有对外发布，而且在生产环境中暂时不可用。它的设计思路是：最多 30MB 的 PDF 内容可以被分析并写入模型的上下文里，这样用户就能从现有文档中抽取更有价值的信息，而不是只靠人自己翻页看。在 Gemini Enterprise 里，还有不少其他功能正在开发中，但真正最抢眼的，还是这两条线： 1. 多智能体锦标赛式工作流 2. 面向文档的专用智能体特别是那个基于锦标赛的多智能体架构，看起来就是一种突破性的产品路线——其他大语言模型（LLM）服务商，目前似乎还没有在这个层级上，给用户提供类似的东西。多智能体锦标赛在面向终端用户的工具里依然非常少见。也许可以拿 Grok Heavy 来做某种对比，但很可能也不能算是和 Google 这套完全同一个方向的东西。等这些智能体成熟之后，如果能看到一套正式的评估结果和基准测试，那会非常有价值。光从现在的描述来看，那个 Co-scientist 智能体已经足够让很多大型组织和研究团队心动——尤其是那些正在探索新科学方向的团队。至于这些智能体具体什么时候会正式上线，或者会不会开放给非企业用户，目前还都是未知数。来源：

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini Enterprise #多智能体 #锦标赛式评估 #AI研究 #算力

2个月前

Google code wiki 搜索开源的项目，关于开源项目相关的信息都是由AI生成的，内容包括视频、架构图、文档。还支持和Gemini聊天去了解这份开源代码。

谷歌Deep Research：AI操作系统雏形？· 145 条信息

#Google #开源项目 #AI生成 #Gemini #代码理解

外汇交易员

2个月前

美国白宫国家经济委员会主任哈塞特表示，AI提升生产率或致就业市场“平静期”，美联储是时候真正“以数据为驱动”。 🗒️特朗普政府高层罕见公开承认AI取代初级岗位的担忧。

川普签署行政命令，人工智能发展引发热议· 19 条信息

#AI #就业市场 #哈塞特 #美联储 #特朗普政府

2个月前

Qwen 的模型哪怕是最强的 Qwen3-Max 也不是今天才发布，怎么千问 App 突然就效果特别好了呢。好难猜啊。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#Qwen #Qwen3-Max #千问App #模型效果 #猜测

TZ韩信 $Doge is currency, $Doge是新时代货币

2个月前

这几天一直在考虑如何在TESLA/NVDA/GOOG之间犹豫,突然发现好像只有TESLA是一个ALL IN ON SOULUTION, AI应用,加上未来自营AI晶片厂

英伟达看多特斯拉看空，股市风云再起· 37 条信息

#TESLA #AI应用 #AI晶片厂 #股票选择 #未来科技

2个月前

黄仁勋:聪明没什么了不起,真正的伟大来源于品格｡ #黄仁勋...

黄仁勋称赞中国市场创新能力，激发全球关注· 30 条信息

#黄仁勋 #品格 #伟大 #积极

2个月前

使用ChatGPT的过程中，它居然弹窗广告了，非常打扰使用的沉浸感，并且不容易关掉。现在仅仅是跳自家产品的广告，过段时间，它一定会根据我的对话，和历史记录，proactively的弹窗其他广告。迟早药丸。

ChatGPT Plus用户抗议权益缩水，萨姆奥尔特曼亲自道歉· 28 条信息

#ChatGPT广告 #弹窗广告 #用户体验差 #侵入式广告 #商业化

2个月前

Peter Yang 对 Cursor 设计负责人 Ryo Lu 的访谈中，其中两点尤其认同： 1. 在 AI 原生（AI-native）公司里，角色边界会变得很模糊。在 Cursor，设计师、产品经理、工程师之间的分工并不是传统那种各管一摊。 Ryo 的说法是：大家会根据自己的长处来做事，谁更擅长就多承担那一块，然后用 AI Agent 把这些工作串起来，形成一个完整的产品体验。 2. 模型越强，规格说明（spec）就越重要，而不是越不重要。 Ryo 的预测是：随着大语言模型能力越来越强，它们会变得非常擅长“严格按规格实现需求”。这意味着：你的 spec 写得有多清晰、具体、准确，很大程度上就决定了 AI 帮你做出来的东西质量有多高。 3. 分批发布，每一轮都会根据反馈打磨调整 Ryo 讲了 Cursor 内部发布的节奏：第一步，先发给公司内部员工用；第二步，再把最新的 nightly build 发给 Cursor 的忠实用户；第三步，才逐步推给普通用户；最后，才是企业用户（enterprise）。每一批用户都是一次打磨机会，让他们在小范围发现问题、修细节，再扩大范围。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#AI原生公司 #角色边界模糊 #规格说明重要性 #分批发布 #用户反馈打磨

2个月前

FocusCursor 好用的大功能新增

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#FocusCursor #大功能 #新增

2个月前

被骂久，准备重写一下应用网站，准备使用应用生成 html 然后放到一个仓库中维护

从月薪1800到被裁后独立开发，程序员的逆袭之路· 65 条信息

#应用网站 #重写 #仓库 #维护

2个月前

看到一个很棒的独立开发案例，一个哥们做了个应用，专门用来省停车费现在很多停车场，多停一分钟，就得多交一个小时的钱。这个痛点不大，但扎人。老哥就做了个app，输入停车场信息，就在计费周期结束前，通过灵动岛和锁屏提醒你。就这么一个小的功能。他这个发现小痛点的思路，是最值钱的逻辑现在太多人聊，动不动就是颠覆行业。但有所收获的，往往就是这种停车费级别的小机会点 AI对我们来说是一个新工具包，这个工具包里，有能帮你写文案的笔，有能帮你画图的尺。我们不是要去造这个笔和尺。而是要带着这个工具包，去找到一个被扎了的用户。比如用AI去做一个会议纪要助手，它什么也不会，就一件事：喂给它一个小时的录音，五秒钟后只吐给你三个待办事项再比如用AI去做一个财报翻译机。把100页的PDF扔进去，它只告诉你这家公司下个季度的风险点在哪这个停车app的启发是，去找到一个你或者你身边的人，每天都在忍受的、具体的小麻烦。然后用AI这个新工具，去精准地解决它，你觉得呢？

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#停车费 #独立开发 #AI工具 #小痛点 #灵动岛提醒

吕立青_JimmyLv (闭关ing) 2𐃏25

2个月前

我之后还是会优先用 CC+GLM 的组合了，Cursor Composer 1 太贵了， Codex 又太慢了 😂 规划阶段：Cursor Plan Mode + Claude Sonnet 搭配，人为修订 .md 文件执行阶段：Claude Code + GLM 最强编排+最便宜模型，长时运行～

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#CC+GLM组合 #Cursor Composer #Codex #Claude Sonnet #Claude Code

2个月前

后知后觉，今天才发现 Codex 也可以无缝与 VSCode 整合起来用了。本来我是用命令行跑的一个编程任务，后来发现在 VSCode 里通过 Codex 插件也可以把这个任务调用出来，结合编辑器去交互。 Claude Code 有 VSCode 插件一段时间了，现在 Codex 也有了，兜兜转转又都回到了 VSCode 的怀抱。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Codex #VSCode插件 #编程任务 #Claude Code #编辑器

2个月前

gemini 2.5 从入门到祛魅，只在结构化输出这里就给我干麻了，输出的时候持续报错，用的还是官方的示例🤪

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 2.5 #结构化输出 #报错 #官方示例 #技术问题

2个月前

codex + claude 轮轴转，我给了所有权限，跑了仨小时无解。最后还是我大脑深处一个久违的声音响起：要不然删了node_modules 重装试试？…… 然后就好了……

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#node_modules #重装 #解决问题 #编程 #经验

吕立青_JimmyLv (闭关ing) 2𐃏25

2个月前

昨晚用 Claude Code 搭配 GLM-4.6 简直用嗨了，真是又快又便宜！不吹不黑，我第一次对国产 AI 编程模型拥有了非常强的信心。在 Curse 2.0 之前，我 9 月份的账单高达 336 美元，恨啊！据说 Cursor 的 Composer 新模型也是基于 GLM 开源模型微调的，难怪用起来非常像～

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Code #GLM-4.6 #国产AI编程模型 #Cursor #账单降低

摆烂程序媛

2个月前

💡 最近，我搭了一个小网页：把海外，最值得读的 AI Newsletter ，全部整理在一起。 🔗 原因很简单：每天刷 X、Reddit、新闻太累，真正的干货总是被淹没。于是我直接做了个聚合站👇 🔍 支持搜关键词 🧭 看摘要 ⭐ 一键收藏/订阅全部在一个地方解决。

澎湃AI新闻合辑：未来科技与社会热点交锋· 112 条信息

#AI Newsletter #聚合网站 #信息整理 #干货 #一键收藏

海拉鲁编程客

2个月前

看 gemini cli 升级了 textinput，支持了光标，对 gemini 3.0 不抱太大希望。这些修改 codex 也能做，而如果 3.0 升级真的很逆天，最近 gemini cli 的升级速度不该这么慢。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini CLI #文本输入 #光标支持 #Gemini 3.0 #升级预期低

作家崔成浩

2个月前

小米汽车最佳客服来了，气死活人！

小米汽车维权事件：数百车主要求退车引发舆论风波· 74 条信息

#小米汽车 #客服 #负面 #气愤 #服务态度

2个月前

算力舱上新了好多应用，明天写详细的场景文章给你们看

懒猫家族新成员亮相，AI算力舱引发热议！· 143 条信息

#算力舱 #应用 #场景文章

... ...