时政
财经
科技
虚拟货币
其他
登录
智能推荐信息源
李老师不是你老师
关注
德潤傳媒
关注
悉尼閑人
关注
联合早报 Lianhe Zaobao
关注
DW 中文- 德国之声
关注
ABC中文
关注
Gancheng Wang
关注
Ignatius Lee
关注
《议报》
关注
网易新闻-红星新闻
关注
由 AI 根据您的兴趣偏好筛选
事件跟踪
热点事件
最新话题
实时新闻
宝玉
1个月前
来自 X 账号 TestingCatalog 的爆料:Google 在 Gemini 企业版(Gemini Enterprise)里新增多智能体「自动做研究」模式 Google 正在 Gemini for Enterprise 里打造一个多智能体系统。你给它一个主题,再配上一套评估标准,它就能自己生成一大堆点子,然后拉起一整支智能体团队,像打锦标赛一样一轮轮评审这些点子。 这个系统一次可以连续干活大约 40 分钟。对一个面向普通企业用户的产品来说,这已经是非常长的一次连续推理过程了。 在这 40 分钟结束时,用户会收到一大串点子清单,按你一开始设定的标准从优到劣排好名。整个规模也不小:系统一次能产出大约 100 个点子。对每一个点子,你都能拿到: - 一个概览 - 一个更详细的说明 - 一份点评总结 - 一份完整长评 - 以及一份专门的「锦标赛表现报告」(tournament performance report) 这个「表现报告」还是一个单独的输出,可以单独打开慢慢看。所有生成出来的点子都是可选择的,你可以点进任意一个,继续深入展开。 在当前的内测版本里,Google 看起来内置了三个智能体,其中有两个就是搭在这个多智能体「锦标赛」系统之上的。 第一个叫 “Idea Generation”(创意生成) 在这个模式里,你只要给一个主题,这个智能体就会启动整套多智能体工作流,用「锦标赛式评估」(tournament-style evaluation)来生成和排序各种相关点子。(所谓锦标赛式,就是不断让方案互相“对决”,胜出的留下,弱的被淘汰) 第二个叫 “Co-scientist”(联合科学家) 这个则更偏向科研和研究场景。你可以指定一个研究主题,再提供一些额外数据,然后一整个智能体团队会先生成研究方向和方案,再用同样的锦标赛机制去评估这些想法,只是这次会更强调科研和科学探索的需求。 这里最有意思的一点,是它背后明显投入了非常夸张的算力。允许智能体在一个任务上连续工作大约 40 分钟,这在现在的大多数智能体工具里都算是「豪华配置」了。 在整个 40 分钟里,系统会不断迭代这个问题,不停生成、筛选、打分、重组。目前,这一切都还只出现在 Gemini for Enterprise 里,属于内部开发阶段,对普通用户是隐藏的,还没有以正式功能形式对外开放。 跟现有的智能体实现相比,这一套看起来是个明显的前进一大步。就算是那些已经带浏览器模式的高级智能体,通常也会受限于上下文窗口和时间预算(time budget)。 而这次,Google 的做法,是直接把一大块算力「摆在台面上」给企业客户用,做成一个正儿八经的前端产品界面。这也和所谓的「Level 3 AI」的概念非常契合:这一层级的 AI 智能体,被描述为可以在同一个问题上持续工作一段较长时间。(这里的 Level 3 并不是统一标准,更像是行业里对“能长时间连续工作的智能体”的一种非正式分级说法)从这个角度看,让智能体在单个任务上跑满 40 分钟,是一个非常典型、甚至偏激进的例子。 在实际使用中,这套系统输出的核心是「被充分筛选和精炼过的点子集合」。但它们远不只是随手抛出来的一堆建议,而是可以视为一组结构化的研究方向:在你给定的数据和问题背景下,这些方向有可能真正指向高价值的洞见。所以,Google 正在推进这种极其强力的智能体能力,专门服务于组织、公司和研究团队,这件事本身非常耐人寻味。 等这项功能真正对外发布时,很可能会是一次不小的跃迁,尤其是如果这些智能体最终由 Gemini 3 Pro 来驱动的话。现在,Gemini 3 Pro 还没有进入 Gemini Enterprise,所以目前还不清楚这些实验性智能体背后具体用的是哪一个模型。 这里依然有很多东西需要测试和验证。当你把一个提示词(prompt)提交给这套系统时,它首先会给出一份「计划做什么」的概要:会在哪些维度上评估、打算从哪些方向出发生成和筛选点子。只有在你确认这份概要之后,系统才会真正启动那次「大任务」。这相当于在烧一大笔算力之前,先和你对齐「我到底打算怎么理解你的问题」。 除了多智能体锦标赛工作流之外,Gemini Enterprise 里还有另一个智能体,叫 “chat with your docs”(和文档聊天),它配了一套独立的 UI。这个智能体允许用户上传大小最高 30MB 的 PDF,然后面向这些文档进行专门对话。 这个功能同样属于 Gemini Enterprise 的一部分,目前还没有对外发布,而且在生产环境中暂时不可用。它的设计思路是:最多 30MB 的 PDF 内容可以被分析并写入模型的上下文里,这样用户就能从现有文档中抽取更有价值的信息,而不是只靠人自己翻页看。 在 Gemini Enterprise 里,还有不少其他功能正在开发中,但真正最抢眼的,还是这两条线: 1. 多智能体锦标赛式工作流 2. 面向文档的专用智能体 特别是那个基于锦标赛的多智能体架构,看起来就是一种突破性的产品路线——其他大语言模型(LLM)服务商,目前似乎还没有在这个层级上,给用户提供类似的东西。多智能体锦标赛在面向终端用户的工具里依然非常少见。也许可以拿 Grok Heavy 来做某种对比,但很可能也不能算是和 Google 这套完全同一个方向的东西。 等这些智能体成熟之后,如果能看到一套正式的评估结果和基准测试,那会非常有价值。光从现在的描述来看,那个 Co-scientist 智能体已经足够让很多大型组织和研究团队心动——尤其是那些正在探索新科学方向的团队。 至于这些智能体具体什么时候会正式上线,或者会不会开放给非企业用户,目前还都是未知数。 来源:
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini Enterprise
#多智能体
#锦标赛式评估
#AI研究
#算力
分享
评论 0
0
卫斯理
1个月前
Google code wiki 搜索开源的项目,关于开源项目相关的信息都是由AI生成的,内容包括视频、架构图、文档。 还支持和Gemini聊天去了解这份开源代码。
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#Google
#开源项目
#AI生成
#Gemini
#代码理解
分享
评论 0
0
外汇交易员
1个月前
美国白宫国家经济委员会主任哈塞特表示,AI提升生产率或致就业市场“平静期”,美联储是时候真正“以数据为驱动”。 🗒️特朗普政府高层罕见公开承认AI取代初级岗位的担忧。
川普签署行政命令,人工智能发展引发热议· 19 条信息
#AI
#就业市场
#哈塞特
#美联储
#特朗普政府
分享
评论 0
0
九原客
1个月前
Qwen 的模型哪怕是最强的 Qwen3-Max 也不是今天才发布,怎么千问 App 突然就效果特别好了呢。 好难猜啊。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#Qwen
#Qwen3-Max
#千问App
#模型效果
#猜测
分享
评论 0
0
TZ韩信 $Doge is currency, $Doge是新时代货币
1个月前
这几天一直在考虑如何在TESLA/NVDA/GOOG之间犹豫,突然发现好像只有TESLA是一个ALL IN ON SOULUTION, AI应用,加上未来自营AI晶片厂
英伟达看多特斯拉看空,股市风云再起· 37 条信息
#TESLA
#AI应用
#AI晶片厂
#股票选择
#未来科技
分享
评论 0
0
德潤傳媒
1个月前
黄仁勋:聪明没什么了不起,真正的伟大来源于品格。 #黄仁勋...
黄仁勋称赞中国市场创新能力,激发全球关注· 30 条信息
#黄仁勋
#品格
#伟大
#积极
分享
评论 0
0
马东锡 NLP
1个月前
使用ChatGPT的过程中,它居然弹窗广告了,非常打扰使用的沉浸感,并且不容易关掉。 现在仅仅是跳自家产品的广告,过段时间,它一定会根据我的对话,和历史记录,proactively的弹窗其他广告。 迟早药丸。
ChatGPT Plus用户抗议权益缩水,萨姆奥尔特曼亲自道歉· 28 条信息
#ChatGPT广告
#弹窗广告
#用户体验差
#侵入式广告
#商业化
分享
评论 0
0
宝玉
1个月前
Peter Yang 对 Cursor 设计负责人 Ryo Lu 的访谈中,其中两点尤其认同: 1. 在 AI 原生(AI-native)公司里,角色边界会变得很模糊。 在 Cursor,设计师、产品经理、工程师之间的分工并不是传统那种各管一摊。 Ryo 的说法是:大家会根据自己的长处来做事,谁更擅长就多承担那一块,然后用 AI Agent 把这些工作串起来,形成一个完整的产品体验。 2. 模型越强,规格说明(spec)就越重要,而不是越不重要。 Ryo 的预测是:随着大语言模型能力越来越强,它们会变得非常擅长“严格按规格实现需求”。 这意味着:你的 spec 写得有多清晰、具体、准确,很大程度上就决定了 AI 帮你做出来的东西质量有多高。 3. 分批发布,每一轮都会根据反馈打磨调整 Ryo 讲了 Cursor 内部发布的节奏: 第一步,先发给公司内部员工用; 第二步,再把最新的 nightly build 发给 Cursor 的忠实用户; 第三步,才逐步推给普通用户; 最后,才是企业用户(enterprise)。 每一批用户都是一次打磨机会,让他们在小范围发现问题、修细节,再扩大范围。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#AI原生公司
#角色边界模糊
#规格说明重要性
#分批发布
#用户反馈打磨
分享
评论 0
0
小弟调调
1个月前
FocusCursor 好用的大功能新增
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#FocusCursor
#大功能
#新增
分享
评论 0
0
小弟调调
1个月前
被骂久,准备重写一下应用网站,准备使用应用生成 html 然后放到一个仓库中维护
从月薪1800到被裁后独立开发,程序员的逆袭之路· 65 条信息
#应用网站
#重写
#仓库
#维护
分享
评论 0
0
Ian (伊恩)
1个月前
看到一个很棒的独立开发案例,一个哥们做了个应用,专门用来省停车费 现在很多停车场,多停一分钟,就得多交一个小时的钱。这个痛点不大,但扎人。 老哥就做了个app,输入停车场信息,就在计费周期结束前,通过灵动岛和锁屏提醒你。就这么一个小的功能。 他这个发现小痛点的思路,是最值钱的逻辑 现在太多人聊,动不动就是颠覆行业。但有所收获的,往往就是这种停车费级别的小机会点 AI对我们来说是一个新工具包,这个工具包里,有能帮你写文案的笔,有能帮你画图的尺。 我们不是要去造这个笔和尺。而是要带着这个工具包,去找到一个被扎了的用户。 比如用AI去做一个会议纪要助手,它什么也不会,就一件事:喂给它一个小时的录音,五秒钟后只吐给你三个待办事项 再比如用AI去做一个财报翻译机。把100页的PDF扔进去,它只告诉你这家公司下个季度的风险点在哪 这个停车app的启发是,去找到一个你或者你身边的人,每天都在忍受的、具体的小麻烦。然后用AI这个新工具,去精准地解决它,你觉得呢?
独立创业者如何突破零收入困境,迈向月入1000元· 307 条信息
#停车费
#独立开发
#AI工具
#小痛点
#灵动岛提醒
分享
评论 0
0
吕立青_JimmyLv (闭关ing) 2𐃏25
1个月前
我之后还是会优先用 CC+GLM 的组合了,Cursor Composer 1 太贵了, Codex 又太慢了 😂 规划阶段:Cursor Plan Mode + Claude Sonnet 搭配,人为修订 .md 文件 执行阶段:Claude Code + GLM 最强编排+最便宜模型,长时运行~
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#CC+GLM组合
#Cursor Composer
#Codex
#Claude Sonnet
#Claude Code
分享
评论 0
0
图拉鼎
1个月前
后知后觉,今天才发现 Codex 也可以无缝与 VSCode 整合起来用了。 本来我是用命令行跑的一个编程任务,后来发现在 VSCode 里通过 Codex 插件也可以把这个任务调用出来,结合编辑器去交互。 Claude Code 有 VSCode 插件一段时间了,现在 Codex 也有了,兜兜转转又都回到了 VSCode 的怀抱。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Codex
#VSCode插件
#编程任务
#Claude Code
#编辑器
分享
评论 0
0
Meepo
1个月前
gemini 2.5 从入门到祛魅,只在结构化输出这里就给我干麻了,输出的时候持续报错,用的还是官方的示例🤪
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini 2.5
#结构化输出
#报错
#官方示例
#技术问题
分享
评论 0
0
wwwgoubuli
1个月前
codex + claude 轮轴转,我给了所有权限,跑了仨小时无解。 最后还是我大脑深处一个久违的声音响起:要不然删了node_modules 重装试试?…… 然后就好了……
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#node_modules
#重装
#解决问题
#编程
#经验
分享
评论 0
0
吕立青_JimmyLv (闭关ing) 2𐃏25
1个月前
昨晚用 Claude Code 搭配 GLM-4.6 简直用嗨了,真是又快又便宜! 不吹不黑,我第一次对国产 AI 编程模型拥有了非常强的信心。 在 Curse 2.0 之前,我 9 月份的账单高达 336 美元,恨啊! 据说 Cursor 的 Composer 新模型也是基于 GLM 开源模型微调的,难怪用起来非常像~
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude Code
#GLM-4.6
#国产AI编程模型
#Cursor
#账单降低
分享
评论 0
0
摆烂程序媛
1个月前
💡 最近,我搭了一个小网页: 把海外,最值得读的 AI Newsletter ,全部整理在一起。 🔗 原因很简单: 每天刷 X、Reddit、新闻太累,真正的干货总是被淹没。 于是我直接做了个聚合站👇 🔍 支持搜关键词 🧭 看摘要 ⭐ 一键收藏/订阅 全部在一个地方解决。
澎湃AI新闻合辑:未来科技与社会热点交锋· 112 条信息
#AI Newsletter
#聚合网站
#信息整理
#干货
#一键收藏
分享
评论 0
0
海拉鲁编程客
1个月前
看 gemini cli 升级了 textinput,支持了光标,对 gemini 3.0 不抱太大希望。 这些修改 codex 也能做,而如果 3.0 升级真的很逆天,最近 gemini cli 的升级速度不该这么慢。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini CLI
#文本输入
#光标支持
#Gemini 3.0
#升级预期低
分享
评论 0
0
作家崔成浩
1个月前
小米汽车最佳客服来了,气死活人!
小米汽车维权事件:数百车主要求退车引发舆论风波· 74 条信息
#小米汽车
#客服
#负面
#气愤
#服务态度
分享
评论 0
0
Andy Stewart
1个月前
算力舱上新了好多应用,明天写详细的场景文章给你们看
懒猫家族新成员亮相,AI算力舱引发热议!· 143 条信息
#算力舱
#应用
#场景文章
分享
评论 0
0
上一页
1
...
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
...
248
下一页
AI 实时热榜 (24小时)
智能算法加权排行
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞