时政
财经
科技
虚拟货币
其他
登录
智能推荐信息源
李老师不是你老师
关注
德潤傳媒
关注
悉尼閑人
关注
联合早报 Lianhe Zaobao
关注
DW 中文- 德国之声
关注
ABC中文
关注
Gancheng Wang
关注
Ignatius Lee
关注
《议报》
关注
网易新闻-红星新闻
关注
由 AI 根据您的兴趣偏好筛选
事件跟踪
热点事件
最新话题
实时新闻
财经真相
4周前
李飞飞啥时候成了“AI教母”了? 红色权贵跟美国权贵的套路,先给各大美国顶级大学捐款,然后弄几篇包装的论文,或者以基金高薪招募全球顶尖人才,把人家的成果弄成公司项目,然后以老板身份对外宣发,打造人设,再请彭博社、路透社、华尔街日报、纽约时报吹捧 于是一个个“AI酵母、教父”腾空出世!
DeepSeek数据泄露:德国下架,信任崩盘· 446 条信息
#李飞飞
#AI教母
#红色权贵
#学术包装
#负面
分享
评论 0
0
meng shao
4周前
[Anthropic 工程博客解读] 高级工具使用功能:工具搜索工具、程序化工具调用和工具使用示例三项技术结合,显著降低 Token 消耗,工具选择更明确,复杂调用更准确。 Anthropic 最近在 Claude 开发者平台上推出了高级工具使用 (advanced tool use) 功能,让 AI 智能体能够高效处理数百甚至数千个工具,而不会被上下文窗口的限制所束缚。想象一下,一个智能体需要同时操作 IDE、Git、Slack、GitHub、Jira 或数据库等系统——传统方式下,工具定义会占用海量 Token,导致上下文膨胀、工具选择错误或调用延迟。这些新功能通过动态加载、代码编排和示例指导,显著提升了智能体的实用性和可扩展性。 核心挑战与应对策略 构建可靠的工具使用系统面临三大痛点: 一是 Token 消耗过高——例如,从多个服务(如 GitHub 和 Slack)拉取工具定义,可能瞬间吃掉 50,000+ Token 二是工具选择不准——类似名称的工具(如 notification-send-user 和 notification-send-channel)容易混淆 三是调用模式模糊——JSON 模式虽规范参数,但无法直观展示复杂格式,如日期或嵌套对象。 Anthropic 的策略是“延迟与智能”:不一次性加载所有工具,而是按需发现和调用;用代码代替自然语言来协调多步操作,减少推理轮次;并通过示例澄清用法。这些方法本质上将工具使用从静态描述转向动态执行,帮助智能体在资源有限的环境中实现复杂工作流。 三大关键技术 1. 工具搜索工具(Tool Search Tool) 这是一个“元工具”,允许智能体在运行时搜索并加载相关工具,而非预加载全部定义。工具标记 defer_loading: true 后,只有搜索工具和少数核心工具进入初始上下文。智能体可通过名称或描述动态拉取,例如查询 GitHub 任务时,只加载 github.createPullRequest。 优势:Token 节省高达 85%(从 77K 降至 8.7K),准确率提升显著(如 Claude Opus 4 从 49% 升至 74%)。实现简单:在工具数组中添加搜索配置,即可支持 MCP 的批量延迟加载。这让智能体像“智能索引”一样,高效导航庞大工具库。 2. 程序化工具调用(Programmatic Tool Calling) 智能体不再逐一用自然语言调用工具,而是生成 Python 代码在沙箱环境中执行多工具协调。工具需标记 allowed_callers: ["code_execution_20250825"],Claude 则输出包含循环、条件和并行执行(如 asyncio.gather)的代码片段。 示例:检查预算超支时,代码可并行获取团队成员、预算和支出数据,只将最终结果(如超支列表)返回给智能体,避免中间数据污染上下文。 优势:Token 减少 37%(从 43,588 降至 27,297),延迟降低(无需多轮推理),准确率在知识检索任务中从 25.6% 升至 28.5%。这特别适合处理大表格或 API 链路,如 Claude for Excel 中的批量数据分析。 3. 工具使用示例(Tool Use Examples) 补充 JSON 模式,提供输入示例来演示实际调用模式。例如,在 create_ticket 工具中,列出日期格式(YYYY-MM-DD)、嵌套对象(如 reporter)和可选参数(紧急升级)。每个工具可附 2-3 个变体示例。 优势:复杂参数准确率从 72% 跃升至 90%,尤其在 ID 格式或参数关联上。这像给智能体一份“用户手册”,让它快速掌握隐含规则。 实验结果与展望 内部基准测试显示,这些功能在 MCP 和 GIA 基准上均有提升:上下文保留率达 85%,整体准确率平均提高 10-20%。例如,在处理大型工具集时,Claude Opus 4.5 的性能从 79.5% 升至 88.1%。实际应用中,它已助力智能体无缝集成 Excel 或 Jira 等场景。
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Anthropic
#Claude
#高级工具使用
#Token 消耗降低
#AI 智能体
分享
评论 0
0
SleepyZone
4周前
今天的推:Claude Opus 4.5 is now live in XXX !
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude Opus 4.5
#XXX
#发布
#技术
#AI
分享
评论 0
0
Inty News
4周前
🔒 VilaVPN - 安全第一 隐藏IP地址 SHA256加密算法 多种加密协议 🛡️ 全面保护您的隐私 🏢 合法注册公司运营 ⚡ 高速稳定连接 🔗 了解更多: 📅 2025-11-25
#日本VilaVPN引领全球VPN市场,隐私安全成焦点· 25 条信息
#VilaVPN
#隐私保护
#安全
#高速稳定
#2025-11-25
分享
评论 0
0
RamenPanda
4周前
oai阵营和谷歌阵营都看好 token需求指数级别上涨,这是蓝海市场,不是pvp 蛋糕会做大,不是你多吃一口我少吃一口 哪个阵营fud另外一个阵营,股价跷跷板就是给你的节日大促销 半导体的多头故事都会实现,无论是nvda 还是相信oai,二阶导的amd
英伟达市值突破5万亿,币圈信心崩溃引发热议· 36 条信息
#OAI阵营
#谷歌阵营
#Token需求上涨
#蓝海市场
#半导体多头
分享
评论 0
0
Orange AI
4周前
Claude Opus 4.5 终于发布,依旧是 Coding 和 Agent 之王。 在这两个方面,比 Gemini 3 还要好。 它的智力超强,无须过多指导就能权衡取舍。 可以完成很多 Sonnet 4.5 无法完成的任务。 虽然 Opus 4.5 比 Sonnet 4.5 贵 60% 但是 Opus 在思考 token 减少 76% 的情况下,效果依然超过了 Sonnet
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Claude Opus 4.5
#coding
#agent
#Gemini 3
#Sonnet 4.5
分享
评论 0
0
小互
4周前
Anthropic 发布其最强的 AI 模型 Claude Opus 4.5 🚀 提升了推理与问题解决能力,能理解含糊内容并自动修复复杂 bug 🧠 更智能的对话记忆,支持无限制对话和自动总结 💻 软件工程性能行业领先,刷新 SWE-bench 和多语言编程纪录 ⚡ 执行效率与上下文管理优化,支持高效长时间运行 🔍 多模态能力增强,上下文扩展到 200K tokens 🎯 Plan Mode 升级,主动澄清需求并自动执行任务
Claude Skills系统发布引发AI行业新变革· 66 条信息
#Claude Opus 4.5
#AI 模型
#推理与问题解决
#软件工程
#多模态能力
分享
评论 0
0
吕立青_JimmyLv (闭关ing) 2𐃏25
4周前
Cursor 现在可以便宜用 Claude Opus 4.5,Sonnet 的价格,真香! 以及免费使用 Composer 1 模型,速度贼快,大家快冲~ 另外强烈建议安装 Claude Code 和 Codex 插件, 这是我目前最佳的模型调度一体化 GUI。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Cursor
#Claude Opus
#Composer 1
#免费
#插件
分享
评论 0
0
Jesse Lau 遁一子
4周前
tool search这个视频印象深刻,且opus 4.5的价格比4.1便宜了3倍
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#tool search
#opus 4.5
#价格
#便宜
分享
评论 0
0
supermao
4周前
这么反华的公司竟然在官网增加了简体中文 不可思议 另外就是这个 Claude Code 啥时候开源了啊? 我才刚发现
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#反华
#简体中文
#Claude Code
#开源
分享
评论 0
0
阑夕
4周前
用Gemini里的Nano Banana Pro出图有时会出现图片质量下降很严重的现象,简单来说就是图片变「糊」,这个情况你们有遇到过吗?是怎么解决的?(我是Ultra会员
nanobanana平台助力个人形象照生成,专业形象照引发热议· 107 条信息
#Gemini
#Nano Banana Pro
#图片质量下降
#图片模糊
#Ultra会员
分享
评论 0
0
sitin
4周前
想干 AI 出海,不要一开始就憋大招, 三步骤 1. 去 Product Hunt 看看每天的前几名都是什么产品。 2. 找一个简单的工具站(如 AI 头像生成),套壳一个 API, 尝试复刻一个 MVP(最小可行性产品)。 3. 解决 creem 或者 Stripe 收款账号问题
独立创业者如何突破零收入困境,迈向月入1000元· 307 条信息
#AI出海
#Product Hunt
#MVP
#工具站
#Stripe
分享
评论 0
0
Robinson · 鲁棒逊
4周前
2025.11.25 我依然认为: 学CS是认知能力足够、但缺乏家族资源的人的最优路径 CS这东西,会就是会,不会就是不会。 另外,我有一个问题非常好奇: TL上,有很多学CS的推友,在说不好找工作,面临失业问题,然后很多人在讨论,现在还推荐学CS,是一件愚蠢的事情。 但我的困惑是: 不学CS的话,对于有学习能力的孩子来说, 推荐的专业有什么? 真心求教
#AI编程:自学or科班?新旧码农之争· 156 条信息
#CS
#就业
#迷茫
#专业选择
#未来
分享
评论 0
0
铁锤人
4周前
用这个Prompt利用记忆宫殿学习英语太简单啦 之前想做出效果来的,没想到Nano Banana一个Prompt 就搞定啦 为我绘制一个详细的{{宠物商店}}场景 并标注所有物体的英语单词, 标注格式: 第一行:英文单词 第二行:音标(国际音标IPA格式) 第三行:中文翻译 真的是模型越强,啥都容易
nanobanana平台助力个人形象照生成,专业形象照引发热议· 107 条信息
#记忆宫殿
#英语学习
#Prompt
#nano banana
#宠物商店
分享
评论 0
0
sitin
4周前
买了 ultra 一直傻傻分不清区别,问了下 Gemini,对比下Google AI Pro 和 Google AI Ultra 区别,目前用的最多就是 Deep Research 但是经常出现服务器繁忙,确实很详细得到结果。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Google AI Pro
#Google AI Ultra
#Deep Research
#服务器繁忙
#AI对比
分享
评论 0
0
howie.serious
4周前
gemini 3.0 pro 的 IQ 分数出来了:历史上所有 LLM 的最高分! (IQ 测试分为两档:门萨版测试和线下/离线版测试。离线版的题目是全新设计且保密的,所有 LLM 都没看过,所以不存在背答案、或模型训练时见过等问题。通常情况下,离线版的 IQ 也会低 10~20 分。) 离线版测试,gemini 3.0 pro 的 IQ 是历史最高分,130 分; 门萨测试,gemini 3.0 pro 的 IQ 是142,比gpt-5 pro 低 1分。 平均一下,gemini 3.0 pro 的 IQ 得分也显著超过 gpt-5 pro。 (IQ分数不是衡量智能的标准,不论是人类智能还是 llm 智能,智能的结构是复杂且多维度的,但 IQ 可以作为其中一个维度。)
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 67 条信息
#Gemini 3.0 Pro
#IQ测试
#LLM
#历史最高分
#GPT-5 Pro
分享
评论 0
0
LE
4周前
Gemini Pro无敌了,用Gemini Pro帮娃检查作业,Gemini Pro像一个耐心的老师,不仅会检查作业,还会鼓励人,给足我和孩子情绪价值 最最厉害的是,它还直接针对出错的题型,生成新的可以互动的题目,太强了。 推荐需要辅导娃功课的推友都试试👍
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 67 条信息
#Gemini Pro
#作业辅导
#情绪价值
#互动题目
#积极
分享
评论 0
0
Meathill
1个月前
我发现大模型在搭建项目框架和升级框架方面的表现很差。具体来说,搭建 RN+Expo ,搭建新版 Next.js,从 Next.js 切换到 OpenNext 之类的操作,都不适合交给大模型来做。我猜测跟上下文空间和知识库有关。 不过搭建一个早一些的能用的开发框架是没问题的。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#大模型
#项目框架
#搭建
#升级
#局限性
分享
评论 0
0
Susan STEM
1个月前
计算机系真正给我的最大帮助,其实不是那些底层知识本身,而是软件工程,以及在软件工程架构里慢慢长出来的工程哲学。 就是软工这门课。 当时课程老师不鼓励我把时间花在“拼命写代码”上。我一开始就是那种特别爱写代码的人,挨批。 工程式的思考方式:结构先行、接口优先、系统性推演,而不是沉迷在代码的细枝末节里。 回头看,我现在关于工程哲学的一切核心认知,几乎都能追溯到那门软工课。
#AI编程:自学or科班?新旧码农之争· 156 条信息
#软件工程
#工程哲学
#系统性思考
#结构先行
#接口优先
分享
评论 0
0
Gorden Sun
1个月前
AI资讯日报,11月24日:
AI技术引发伦理争议,专家呼吁加强监管· 167 条信息
#AI
#资讯
#11月24日
分享
评论 0
0
上一页
1
...
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
...
248
下一页
AI 实时热榜 (24小时)
智能算法加权排行
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞