科技事件跟踪,实时事件跟踪- 第15页 news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

智能推荐信息源

由 AI 根据您的兴趣偏好筛选

2个月前

李飞飞啥时候成了“AI教母”了？红色权贵跟美国权贵的套路，先给各大美国顶级大学捐款，然后弄几篇包装的论文，或者以基金高薪招募全球顶尖人才，把人家的成果弄成公司项目，然后以老板身份对外宣发，打造人设，再请彭博社、路透社、华尔街日报、纽约时报吹捧于是一个个“AI酵母、教父”腾空出世！

DeepSeek数据泄露：德国下架，信任崩盘· 446 条信息

#李飞飞 #AI教母 #红色权贵 #学术包装 #负面

2个月前

[Anthropic 工程博客解读] 高级工具使用功能：工具搜索工具、程序化工具调用和工具使用示例三项技术结合，显著降低 Token 消耗，工具选择更明确，复杂调用更准确。 Anthropic 最近在 Claude 开发者平台上推出了高级工具使用 (advanced tool use) 功能，让 AI 智能体能够高效处理数百甚至数千个工具，而不会被上下文窗口的限制所束缚。想象一下，一个智能体需要同时操作 IDE、Git、Slack、GitHub、Jira 或数据库等系统——传统方式下，工具定义会占用海量 Token，导致上下文膨胀、工具选择错误或调用延迟。这些新功能通过动态加载、代码编排和示例指导，显著提升了智能体的实用性和可扩展性。核心挑战与应对策略构建可靠的工具使用系统面临三大痛点：一是 Token 消耗过高——例如，从多个服务（如 GitHub 和 Slack）拉取工具定义，可能瞬间吃掉 50,000+ Token 二是工具选择不准——类似名称的工具（如 notification-send-user 和 notification-send-channel）容易混淆三是调用模式模糊——JSON 模式虽规范参数，但无法直观展示复杂格式，如日期或嵌套对象。 Anthropic 的策略是“延迟与智能”：不一次性加载所有工具，而是按需发现和调用；用代码代替自然语言来协调多步操作，减少推理轮次；并通过示例澄清用法。这些方法本质上将工具使用从静态描述转向动态执行，帮助智能体在资源有限的环境中实现复杂工作流。三大关键技术 1. 工具搜索工具（Tool Search Tool）这是一个“元工具”，允许智能体在运行时搜索并加载相关工具，而非预加载全部定义。工具标记 defer_loading: true 后，只有搜索工具和少数核心工具进入初始上下文。智能体可通过名称或描述动态拉取，例如查询 GitHub 任务时，只加载 github.createPullRequest。优势：Token 节省高达 85%（从 77K 降至 8.7K），准确率提升显著（如 Claude Opus 4 从 49% 升至 74%）。实现简单：在工具数组中添加搜索配置，即可支持 MCP 的批量延迟加载。这让智能体像“智能索引”一样，高效导航庞大工具库。 2. 程序化工具调用（Programmatic Tool Calling）智能体不再逐一用自然语言调用工具，而是生成 Python 代码在沙箱环境中执行多工具协调。工具需标记 allowed_callers: ["code_execution_20250825"]，Claude 则输出包含循环、条件和并行执行（如 asyncio.gather）的代码片段。示例：检查预算超支时，代码可并行获取团队成员、预算和支出数据，只将最终结果（如超支列表）返回给智能体，避免中间数据污染上下文。优势：Token 减少 37%（从 43,588 降至 27,297），延迟降低（无需多轮推理），准确率在知识检索任务中从 25.6% 升至 28.5%。这特别适合处理大表格或 API 链路，如 Claude for Excel 中的批量数据分析。 3. 工具使用示例（Tool Use Examples）补充 JSON 模式，提供输入示例来演示实际调用模式。例如，在 create_ticket 工具中，列出日期格式（YYYY-MM-DD）、嵌套对象（如 reporter）和可选参数（紧急升级）。每个工具可附 2-3 个变体示例。优势：复杂参数准确率从 72% 跃升至 90%，尤其在 ID 格式或参数关联上。这像给智能体一份“用户手册”，让它快速掌握隐含规则。实验结果与展望内部基准测试显示，这些功能在 MCP 和 GIA 基准上均有提升：上下文保留率达 85%，整体准确率平均提高 10-20%。例如，在处理大型工具集时，Claude Opus 4.5 的性能从 79.5% 升至 88.1%。实际应用中，它已助力智能体无缝集成 Excel 或 Jira 等场景。

Claude Skills系统发布引发AI行业新变革· 66 条信息

#Anthropic #Claude #高级工具使用 #Token 消耗降低 #AI 智能体

2个月前

今天的推：Claude Opus 4.5 is now live in XXX ！

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Opus 4.5 #XXX #发布 #技术 #AI

2个月前

🔒 VilaVPN - 安全第一隐藏IP地址 SHA256加密算法多种加密协议 🛡️ 全面保护您的隐私 🏢 合法注册公司运营 ⚡ 高速稳定连接 🔗 了解更多： 📅 2025-11-25

#日本VilaVPN引领全球VPN市场，隐私安全成焦点· 25 条信息

#VilaVPN #隐私保护 #安全 #高速稳定 #2025-11-25

2个月前

oai阵营和谷歌阵营都看好 token需求指数级别上涨，这是蓝海市场，不是pvp 蛋糕会做大，不是你多吃一口我少吃一口哪个阵营fud另外一个阵营，股价跷跷板就是给你的节日大促销半导体的多头故事都会实现，无论是nvda 还是相信oai，二阶导的amd

英伟达市值突破5万亿，币圈信心崩溃引发热议· 36 条信息

#OAI阵营 #谷歌阵营 #Token需求上涨 #蓝海市场 #半导体多头

2个月前

Claude Opus 4.5 终于发布，依旧是 Coding 和 Agent 之王。在这两个方面，比 Gemini 3 还要好。它的智力超强，无须过多指导就能权衡取舍。可以完成很多 Sonnet 4.5 无法完成的任务。虽然 Opus 4.5 比 Sonnet 4.5 贵 60% 但是 Opus 在思考 token 减少 76% 的情况下，效果依然超过了 Sonnet

Claude Skills系统发布引发AI行业新变革· 66 条信息

#Claude Opus 4.5 #coding #agent #Gemini 3 #Sonnet 4.5

2个月前

Anthropic 发布其最强的 AI 模型 Claude Opus 4.5 🚀 提升了推理与问题解决能力，能理解含糊内容并自动修复复杂 bug 🧠 更智能的对话记忆，支持无限制对话和自动总结 💻 软件工程性能行业领先，刷新 SWE-bench 和多语言编程纪录 ⚡ 执行效率与上下文管理优化，支持高效长时间运行 🔍 多模态能力增强，上下文扩展到 200K tokens 🎯 Plan Mode 升级，主动澄清需求并自动执行任务

Claude Skills系统发布引发AI行业新变革· 66 条信息

#Claude Opus 4.5 #AI 模型 #推理与问题解决 #软件工程 #多模态能力

吕立青_JimmyLv (闭关ing) 2𐃏25

2个月前

Cursor 现在可以便宜用 Claude Opus 4.5，Sonnet 的价格，真香！以及免费使用 Composer 1 模型，速度贼快，大家快冲～另外强烈建议安装 Claude Code 和 Codex 插件，这是我目前最佳的模型调度一体化 GUI。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Cursor #Claude Opus #Composer 1 #免费 #插件

Jesse Lau 遁一子

2个月前

tool search这个视频印象深刻，且opus 4.5的价格比4.1便宜了3倍

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#tool search #opus 4.5 #价格 #便宜

2个月前

这么反华的公司竟然在官网增加了简体中文不可思议另外就是这个 Claude Code 啥时候开源了啊？我才刚发现

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#反华 #简体中文 #Claude Code #开源

2个月前

用Gemini里的Nano Banana Pro出图有时会出现图片质量下降很严重的现象，简单来说就是图片变「糊」，这个情况你们有遇到过吗？是怎么解决的？（我是Ultra会员

nanobanana平台助力个人形象照生成，专业形象照引发热议· 107 条信息

#Gemini #Nano Banana Pro #图片质量下降 #图片模糊 #Ultra会员

2个月前

想干 AI 出海，不要一开始就憋大招，三步骤 1. 去 Product Hunt 看看每天的前几名都是什么产品。 2. 找一个简单的工具站（如 AI 头像生成），套壳一个 API，尝试复刻一个 MVP（最小可行性产品）。 3. 解决 creem 或者 Stripe 收款账号问题

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#AI出海 #Product Hunt #MVP #工具站 #Stripe

Robinson · 鲁棒逊

2个月前

2025.11.25 我依然认为：学CS是认知能力足够、但缺乏家族资源的人的最优路径 CS这东西，会就是会，不会就是不会。另外，我有一个问题非常好奇： TL上，有很多学CS的推友，在说不好找工作，面临失业问题，然后很多人在讨论，现在还推荐学CS，是一件愚蠢的事情。但我的困惑是：不学CS的话，对于有学习能力的孩子来说，推荐的专业有什么？真心求教

#AI编程：自学or科班？新旧码农之争· 156 条信息

#CS #就业 #迷茫 #专业选择 #未来

2个月前

用这个Prompt利用记忆宫殿学习英语太简单啦之前想做出效果来的，没想到Nano Banana一个Prompt 就搞定啦为我绘制一个详细的{{宠物商店}}场景并标注所有物体的英语单词，标注格式：第一行：英文单词第二行：音标（国际音标IPA格式）第三行：中文翻译真的是模型越强，啥都容易

nanobanana平台助力个人形象照生成，专业形象照引发热议· 107 条信息

#记忆宫殿 #英语学习 #Prompt #nano banana #宠物商店

2个月前

买了 ultra 一直傻傻分不清区别，问了下 Gemini，对比下Google AI Pro 和 Google AI Ultra 区别，目前用的最多就是 Deep Research 但是经常出现服务器繁忙，确实很详细得到结果。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Google AI Pro #Google AI Ultra #Deep Research #服务器繁忙 #AI对比

2个月前

gemini 3.0 pro 的 IQ 分数出来了：历史上所有 LLM 的最高分！（IQ 测试分为两档：门萨版测试和线下/离线版测试。离线版的题目是全新设计且保密的，所有 LLM 都没看过，所以不存在背答案、或模型训练时见过等问题。通常情况下，离线版的 IQ 也会低 10～20 分。）离线版测试，gemini 3.0 pro 的 IQ 是历史最高分，130 分；门萨测试，gemini 3.0 pro 的 IQ 是142，比gpt-5 pro 低 1分。平均一下，gemini 3.0 pro 的 IQ 得分也显著超过 gpt-5 pro。（IQ分数不是衡量智能的标准，不论是人类智能还是 llm 智能，智能的结构是复杂且多维度的，但 IQ 可以作为其中一个维度。）

AI高考数学测试：O3意外落后，Gemini夺冠引发热议· 67 条信息

#Gemini 3.0 Pro #IQ测试 #LLM #历史最高分 #GPT-5 Pro

2个月前

Gemini Pro无敌了，用Gemini Pro帮娃检查作业，Gemini Pro像一个耐心的老师，不仅会检查作业，还会鼓励人，给足我和孩子情绪价值最最厉害的是，它还直接针对出错的题型，生成新的可以互动的题目，太强了。推荐需要辅导娃功课的推友都试试👍

AI高考数学测试：O3意外落后，Gemini夺冠引发热议· 67 条信息

#Gemini Pro #作业辅导 #情绪价值 #互动题目 #积极

2个月前

我发现大模型在搭建项目框架和升级框架方面的表现很差。具体来说，搭建 RN+Expo ，搭建新版 Next.js，从 Next.js 切换到 OpenNext 之类的操作，都不适合交给大模型来做。我猜测跟上下文空间和知识库有关。不过搭建一个早一些的能用的开发框架是没问题的。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#大模型 #项目框架 #搭建 #升级 #局限性

2个月前

计算机系真正给我的最大帮助，其实不是那些底层知识本身，而是软件工程，以及在软件工程架构里慢慢长出来的工程哲学。就是软工这门课。当时课程老师不鼓励我把时间花在“拼命写代码”上。我一开始就是那种特别爱写代码的人，挨批。工程式的思考方式：结构先行、接口优先、系统性推演，而不是沉迷在代码的细枝末节里。回头看，我现在关于工程哲学的一切核心认知，几乎都能追溯到那门软工课。

#AI编程：自学or科班？新旧码农之争· 156 条信息

#软件工程 #工程哲学 #系统性思考 #结构先行 #接口优先

2个月前

AI资讯日报，11月24日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月24日

... ...