科技实时新闻、最新快讯- 第281页 news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

那年今日

美国投资银行雷曼兄弟宣布破产，引发全球金融海啸，成为2008年全球金融危机深化的重要标志

苏联“月球2号”探测器发射升空，成为首个抵达月球表面的人造物体

智能推荐信息源

由 AI 根据您的兴趣偏好筛选

东方网-上观新闻

2个月前

场面｜徐汇“硅谷”：淀浦河畔崛起AI小镇

#徐汇 #硅谷 #AI小镇 #淀浦河 #人工智能

2个月前

关于 GPT-4.5/5 及更多信息的摘要：太长不看版 GPT-4.5 (“Orion” / 猎户座) * 最初以 Orion 为代号开发，并计划作为 GPT-5 发布。 * 性能令人失望：与 GPT-4o 相比没有重大飞跃。 * 失败原因： * 用于预训练的高质量网络数据日益枯竭。 * 优化方法在小模型上有效，但无法扩展到大模型。 * 后果：于 2025 年 2 月作为 GPT-4.5 发布，并迅速失去了重要性。 GPT-5 * 焦点：侧重于实用性改进，而非量子跳跃式的发展。 * 编程与数学：能编写更简洁、功能更丰富、用户体验更友好的代码。 * 智能体能力：更擅长处理复杂的任务列表和边缘案例（例如，客服退款）。 * 效率：能更高效地使用计算资源，在不大幅增加算力消耗的情况下提供高质量答案。 * 新技术： * 采用强化学习与“通用验证器”（Universal Verifier），该验证器能自动核查答案。 * 基于 o 系列（o1, o3）的经验，该系列在纯推理任务上表现强劲，但在聊天对话中性能下降。 * 结果：实现了增量式但具有商业价值的改进——但并非像 GPT-3 到 GPT-4 那样的飞跃。问题与内部动态 * 技术障碍： * 聊天模型（“学生模型”）的性能下降。 * 预训练的局限性和数据稀缺。 * 内部矛盾： * 研究人员因 Meta 的优厚薪酬（锁定式合同）而离职。 * 研究与商业之间的冲突：抵制与微软建立过于紧密的关系。 * 研究主管 Mark Chen 与副总裁 Jerry Tworek 在 Slack 上发生公开摩擦；同时，Mark Chen 在团队重组和研究员离职事件中也是一个有争议的人物。与微软的交易 * 微软拥有到 2030 年的独家权利，并计划在营利性公司架构中持有约 33% 的股份。 * 战略性谈判正在进行中，同时 OpenAI 正在为可能的 IPO 做准备。

#GPT-4.5性能未达预期 #GPT-5侧重实用性改进 #OpenAI内部矛盾 #OpenAI与微软合作 #AI模型发展瓶颈

2个月前

The Information：揭秘 OpenAI GPT-5 崎岖的研发之路 OpenAI 在开发 GPT-5 过程中遭遇的种种困境，预示着整个行业 AI 进展的放缓。研究人员相信，强化学习领域的进步将有助于克服这一障碍。核心要点 • GPT-5 将展现出超越其前辈的实质性改进，但其性能上的提升将无法与早期 GPT 系列模型的性能飞跃相提并论。 • 今年，OpenAI 遭遇了一系列技术难题，使其 o3 及其他模型的研发一度陷入困境。 • 研究主管 Mark Chen 与一位副手之间的分歧在内部通讯工具 Slack 上被公之于众。

#OpenAI #GPT-5 #研发困境 #Mark Chen #AI进展放缓

2个月前

filo email 的作者不知道在不在推上混，app非常好用，就是有个特别尴尬的bug，reply all这个按钮点了没用

#filo email #App #reply all bug #用户体验 #软件问题

2个月前

有时候看 AI 回复，也挺同情+无奈的。

#AI #同情 #无奈

新浪新闻-新浪新闻综合

2个月前

美国“龙”飞船执行新一期载人航天任务前往空间站

来源：财联社财联社8月2日电，美国太空探索技术公司的“龙”飞船1日从美国佛罗里达州发射升空，搭载4名来自美国、日本和俄罗..._新浪网

#美国 #太空探索技术公司 #龙飞船 #发射升空 #国际合作

2个月前

我说Grok是个智障，还有很多人不满意。看看这两天满屏的自画像吧，明明都是用中文的小黄人，结果画出来的绝大多数都是黑人，还有半白人、棕色人种，就没见过一个黄种人。不是智障是什么？

#Grok #智障 #AI偏见 #种族歧视 #中文小黄人

2个月前

现在很多 Context Engineering 谈的是如何构建 AI Agents 用到的技术，对于普通人未必适用，我总结了一点普通人使用 AI 时用得上的 Context Engineering。 Context Engineering 核心是两点：一、更少的上下文二、更准确的上下文一、更少的上下文这条有点反常识，现在提示词都超长，似乎提示词不长就不好了，但实际上，提示词太长会影响生成结果，产生幻觉，尤其是太多无关的内容在上下文更会如此。对此两点注意的： 1). 多开新会话而不是同一个会话一直聊当你会话太长，后续你发的内容，AI 不容易抓住重点，可能会忘记你前面说的，最好是到一定程度，让 AI 帮你总结一下重点，然后新开会话。如果是和当前会话无关的任务，直接新开会话。 2). 一次一个小的任务，而不是太复杂的任务这有点像人，当你任务太多太复杂，AI 很难完成好，但是你让 AI 一次完成一个小任务，就好很多。二、更准确的上下文准确的上下文好理解，就是让 AI 更准确的知道你想要什么，以及它有完成任务所需要的信息要让 AI 获得更准确的上下文，有两种主要方式，这两种方式互为补充。一种就是我们提供准确和充足的上下文给 AI，另一种就是让 AI 帮我们找到上下文。 1. 我们提供准确和充足的上下文给 AI AI 并不知道我们知道的信息，所以我们需要主动告诉AI我们知道它不知道的信息，比如说让AI帮我写简历，那我得把我的信息都告诉AI，不然它也写不出来。使用AI写代码，一个实用的技巧就是把你知道的相关的文件都提供给它参考，让它可以读到文件内容，这样它就不会遗漏重要信息。 2. 让 AI 帮我们找到上下文现在 AI Agent 都有能力帮我们找上下文，但能力有好优化，对于普通人来说，这几点直观重要： 1). 选擅长 Agent 任务模型 Claude 4 Opus/Sonnet, OpenAI o3 是 Agent 效果最好的，现在国产的很多专门为 Agent 优化过的模型也很强了，比如 Doubao Think 1.6, GLM 4.5, Kimi K2 等等 2). 为 AI 提供合适的工具 Agent 最重要的就是有工具能力，能借助工具去找上下文，但是它只有内置的几个工具，有时候需要你提供额外的工具会更有效，比如现在的 MCP 工具，可以让 AI 访问到一些内部的数据，或者操作浏览器等等。编程的时候，我自己有个常用的技巧：就是让 AI 写测试代码，并告诉AI如何测试单个文件，这样 AI 就可以自己去验证自己写的结果，实现完功能写测试，写完测试运行，运行出错去修复，直到完成，这样不需要太多干预就可以得到不错的结果，当然还是要人工审查一下，有时候 AI 为了通过测试会无所不用其极…… 3). 让 AI 先做计划，避免在错误的方向越走越远对于复杂一点的任务，如果AI方向错了，就会在错误的方向越走越远，白白浪费tokens，现在像 Claude Code 这样的AI Agent都会有Plan mode，就是先做计划，做完计划仔细看一下计划内容，如果方向不对，就需要让它改正，或者直接重开新会话，调整提示词，让 AI 搞清楚正确的方向是什么，方向对了再去执行。上面就是我整理的一点经验技巧，希望对你有用，也欢迎交流分享。

#AI #Context Engineering #提示词优化 #AI Agent #任务分解

2个月前

做汉化那么多年，确实观察到英文互联网相比中文互联网的几个有意思的特点： 1. 经常引用别人的网页 2. 可以找到很多远古网页 3. 有很多互联网老玩家

#互联网文化 #汉化 #英文互联网 #中文互联网 #互联网老玩家

大喵CS、转码、预科班(9年讲师，能够教你学会编程)

2个月前

c语言第二节课讲c的函数调用怎么编译到汇编大家都表示能听明白什么档次

#C语言 #函数调用 #汇编 #编程 #教学

新华网-新华社

2个月前

科学与健康｜减重“长征”贵在坚持科学认知告别焦虑

科学与健康｜减重“长征”贵在坚持科学认知告别焦虑-减重门诊专家如何看待减重药物？到底哪种程度的肥胖需要医疗干预？8月1日，《中国公众健康减重认知与科学用药》报告在京发布，记者采访了有关专家。

#减重 #肥胖 #医疗干预 #专家 #健康

2个月前

看到 Nginx 支持 QuickJS 的新闻了，想起 Pipy 貌似原生就支持 JavaScript，刚看了下，这个精巧的项目还在持续活跃中

#Nginx #QuickJS #Pipy #JavaScript #技术

2个月前

Agent不稳定，Workflow局限性且搭建费时间，有没有折中的方案？谷歌出了一个实验性产品：Opal，AI生成workflow。优点：文字生成workflow，简单快速，支持手动修改；集成谷歌家几乎所有的模型，LLM（flash和pro）、AI绘画（flash 2.0 image和Imagen 4）、AI视频（Veo 3）、Deep Research和任务规划、AI语音（AudioLM）、AI音乐（Lyria 2）、联网搜索、关联谷歌文档；免费，有不少生成视频和图片的次数；可以创建可公开访问的网页，别人能便捷地使用你的工作流；缺点：只有谷歌自家产品，能力局限；生成语音不支持中文，中文整体支持都一般；

#Opal #AI工作流生成 #谷歌AI #实验性产品 #多模态AI

2个月前

iPhone 真的那么好用吗？我大概在大学时候用过一次 iPhone，感觉这个手机挺封闭的，很多安卓手机的常用功能都没有最近准备开发手机录屏了，想入一台测试的机器，有推荐吗？

#iPhone #用户体验 #封闭系统 #录屏开发 #手机推荐

2个月前

15 年老 Objective-C 开发者今天又学会了新东西，原来早在 Clang 10.0 就加入了 struct 中使用 ARC 指针的支持，我还在这自己写 CFRetain/CFRelease 呢🤦‍♂️ （这次不是 AI 教的，Gemini 和 o3、opus 也都不知道，我无意间发现没加 __unsafe_unretained 编译通过了，去翻 clang 文档才知道）

#Objective-C #Clang 10.0 #ARC指针 #CFRetain/CFRelease #技术学习

2个月前

ACL 2025 最佳论文前两天公布了，俗话说：错过ACL 2025 = 在AI 2.0时代掉队🤣 于是今天一早，在 G 老师的协助下，火速拜读了由 DeepSeek & 北大等联合发表的论文：《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。 📝 一句话总结：这篇论文不仅提出了一个新的 Attention 结构，更重要的是，它为“大模型在训练和推理阶段如何高效处理长上下文”这个老大难问题，给出了一个真正可落地、可扩展的结构性解法。 𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅 01｜先捋清楚：长上下文处理，难点在哪？原始 Transformer 的 Attention 是全连接的 —— 每一个 token 都要跟前面所有 token 做一次注意力计算。这种结构虽然简单有效，但当上下文长度从 2K 增加到 64K 时，计算量和内存需求就会指数级飙升，直接拖垮效率。比如当前主流大模型是“自回归”地一个词一个词生成，也就是说每输出一个 token，都要重新读并计算之前所有的 token，导致 GPU 明明计算力挺强，但要一直等计算完才行 —— 这就像在做阅读理解题，每写一个字，都得从头看前面写了啥。所以写得慢，不是因为不会写，而是因为每次回看太耗时间了。 NSA 论文也指出，在处理 64K token 的长上下文时，光是 Attention 模块里的 Softmax 操作就占了70~80% 的推理延迟，很影响效率。 02｜稀疏化注意力早就被提出了，为什么以前都没完美解决难题？其实很多人早就尝试用“稀疏注意力”来减轻计算压力，比如BigBird：滑动窗口 + 全局 token + 跳跃连接、ClusterKV：对 token 做语义聚类，只关注代表性 token等等。但这些方法基本都只能在“推理阶段”用，训练阶段模型根本学不会怎么选重点。更致命的是：很多稀疏策略是离散不可导的，模型压根无法“学着自己调整关注重点”。通俗点说：以前的方法更像是“临时抱佛脚看重点”，而不是“从一开始就学会划重点”。所以模型最终也就学不到真正高效理解文本的能力，无法从根本解决长上下文的挑战。 03｜NSA 的核心创新：让模型从训练第一天起就学会“划重点” 它是怎么做到的？由两大关键组成：三分支注意力机制 + 可微分门控融合。三分支注意力机制： 1️⃣ 压缩注意力：快速扫一眼，抓全局概念。➡️ 类似于看目录、抓关键词。 2️⃣ 选择注意力：选择重要的内容看 ➡️ 类似跳读找重点，精准阅读。 3️⃣ 滑动注意力：保留局部上下文信息，确保语义连贯。➡️ 类似连着上下文看，不跳行。可微分门控融合：前面说的三种注意力机制并不是互斥的，而是并行存在的。然后在NSA 中每个 token 都通过一个小的门控网络（MLP）生成三个融合权重，对三路注意力输出加权平均。这一步很关键： ✅ MLP 是可微分的，意味着这些权重是可训练的； ✅ 每个 token 都可以根据自己的上下文内容，动态决定到底用多少“扫一眼”，用多少“挑重点”，用多少“连着看”。 👉 换句话说，模型就像有了内建的“阅读策略”：该扫一眼时扫一眼、该精准跳读时跳读、该连着读时不跳行，从头到尾都在自主划重点。 04｜还有一项关键突破：硬件对齐优化以往稀疏 Attention 最大的难点之一是：你虽然选中了 10 个重点 token，但它们分布在 GPU 内存中各个角落，导致读取时要跳来跳去，访问成本高，效率不升反降。 NSA 在执行上设计了原生的可训练稀疏 Attention 路径，并和底层硬件执行方式做了深度对齐 —— 虽然细节略复杂，但结论很清晰。 05｜那实际效果怎么样？来看多个维度的评测： ❇️ 通用任务（如 MMLU、HumanEval）：9个基准中7项优于全Attention ❇️ 长文本任务（如 LongBench）：在64K tokens下准确率保持100% ❇️ 链式推理任务（如 AIME 数学题）：在8K/16K上下文下大幅超越全Attention，推理逻辑能力更强更重要的是：这些性能是在显著降低显存和推理延迟的同时实现的。 𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅𝌅 📍总结一下：过去做不出NSA，是因为“划重点”的方法太随机、太粗暴，模型既学不会也算不快。而NSA则把“划重点”变成一种可以训练的能力，还找到了让GPU快速配合的方法，真正让稀疏注意力从“理想”变成了“实用”。如果你也对这个领域感兴趣，NSA 的论文绝对值得啃完一遍。毕竟——长上下文不是下一个挑战，而是现在的主战场。 #AI #NSA #ACL2025NLP #Studylog #DeepSeek

#ACL 2025 #长上下文处理 #稀疏注意力 #DeepSeek #硬件对齐优化

野原新之栋 Sintone

2个月前

🍵录屏软件哪家强，ScreenSage so strong？

#录屏软件 #ScreenSage #软件评测 #工具推荐 #中性

2个月前

上二休五：形容一种周一到周五忙公司的事情，周末才有两天时间好好写代码的人一种状态。

#上二休五 #程序员 #工作日忙碌 #周末写代码 #时间分配

2个月前

流感和新冠感染会唤醒休眠的癌细胞？ 2025年7月31日，科罗拉多大学研究团队在《Nature》期刊上发表研究论文。研究显示，流感、新冠等呼吸道病毒感染，可能会唤醒肺部处于休眠状态的乳腺癌细胞，导致癌症复发和转移风险显著增加。通过小鼠模型和人类数据发现，呼吸道病毒感染会引发炎症反应，进而促进休眠癌细胞的增殖和转移，强调了呼吸道病毒感染对癌症复发的重大影响。

#流感 #新冠 #癌症复发 #科罗拉多大学 #Nature期刊

东方网-上观新闻

2个月前

这场数字要素领域的重大赛事在松江举办，以赛为媒赋能工业数...

#数字要素 #松江 #工业数

2个月前

近日，澳大利亚莫纳什大学研究团队在《糖尿病与代谢》杂志上发表研究论文。研究显示，无论是含糖饮料还是人工甜味剂饮料，每天饮用都与糖尿病风险增加相关，每天饮用含糖饮料与糖尿病风险增加23%相关，每天饮用人工甜味剂饮料与糖尿病风险增加38%相关。

#莫纳什大学 #糖尿病风险 #含糖饮料 #人工甜味剂饮料 #健康警示

2个月前

Lovart这样一个和图片打交道的产品，居然不支持在输入框粘贴图片文件。。。

#Lovart产品 #图片粘贴功能缺失 #用户吐槽 #产品体验负面 #输入框

2个月前

今天在设计公司的新logo，听说 edge 浏览器可以无限使用 4o 生图了于是就打开使用试试真的又快又不要钱以及4o生图在创意性方面吊打其他所有模型玩得根本停不下来不知道微软是准备长期供应还是短期用来做增长但是我发一下，应该不至于给它奶崩吧。。。

#Edge浏览器 #4o生图 #免费 #创意性强 #微软

2个月前

互联网的信息传递渠道应该是这样😅

#互联网 #信息传递 #渠道

东方网-上观新闻

2个月前

这些AI游戏获奖！“数龙杯”全球AI游戏及应用创新大赛颁...

#AI游戏 #数龙杯 #创新大赛 #颁奖 #积极

... ...