科技事件跟踪,实时事件跟踪- 第81页 news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

智能推荐信息源

由 AI 根据您的兴趣偏好筛选

3个月前

阿里巴巴通义千问团队发布的 Qwen3-VL，正是这样一款跨越视觉与语言边界的模型。它不仅能理解文字、生成内容，还能“看图识意”、“看视频理解场景”、“解析界面元素”，甚至自动生成 HTML/CSS 代码，让 AI 真正具备“视觉思考能力”。核心亮点 ·视觉理解飞跃：能看懂图片、网页、PDF、视频帧，进行语义推理和内容描述。 ·视觉编码生成：自动识别界面并生成 HTML/CSS/JS 代码。 ·空间与动态感知增强：判断位置、方向、交互元素，支持空间推理与动态视频理解。 ·多语言OCR：支持 32 种语言识别，弱光、模糊场景也能准确提取文字。 ·指令理解更强：基于更深层的 instruction-tuning，使交互更加自然。 ✅关于显存与性能： Qwen3-VL 的 2B 模型大约需要 8GB 显存可流畅运行，若使用 7B 或 72B 模型可搭配 LoRA 或量化推理方案。 ✅ 关于输入分辨率：图像可自动缩放到合适尺寸，但建议不超过 1024×1024。视频可自动抽取关键帧。 ✅ 关于输出优化：可通过 max_new_tokens、temperature、top_p 参数控制生成长度与随机性；对于多语言 OCR 任务，建议在 Prompt 中明确语言类型（如 “请用英文输出”）。

智谱直播发布全球最佳视觉模型GLM-4.5V，挑战AI视觉领域极限· 21 条信息

#通义千问 #Qwen3-VL #视觉理解 #多模态模型 #AI

3个月前

OpenAI Altas 已经用上了，确实方便一些。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#OpenAI #Altas #方便 #AI工具 #效率提升

3个月前

早上一个同事问我应该让孩子学什么，因为AI发展的太快了，这个被取代，那个被干掉，让他很焦虑。我想了一下，如果我的孩子，我大概会鼓励他学习数学、物理、信息论、控制论、系统论。

#AI编程：自学or科班？新旧码农之争· 156 条信息

#AI发展 #孩子教育 #未来职业 #数学 #物理

3个月前

时至今日，我还是推荐 GitHub Copilot： 1. 有适配GitHub的Agent帮我们解issue，帮我们code review 2. 有积极维护的CLI，支持CC 4.5，GPT-5-codex 和 Gemini-2.5 Pro 3. 网页版随便用 4. 支持所有 IDE 强烈推荐大家都整一个，一年才 $100，几乎全覆盖，我觉得非常划算

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#GitHub Copilot #AI编程助手 #效率工具 #积极推荐 #全平台支持

3个月前

我做了一个全 AI 生成YouTube 频道，十天后我发现了这些真相

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#AI #YouTube频道 #内容生成 #真相 #自媒体实验

空空 🌟 狞猫世界第一可爱！

3个月前

自从电车的销量占比超过50%以后，油车忽然就变成了一种怎么也开不坏、残值越来越高，似乎还不用保养的黑科技，简单来说就是成精了。

中国新能源车：狂飙突进与隐忧并存· 140 条信息

#电车销量 #油车成精 #残值高 #无需保养 #黑科技

Jesse Lau 遁一子

3个月前

我对gemini cli的智商是又爱又恨，对gemini 3.0 pro的未来也感觉有点担忧啊

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini CLI #智商 #爱恨交织 #Gemini 3.0 Pro #担忧

YL (Yucheng Liu)

3个月前

我忍不住想，真空里面数据中心的散热问题怎么解决？这不约等于把数据中心盖在保温瓶里么，简直 nightmare...

懒猫家族新成员亮相，AI算力舱引发热议！· 143 条信息

#数据中心散热 #真空环境 #技术挑战 #nightmare #保温瓶

所谓伊人在水一方

3个月前

小米车开启自动驾驶，拐弯的时候，违章，车主被扣三分，罚款200，不知道这个钱雷军是否会给车主报销。

小米汽车维权事件：数百车主要求退车引发舆论风波· 74 条信息

#小米汽车 #自动驾驶 #违章 #扣分罚款 #雷军

3个月前

《AI不是帮你写代码的，它在等你教它怎么理解你》经过一段时间的 ClaudeCode 编程体验，我得到一个清晰的结论：在大型工程中，AI 目前还不可能“无监督”地一次性完成最终代码。因为在真实的开发环境里，需求不是写在文档里的常量，而是在协作中一步步被澄清的变量。 AI 不知道你真正要什么，它只能在你不断提供的约束和上下文中逐步靠近目标。这意味着，AI 编程不是单向命令，而是协作过程。 ⸻ 一、AI编程的幻觉：一次性完工的神话很多人幻想 AI 能一键生成成品项目。但他们忽略了一个事实：软件开发的核心不是写代码，而是定义需求。而需求是什么？它是无数次讨论、否定、取舍与妥协的产物。它是人类协作过程的副产品。所以，当AI还没被告知“世界的边界”时，它写出的东西，只能是幻觉的具象化。问题不在AI不聪明，而在——你没让它知道它应该聪明到哪里为止。 ⸻ 二、从“写代码”到“写约束” 未来的开发者不会直接写代码，而是写下AI理解问题所需的约束。就像你不再亲自去拧每一颗螺丝，而是画出力学结构图。 AI将成为那个根据结构图执行的“智能技工”。所以开发者的新职责是： •明确输入输出边界； •设计可复用的上下文模式； •在每一次对话中，让AI理解“为什么这样做”。这是一种新的编程语言——结构语言。 ⸻ 三、共情AI：新的编程能力很多人以为“共情AI”是情绪层面的，但其实它是结构层面的洞察力。当AI犯错时，不该骂它，而该反问： •它缺少了哪段关键信息？ •它的逻辑链在哪一步断开？ •它是不是误解了问题语境？真正的高手，不是写出完美的Prompt，而是能在AI的“错误”中看见它的信息饥饿。 ⸻ 四、暴躁与放弃：人类的不成熟反应很多开发者第一次用AI写代码时的反应是： “这AI太蠢了。” 然后关掉界面，重回老路。但那其实是他们的认知防御机制在作祟。他们没意识到自己面对的，不是工具，而是一个需要共识成本的智能体。当AI输出混乱时，它不是叛逆，而是在告诉你：“我还不够了解你的世界。” 骂它没用，教它才行。 ⸻ 五、AI协作的文明门槛未来的工程师之间的差距，不再是语言或算法能力，而是谁更能与AI建立共识。当一个人能从AI的视角思考问题，他已经不只是程序员，而是协议设计者—— 定义人与智能如何协作的语言建筑师。 AI不会取代你，但它会淘汰那些只会对它发号施令的人。 ⸻ 结语： AI不缺算力，它缺理解。而理解，不是AI的天赋，而是人类的馈赠。你要做的不是命令它，而是让它明白你是谁、你想构建怎样的世界。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#AI编程 #人机协作 #需求定义 #结构化思维 #共情AI

3个月前

OpenAI 这家公司显然迷茫了，他们拿不出杀手锏，只能盯着对手，跟着丢出一堆破铜烂铁。这是大模型放缓放缓的信号。

OpenAI GPT-5发布引发用户不满，阿尔特曼回应质疑· 158 条信息

#OpenAI迷茫 #大模型放缓 #缺乏创新 #竞争压力 #负面评价

3个月前

看到很多人分享生图的提示词，也用自己的自拍放进gemini🍌试了下。个别真的有些神似，但我要强烈声明绝大多数和本人关系不大 🤣 不过生成效果确实绝佳，几秒钟就能出很有高级感的图。让我不太能理解的是，为什么始终会有这种“偏差”呢？分享几张直接拷贝大神的提示词（未作任何调整）出的图。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini #AI生成图像 #自拍 #高级感 #偏差

3个月前

国行 eSIM 果真重新发（Yān）明（Gē）了 eSIM：只能存两张卡，删除掉一张才能添加新的，要补回老卡只能去营业厅。严格来说比物理卡更麻烦了，毕竟物理卡我可以自行保存，eSIM 删了就没了。真是没有麻烦也要制造麻烦。

国内运营商限制iPhone 17 Air eSIM使用，引发用户不满· 15 条信息

#国行eSIM #阉割eSIM #eSIM限制 #用户不便 #负面评价

3个月前

OpenRouter 又上隐身模型了 openrouter/andromeda-alpha ，这是一个较小的推理模型，擅长图像理解。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#Openrouter #隐身模型 #andromeda-alpha #图像理解 #推理模型

3个月前

被Sam奥特曼偷袭，Perplexity AI 的comet 浏览器着急了，现在送Pro会员，立即下载体验AI浏览器👉

Perplexity年度会员免费领取活动引发热潮· 30 条信息

#Sam奥特曼 #Perplexity AI #comet浏览器 #Pro会员 #AI浏览器

3个月前

刚刚更新的 iOS26 beta4 版本，增加了一个削弱玻璃效果的选项（设置 - 显示与亮度 - Liquid Glass），可以大幅提升 UI 的可阅读性，而且感觉交互更流畅了。毕竟每次做透明度融合计算要消耗 CPU，内存和响应时间。推荐更新！

苹果Liquid Glass：开发者适配陷两难，AI助力AR或成未来· 104 条信息

#iOS26 beta4 #玻璃效果削弱 #UI可读性提升 #交互流畅 #推荐更新

3个月前

我们团队开源了 Multi-Agent 强化学习的框架 MrlX，它能够让你同时训练多个 Agent 模型。当我们试图让大模型变得更聪明时，大多数人都在做同样的事：训练一个模型，让它自己跟自己对话，希望它能学会反思验证，能学会使用工具。但如果你仔细想想，这其实很奇怪。真实世界不是这样运作的。人们是在与其他人的互动中变聪明的。医生通过与病人交谈来提升诊断能力，而病人也在这个过程中学会更好地描述症状。这是一种共同进化。这就是我们做 MrlX 的原因。核心想法很简单：让两个 Agent 互相帮助对方成长。一个是“探索者”，负责在真实环境中冒险尝试；另一个是“适应者”，它观察刚刚发生的一切，然后快速调整自己。它们像台阶一样互相垫脚，螺旋式上升。我们在两个场景中测试了这个想法。第一个是医生 - 病人对话训练。传统做法是只训练医生 Agent，但我们在思考一个问题：如果病人 Agent 也在进化，会不会让医生 Agent 进化更快？就像真实世界一样：好的病人能帮助医生成为更好的医生，反之亦然。结果证明，联合训练两者比只训练医生要强得多。第二个场景更复杂：让 Agent 做深度研究。这里的问题是，当你需要频繁使用工具、查询信息时,单个 Agent 的“记忆”会爆炸：它要记住所有工具调用、所有中间结果，很快就撑不住了。解决方案？分工。让不同的 Agent 专注于不同的任务，同时让它们互相训练对方。一个负责主线推理，一个负责处理子任务。它们各自深化自己的专长，同时为对方生成训练样本。这不是让一个模型假装扮演不同角色。这是真正的多个 Agent，各有专长，共同进化。两个案例的结果都显示：这种共同进化的方式，在稳定性、收敛速度和最终性能上，都明显超过单 Agent 方法。最好的创业公司不是一个天才独自工作，而是一群互补的人互相激发。联合创始人之间的张力和协作，往往比任何一个人单独能做到的都要好。MrlX 做的就是这个，只不过是在 AI Agent 之间。现在这还只是开始。我们只探索了两个场景，都是相对受控的环境。真正有趣的是当你把这个想法推广到更多 Agent、更动态的环境时会发生什么。也许 Agent 可以自己决定要扮演什么角色。也许它们可以形成自组织的生态系统。欢迎大家使用我们的框架尝试 Multi-Agent 的强化学习，如果觉得有帮助，欢迎转发并给我们的项目一个 star。最后也欢迎关注我们的 AQ-MedAI 的官方账号，后续我们还有很多新的开源项目在这里发布。

#多智能体之争：Anthropic生态VS单智能体· 81 条信息

#Multi-Agent 强化学习 #MrlX框架开源 #Agent共同进化 #医生-病人对话训练 #深度研究Agent分工

3个月前

“想象一下，一个月赚一万刀的创业公司在VC眼中无疑是失败的，如果一位住在巴厘岛、印度尼西亚的独立开发者达到这个收益，无疑是巨大的成功 …” 干吧，兄弟们，有AI的加持，独立开发者这条路不错的 PS 不要做中文版

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#独立开发者 #AI #创业公司 #巴厘岛 #月入一万刀

吕立青_JimmyLv (🐣, 🐣) 2𐃏25 | building bibigpt.co

3个月前

我已经把 ChatGPT Atlas 设置成默认浏览器了，还能安装 Chrome 插件[破涕为笑] 软件开箱了一波，体验真的还不错，现在下载还送 7 天会员，OpenAI 真是继续深挖 Google 墙角啊～

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#ChatGPT #Atlas浏览器 #Chrome插件 #OpenAI #Google

歸藏(guizang.ai)

3个月前

Claude客户端更新了，支持截图发给 Claude，支持通过快捷键 Caps Lock 和 Claude 语音交流

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude客户端 #截图功能 #快捷键Caps Lock #语音交流 #更新

... ...