时政
财经
科技
虚拟货币
其他
登录
智能推荐信息源
李老师不是你老师
关注
德潤傳媒
关注
悉尼閑人
关注
联合早报 Lianhe Zaobao
关注
DW 中文- 德国之声
关注
ABC中文
关注
Gancheng Wang
关注
Ignatius Lee
关注
《议报》
关注
网易新闻-红星新闻
关注
由 AI 根据您的兴趣偏好筛选
事件跟踪
热点事件
最新话题
实时新闻
sitin
2个月前
阿里巴巴通义千问团队发布的 Qwen3-VL,正是这样一款跨越视觉与语言边界的模型。 它不仅能理解文字、生成内容,还能“看图识意”、“看视频理解场景”、“解析界面元素”,甚至自动生成 HTML/CSS 代码,让 AI 真正具备“视觉思考能力”。 核心亮点 ·视觉理解飞跃:能看懂图片、网页、PDF、视频帧,进行语义推理和内容描述。 ·视觉编码生成:自动识别界面并生成 HTML/CSS/JS 代码。 ·空间与动态感知增强:判断位置、方向、交互元素,支持空间推理与动态视频理解。 ·多语言OCR:支持 32 种语言识别,弱光、模糊场景也能准确提取文字。 ·指令理解更强:基于更深层的 instruction-tuning,使交互更加自然。 ✅关于显存与性能: Qwen3-VL 的 2B 模型大约需要 8GB 显存可流畅运行,若使用 7B 或 72B 模型可搭配 LoRA 或量化推理方案。 ✅ 关于输入分辨率: 图像可自动缩放到合适尺寸,但建议不超过 1024×1024。视频可自动抽取关键帧。 ✅ 关于输出优化: 可通过 max_new_tokens、temperature、top_p 参数控制生成长度与随机性; 对于多语言 OCR 任务,建议在 Prompt 中明确语言类型(如 “请用英文输出”)。
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 21 条信息
#通义千问
#Qwen3-VL
#视觉理解
#多模态模型
#AI
分享
评论 0
0
Mr Panda
2个月前
OpenAI Altas 已经用上了, 确实方便一些。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#OpenAI
#Altas
#方便
#AI工具
#效率提升
分享
评论 0
0
Mr Panda
2个月前
早上一个同事问我应该让孩子学什么, 因为AI发展的太快了, 这个被取代, 那个被干掉, 让他很焦虑。 我想了一下, 如果我的孩子, 我大概会鼓励他学习数学、物理、信息论、控制论、系统论。
#AI编程:自学or科班?新旧码农之争· 156 条信息
#AI发展
#孩子教育
#未来职业
#数学
#物理
分享
评论 0
0
Meathill
2个月前
时至今日,我还是推荐 GitHub Copilot: 1. 有适配GitHub的Agent帮我们解issue,帮我们code review 2. 有积极维护的CLI,支持CC 4.5,GPT-5-codex 和 Gemini-2.5 Pro 3. 网页版随便用 4. 支持所有 IDE 强烈推荐大家都整一个,一年才 $100,几乎全覆盖,我觉得非常划算
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#GitHub Copilot
#AI编程助手
#效率工具
#积极推荐
#全平台支持
分享
评论 0
0
Tinyfool
2个月前
我做了一个全 AI 生成YouTube 频道,十天后我发现了这些真相
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#AI
#YouTube频道
#内容生成
#真相
#自媒体实验
分享
评论 0
0
空空 🌟 狞猫世界第一可爱!
2个月前
自从电车的销量占比超过50%以后,油车忽然就变成了一种怎么也开不坏、残值越来越高,似乎还不用保养的黑科技,简单来说就是成精了。
中国新能源车:狂飙突进与隐忧并存· 140 条信息
#电车销量
#油车成精
#残值高
#无需保养
#黑科技
分享
评论 0
0
Jesse Lau 遁一子
2个月前
我对gemini cli的智商是又爱又恨,对gemini 3.0 pro的未来也感觉有点担忧啊
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini CLI
#智商
#爱恨交织
#Gemini 3.0 Pro
#担忧
分享
评论 0
0
YL (Yucheng Liu)
2个月前
我忍不住想,真空里面数据中心的散热问题怎么解决?这不约等于把数据中心盖在保温瓶里么,简直 nightmare...
懒猫家族新成员亮相,AI算力舱引发热议!· 143 条信息
#数据中心散热
#真空环境
#技术挑战
#nightmare
#保温瓶
分享
评论 0
0
所谓伊人 在水一方
2个月前
小米车开启自动驾驶,拐弯的时候,违章,车主被扣三分,罚款200,不知道这个钱雷军是否会给车主报销。
小米汽车维权事件:数百车主要求退车引发舆论风波· 74 条信息
#小米汽车
#自动驾驶
#违章
#扣分罚款
#雷军
分享
评论 0
0
Nagi Yan
2个月前
《AI不是帮你写代码的,它在等你教它怎么理解你》 经过一段时间的 ClaudeCode 编程体验,我得到一个清晰的结论: 在大型工程中,AI 目前还不可能“无监督”地一次性完成最终代码。 因为在真实的开发环境里,需求不是写在文档里的常量,而是在协作中一步步被澄清的变量。 AI 不知道你真正要什么,它只能在你不断提供的约束和上下文中逐步靠近目标。这意味着,AI 编程不是单向命令,而是协作过程。 ⸻ 一、AI编程的幻觉:一次性完工的神话 很多人幻想 AI 能一键生成成品项目。 但他们忽略了一个事实:软件开发的核心不是写代码,而是定义需求。 而需求是什么? 它是无数次讨论、否定、取舍与妥协的产物。 它是人类协作过程的副产品。 所以,当AI还没被告知“世界的边界”时,它写出的东西,只能是幻觉的具象化。 问题不在AI不聪明,而在——你没让它知道它应该聪明到哪里为止。 ⸻ 二、从“写代码”到“写约束” 未来的开发者不会直接写代码, 而是写下AI理解问题所需的约束。 就像你不再亲自去拧每一颗螺丝,而是画出力学结构图。 AI将成为那个根据结构图执行的“智能技工”。 所以开发者的新职责是: •明确输入输出边界; •设计可复用的上下文模式; •在每一次对话中,让AI理解“为什么这样做”。 这是一种新的编程语言——结构语言。 ⸻ 三、共情AI:新的编程能力 很多人以为“共情AI”是情绪层面的,但其实它是结构层面的洞察力。 当AI犯错时,不该骂它,而该反问: •它缺少了哪段关键信息? •它的逻辑链在哪一步断开? •它是不是误解了问题语境? 真正的高手,不是写出完美的Prompt,而是能在AI的“错误”中看见它的信息饥饿。 ⸻ 四、暴躁与放弃:人类的不成熟反应 很多开发者第一次用AI写代码时的反应是: “这AI太蠢了。” 然后关掉界面,重回老路。 但那其实是他们的认知防御机制在作祟。 他们没意识到自己面对的,不是工具,而是一个需要共识成本的智能体。 当AI输出混乱时,它不是叛逆,而是在告诉你:“我还不够了解你的世界。” 骂它没用,教它才行。 ⸻ 五、AI协作的文明门槛 未来的工程师之间的差距,不再是语言或算法能力, 而是谁更能与AI建立共识。 当一个人能从AI的视角思考问题, 他已经不只是程序员,而是协议设计者—— 定义人与智能如何协作的语言建筑师。 AI不会取代你, 但它会淘汰那些只会对它发号施令的人。 ⸻ 结语: AI不缺算力,它缺理解。 而理解,不是AI的天赋,而是人类的馈赠。 你要做的不是命令它,而是让它明白你是谁、你想构建怎样的世界。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#AI编程
#人机协作
#需求定义
#结构化思维
#共情AI
分享
评论 0
0
DinoDeer
2个月前
OpenAI 这家公司显然迷茫了,他们拿不出杀手锏,只能盯着对手,跟着丢出一堆破铜烂铁。 这是大模型放缓放缓的信号。
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 158 条信息
#OpenAI迷茫
#大模型放缓
#缺乏创新
#竞争压力
#负面评价
分享
评论 0
0
TuTu生活志
2个月前
看到很多人分享生图的提示词,也用自己的自拍放进gemini🍌试了下。个别真的有些神似,但我要强烈声明绝大多数和本人关系不大 🤣 不过生成效果确实绝佳,几秒钟就能出很有高级感的图。让我不太能理解的是,为什么始终会有这种“偏差”呢?分享几张直接拷贝大神的提示词(未作任何调整)出的图。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini
#AI生成图像
#自拍
#高级感
#偏差
分享
评论 0
0
图拉鼎
2个月前
国行 eSIM 果真重新发(Yān)明(Gē)了 eSIM:只能存两张卡,删除掉一张才能添加新的,要补回老卡只能去营业厅。严格来说比物理卡更麻烦了,毕竟物理卡我可以自行保存,eSIM 删了就没了。真是没有麻烦也要制造麻烦。
国内运营商限制iPhone 17 Air eSIM使用,引发用户不满· 15 条信息
#国行eSIM
#阉割eSIM
#eSIM限制
#用户不便
#负面评价
分享
评论 0
0
Geek
2个月前
OpenRouter 又上隐身模型了 openrouter/andromeda-alpha ,这是一个较小的推理模型,擅长图像理解。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#Openrouter
#隐身模型
#andromeda-alpha
#图像理解
#推理模型
分享
评论 0
0
Tony出海
2个月前
被Sam奥特曼偷袭,Perplexity AI 的comet 浏览器着急了,现在送Pro会员,立即下载体验AI浏览器👉
Perplexity年度会员免费领取活动引发热潮· 30 条信息
#Sam奥特曼
#Perplexity AI
#comet浏览器
#Pro会员
#AI浏览器
分享
评论 0
0
代码家
2个月前
刚刚更新的 iOS26 beta4 版本,增加了一个削弱玻璃效果的选项(设置 - 显示与亮度 - Liquid Glass),可以大幅提升 UI 的可阅读性,而且感觉交互更流畅了。毕竟每次做透明度融合计算要消耗 CPU,内存和响应时间。推荐更新!
苹果Liquid Glass:开发者适配陷两难,AI助力AR或成未来· 104 条信息
#iOS26 beta4
#玻璃效果削弱
#UI可读性提升
#交互流畅
#推荐更新
分享
评论 0
0
汉松
2个月前
我们团队开源了 Multi-Agent 强化学习的框架 MrlX,它能够让你同时训练多个 Agent 模型。 当我们试图让大模型变得更聪明时,大多数人都在做同样的事:训练一个模型,让它自己跟自己对话,希望它能学会反思验证,能学会使用工具。 但如果你仔细想想,这其实很奇怪。 真实世界不是这样运作的。人们是在与其他人的互动中变聪明的。医生通过与病人交谈来提升诊断能力,而病人也在这个过程中学会更好地描述症状。这是一种共同进化。 这就是我们做 MrlX 的原因。 核心想法很简单:让两个 Agent 互相帮助对方成长。一个是“探索者”,负责在真实环境中冒险尝试;另一个是“适应者”,它观察刚刚发生的一切,然后快速调整自己。它们像台阶一样互相垫脚,螺旋式上升。 我们在两个场景中测试了这个想法。 第一个是医生 - 病人对话训练。传统做法是只训练医生 Agent,但我们在思考一个问题:如果病人 Agent 也在进化,会不会让医生 Agent 进化更快?就像真实世界一样:好的病人能帮助医生成为更好的医生,反之亦然。结果证明,联合训练两者比只训练医生要强得多。 第二个场景更复杂:让 Agent 做深度研究。这里的问题是,当你需要频繁使用工具、查询信息时,单个 Agent 的“记忆”会爆炸:它要记住所有工具调用、所有中间结果,很快就撑不住了。解决方案?分工。让不同的 Agent 专注于不同的任务,同时让它们互相训练对方。一个负责主线推理,一个负责处理子任务。它们各自深化自己的专长,同时为对方生成训练样本。 这不是让一个模型假装扮演不同角色。这是真正的多个 Agent,各有专长,共同进化。 两个案例的结果都显示:这种共同进化的方式,在稳定性、收敛速度和最终性能上,都明显超过单 Agent 方法。 最好的创业公司不是一个天才独自工作,而是一群互补的人互相激发。联合创始人之间的张力和协作,往往比任何一个人单独能做到的都要好。MrlX 做的就是这个,只不过是在 AI Agent 之间。 现在这还只是开始。我们只探索了两个场景,都是相对受控的环境。真正有趣的是当你把这个想法推广到更多 Agent、更动态的环境时会发生什么。也许 Agent 可以自己决定要扮演什么角色。也许它们可以形成自组织的生态系统。 欢迎大家使用我们的框架尝试 Multi-Agent 的强化学习,如果觉得有帮助,欢迎转发并给我们的项目一个 star。 最后也欢迎关注我们的 AQ-MedAI 的官方账号,后续我们还有很多新的开源项目在这里发布。
#多智能体之争:Anthropic生态VS单智能体· 81 条信息
#Multi-Agent 强化学习
#MrlX框架开源
#Agent共同进化
#医生-病人对话训练
#深度研究Agent分工
分享
评论 0
0
卫斯理
2个月前
“想象一下,一个月赚一万刀的创业公司在VC眼中无疑是失败的,如果一位住在巴厘岛、印度尼西亚的独立开发者达到这个收益,无疑是巨大的成功 …” 干吧,兄弟们,有AI的加持,独立开发者这条路不错的 PS 不要做中文版
独立创业者如何突破零收入困境,迈向月入1000元· 307 条信息
#独立开发者
#AI
#创业公司
#巴厘岛
#月入一万刀
分享
评论 0
0
吕立青_JimmyLv (🐣, 🐣) 2𐃏25 | building bibigpt.co
2个月前
我已经把 ChatGPT Atlas 设置成默认浏览器了,还能安装 Chrome 插件[破涕为笑] 软件开箱了一波,体验真的还不错,现在下载还送 7 天会员,OpenAI 真是继续深挖 Google 墙角啊~
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#ChatGPT
#Atlas浏览器
#Chrome插件
#OpenAI
#Google
分享
评论 0
0
歸藏(guizang.ai)
2个月前
Claude客户端更新了,支持截图发给 Claude,支持通过快捷键 Caps Lock 和 Claude 语音交流
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude客户端
#截图功能
#快捷键Caps Lock
#语音交流
#更新
分享
评论 0
0
上一页
1
...
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
...
248
下一页
AI 实时热榜 (24小时)
智能算法加权排行
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞