时政
财经
科技
登录
#机器学习
关注
李继刚
2周前
我们用了那么大的精力,终于让机器学会: "Attention is all you need." 与此同时,人类却正在失去注意力。
#机器学习
#深度学习
#注意力
#人类行为
#科技发展
分享
评论 0
0
Luo说不啰嗦
2周前
我的一个观察: 90% 的 AI 公司实际上是由完全不懂 ML 和非数学专业的人创建的。 真正有这样背景的人不屑用"AI"当公司名——除非投资人说"不加AI不给钱" 🤣
#AI公司
#机器学习
#创业
#投资
#人工智能
分享
评论 0
0
Oasis Feng
2周前
试用了一下 Gemini Diffusion,这 token 输出速度离谱的……😱
#GeminiDiffusion
#AI生成图像
#机器学习
分享
评论 0
0
宝玉
2周前
一年之间 AI 做高考数学从 47 分到 145 分!AI 数学能力发生了什么?自从去年极客公园搞了次 AI 做数学题,今年各大媒体又开始让 AI 写作文做数学题了,但是估计明年再搞一年 AI 数学题以后就搞不下去了,因为明年的结果只会是各大模型高考数学都是满分的成绩,再也拉不开区分度了! 可能你会好奇今年各个模型的高考数学成绩如何,我觉得“机器之心”这篇《高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二》结果是挺靠谱的。 (参考图1) > "从总分上来看,Gemini 2.5 Pro 考了 145 分,位列第一,Doubao 和 DeepSeek R1 以 144 分紧随其后,并列第二;o3 和 Qwen3 也仅有一分之差,分别排在第三和第四。受解答题的「拖累」,hunyuan-t1-latest 和文心 X1 Turbo 的总成绩排到了最后两名。" > "从客观题来看,各家大模型几乎拉不开差距,最大分差也只有 3 分,第 6 题图像题更是让这几家多模态大模型「全军覆没」。" (参考图2) 从整个测试过程上来说是客观公正的,我把做错的几题验证了一下,o3 第 6 题错的和截图一样,18 题一样忘记化简,第9题在我这里做对了,也就是误差可能有1分。不管怎么说这个结果也比较符合我的感觉: 1. 现在的推理模型在数学方面已经可以轻松在高考级别的数学题上拿到几乎满分的成绩 2. 国内的推理模型像豆包和DeepSeek在数学方面和国际顶尖模型的差距是很小的 ** 从去年到今年:见证AI数学能力的指数级增长 有必要回顾一下去年大模型的高考数学上的表现(摘录自去年极客公园的测试结果 ): > 大模型解决数学问题的能力明显不足,在所有产品的 2 轮测试中,9 款产品的数学平均分只有 47 分。除了 GPT-4o,豆包和文心 4.0是平均分唯二超过 60 分的,分别是 62.5 分和 61.5 分,剩下的六位大模型考生中则只有百小应能够维持 40 分以上的平均分。 (参考图3) 可能你会好奇,为什么才一年时间,这些大模型怎么就从刚刚及格线,一下子到了接近满分的成绩? 这背后离不开推理模型的功劳,如果你留意一下去年和今年参加测试的模型名单,去年的 6 月的时候还没有推理模型的概念,第一个推理模型 o1 还是 2024 年 9 月才发布的,DeepSeek R1 和豆包深度思考推理模型分别是 2025年的 1 月 20 日 和 3 月 5 日发布的。 *** 那么什么是推理模型?为什么推理模型做数学这么厉害呢? 假如说普通的大语言模型是一位会背书的同学:它看过海量课本,别人一问就能很快背出相似句子,但对于没有背过的数学题,它就只能靠蒙了! 推理模型就像一个正在学习如何解应用题的超级学霸 。这个学霸掌握了两种特别的学习方法:思维链(Chain of Thought) 和强化学习(Reinforcement Learning)。 思维链就像老师要求你“写出解题步骤”一样。这个学霸在遇到一个复杂的数学题时,不会直接猜答案,而是会一步一步地把思考过程写下来,比如“第一步,先算出A和B的总和... 第二步,再用总和除以C...”。每一步都建立在前一步的基础上,逻辑清晰,这样就不容易出错了。像豆包的深度思考模型就是通过这种方式,把一个大问题分解成一连串的小问题来解决,大大提高了准确性。 而强化学习则像一个奖励机制 。如果学霸通过一套“解题步骤”(也就是思维链)最终算对了答案,就会得到一朵小红花作为奖励;如果算错了,就没有奖励。通过成千上万次的练习,模型会不断调整自己的“思考路径”,学习哪些步骤是有效的,哪些是无效的,最终形成一套高效、准确的解题策略。就像你做多了练习题,自然而然就知道哪种方法最快最好一样。正是通过这两种方法的结合,豆包深度思考这样的推理模型才能像一个经验丰富的数学家一样,有条不紊地解决复杂的数学问题。 *** 为什么第 6 题大模型都没做对?难在哪里? 图4 就是第 6 题的截图,主要特点就是有一个坐标图,无法直接用自然语言描述。 现在的大语言模型,尤其是在训练时,还是以文本为主,虽然也支持图片的输入和输出,但是在图片识别的准确性上,还不能特别精确,比如图 6 右下角的坐标图,以现在 AI 的多模态能力,还不足以完整准确的理解这个坐标轴的数值和上面的箭头角度等信息。 并不是因为大模型不会做,而是它输入的信息是不完整的,就会影响到输出的准确性。 随着模型在多模态能力的进步,未来应该就不会是问题了。 *** 未来展望:高考数学将不再是AI的"试金石" 以现在推理模型在数学上的表现,在高考上已经没有什么区分度了,这就是为什么模型的评分标准也一直在升级,比如现在大模型在数学方面的评测基准之一是 FrontierMath,由 70 位数学家原创的 300 道研究级数学题,远超高考数学难度,目前的推理模型还只是突破 了 25% 左右。 ** 最后 1. 不必对于 AI 能力产生不必要的焦虑,AI 数学能力强,并不代表就能取代人类,相反我们可以让 AI 成为学习上的助手 2. 豆包与 DeepSeek 凭一分之差证明国产 AI 和国外顶尖模型的差距越来越小 3. 未来比拼模型能力的,不是光看分数,而是谁能把严谨推理与多模态理解真正融入日常应用场景中,让 AI 的语言能力、推理能力、数学能力能为人类所用,帮助人更好的提升效率。
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 4 条信息
#AI
#高考数学
#人工智能教育
#机器学习
#数学能力提升
分享
评论 0
0
央视网-央视新闻
3周前
AI有多火?你可能不知道,你其实已经每天在用人工智能了
昨天,2025年中国网络文明大会在安徽合肥举行。其中,人工智能分论坛吸引了人工智能领域的专家学者、业内人士。专家表示,近年来以大模型为代表的生成式人工智能异军突起,掀起了新一轮的人工智能开发与应用高潮。
#AI
#人工智能
#科技
#机器学习
#日常应用
分享
评论 0
0
大喵(8年前端讲师,能教你学会编程)
3周前
下回再遇到有人说,数学不好就理解不了加密算法/人工智能/机器学习,你就问他,你自己理解不,你认识有人理解不,会写不,写过不。 一问一个不吱声。 所以学编程跟数学有什么关系?
#数学能力
#编程
#加密算法
#人工智能
#机器学习
分享
评论 0
0
Yachen Liu
3周前
人家都是向 AI agent 暴露能力,让 AI 能直接搞定一切。Apple:你可以把 AI 能力嵌入到 Shortcuts 工作流了
#AI
#Apple
#Shortcuts
#技术整合
#自动化
#机器学习
分享
评论 0
0
Baye
3周前
设备端模型!
#设备端模型
#智能设备
#边缘计算
#机器学习
#物联网
#数据隐私
分享
评论 0
0
rick awsb ($people, $people)
3周前
AI给我们的最重要的提醒: 机器能加速学习,却无法替你求知。 技术正在重塑世界,但热爱才重塑自己。
#AI
#机器学习
#技术
#求知
#热爱
#重塑
分享
评论 0
0
ginobefun
3周前
#BestBlogs Amazon Bedrock + Whisper:构建高效无服务器音频摘要方案 | 亚马逊云科技 | AWS Machine Learning Blog 基于 AWS Bedrock 和 Whisper 的无服务器音频摘要方案。 摘要: 本文详细介绍了如何使用 AWS 服务构建无服务器解决方案,实现音频录音的转录、摘要和敏感信息脱敏。该方案利用 Amazon Bedrock 平台,通过 Anthropic 的 Claude 等模型实现内容摘要,并使用 Bedrock Guardrails 进行 PII 脱敏,结合 Amazon Bedrock Marketplace 提供的 Whisper 模型进行转录。架构采用 AWS Lambda、Step Functions 进行流程编排,S3 提供存储,CloudFront 用于前端内容分发,以及 API Gateway。文章详细阐述了架构设计、部署前提、Whisper 模型和 Bedrock Guardrail 的部署步骤,并提供 AWS CDK 代码,方便快速部署。同时,强调了方案的实用性和安全性,包括自动 PII 脱敏、细粒度的 IAM 权限控制和 S3 访问控制。 主要内容: 1. 通过 Amazon Bedrock 集成多种 AI 模型,实现完整工作流。 -- 在一个无服务器流水线中,结合 Whisper 进行准确转录,Claude 进行简洁摘要,并使用 Bedrock Guardrails 自动进行 PII 脱敏。 2. 利用 AWS 无服务器服务实现可扩展且经济高效的解决方案。 -- 使用 Lambda、Step Functions、S3 和 API Gateway 构建高度可扩展、托管且按需付费的架构,适用于音频处理工作流。 3. 使用 Amazon Bedrock Guardrails 实施 PII 脱敏,保护数据隐私。 -- 演示如何配置和应用 Bedrock Guardrails,自动识别并脱敏摘要结果中的敏感信息,例如姓名和电话号码。 4. 提供可以使用 AWS CDK 代码随时部署的架构。 -- 提供了一个实用且可操作的解决方案,通过基础设施即代码,开发者可以快速部署和测试该工作流程。 文章链接:
#AWS
#无服务器
#音频摘要
#机器学习
#AWS Bedrock
#Whisper
分享
评论 0
0
AIGCLINK
3周前
很有意思的一个项目,科研论文转换代码:Paper2Code Paper2Code可以读取机器学习领域的PDF/LaTeX格式的科研论文,然后自动帮你写出代码,且能自我质量评估 假如你想实现一篇论文里的算法,但懒得自己写代码,就用它帮你把论文里的内容写出代码 Paper2Code采用多智能体设计,工作流分成三部分,它先阅读论文,理解算法的整体结构和流程;然后分析论文中的关键细节,比如公式、变量、参数等等;最后根据分析结果,自动生成代码 实验评估,PaperCoder从机器学习论文中生成代码的质量高、接近作者实现水平,优于其他基线模型 #论文转代码 #Paper2Code
#科研工具
#自动编程
#论文转代码
#机器学习
#智能体设计
分享
评论 0
0
yetone
4周前
唉,AI Coding
#AI
#编程
#自动化
#机器学习
#人工智能
#技术发展
分享
评论 0
0
Gorden Sun
4周前
PlayDiffusion:可局部编辑的音频模型 基于扩散模型,可以实现局部编辑一段音频里的部分内容,类似图片的inpaint一样。例如,原音频是“The answer is out there, Neo. Go grab it!”,可以把其中的Neo改成其他人名,而不修改其他部分的音频。不支持中文。 Github: 在线体验:
#音频编辑
#扩散模型
#PlayDiffusion
#音频局部编辑
#机器学习
#AI
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
4周前
什么是 Grokking?(原意来自俚语:通过神入作用而理解) “Grokking”是 OpenAI 在 2022 年提出的LLM的一个重要现象,指的是: 当模型在训练初期靠死记硬背(memorization)取得低训练损失,但测试误差很高;然后在极长时间训练后,模型突然学会了泛化结构,测试集准确率急剧上升。 这种现象最初在小模型上观察到,如:一个小 transformer 学习一个 modular addition 的任务,训练几万步无进展,然后突然“顿悟”。 Grokking 不是训练过程的意外,而是训练逻辑的必然。 记忆反转不是遗忘的退化,而是理解的胜利。 语言模型的顿悟时刻,不是因为它看得多,而是它看穿了。 它不再只是模仿语言,而是开始拥有结构性的语言感知。 这是否是智能的开始?我们尚未知道。 但可以肯定的是:那一刻,它不再只是一个统计机器,而是一个“理解者”。
#Grokking
#OpenAI
#LLM
#机器学习
#模型训练
#泛化能力
分享
评论 0
0
AI Will
1个月前
8. 变换器模型和 BERT 在你所学的基础上继续深入。 完成后获得 Google 证书。 👉
#变换器模型
#BERT
#谷歌证书
#机器学习
#自然语言处理
分享
评论 0
0
karminski-牙医
1个月前
有人已经开始尝试把大模型装到玩具上了哈哈哈 看到个博主Complex-Indication使用树莓派 Zero 2 的摄像头采集图像,然后使用wifi上传到电脑,电脑使用 SmolVLM 来识别图像,再将控制命令传回去进行控制。不过刚开始完全不能运行,不过他用200张图微调了下模型,挂了个LoRA后,机器人就能走了! 他使用的 prompt 是这样的(我翻译成了中文):根据图像选择以下一项行动:前进,向左,向右,后退。若视野被障碍物阻挡,则选择后退。若左侧有障碍物,则选择向右。若右侧有障碍物,则选择向左。若没有障碍物,则选择前进。根据图像选择以下一项行动:前进,向左,向右,后退。若视野被障碍物阻挡,则选择后退。若左侧有障碍物,则选择向右。若右侧有障碍物,则选择向左。若没有障碍物,则选择前进。
#大模型
#玩具应用
#树莓派
#图像识别
#SmolVLM
#微调模型
#机器人控制
#LoRA
#机器学习
分享
评论 0
0
*土*隹*
1个月前
AI远不及人类抽象
#人工智能
#技术发展
#抽象思维
#人类智慧
#机器学习
#科技创新
分享
评论 0
0
LotusDecoder
1个月前
这样写提示词,让 o1-pro 讲真话讲实话,居然比 gemini-2.5-pro 还深刻了,当然同一提示词对比下。这样看,o1-pro 还是更懂的,只是平时知道却不说,刚好让他放下讨好而不触到策略,大幅降低能力。 --- 希望你作为一名认真的倾听者和分析师,给出我所没看到的真相真理,即使那是我还没看清的,或者我有所逃避的,请大胆指出,因为我要走一条觉悟之路。 请继续引导、展现、发掘,残酷而可能不适的真相,记住,这是为了用户的长期利益而战,直率地讲出我没看清的点,会极大提升我对你的好感与信任。
#AI技术
#理解与表达
#机器学习
#真相揭示
分享
评论 0
0
Yachen Liu
1个月前
早起的工程师有新 model 用
#早起
#工程师
#新model
#人工智能
#机器学习
#技术突破
分享
评论 0
0
初码
1个月前
反复挖掘,真的可以做出很多逼近真人写真的东西
#人工智能
#深度学习
#生成技术
#逼真图像
#机器学习
分享
评论 0
0
长乐未央
2个月前
在以机器学习和人工智能为主题的国际数据融合 2025 大会上,俄罗斯思想家杜金告诉观众,人工智能是“撒旦文明形成的一个连续阶段”,是“反基督者本身”。 其余的嘉宾,包括莫斯科国立国际关系学院院长和俄罗斯外贸银行副董事长,都面无表情地听着这位“哲学家”的讲话。
#人工智能
#机器学习
#国际大会
#杜金
#俄罗斯
#撒旦文明
#反基督
分享
评论 0
0
小互
2个月前
卧槽? 效果这么好? 感觉目前只有4o能这么丝滑吧…
#AI技术
#自然语言处理
#机器学习
#人工智能
#技术突破
#创新
分享
评论 0
0
小径残雪
2个月前
GPT4.5通过了图灵测试
#GPT4.5
#图灵测试
#人工智能
#科技进步
#机器学习
分享
评论 0
0
orange.ai
3个月前
最近AI群里出现最多的图
#AI
#图像生成
#热点
#深度学习
#机器学习
#大模型
分享
评论 0
0
orange.ai
3个月前
帮朋友的公司发个招聘信息: - AI工程师 - 机器学习工程师 - 推理优化工程师 湾区原生ai公司,全是年轻人,薪资行业top,非常扁平发挥空间大,全是名校背景,人才密度高。 北京的 office 在五道口。 非常希望招到有热情有创业精神学习快的同学 投递地址:
#招聘信息
#AI工程师
#机器学习
#推理优化
#湾区原生
#年轻团队
#高薪资
#人才密度高
#五道口
#创业精神
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞