马东锡 NLP 🇸🇪2025-04-09 03:42:53「LLM, Reasoning」论文: Rethinking Reflection in Pre-Training 预训练卷土重来,reasoning 时代神奇的 “wait” 再现。 本周我最喜欢的一篇论文来了。 来自 Essential AI,由 Ashish Vaswani 主导,对写过论文的人来说,这个引用太熟悉了 (Vaswani et al., 2017), Transforme#预训练#推理#论文
勃勃OC2025-02-16 19:38:05马斯克宣布,xAI 开发的 AI 聊天机器人 Grok 3 将于太平洋时间周一晚上 8 点正式发布。 Grok 3 被称为“地球上最聪明的 AI”,预计将在推理、速度和实时能力方面大幅超越当前模型,推动 AI 技术的重大进步。 此次发布引发了广泛讨论,人们关注其在 AI 规模法则上的突破以及与 ChatGPT 等其他 AI 模型的竞争优势。发布活动将包括现场演示,展示 Grok 在 X Cor#马斯克#XAI#发布活动
阑夕2025-01-22 21:22:29Kimi和DeepSeek的新模型这几天内同时发布,又是一波让人看不懂的突飞猛进,硅谷的反应也很有意思, 已经不再是惊讶「他们是怎么办到的」,而是变成了「他们是怎么能这么快的」,就快走完了质疑、理解、成为的三段论。 先说背景。大模型在运作上可用粗略分为训练和推理两大部分,在去年9月之前,训练的质量一直被视为重中之重,也就是通过所谓的算力堆叠,搭建万卡集群甚至十万卡集群来让大模型充分学习人类语料,#Kimi#DeepSeek#新模型
腾讯新闻-全天候科技2025-01-15 01:12:00OpenAI的o1模型推理时蹦出中文 专家:AI可能想用最高效的语言来思考媒体报道,在OpenAI 发布其首个“推理”AI模型o1不久后,有用户注意到一种奇怪的现象:即使用户是用英语提问,这一模型有时会在回答问题时突然“转而用”中文、波斯语或其他语言“思考”。例如,当被问及“单词‘strawberry’中有多少个‘R’?”时,o1会开始其“推理”过程,通过一系列推理步骤得出答案。如果问题是用英语...#OpenAI#o1模型#推理
空空 🌟 狞猫世界第一可爱!2024-12-30 09:02:43一直没看死亡笔记,根据网上各种梗加上大支对其封杀的反应把它当作比较中二病再带点矫情自省的作品。最近总算看了漫画才发现自己大错特错,这分明是地道的本格推理+全程斗智啊。笔记和死神在故事里甚至可以当作一种麦高芬来看待,我都不敢相信这曾是JUMP刊登漫画,比起当下连载的跳跳杂鱼们出色太多!#死亡笔记#漫画#推理