马东锡 NLP 🇸🇪2025-04-09 03:42:53「LLM, Reasoning」论文: Rethinking Reflection in Pre-Training 预训练卷土重来,reasoning 时代神奇的 “wait” 再现。 本周我最喜欢的一篇论文来了。 来自 Essential AI,由 Ashish Vaswani 主导,对写过论文的人来说,这个引用太熟悉了 (Vaswani et al., 2017), Transforme
勃勃OC2025-02-16 19:38:05马斯克宣布,xAI 开发的 AI 聊天机器人 Grok 3 将于太平洋时间周一晚上 8 点正式发布。 Grok 3 被称为“地球上最聪明的 AI”,预计将在推理、速度和实时能力方面大幅超越当前模型,推动 AI 技术的重大进步。 此次发布引发了广泛讨论,人们关注其在 AI 规模法则上的突破以及与 ChatGPT 等其他 AI 模型的竞争优势。发布活动将包括现场演示,展示 Grok 在 X Cor
karminski-牙医2025-02-08 07:00:02分享反编译大模型!LLM4Decompile。反编译工作不需要苦哈哈盯着intel汇编头痛了,这个模型可以将 x86_64二进制程序反编译为C代码 我看了下模型大小从1.3B到22B都有,22B如果Q4量化的话只有10G左右,Q8大概22G。好一点的显卡就能本地用了 项目地址: