李老师不是你老师2025-04-06 11:49:264月5日 Meta发布了其新一代开源大语言模型Liama4,其拥有超过4000亿参数,Meta宣称该模型是同类中最好的多模态模型(可以处理图像输入输出),在参数量更少运行门槛更低的情况下,编程和推理能力上和DeepSeek V3相当。 并且该模型完全免费开源,用户可以从Liama官网下载并部署在本地。 #Meta#开源#大语言模型
背包健客2025-04-03 11:47:11Cell:AI破解自闭症诊断密码 2025 年 3 月 26 日,加拿大 Mila-魁北克人工智能研究所、麦吉尔大学在 Cell 期刊发表研究成果。 这项颠覆性研究通过大语言模型(LLM)解构了 4000 多份自闭症诊断病例报告,对报告中的专家医生的“临床直觉”的逻辑进行了拆解和探索,得出了一个反常识结论——重复行为和特殊兴趣才是自闭症诊断的“黄金线索”,而非传统认为的社交缺陷。这一发现有望改#AI#自闭症#大语言模型
马东锡 NLP 🇸🇪2025-03-17 07:10:45大语言模型 post-training 的变迁,从 Large Language Model (LLM) 到 Large Reasoning Model (LRM) 本周推荐论文:POST-TRAINING OF LARGE LANGUAGE MODELS Post-training,本质是在做一件事,即如何运用 LLM 的 pretrained knowledge 来解决实际任务,具体的方法#大语言模型#后训练#POST-TRAINING
宝玉2025-03-14 23:48:47问:宝玉老师,我一直很困惑,智能体跟Ai编程这两者的区别,智能体适合什么场景,Ai编程适合什么场景?请指教 答:这其实是两个不同的概念,当然定义在不同的环境或者不同人解读可能都有不同,我只是基于通用场景以我自己的理解解释一下。 首先说说 AI 智能体 为什么现在有了智能度很高的的大语言模型还要有智能体呢?因为大语言模型它只能接受文字、图片、视频、文档等,输出也只能是文字图片,没有记忆,没有办#智能体#AI编程#大语言模型
背包健客2025-02-21 20:43:40生物学DeepSeek来了 2025年2月19日,Arc 研究所的 Patrick Hsu 和 Brian Hie 团队联合斯坦福大学、加州大学伯克利分校、加州大学旧金山分校以及英伟达的科学家,发布了有史以来最大的生物学人工智能模型——Evo-2,其在规模上堪比当前最强大的生成式人工智能大语言模型,但其训练仅使用了 2000 多个英伟达 H100 GPU,且该模型完全开源。 该模型训练了从单细#生物学#DeepSeek#Evo-2
勃勃OC2025-01-08 00:07:51果然马斯克即将允许大语言模型实现车内交互了。。 怎么说呢,当技术走在正确的道路上,它只会越来越正确。 途中的小磕碰根本不用担心#马斯克#大语言模型#车内交互