马东锡 NLP 🇸🇪2025-03-19 15:55:38Large Reasoning Model时代, 几乎等于Reinforcement Learning + LLM的时代。 但RL专业性非常强,去参加ML的会议时,专门做RL的研究员都现场拿着笔纸推算数学公式,掌握起来学习难度较高。 分享一本RL的入门教材,从RL基础MDP,PPO,直到跟LLM结合,如RLHF,都有讲解,深入浅出。 Reinforcement Learning: An O#强化学习#大型语言模型#RLHF
联合早报 Lianhe Zaobao2025-03-11 10:02:19全球最大电子产品代工制造商台湾鸿海集团宣布,推出首款具推理能力的繁体中文大型语言模型“FoxBrain”,计划利用这个模型推动人工智能(AI)在制造业、供应链管理与智慧决策领域的应用。 #鸿海集团#大型语言模型#FoxBrain
素人极客-Amateur Geek2025-02-23 06:26:26聊一聊两个不懂代码的人,尝试用 html 做智能体的经历:我是一个文案,15 年文案。朋友是自学了一年半的代码。 在我使用一年半 ai 的时候,我发现了大模型终于可以帮我写文案了,于是积累了很多自己的文案生成方法。于是我想,我可以打包我的提示词工程和工作流,卖给其他人用。 于是就干!#HTML#智能体#文案
勃勃OC2025-02-18 14:08:15xAI 的新大型语言模型 Grok 3 发布 Grok 3具备推理能力,以及一个Grok-mini的小模型 在 LMArena 上的 ELO 评分达到 1400,排名第一 AIME 24 —— 52% [推理后 96%] GPQA —— 75% [推理后 85%] 编程(LiveCodeBench)—— 57% [推理后 80%] 此外,在最新的数学竞赛 AIME 2025 中取得了 93#XAI#大型语言模型#Grok-mini