时政

财经

科技

#Qwen模型

马东锡 NLP 🇸🇪

2025-05-30 04:20:48

OpenAI 悄然隐藏CoT推理过程，逐渐走向完全黑箱化。想从 OpenAI 蒸馏 Agentic Reasoning 过程，变的非常困难。另一方面，近期的几篇 LLM RL 的论文的可靠性受到质疑，让使用开源的 Qwen 模型的工作变得似乎意义虚无化。另外，刷榜benchmarking的开源模型，又有多少存在 data contamination 的问题？闭源的不让蒸馏，开源的又不

#OpenAI黑箱化 #Qwen模型 #开源模型

2025-02-07 10:45:48

【李飞飞团队“50美元”复刻DeepSeek的R1真相：基于阿里云Qwen模型监督微调而成】财联社说李飞飞团队训练出s1人工智能推理模型，在数学和编码能力测试中与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。我看了原始paper，核心信息如下：【1】s1的基座模型为阿里通义千问Qwen 2.5-32B(图二红线部分)。在已经训练好的模型基础上，通过监督微调(supervi

#李飞飞团队 #DeepSeek #人工智能

没有更多了 🤐