LT 視界2025-01-30 07:10:36為何阿里搶在大年初一發布新模型?路透社認為阿里主要為了保住中國人工智能界尚存的一點尊嚴。阿里聲明發出兩大信息:1)其產品比Deepseek先進。2)Deepseek不能代表中國。 #阿里#人工智能#新模型
阑夕2025-01-22 21:22:29Kimi和DeepSeek的新模型这几天内同时发布,又是一波让人看不懂的突飞猛进,硅谷的反应也很有意思, 已经不再是惊讶「他们是怎么办到的」,而是变成了「他们是怎么能这么快的」,就快走完了质疑、理解、成为的三段论。 先说背景。大模型在运作上可用粗略分为训练和推理两大部分,在去年9月之前,训练的质量一直被视为重中之重,也就是通过所谓的算力堆叠,搭建万卡集群甚至十万卡集群来让大模型充分学习人类语料,#Kimi#DeepSeek#新模型