现在DeepSeek受到的质疑有：1，DeepSeek公布的芯片数量和种类可能不实；2，DeepSeek公布的模型训练成本计算方式与业界方式不一样、因此低估了成本；3，DeepSeek可能未经授权使用了ChatGPT API进行“数据蒸馏”、利用OpenAI 数据和算力训练模型；4，DeepSeek和幻方量化交易公司属于同样股东，有没有关联公司和个人从这几天美国股票下跌中获利？有没有违反美国证券法

#DeepSeek质疑 #芯片数量真实性 #模型训练成本 #数据蒸馏 #OpenAI授权问题 #幻方量化交易 #股市下跌获利 #美国证券法

相关新闻

高级分析师

6个月前

Anthropic CEO Dario： - 在模型推理方面，毛利相当可观。 - 模型训练和产生营收的错位导致人们误认为AI不赚钱。 - 2023年1亿美元训练的模型在2024年产生2亿营收，10亿美元训练下一代，账面亏损8亿；2025年产生20亿营收，投入100亿训练的是下一代。 - 若按照模型计算，每个模型都是赚钱的。

宝玉

1年前

可以看得出，OpenAI 正在用 o3 的数据来蒸馏 GPT-4o，所以 GPT-4o 越来越强了。 o1、o3 这样的推理模型因为更擅长逻辑推理和长链思考（或在某些领域拥有更深入的知识），因此能生成更高质量、更精准、更具启发性的数据。这些“数据”可能包括：更完善的解题思路、更详细的标注数据、难以在网上直接找到的“合成知识”、或者更高质量的问答示例等等。这些由推理模型生成的优质数据，又能

偶像派作手

1年前

DeepSeek 声称它仅使用了 2,048 个 Nvidia H800 和 560 万美元来训练一个具有 6710 亿参数的模型，这只是 OpenAI 和 Google 用于训练同等规模模型支出的一个小部分。