karminski-牙医

karminski-牙医

0 关注者

7个月前

给大家带来全网最速 DeepSeek-V3-0324 写代码实测! 直接说结论—— 超越 DeepSeek-R1!甚至超越 Claude-3.7! 难以想象这还不是一个 Thinking 模型! DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1),仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错

#DeepSeek-V3-0324 #DeepSeek-R1 #Claude-3.7 #Thinking模型 #KCORES #大模型竞技场

相关新闻

placeholder

Geek

1周前

我为亲友们搭了一个AI平台,提供多种主流模型。尽管我推荐他们尝试 Gemini 2.5 PRO、GPT-5或GLM-4.6,但一直以来他们始终只使用 DeepSeek-R1。 起初我不解,为何不试试更强大的模型,后来才意识到,DeepSeek-R1/V3 已完全满足他们的日常使用场景。 也好,现在我能轻松找到 R1 的免费资源供应😅

placeholder

karminski-牙医

1个月前

Claude-Sonnet-4.5 的 EQBench 结果出了,EQBench本身在第8名的成绩,不过创意写作和长篇创意写作直接来了个第一。 所以除了用 Claude-Sonnet-4.5 写代码以外,也可以试试用 Claude-Sonnet-4.5 写文了,之前我一直用幻觉之王 DeepSeek-R1 来写一些创意性质的东西。感觉现在可以换换了。

placeholder

新浪新闻-第一财经网

1个月前

DeepSeek首次回应“蒸馏OpenAI”质疑

placeholder

环球网-科技日报

1个月前

登上《自然》!DeepSeek-R1训练方法发布

placeholder

邓聿文

1个月前

由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上《自然》封面。与1月的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。Nature对DeepSeek-R1评价是:目前几乎所有主流大模型都未经过独立同行评审,该空白“终于被DeepSeek打破”

© 2025 news.news. All rights reserved. 0.06659 秒. v1.0.46
我的评论