karminski-牙医

karminski-牙医

0 关注者

6个月前

给大家带来全网最速 DeepSeek-V3-0324 写代码实测! 直接说结论—— 超越 DeepSeek-R1!甚至超越 Claude-3.7! 难以想象这还不是一个 Thinking 模型! DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1),仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错

#DeepSeek-V3-0324 #DeepSeek-R1 #Claude-3.7 #Thinking模型 #KCORES #大模型竞技场

相关新闻

placeholder

karminski-牙医

1天前

Claude-Sonnet-4.5 的 EQBench 结果出了,EQBench本身在第8名的成绩,不过创意写作和长篇创意写作直接来了个第一。 所以除了用 Claude-Sonnet-4.5 写代码以外,也可以试试用 Claude-Sonnet-4.5 写文了,之前我一直用幻觉之王 DeepSeek-R1 来写一些创意性质的东西。感觉现在可以换换了。

placeholder

新浪新闻-第一财经网

2周前

DeepSeek首次回应“蒸馏OpenAI”质疑

placeholder

环球网-科技日报

2周前

登上《自然》!DeepSeek-R1训练方法发布

placeholder

邓聿文

2周前

由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上《自然》封面。与1月的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。Nature对DeepSeek-R1评价是:目前几乎所有主流大模型都未经过独立同行评审,该空白“终于被DeepSeek打破”

placeholder

澎湃新闻-10%公司

2周前

首个接受同行评审的大语言模型!DeepSeek-R1论文登《自然》封面,作者包括梁文锋

placeholder
© 2025 news.news. All rights reserved. 0.07424 秒. v1.0.46
我的评论