karminski-牙医

karminski-牙医

0 关注者

2个月前

GPT-OSS 模型的 EQBench 结果出了, 基本就是 GPT-4.1-mini 和 GPT-4.1-nano 的水平. 长篇创意写作基本接近 Qwen3-30B-A3B 的水平。gpt-oss-120b 120B VS 30B。写作方面好不好用不言而喻了。更何况有幻觉大师 DeepSeek-R1 在前面。 我比较好奇的是除了给程序API调用,真的有人在工作中用 GPT-4.1-min

#GPT-OSS模型 #EQBench结果 #GPT-4.1-mini #Qwen3-30B-A3B #DeepSeek-R1

相关新闻

placeholder

karminski-牙医

1周前

Claude-Sonnet-4.5 的 EQBench 结果出了,EQBench本身在第8名的成绩,不过创意写作和长篇创意写作直接来了个第一。 所以除了用 Claude-Sonnet-4.5 写代码以外,也可以试试用 Claude-Sonnet-4.5 写文了,之前我一直用幻觉之王 DeepSeek-R1 来写一些创意性质的东西。感觉现在可以换换了。

placeholder

新浪新闻-第一财经网

3周前

DeepSeek首次回应“蒸馏OpenAI”质疑

placeholder

环球网-科技日报

3周前

登上《自然》!DeepSeek-R1训练方法发布

placeholder

邓聿文

3周前

由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上《自然》封面。与1月的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。Nature对DeepSeek-R1评价是:目前几乎所有主流大模型都未经过独立同行评审,该空白“终于被DeepSeek打破”

placeholder

澎湃新闻-10%公司

3周前

首个接受同行评审的大语言模型!DeepSeek-R1论文登《自然》封面,作者包括梁文锋

placeholder
© 2025 news.news. All rights reserved. 0.08711 秒. v1.0.46
我的评论