好多人说 DeepSeek 不行了，但是半年多以前的 R1 依然在大多数模型发布的 benchmark 里，这不恰恰说明半年前的模型依然能打么？

#DeepSeek #R1模型 #Benchmark #模型评估 #技术讨论

相关新闻

铁锤人

1天前

最近基于这个仓库的代码刷屏了普通人可能不太清楚为什么？就是之前页面每一次修改文字布局消耗的性能很高，这个库解决了这个问题。所以今天你看到很多程序员做了很多围绕文字的Demo。对于普通人这个不是很重要的信息，你生活中百分之99的事情都没有改变。

大帅老猿

4天前

当下这个时代，千万不要跟那种在推特上和你探讨技术的人浪费时间，你告诉他技术如何实现的，给你带不来半点价值。

📦Acbox

1周前

发现中文社媒会对品牌名和现象有意混淆去年：llm发展很久了，但是因为deepseek是第一个走进大众层面的llm，所以LLM=DeepSeek 今年：Agent做很久了，但是OpenClaw是第一个走进大众层面的agent，所以Agent=龙虾

yetone

1周前

有什么 coding agent 的 benchmark 吗？我想去测试一下不同的 coding agent 的能力。

BITWU.ETH 🔆

1周前

Claude 被封的没脾气了，我也开始用 zenmux 相对来说比较稳定，而且选择余地多 OpenAI / Claude / Gemini / DeepSeek 等所有模型也不降智。懒得折腾贵就贵点吧，下面链接大家有需要自取：用的话可以帮你们省10刀费用，不用也随意。他们是随机开放名额的，我上午还不行刚看了下可以才注册的。

关联事件

深度学习模型升级引发AI能力大跃进，行业迎新变革

143

深Seek R1模型完成“小版本”升级，显著增强代码能力、语义理解和复杂逻辑推理，带来性能提升。此次升级由官方宣布，用户可在官网和APP体验，模型在训练基础上基于V3-0324版本，效果明显优于之前版本。尽管期待大版本更新，但此次小升级已引发行业关注，显示出深度学习技术不断突破的趋势。未来，模型升级或将推动AI在编程、文本理解等领域的广泛应用，影响行业发展方向。