好多人说 DeepSeek 不行了,但是半年多以前的 R1 依然在大多数模型发布的 benchmark 里,这不恰恰说明半年前的模型依然能打么?
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
20小时前
看字节seed这研究趋势,不会截胡了DeepSeek的下一个突破吧?🤔 北京大学、ByteDance Seed和香港大学研究:SWE-Swiss——一个用于构建人工智能的完整训练“公式”,用于解决软件工程任务。 基于此,他们的32B参数SWE-Swiss-32B在SWE-bench Verified上达到了60.2%,为其尺寸设定了新的SOTA。 这证明,通过合适的方法,中型模型可以超越其重
dontbesilent
21小时前
ChatGPT 的 study mode,是不是我写一套提示词做一个智能体,就可以实现? 这个有什么特殊之处吗
花果山大圣
22小时前
看了下vue的vapor模式 很强啊 这个中文应该叫啥
BBC News 中文
3天前
专家称,DeepSeek对美国科技的撼动并未持久。这部分归因于营运挫折,也源于来自美国与中国公司的激烈竞争。该公司的下一代产品DeepSeek-R2据报已延迟原因之一是高端晶片短缺。
花果山大圣
3天前
vue vapor模式中文应该叫啥