东方网-上观新闻
0 关注者
Geek
12小时前
注册送 $20 可用 GPT-5、Claude Sonnet 4、GptOSS-120b。DeepSeek 免费用至 2026-01-01,未试真假,就不放自己的推广链接了(网址见图),有需要的兄弟评论区发AFF吧
德潤傳媒
2天前
DeepSeek缺少芯片支持推遲發布新模型
夏雨婷
3天前
有时候觉得华为的硬件基本是负价值,比如就DeepSeek这个事情,全公司那么多顶级的LLM专家不知道光工资和社保要交多少,全在那陪着华为浪费时间白白错过市场先机在那消耗DeepSeek来之不易的品牌价值,损失价值不知道多少万块H100了。
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5天前
看字节seed这研究趋势,不会截胡了DeepSeek的下一个突破吧?🤔 北京大学、ByteDance Seed和香港大学研究:SWE-Swiss——一个用于构建人工智能的完整训练“公式”,用于解决软件工程任务。 基于此,他们的32B参数SWE-Swiss-32B在SWE-bench Verified上达到了60.2%,为其尺寸设定了新的SOTA。 这证明,通过合适的方法,中型模型可以超越其重
yihong0618
6天前
好多人说 DeepSeek 不行了,但是半年多以前的 R1 依然在大多数模型发布的 benchmark 里,这不恰恰说明半年前的模型依然能打么?