国内大模型公司To B不好做了,大家需求很一致,效果对齐deepseek 或者 直接部署deepseek。
德潤傳媒
2天前
DeepSeek缺少芯片支持推遲發布新模型
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5天前
看字节seed这研究趋势,不会截胡了DeepSeek的下一个突破吧?🤔 北京大学、ByteDance Seed和香港大学研究:SWE-Swiss——一个用于构建人工智能的完整训练“公式”,用于解决软件工程任务。 基于此,他们的32B参数SWE-Swiss-32B在SWE-bench Verified上达到了60.2%,为其尺寸设定了新的SOTA。 这证明,通过合适的方法,中型模型可以超越其重