Blarney
0 关注者
专访:DeepSeek为何能在AI大模型中脱颖而出
纽约时报中文网
1天前
中国多年来一直被指责抄袭其他国家的技术,但如今,受北京的战略政策以及学术研究环境日趋成熟推动,中国不仅在可再生能源领域的专利与论文数量上占据了主导地位,而且还作出了有助于推动全球摆脱化石燃料的重大贡献。
德潤傳媒
DeepSeek缺少芯片支持推遲發布新模型
夏雨婷
2天前
有时候觉得华为的硬件基本是负价值,比如就DeepSeek这个事情,全公司那么多顶级的LLM专家不知道光工资和社保要交多少,全在那陪着华为浪费时间白白错过市场先机在那消耗DeepSeek来之不易的品牌价值,损失价值不知道多少万块H100了。
dontbesilent
3天前
为了同时打开多个 AI 大模型,我的解决方案: 1、首先选了一个 34 寸的带鱼屏显示器 2、发现 34 寸显示器就算是 5K 分辨率,也不能实现 retina 效果 3、换成 27 寸 5K 分辨率 LG 面板显示器 4、MacBook 带这个显示器费劲,换成 M4 芯片的 mac mini 5、显示器和 mac mini 都没有内置麦克风,还要单独配一个 USB 麦克风 6、5K
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
4天前
看字节seed这研究趋势,不会截胡了DeepSeek的下一个突破吧?🤔 北京大学、ByteDance Seed和香港大学研究:SWE-Swiss——一个用于构建人工智能的完整训练“公式”,用于解决软件工程任务。 基于此,他们的32B参数SWE-Swiss-32B在SWE-bench Verified上达到了60.2%,为其尺寸设定了新的SOTA。 这证明,通过合适的方法,中型模型可以超越其重