专访：DeepSeek为何能在AI大模型- news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

Blarney

0 关注者

6个月前

专访：DeepSeek为何能在AI大模型中脱颖而出

#专访 #DeepSeek #AI大模型 #技术创新

相关新闻

纽约时报中文网

1天前

中国多年来一直被指责抄袭其他国家的技术，但如今，受北京的战略政策以及学术研究环境日趋成熟推动，中国不仅在可再生能源领域的专利与论文数量上占据了主导地位，而且还作出了有助于推动全球摆脱化石燃料的重大贡献。

德潤傳媒

1天前

DeepSeek缺少芯片支持推遲發布新模型

夏雨婷

2天前

有时候觉得华为的硬件基本是负价值，比如就DeepSeek这个事情，全公司那么多顶级的LLM专家不知道光工资和社保要交多少，全在那陪着华为浪费时间白白错过市场先机在那消耗DeepSeek来之不易的品牌价值，损失价值不知道多少万块H100了。

dontbesilent

3天前

为了同时打开多个 AI 大模型，我的解决方案： 1、首先选了一个 34 寸的带鱼屏显示器 2、发现 34 寸显示器就算是 5K 分辨率，也不能实现 retina 效果 3、换成 27 寸 5K 分辨率 LG 面板显示器 4、MacBook 带这个显示器费劲，换成 M4 芯片的 mac mini 5、显示器和 mac mini 都没有内置麦克风，还要单独配一个 USB 麦克风 6、5K

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

4天前

看字节seed这研究趋势，不会截胡了DeepSeek的下一个突破吧？🤔 北京大学、ByteDance Seed和香港大学研究：SWE-Swiss——一个用于构建人工智能的完整训练“公式”，用于解决软件工程任务。基于此，他们的32B参数SWE-Swiss-32B在SWE-bench Verified上达到了60.2%，为其尺寸设定了新的SOTA。这证明，通过合适的方法，中型模型可以超越其重