Compute King

Compute King

#初创公司#NVIDIA#训练市场

这是一条过去两个星期被低估的新闻:这或许已经证明,初创公司再也无法和NVidia在训练市场竞争。 或者说,要想真刀真枪地挑战,初创公司得端出让人眼前一亮的训练性能,可能得数倍于英伟达,才能打破其在该领域建立起来的惯性壁垒。但到现在为止,还没人拿出过能在训练端跟英伟达一较高下的产品。 独家:SambaNova 裁员 15%,聚焦推理业务 By Sally Ward‑Foxton,EETimes 人工智能硬件初创公司SambaNova本周裁减了约15%的员工(其团队规模约500)。 SambaNova一位发言人对《EE Times》表示,此轮裁员正值公司战略由训练(Training)工作负载向AI云服务提供商转型之际。 “在过去一周,SambaNova根据当前市场状况以及我们从模型训练向微调(Fine‑tuning)和推理(Inference)转变的战略做出了调整,”该发言人说。“我们已迅速转向,专注于交付云优先解决方案,帮助企业和开发者在大规模环境中部署开源模型。为此,我们做出了艰难决定,与约75名员工分道扬镳,并重组团队以支持下一阶段增长。” 虽然数据中心AI推理(Inference)芯片市场潜力巨大,但迄今为止最大规模的部署仍采用超大云服务商(Hyperscaler)自研芯片或英伟达GPU,AMD GPU也赢得了少数超大规模客户。SambaNova的目标客户 —— 企业市场 —— 则通过云服务试探性地部署基于大型语言模型(LLM)的应用以实现推理。 大型商业AI负载的重心已从训练大型基础模型,转向按Token提供开源基础模型的推理服务。因此,数据中心AI芯片和硬件初创公司纷纷转型,通过云端为开源LLM提供API访问服务。近几个月来,SambaNova已加入Cerebras和Groq阵营,从自有硬件上提供LLM Tokens as a service。三家公司最初均专注于向其他云厂商和本地部署环境销售硬件系统,其中SambaNova和Cerebras仍在出售硬件系统。 公司与技术发展历程 SambaNova由梁卓鸿(Rodrigo Liang)与斯坦福大学教授Kunle Olukoton、Chris Ré于2017年共同创立,并于2020年12月结束“潜伏”状态。2023年,SambaNova发布了其最新一代专为LLM微调与推理设计的芯片。公司软件栈SambaNova Studio面向企业AI,既可与SambaNova机架级硬件捆绑用于本地集群,也可在云端提供服务。SambaNova还研发了自有的“专家组合”(Composition of Experts)基础模型架构。 融资状况 SambaNova在2021年完成D轮融资,使其累计融资超过11亿美元,估值超50亿美元。 原始链接:

预览

相关信息

李老师不是你老师

李老师不是你老师

2025-05-08 02:44:07

网曝近日河南新乡封丘县人民医院和当地医院,为了开源节流,裁掉了数百名低学历医护人员,其中有不少人疫情期间冲在一线。一份封丘县县直医疗卫生单位临聘人员优化工作方案指出;对于医疗卫生专业人员,全日制医学中专且取得中级以上职称、全日制医学大专且取得初级以上职称、全日制医学本科以上学历的人员,才可以采用「劳动服务形式」进行聘用。不符合上述3类条件的人员,一律予以清退。

Compute King

Compute King

2025-05-07 16:29:21

重要提醒:数据,信息和分析仅供参考,不做投资指引。 作为一个在半导体行业多家核心公司工作了20多年的老人,我的推主要是关于对半导体和芯片产业,以及AI,HPC,以及算力的产业链研究。 总结一下,欢迎大家翻看我最近两个月的历史文章: 先更新一下NVidia的链接 NVidia英伟达 $NVDA Part 1 —— Part 2 —— Part 3 —— Part 4 —— Cor

勃勃OC

勃勃OC

2025-05-06 18:17:05

据路透社报道,Nvidia 将面临一项新的重大监管措施——一位美国议员将提议立法,对 AI 芯片进行追踪,并在其被用于未经批准的地区时使系统“失效”。报道补充称,用于追踪芯片等功能的技术已经很容易获取。该立法提案的初衷是因为 Nvidia 表示其无法在产品售出后对其进行追踪。这项法案获得了两党广泛支持。

多伦多方脸

多伦多方脸

2025-05-03 10:47:54

根据财报显示,2024年中国光伏产业6巨头 净利润正的,只有两家 其中4家净利润同比下跌超150% 并且6家公司有5家裁员,平均裁员比例接近30%

勃勃OC

勃勃OC

2025-04-30 21:34:57

郭: 我们来快速看看超微(Super Micro,股票代码:SMCI)公布的初步业绩。简单来说:本季度的业绩很可能依然承压。 目前AI服务器主要分为三类:ASIC(如Google的TPU服务器)、Nvidia的GB200/300 NVL72,以及较低端的Nvidia服务器(如HGX系列)。增长主要由ASIC和NVL72驱动,尤其是来自云服务提供商(CSP)的需求。 在2025年上半年,SMC

评论 0

相关信息

李老师不是你老师

李老师不是你老师

2025-05-08 02:44:07

网曝近日河南新乡封丘县人民医院和当地医院,为了开源节流,裁掉了数百名低学历医护人员,其中有不少人疫情期间冲在一线。一份封丘县县直医疗卫生单位临聘人员优化工作方案指出;对于医疗卫生专业人员,全日制医学中专且取得中级以上职称、全日制医学大专且取得初级以上职称、全日制医学本科以上学历的人员,才可以采用「劳动服务形式」进行聘用。不符合上述3类条件的人员,一律予以清退。

Compute King

Compute King

2025-05-07 16:29:21

重要提醒:数据,信息和分析仅供参考,不做投资指引。 作为一个在半导体行业多家核心公司工作了20多年的老人,我的推主要是关于对半导体和芯片产业,以及AI,HPC,以及算力的产业链研究。 总结一下,欢迎大家翻看我最近两个月的历史文章: 先更新一下NVidia的链接 NVidia英伟达 $NVDA Part 1 —— Part 2 —— Part 3 —— Part 4 —— Cor

勃勃OC

勃勃OC

2025-05-06 18:17:05

据路透社报道,Nvidia 将面临一项新的重大监管措施——一位美国议员将提议立法,对 AI 芯片进行追踪,并在其被用于未经批准的地区时使系统“失效”。报道补充称,用于追踪芯片等功能的技术已经很容易获取。该立法提案的初衷是因为 Nvidia 表示其无法在产品售出后对其进行追踪。这项法案获得了两党广泛支持。

多伦多方脸

多伦多方脸

2025-05-03 10:47:54

根据财报显示,2024年中国光伏产业6巨头 净利润正的,只有两家 其中4家净利润同比下跌超150% 并且6家公司有5家裁员,平均裁员比例接近30%

勃勃OC

勃勃OC

2025-04-30 21:34:57

郭: 我们来快速看看超微(Super Micro,股票代码:SMCI)公布的初步业绩。简单来说:本季度的业绩很可能依然承压。 目前AI服务器主要分为三类:ASIC(如Google的TPU服务器)、Nvidia的GB200/300 NVL72,以及较低端的Nvidia服务器(如HGX系列)。增长主要由ASIC和NVL72驱动,尤其是来自云服务提供商(CSP)的需求。 在2025年上半年,SMC