sitin2025-05-31 12:10:00秘塔AI搜索推出了全新“极速”模型。 通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。 新版模型不仅更快,准确率更高,逻辑也更清晰。 大家可以去提问,感受一下。
Jesse Lau 遁一子2025-05-30 11:21:44都是gemini 2.5 pro,感觉Google目前的算力分配 Canvas > AI Studio > Gem 也就是bug触发率依此顺序增加
Compute King2025-05-07 16:29:21重要提醒:数据,信息和分析仅供参考,不做投资指引。 作为一个在半导体行业多家核心公司工作了20多年的老人,我的推主要是关于对半导体和芯片产业,以及AI,HPC,以及算力的产业链研究。 总结一下,欢迎大家翻看我最近两个月的历史文章: 先更新一下NVidia的链接 NVidia英伟达 $NVDA Part 1 —— Part 2 —— Part 3 —— Part 4 —— Cor
高级分析师2025-03-05 00:34:30上周全是唱衰OpenAI,唱衰GPT 4.5 的言论,都觉得是拉了一坨大的。结果盲测结果GPT 4.5直接登顶了。舆论一天到晚说Grok 3和GPT 4.5用了那么多算力也不过如此,实际上回答的改进是永无止境的。