2025年LLM趋势个人预测： 1. Test-time compute 使Agent生产可用。GPT-4o能力级别模型可普遍做到 500 tokens/s 的推理速度从而解决推理耗时问题。 2. 多模态大模型生产可用，端到端和大小模型组合两种架构并驾齐驱。 3. 更多领域级的小模型（不仅是数学、代码）从通用模型分化并提升效果。

#LLM趋势 #Test-time compute #多模态大模型 #模型推理速度 #领域级小模型

相关新闻

铁锤人

4个月前

刚刚2025百度世界大会，百度发布全球首个统一原生全模态大模型——文心5.0 所谓的原生全模态，就是解和生成文本，还能同时处理图像、视频、音频。我测试一下乌蝇哥的经典场面，做了个情感分析，感觉效果不错。目前，能做到原生多模态，国外就百度和 Openai，国内就百度百度一技术储备一直可以的，起大早，赶大集

AI产品黄叔

5个月前

一个AI应用如何4个月做到3000万美金年收入？一个AI设计工具，5月内测，7月公测，到9月底，日活跃用户（DAU）就冲到了15-20万，预估年收入（ARR）超过3000万美金。这家公司叫Lovart，它的创始人陈冕说，增长的秘诀不是信息流投放，而是“把未来会发生的东西提前描绘出来，然后等它发生了。” 这听起来有点玄学，但在技术范式剧烈变革的AI时代，这可能就是唯一的答案。 01 “未

Shaolei Zhang

9个月前

👏🏻Stream-Omni：一个类GPT-4o的文本-视觉-语音多模态大模型（1）同时支持文本、视觉、语音输入，生成文本和语音回复。（2）语音交互过程中，同步生成中间的语音识别、文本回复结果，提供更加全面的多模态交互体验！ 📝论文： 🔗代码&Demo：

央视网-新华社

9个月前

我国科学家研究揭示多模态大模型概念表征机制

九原客

1年前

DeepSeek V3 感觉还是差 Sonet 一筹，Benchmark 是一回事，实际表现是一回事，感觉是混入的数学语料太多。我的感受（不考虑推理模型）第一档：Claude Sonet 、Gemini Flash 2.0、 GPT-4o 第二档：DeepSeek V3、Qwen2.5-72B、国内的一票Top 模型 DeepSeek优点是速度变快+便宜～