九原客 0 关注者 关注 11个月前 2025年LLM趋势个人预测: 1. Test-time compute 使Agent生产可用。GPT-4o能力级别模型可普遍做到 500 tokens/s 的推理速度从而解决推理耗时问题。 2. 多模态大模型生产可用,端到端和大小模型组合两种架构并驾齐驱。 3. 更多领域级的小模型(不仅是数学、代码)从通用模型分化并提升效果。 #LLM趋势 #Test-time compute #多模态大模型 #模型推理速度 #领域级小模型 前往原网页查看