时政
财经
科技

#LLM趋势

九原客
九原客
2024-11-18 20:24:39

2025年LLM趋势个人预测: 1. Test-time compute 使Agent生产可用。GPT-4o能力级别模型可普遍做到 500 tokens/s 的推理速度从而解决推理耗时问题。 2. 多模态大模型生产可用,端到端和大小模型组合两种架构并驾齐驱。 3. 更多领域级的小模型(不仅是数学、代码)从通用模型分化并提升效果。

#LLM趋势#多模态大模型#模型推理速度
没有更多了 🤐