plusxiaxia 0 关注者 关注 3天前 优化了两天智能体,对顶级大模型又有新的认知。 1. 提示词只要结构清晰、规则明确,哪怕啰嗦点、长点,对响应时间没影响。 2. 中等长度的提示词(五千token左右),开不开提示词缓存响应时间也没啥影响。 3. 问题改写跟意图识别可以合并一块,一把输出,又快又好使。 4. 小模型不见得快 前往原网页查看