2025-03-03 18:12:37
最近两三周给很多客户反复提及的忠告:
用模型一定要用最好的那个,如果想省钱,请在你的场景下微调,而不是用一个低能力的通用模型,然后试图靠 Prompt 或者工程努力去拯救它。
比如 DeepSeek 的那一堆蒸馏模型是很好的场景级推理模型的Base,但是不要直接用,真的很差。
2025-03-03 18:12:37
2025-03-02 21:57:18
2025-03-02 20:35:48
2025-03-01 13:18:44
2025-02-28 09:10:15