时政
财经
科技
虚拟货币
其他
登录
#推理API
关注
yan5xu
1个月前
说一个在前司的观察:搞应用的,天天手动拼 prompt、管理上下文,去提高prompt cache 命中率,都快卷的没招了,实际就是在模拟“状态”。这全赖底层的推理 API 还是最原始的 stateless 形态。 所以我有一个强烈的预感: 下个能掀起波澜的 AI 产品,会是一个深度结合推理和应用层的怪物,把状态管理、KV Cache 复用做到极致,当别人还在为优化 10% 的 prompt 成本而沾沾自喜时,它在推理层通过“降维打击”的方式,用更少的成本获得了 10 倍的性能。从此之后再也不会有人认为 AI 应用是简单的套壳了
#AI产品
#推理API
#状态管理
#kv cache
#降维打击
分享
评论 0
0
砍砍@标准件厂长
3个月前
用 Talky 的界面给大家说说推理 api 都有什么坑:
#Talky
#界面
#推理API
#注意事项
#使用技巧
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞