黑

0 关注者

22小时前

Kimi K2.5 发布半个月以来,我们的推理服务接受了前所未有的挑战,为了应对持续增长的请求数,我们想尽办法从各种地方掠夺了 GPU 资源,同时也在尝试新的推理方案和调度策略。现在,我们已经能“稳稳接住”这泼天的富贵,从推理速度、到 API 稳定性、再到资源利用率都是前所未有地好,好上加好。(1/7)

热门新闻