2个月前
秘塔AI搜索推出了全新“极速”模型。 通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。 新版模型不仅更快,准确率更高,逻辑也更清晰。 大家可以去提问,感受一下。
秘塔AI搜索推出了全新“极速”模型。 通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。 新版模型不仅更快,准确率更高,逻辑也更清晰。 大家可以去提问,感受一下。
央广网-央视新闻客户端
4个月前
响应速度提升10倍 华中地区首个“超级充电宝”投运
偶像派作手
5个月前
Grok-3 还是很强的,响应速度超快,算力很充沛。