sitin 0 关注者 关注 2个月前 Kyutai STT ——实时语音转文字(speech-to-text) 场景优化的开源模型,主要特点是 低延迟、高准确率、强并发处理能力。 内置语义语音活动检测模块,能智能判断用户是否说完话,提升对话自然度。而且支持多平台实现,包括 PyTorch、Rust 和 MLX,非常适合各种应用场景。#语音识别 #人工智能 #Kyutai STT #语音转文字 #开源模型 #低延迟 #人工智能 前往原网页查看