sitin

sitin

0 关注者

2周前

Kyutai STT ——实时语音转文字(speech-to-text) 场景优化的开源模型,主要特点是 低延迟、高准确率、强并发处理能力。 内置语义语音活动检测模块,能智能判断用户是否说完话,提升对话自然度。而且支持多平台实现,包括 PyTorch、Rust 和 MLX,非常适合各种应用场景。#语音识别 #人工智能