Cohere开源语音识别模型Transcribe 2B参数，本地能跑，可能是目前的开源最佳，但是不确定中文识别的效果如何。模型：

#Cohere #语音识别 #Transcribe #开源模型 #中文识别

Vincent Yang

1天前

Koe v1.0.7 发布了！这个版本加入了实时语音识别文字预览，说话的时候可以直接在屏幕底部看到识别内容。同时新增了设置引导，对于普通用户不用再手动编辑 YAML 配置文件了。

Gorden Sun

2天前

PrismAudio：视频生成音效阿里开源的模型，输入视频，自动生成跟画面匹配的音效。效果还不错。项目地址：模型：

seekinganythingbutalpha

3天前

我不太明白为什么字节的语音识别(STT)可以做到价格最低，但是文字转语音(TTS)却是大厂中价格最高的。难道是因为方言采风和合成的前期成本比较高？图中价格均为今日询价计算得出，不保证时效性和正确性。阿里价格仅为参考，不太适合一般开发者使用。

Larry & Leo & Lucky 🍀

4天前

Terminal 下, 需要支持按住 SPC 语音识别, 从 xfce4 升级到了 plasma, 整个过程让 Claude Code 帮我搞, 所有配置基本全部无缝迁移. 我都不敢去想, 之前这 20 年, 自己用 linux 都是过的什么样的日子....

 快乐永远 

1周前

冷知识：腾讯最早在腾讯云的中英文混合识别接口（16k_zh_en）中支持 “潮汕话” 的语音识别转文字；但在中文方言识别接口（16k_zh_large) 至今未能支持潮汕话 ….而微信输入法和微信的语音输入，同样还没有支持….

Cohere开源语音识别模型Transcribe 2B参数，本地能跑，可能是目前的开源最佳，但是不确定中文识别的效果如何。 模型：