Gorden Sun

Gorden Sun

0 关注者

4小时前

Cohere开源语音识别模型Transcribe 2B参数,本地能跑,可能是目前的开源最佳,但是不确定中文识别的效果如何。 模型:

#Cohere #语音识别 #Transcribe #开源模型 #中文识别

相关新闻

placeholder

Vincent Yang

1天前

Koe v1.0.7 发布了!这个版本加入了实时语音识别文字预览,说话的时候可以直接在屏幕底部看到识别内容。同时新增了设置引导,对于普通用户不用再手动编辑 YAML 配置文件了。

placeholder

Gorden Sun

2天前

PrismAudio:视频生成音效 阿里开源的模型,输入视频,自动生成跟画面匹配的音效。效果还不错。 项目地址: 模型:

placeholder

seekinganythingbutalpha

3天前

我不太明白为什么字节的语音识别(STT)可以做到价格最低,但是文字转语音(TTS)却是大厂中价格最高的。 难道是因为方言采风和合成的前期成本比较高? 图中价格均为今日询价计算得出,不保证时效性和正确性。 阿里价格仅为参考,不太适合一般开发者使用。

placeholder

Larry & Leo & Lucky 🍀

4天前

Terminal 下, 需要支持按住 SPC 语音识别, 从 xfce4 升级到了 plasma, 整个过程让 Claude Code 帮我搞, 所有配置基本全部无缝迁移. 我都不敢去想, 之前这 20 年, 自己用 linux 都是过的什么样的日子....

placeholder

 快乐永远 

1周前

冷知识: 腾讯最早在腾讯云的 中英文混合识别接口(16k_zh_en)中支持 “潮汕话” 的语音识别转文字; 但在中文方言识别接口(16k_zh_large) 至今未能支持潮汕话 ….而微信输入法 和 微信 的语音输入,同样还没有支持….

© 2025 news.news. All rights reserved. 0.03521 秒. v1.0.46
我的评论