Vincent Yang
1天前
Koe v1.0.7 发布了!这个版本加入了实时语音识别文字预览,说话的时候可以直接在屏幕底部看到识别内容。同时新增了设置引导,对于普通用户不用再手动编辑 YAML 配置文件了。
Gorden Sun
2天前
PrismAudio:视频生成音效 阿里开源的模型,输入视频,自动生成跟画面匹配的音效。效果还不错。 项目地址: 模型:
seekinganythingbutalpha
3天前
我不太明白为什么字节的语音识别(STT)可以做到价格最低,但是文字转语音(TTS)却是大厂中价格最高的。 难道是因为方言采风和合成的前期成本比较高? 图中价格均为今日询价计算得出,不保证时效性和正确性。 阿里价格仅为参考,不太适合一般开发者使用。