#多语种

4个月前

HeyGen 这波视频翻译升级，我真觉得有点东西。之前 AI 翻译视频，更多还是「能看懂」的水平，这次是往「真假难辨」方向走了一步。 1.口型这块是真的更像真人了不只是正脸那种「官方 demo 姿势」，连侧脸、嘴巴被挡一半、光线不太好的画面，翻译后的嘴型都还挺自然。以前很多工具一转语言就「嘴在念 A、声音在说 B」，现在这个违和感小很多。 2.翻译开始“看懂画面”了以前更多是照着字幕硬翻，现在它会结合画面去理解语境——愤怒场景里的 “no”，和教学视频里的 “no”，语气完全不一样，这次它是真的会去调这个情绪。对做内容的人来说，很关键。 3.原视频烂一点也没那么怕了随手手机拍、环境吵一点，按理说是翻译模型的灾难场景，但他们这次是把「输出音质」拉得很干净，感觉更像是帮你顺手做了个降噪 + 重新录了一遍的感觉。 4.多说话人 + 性别识别也在往「真实对话」靠以前多人的场景最容易出戏：同一段对话里，不同人、不同性别用的是同一副声音。现在能区分说话人、自动配不同音色，多人对话看起来就没那么“翻译腔”了。 5.还有一个比较现实的点：入口已经铺好了现在 iOS App 已经上线，YouTube 贴链接就能翻。API 和网页版也准备开放，对做产品、做自动化工作流的人来说，很容易塞进自己的一套系统里。视频翻译这条赛道，感觉已经从“玩具阶段”，往“生产力工具”那一档迈进了一小步。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#视频翻译 #HeyGen #AI #口型同步 #多语种

5个月前

卧槽兄弟们 Soul发布的这个语音模型很强 SoulX-Podcast实现了：高真实度、长时段、多说话人、多语种（中英双语 + 多方言）播客式语音生成具备方言与副语言（如笑声、叹气等）控制能力可连续生成 90 分钟以上的对话内容而不失稳定性支持普通话、英语及多种中文方言多人多轮对话还支持在零样本（zero-shot）条件下完成声音与语气的克隆与迁移

#SoulX-Podcast #语音生成 #多语种 #高真实度 #播客

6个月前

已提现实现布局 150+ 国家和地区的自媒体业务人物替换：Wan-AI/Wan2.2-Animate 数字人配音：Eleven Labs 多语种视频翻译：Heygen

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#自媒体 #国际化 #数字人 #多语种 #AI

网易新闻-都市快报橙柿互动

6个月前

女子深夜遭男子尾随骚扰！她用普通话长沙话英文大声斥骂，男子灰溜溜地逃走……

女子深夜遭男子尾随骚扰！她用普通话长沙话英文大声斥骂，男子灰溜溜地逃走……,王晨,普通话,长沙话

#尾随骚扰 #女子斥骂 #多语种 #王晨 #正义行为

中国日报网-中国新闻网

10个月前

义乌老板娘用AI实现多语种“带货”

#义乌 #AI #多语种 #带货 #女性创业