昆仑万维正式上线Mureka V7.5模型。模型在中文歌曲创作上取得重大突破,提升了音色与演奏技法,优化了咬字和情感表现。 通过ASR技术精准捕捉演唱细节,使AI演绎的歌曲更贴近真人演唱,人声表现真实性飞跃: 1.优化ASR技术,深入分析演唱细节(气息、情感起伏、唱法)。 2.智能划分乐句,确定自然换气与停顿位置。 3.提升生成人声的段落清晰度、结构真实感、自然度、呼吸感和情感表达真实性,大幅削弱机械感。 这是首个基于 Mixture-of-Experts 的“角色描述语音合成框架”,特点包括: 1.自然语言控制:仅用文字描述即可精准定义音色与风格(如“清澈少年音带磁性尾韵”)。 2.开放域泛化:在仅使用开源数据的情况下,对标甚至超越闭源商业模型的角色贴合度。 3.技术路径:通过“模态解耦 + 知识冻结迁移”,实现文本与语音专家模块的独立优化。 4.应用规划:后续将集成至 Mureka-Speech 平台,为全球开发者提供开放、可定制的描述性语音合成能力。