MOSS-Voice++是专为情境智能打造的语音生成基础大模型。通过预训练和多任务后训练,实现了单一模型统一多种语音生成任务。从创作到交互,一次集成,多场景落地,声音所想即所得。
- 🎯 指令控制:通过文本指令精准语音音色、风格、情绪,无需克隆已有音色。
- 🌈 环境音模拟:支持环境音语音同步生成、创造身临其境的情境体验。
- 👥 多说话人:多说话人语音生成与准确切换,准确处理复杂对话场景。
- 🗣️ 方言支持:支持上海话、四川话、广东话、陕西话四种方言。
- 🎵 声音事件:支持语音声音事件交替混合生成,全面提升创作维度。
试听demo请见我们的演示主页。