输入 5 秒的声音样本,即刻体验文本到语音转换。


仅需 1 分钟的训练数据即可微调模型,提升声音相似度和真实感。


支持与训练数据集不同语言的推理,目前支持英语、日语和中文。


集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。


📎开源地址

📎教程地址


🏷标签:#开源 #工具 #配音 #SoVITS #声音克隆