CosyVoice(i卡整合包)
介绍: 
1). 阿里推出的开源语音克隆、文本转语音项目,支持情感控制及粤语。 
 
2). 本次测试以Windows 11 专业版22631.3880为例,显卡驱动5445; 
 
3).ipex版本为2.1.30+xpu; 
 
说明 
1).针对I卡做了适配。 
 
2).长文本情况下显存占用较高,有接近16G占满情况(测试多行1000字左右) 
 
3).相较于ChatTTS,CosyVoice多段长文本音色统一;有音色复刻功能,复刻效果还不错。 
 
4).模型文件单独压缩,models.7z解压后将两个文件夹放置于根目录下的pretrained_models中,其余模型也可自行到魔搭社区下载。 
 
5).需要切换模型可以在启动文件中修改--model_dir pretrained_models/CosyVoice-300M 
 
6).整合包建议使用7zip 23.01或以上版本进行解压,应尽量避免使用中文路径及中文命名的输入文件。 
 
 
2025.03.05 
目前github有大佬适配了2.0的版本,具体可以看:https://github.com/eighteen-k-gold-malow/CosyVoice-XPU,会部署的小伙伴可以自行尝试。 
 
测试截图: 
 
 
音频效果:见网盘文件 
 
提取码: COSY 
 
参考资料: 
 
 
2024-08-11
浏览735
其他AI
登录后评论
8
3