弧
管理员
CosyVoice(i卡整合包)
介绍:
1). 阿里推出的开源语音克隆、文本转语音项目,支持情感控制及粤语。
2). 本次测试以Windows 11 专业版22631.3880为例,显卡驱动5445;
3).ipex版本为2.1.30+xpu;
说明
1).针对I卡做了适配。
2).长文本情况下显存占用较高,有接近16G占满情况(测试多行1000字左右)
3).相较于ChatTTS,CosyVoice多段长文本音色统一;有音色复刻功能,复刻效果还不错。
4).模型文件单独压缩,models.7z解压后将两个文件夹放置于根目录下的pretrained_models中,其余模型也可自行到魔搭社区下载。
5).需要切换模型可以在启动文件中修改--model_dir pretrained_models/CosyVoice-300M
6).整合包建议使用7zip 23.01或以上版本进行解压,应尽量避免使用中文路径及中文命名的输入文件。
2025.03.05
目前github有大佬适配了2.0的版本,具体可以看:,会部署的小伙伴可以自行尝试。
测试截图:
音频效果:见网盘文件
链接:
提取码: COSY
参考资料:
项目官网:
Git仓库:
ipex:
- 下载图片
- 复制图片
2024-08-11
浏览782
其他AI
登录后评论
11
8
4