Whisper-WebUI整合包(I卡)
测试环境:Windows 11 专业版 22631.3593,显卡驱动版本:31.0.101.5445; 
 
说明: 
1). 语音生成字幕及文本的AI工具,同时有字幕文本转译功能; 
 
2). 双击目录下“Whisper启动.bat”运行;默认调用Whisper。 
 
3). 网盘上传了large-v2模型,本地模型路径:.\Whisper-WebUI\models\Whisper 
 
2024.08.31更新: 
1).适配新版本whisper,更新ipex版本为2.1.4; 
 
2).由于pyannote.audio3.3.1需要torchaudio2.2以上版本,因此回退到3.1.1版本,作用于声纹分割聚类(Speaker Diarization)。  
 
3).Diarization功能测试正常,启用需要有HuggingFace账号(需魔法),在HF上接受两个模型的协议a.b.,并创建访问令牌,具体看README,若操作不当程序会报错。 
 
提取码:KEFG 
 
 
测试截图:
 
 
各个模型占用显存如图: 
 
参考资料: 
 
2024-05-25
浏览803
其他AI
登录后评论
1
5