开源项目 地址 https://github.com/FireRedTeam/FireRedTTS
项目用途:
写一段文本
上传一段参考音频
本工具参考你上传的音频文件,将文本转换成音频
实际测试下来没什么用
生成的音频与上传的参考音频不搭杠
根本不沾边....
在我看来,连玩具都算不上
虽然我不会写代码。。。
问题点,原版显存不会回收
例如,你写了200字,大概会占用16gb显存
音频生成完毕后,显存依然占用16gb
哪怕你重新写一个字,再生成音频,依然会占用16gb显存
我这版已修复显存占用问题,生成音频后,显存即会回收
问题2,长文本(大概200以上没有细测)
占用显存非常大
通常一两句话或者两三句话,显存占用6-8gb
200字左右显存占用16gb了
参考音频都是相同的,40秒左右MP3
有待作者优化
问题3,长文本(大概200以上没有细测)
生成的音频文件语速飞快,至少2x以上
没有找到问题原因,无法修复
待作者修复
问题4,逗号通常会被读成“啊”
!!!!
综上,此项目没什么用
本站负优化后的
评论 (0)