微软发布 AI 声音生成工具 VALL-E只需 3 秒音频即可模仿人说话
- 2023-02-14 12:12:00
- aiadmin 原创
- 2204
IT之家 1 月 10 日动静,微软比来揭晓了一款名为 VALL-E 的人工智能器械,只需 3 秒音频即可效仿人说线 小时英语语音数据的操练,并应用特定语音的 3 秒剪辑来天生内容。与目前的很众人工智能器械分别,VALL-E 能够复制言语者的感情和语气,纵使言语者自己从未说过的单词也能够效仿。
IT之家明白到,康奈尔大学的一篇论文应用 VALL-E 合成了几种音响,公共能够正在 GitHub 上谛听这些 AI 合成的音频。
查究职员指出,正在很众景况下,Vall-E 的机能优于现时的文本到语音转换模子。然而,该查究还写道,人工智能模子目前存正在几个题目。比方,文本提示中的某些单词或者会发音不明白、完整漏掉或正在输出中显示两次。另外,该模子目前难以效仿某些音响,特别是带有口音的音响。
像其他 AI 新本领一律,VALL-E 正在安静、伦理等方面也激发了忧愁。微软揭晓了闭于应用 VALL-E 的德行声明,但来日的应用用处方面没有真切阐明。
目前,微软 Vall-E 尚未开源。微软一经正在 GitHub 上创筑了一个 Vall-E 存储库,但目前只蕴涵一个描绘文献。
联系我们
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255