迄今最复杂人工智能语音模型创建可模仿人的原声总编辑圈点
- 2024-06-14 13:57:00
- aiadmin 原创
- 497
据英邦《逐日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功用最庞大的语音天生式人工智能Voicebox”,它可以模拟任何人的音响,网罗逝者。只是,因为顾忌这项前辈技能会被滥用,Meta揭橥不会公然其人工智能模子。
Meta公司深度进修人工智能钻研职员正在先容Voicebox时指出,Voicebox利用了“流成婚”伎俩,其外示优于目今最前辈天生式语音编制利用的扩散模子。结果显示,Voicebox天生的人工音频更容易判辨,单词谬误率为1.9%,低于逐鹿敌手的5.9%。其余,Voicebox天生的音频与真人的类似性更高,同时速率速了近20倍。
正在跨言语翻译时,Voicebox的外示优于备受外扬的众言语文本—语音AI YourTS,单词均匀谬误率从10.9%下降到5.2%,音频类似度从0.335进步到0.481。
Meta论说了Voicebox的众种用处,称其可用来助助视障人士听到恩人和亲人的讯息,或答允非母语人士用本人的音响翻译本人所说的话。据悉,Voicebox目前能说6种言语:英语、法语、西班牙语、德语、波兰语和葡萄牙语。
只是,Meta夸大称,因为潜正在的滥用危机,他们目前不会公然Voicebox模子及其代码。固然他们以为向人工智能社区绽放并分享钻研,对付饱吹人工智能向前迈进特别厉重,但正在绽放与义务之间博得精确的均衡也至闭厉重。
ChatGPT横空出生半年众时辰,人们已然深远感应到人工智能言语模子的庞大。对付各类提问,它都能对答如流,令人感叹。试念一下,即使人工智能正在答复人类的提问时,不但内容款式酷似真人,就连音响也令人真假难辨,用户生怕会感应到更强的障碍力。尔后者,恰是语音天生式人工智能要达成的倾向。只是,正如文中所言,这些庞大的技能确实有被滥用的可以,正在人工智能技能一直升级迭代的同时,联系禁锢与伦理限制也要实时“上途”。
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255