迄今最复杂人工智能语音模型创建可模仿人的原声总编辑圈点

2024-06-14 13:57:00
aiadmin
原创
497

据英邦《逐日邮报》23日报道,脸书母公司元宇宙平台公司(Meta)称,其已研制出“迄今功用最庞大的语音天生式人工智能Voicebox”,它可以模拟任何人的音响,网罗逝者。只是,因为顾忌这项前辈技能会被滥用,Meta揭橥不会公然其人工智能模子。

Meta公司深度进修人工智能钻研职员正在先容Voicebox时指出,Voicebox利用了“流成婚”伎俩,其外示优于目今最前辈天生式语音编制利用的扩散模子。结果显示,Voicebox天生的人工音频更容易判辨,单词谬误率为1.9%,低于逐鹿敌手的5.9%。其余,Voicebox天生的音频与真人的类似性更高,同时速率速了近20倍。

正在跨言语翻译时,Voicebox的外示优于备受外扬的众言语文本—语音AI YourTS,单词均匀谬误率从10.9%下降到5.2%,音频类似度从0.335进步到0.481。

Meta论说了Voicebox的众种用处,称其可用来助助视障人士听到恩人和亲人的讯息,或答允非母语人士用本人的音响翻译本人所说的话。据悉,Voicebox目前能说6种言语:英语、法语、西班牙语、德语、波兰语和葡萄牙语。

只是,Meta夸大称,因为潜正在的滥用危机,他们目前不会公然Voicebox模子及其代码。固然他们以为向人工智能社区绽放并分享钻研,对付饱吹人工智能向前迈进特别厉重,但正在绽放与义务之间博得精确的均衡也至闭厉重。

ChatGPT横空出生半年众时辰,人们已然深远感应到人工智能言语模子的庞大。对付各类提问,它都能对答如流,令人感叹。试念一下,即使人工智能正在答复人类的提问时,不但内容款式酷似真人,就连音响也令人真假难辨,用户生怕会感应到更强的障碍力。尔后者,恰是语音天生式人工智能要达成的倾向。只是,正如文中所言,这些庞大的技能确实有被滥用的可以,正在人工智能技能一直升级迭代的同时,联系禁锢与伦理限制也要实时“上途”。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号