小米声音识别算法性能新突破:国际排名第一

2024-09-17 11:55:00
aiadmin
原创
259

据明了,Google将AudioSet数据集分为三个子集,前两个子集用于教练,被兼并称为 “AudioSet-2M”。恰是正在这个兼并后的教练集结,小米的音响识别算法模子初次正在业界冲破了50 mAP,改正了音频象征手艺目标,成为截至目前机能最好的模子。

别的,小米还揭橥了一个Mini版模子,适合伙源受限的场景。该模子的参数目被压缩到了原模子的约九分之一,远小于其他机构的模子,但机能却优于其他全面机构。

这项手艺的冲破意味着小米的音响识别算法才略再次精进,小米的繁众智能硬件修设操纵此项手艺后,可能更灵活地逮捕和识别境况音响,大幅提拔硬件的智能化水平,从而为用户创造尤其便捷的智能生存体验。

小米此次精进后的音响识别算法,具有极高的操纵价格。它不妨广博操纵于小米的智能修设中,大幅提拔用户的智能生存体验。简直来说,音频象征算法不妨识别广博的境况音响,好比婴儿的啼哭声、动物啼声、汽车引擎声、爆炸声、烟雾警报、门铃声、水流声等,并让境况中的音响以文字等模态外达。

别的,这项算法手艺还广博操纵于小米机械人的研发中,大幅提拔了机械人的感知才略。人形机械人CyberOne可能识别85种境况音响,不妨通过听觉感知6类、45种人类激情。而小米第二代仿生四足机械人CyberDog 2则可能识别38种境况音响,杀青更强壮的动态反响才略。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号