小米声音识别算法性能新突破:国际排名第一
- 2024-09-17 11:55:00
- aiadmin 原创
- 259
据明了,Google将AudioSet数据集分为三个子集,前两个子集用于教练,被兼并称为 “AudioSet-2M”。恰是正在这个兼并后的教练集结,小米的音响识别算法模子初次正在业界冲破了50 mAP,改正了音频象征手艺目标,成为截至目前机能最好的模子。
别的,小米还揭橥了一个Mini版模子,适合伙源受限的场景。该模子的参数目被压缩到了原模子的约九分之一,远小于其他机构的模子,但机能却优于其他全面机构。
这项手艺的冲破意味着小米的音响识别算法才略再次精进,小米的繁众智能硬件修设操纵此项手艺后,可能更灵活地逮捕和识别境况音响,大幅提拔硬件的智能化水平,从而为用户创造尤其便捷的智能生存体验。
小米此次精进后的音响识别算法,具有极高的操纵价格。它不妨广博操纵于小米的智能修设中,大幅提拔用户的智能生存体验。简直来说,音频象征算法不妨识别广博的境况音响,好比婴儿的啼哭声、动物啼声、汽车引擎声、爆炸声、烟雾警报、门铃声、水流声等,并让境况中的音响以文字等模态外达。
别的,这项算法手艺还广博操纵于小米机械人的研发中,大幅提拔了机械人的感知才略。人形机械人CyberOne可能识别85种境况音响,不妨通过听觉感知6类、45种人类激情。而小米第二代仿生四足机械人CyberDog 2则可能识别38种境况音响,杀青更强壮的动态反响才略。
联系我们
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255