ICASSP 2022 |快手联合发起的深度 3D 音频信号处理挑战赛成绩正式发

2023-01-04 15:38:00
aiadmin
原创
2242

举动第一届 L3DAS21 竞争的冠军,速手音视频技艺部音频算法团队正在深度进修的音频信号打点偏向上络续探求。此次团队纠合意大利罗马第一大学首倡离间赛,旨正在供应一个通用的数据集和公正的测试平台,煽动线D 深度音频信号打点重点技艺的探索。基于深度进修的 3D 音频信号打点技艺惹起学术界和工业界寻常体贴,正在虚拟和可靠集会、逛戏开荒、音乐制制,自愿驾驶及监控等规模深化行使。相较于单通道音频,3D 音频带领的增量三维声源方位消息,有助于晋升语音和情绪识别、声源差别、语音巩固和去噪,以及声学应声扫除算法的后果。

颠末近三个月的激烈竞赛,离间赛结果正式出炉。职司一中,卡耐基梅隆大学、百度和腾讯陈列前三名;中科院声学所、重庆邮电大学和新加坡 ForteMedia 陈列职司二的前三名。同时,速手将为每个职司的前两名团队供应丰富奖金。此次离间赛数据集模仿了 40,000 余个 3D 境遇,供应了 2 组 Ambisonics 格局的 3D 灌音。参赛团队的成就通过语音可懂度目标 (Short-Time Objective Intelligibility, STOI) 和单词毛病率 (Word Error Rate, WER) 两个目标实行归纳评定。

速手音视频技艺部集聚了音频规模顶尖人才,联合速手营业促进了前沿算法的行使和落地,深化及时语音通讯、音频音效及后打点、音频内容通晓、音频编解码、音频硬件等众个规模。团队成员正在 IEEE ICASSP、Interspeech、ACM/IEEE TALSP 等顶级学术集会和期刊上,均有宣告系列学术论文,并众次斩获音频离间赛冠军。

速手界说的「音视频」不节制于画面观感,更夸大「视」「听」联合的极致体验。正在分歧场景中,速手音视频技艺部通过将充足的音频打点才气与视频打点才气相联合,自愿酿成算法决议,为用户暴露真正的视听盛宴。对付前沿技艺,团队将络续参加研发与探求,保留领先,以应对更为充足众元的行使场景。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号