ICASSP 2022|快手联合发起的深度3D音频信号处理挑战赛成绩发布

2024-03-25 14:51:00
aiadmin
原创
823

动作第一届 L3DAS21 竞赛的冠军,速手音视频技能部音频算法团队正在深度练习的音频信号照料偏向上赓续研究。此次团队合伙意大利罗马第一大学倡始寻事赛,旨正在供应一个通用的数据集和平正的测试平台,推动线D 深度音频信号照料主旨技能的商酌。基于深度练习的 3D 音频信号照料技能惹起学术界和工业界渊博合切,正在虚拟和切实集会、逛戏拓荒、音乐创制,自愿驾驶及监控等范畴长远运用。相较于单通道音频,3D 音频率领的增量三维声源方位音信,有助于晋升语音和心情识别、声源星散、语音加强和去噪,以及声学反响杀绝算法的成果。

经历近三个月的激烈竞赛,寻事赛结果正式出炉。职司一中,卡耐基梅隆大学、百度和腾讯排列前三名;中科院声学所、重庆邮电大学和新加坡 ForteMedia 排列职司二的前三名。同时,速手将为每个职司的前两名团队供应丰富奖金。此次寻事赛数据集模仿了 40,000 余个 3D 处境,供应了 2 组 Ambisonics 方式的 3D 灌音。参赛团队的收获通过语音可懂度目标 (Short-Time Objective Intelligibility, STOI) 和单词纰谬率 (Word Error Rate, WER) 两个目标举办归纳评定。

速手音视频技能部集聚了音频范畴顶尖人才,连合速手营业胀动了前沿算法的运用和落地,长远及时语音通讯、音频音效及后照料、音频内容通晓、音频编解码、音频硬件等众个范畴。团队成员正在 IEEE ICASSP、Interspeech、ACM/IEEE TALSP 等顶级学术集会和期刊上,均有楬橥系列学术论文,并众次斩获音频寻事赛冠军。

速手界说的「音视频」不范围于画面观感,更夸大「视」「听」团结的极致体验。正在差异场景中,速手音视频技能部通过将丰裕的音频照料才气与视频照料才气相连合,自愿酿成算法决定,为用户大白真正的视听盛宴。对待前沿技能,团队将赓续进入研发与研究,依旧领先,以应对更为丰裕众元的运用场景。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号