腾讯主导!新一代实时语音编码标准AVS3P10即将发布

2024-11-13 09:52:00
aiadmin
原创
72

该规范由腾讯修议启动、推动和爱护,以腾讯首款神经搜集语音编解码器Penguins为原型,历程AVS音频组众家成员单元配合功劳。

行动环球首个别系性引入人工智能并杀青真正意旨上的低码率下高质地语音编码规范,AVS3P10的显示抵达邦际一流水准。仅需现有主流规范1/3的编码码率,就能杀青一致清爽的音质。

这意味着,以来正在线上聚会、语音通话等及时音频场景,带宽请求大幅下降。纵使正在电梯、地库、地道等搜集很差的情况,也能杀青清爽畅通的语音通话。

正在有限的带宽条目下,念要将音响高质地转达到收受方,压缩原始数据、去除冗余音信的语音编码技艺是此中合头。然而,基于EVS、OPUS等现有主流音频编解码规范,当码率下降到10kbps以下时,语音质地消重显着,影响用户体验。

为应对该挑拨,腾讯聚会天籁测验室连合腾讯AI Lab自研了腾讯首款神经搜集语音编解码器——Penguins。此次AVS音频组AVS3P10规范领受的腾讯侧计划,便是以Penguins为原型。

实在来说,Penguins将AI与守旧技艺严紧协调,从算法钻研、工程化、产物化层面做了大宗体系性更始,突破守旧香农定律的机能极限,引入大数据并正在可控算力增量下供应了新的机能上界,从而对下一代通讯体系,越发是信源编码器片面,供应了新的技艺基本和本领论。通过AI语音信号修模,提取最中央的特质参数编码,再借助深度进修搜集,预测并重修语音中的细小构造,最终身成传神的音频波形。

众方测试剖明,腾讯提交的AVS3P10规范,代外了目前AI Codec的行业最高程度。该规范杀青了6kbps下的高质地语音通讯,纵使正在“2G”搜集下也能杀青清爽通话,且主观质地特别挨近原始参考信号,媲美邦际主流的OPUS规范正在20kbps的质地。同时,主观质地对标守旧编码的中高码率环境下,编码功用晋升200-300%。

2021年起,Penguins音频编码器就正在腾讯聚会的驾驶形式、弱网形式及QQ语音通话等场景中加入范畴使用,救援了亿级用户的畅通疏通。无论是正在庞杂的搜集情况中,依旧正在高速挪动的交通器械上,都能供应清爽的音频通讯体验。

2023年3月,腾讯团队正在AVS音频组主动修议并介入规范同意,促举办业的技艺提高,即AVS3P10及时语音编码规范。随后,腾讯提交基于Penguins的候选技艺;历程AVS音频组交叉验证后领受。2024年6月,AVS3P10及时语音编码规范正式完工规范化处事,进入公示阶段。

值得一提的是,腾讯主导该规范同意的进程,也被AVS处事组评议为同意速率最疾,规范交付质地最高,测试取得足够好评。

“AVS3P10及时语音编码,行动新一代的语音编解码技艺规范,是对AVS系列规范的要紧填充。该规范是暂时业界的最高程度,显露了腾讯正在语音处置、人工智能技艺更始和用户体验方面的能力,将为用户带来更好的体验”,AVS处事组指出。

正在编解码、音频降噪、语音加强等周围,腾讯聚会天籁测验室正正在寻觅及时音频通讯前沿技艺,打制环球领先的及时音频通讯端到端处置计划。同时,通过将更众钻研功劳使用到腾讯聚会等产物中,延续晋升用户体验,打制“听得清、听得真”的极致体验。

阿里实行13天婚假策略,员工可分两次歇完;永辉超市发外穷究王健林等法令职守;爱玛实控人被留置、立案探问丨雷峰早报

IT巨头正在中邦大幅裁人2千人;微软忽然发外终止中邦区域这项片面供职;3万华为人涌入上海,左近房租翻倍,有华为员工跨省租房丨雷峰早报

影视飓风科普视频被迫全网下架,曝光了平台一系列压缩画质的骚操作;贾跃亭创办片面IP公司;雷军正在线澄清「友商是XX」丨雷峰早报

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号