搜狗推出“唇语识别”技术准确率最高达 90%

2022-10-25 15:13:00
aiadmin
原创
2411

12 月 14 日,搜狗 推出了一种人机交互新时间——“唇语识别”。据先容,唇语识别是一项集呆板视觉与自然言语处分于一体的时间,能够直接从有人谈话的视频中,通过识别讲话人唇部作为,来解读讲话者所说的内容。

搜狗官方示意,通过纷乱端到端深度神经搜集时间举行中文唇语序列筑模,进程数千小时的实正在唇语数据锻练,搜狗“唇语识别”编制正在非特定人盛开白话测试集上,该编制抵达 60%以上实在凿率,正在笔直场景号令集如车载、智能家居等场景下以至仍然抵达 90%实在凿率。

闭于唇语识别时间的用意,搜狗方面示意古代僧侣和神父通过唇语读懂信徒内心所思以显示奇特。而正在 2003 年的伦敦劫钞案中巡警即是正在唇语识别专家的助助下破的案。另日,唇语识别时间能够辅助语音交互及图像识别,正在寻常生计、安防、公益等各个范畴完成通俗利用。

例如正在车载场景下,方圆噪音过大时会对语音指令发作作对,正在安防备畴,因为目前无数监控惟有摄像头没有麦克风,而唇语识别则能够助助公安职员获取厉重的谈话音信,为群众安定供给有用接济。其它,唇语识别再有时机助助天才性听障人群或暮年人,助助他们更好地与人相易。

据明白,这并非业界首个唇语识别时间,早正在 2003 年,英特尔便开辟了“视传闻识别编制”软件,供开辟者研制能读懂“唇语”的估量机;2016 年,谷歌 DeepMind 音文唇语识别编制便仍然能够接济 17500 个词,音讯测试集识别确凿率达 50%以上。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号