智能语音榜单TOP20:科大讯飞、百度等居首初创企业过半

2024-06-26 14:49:00
aiadmin
原创
548

编者按:正在二十一世纪新十年开启之际,搜狐科技正式推出《中邦立异公司100》系列榜单及报道,环绕5G、AI,以及芯片、缔制、零售、出行、社交、企业供职等范围内的技艺立异和贸易形式立异,对优质立异公司及闭系行业举办深度价格发现。

目前,处于第三波海潮的AI正正在迎来加快生长,AI技艺一直冲破,进入使用范畴发生的临界点。2020年,AI还跻身“新基筑”七大范围,成为各行各业数字化、智能化升级的紧张根源措施,大宗结构AI的科技巨头和创业公司渐渐下手涌上潮头。

正在AI掀起的第四次工业革掷中,谁能脱颖而出?继芯片系列榜单后,搜狐科技《中邦立异公司100》正式推出AI范围榜单,首期聚焦智能语音范围及代外公司。异日的一段韶华内,咱们还将环绕谋略机视觉、机械人等细分范围举办系列谋划报道,并举办中央沙龙勾当,敬请守候。

6月17日,搜狐科技《中邦立异公司100》正式宣告中邦智能语音企业榜单。凭据技艺水准、谋划处境、融资进步等焦点目标,并联络业内专家核定,评选出邦内智能语音行业20家代外企业。邦内智能语音行业商场方式奈何,这些上榜企业正在技艺结构和使用落地方面有何进步?榜单深度解读揭晓谜底。

3、技艺调解生长是行业趋向,机械进修/深度进修、常识图谱、AI芯片等是榜单企业正在智能语音之外广泛结构的技艺;

4、智能语音使用正在消费级商场以语音助手为代外,企业级商场以智能客服为代外,电信、金融、电商、教化、医疗、汽车是角逐相对激烈的范围。

发言是人与外界疏通最紧张的纽带,被称为人工智能皇冠上的明珠。智能语音的焦点是经管自然发言,即以口头发言(语音)和书面发言(文字)为筹议对象,对其举办识别、解析及天生,从而使机用具备能听会说、能解析会斟酌的才华。

智能语音涉及众类型学科,厉重囊括声学信号(如声源定位、语音加强、回响抵消等)、形式识别(如声纹识别、语音识别、语种识别等)、自然发言经管(自然发言解析、自然发言天生等),以及语音合成等细分技艺,囊括感知智能和认知智能两大层面,此中语音识别和自然发言经管位居人工智能七大抵害技艺,也是人机语音交互改造的焦点支持性技艺。

人类对智能语音的搜求始于上世纪50年代,迄今已逾70年。语音识别是最早举办筹议的技艺,2016年语音识别凿凿率正在深度神经汇集的助助下到达95%,被视为初度根本到达人类水准,智能语音也加快进入技艺迭代、产物升级、贸易化落地的发生期。

人工智能之父艾伦·图灵提出的“图灵测试” 平常被以为是自然发言经管思念的初步。自然发言经管,是指用谋略机对自然发言(如汉语、英语)的形、音、义等音信举办经管,即对字、词、句、篇章的输入、输出、识别、理会、解析、天生等的操作和加工,马斯克等合伙创筑的OpenAI宣告超大的自然发言经管模子GPT-3是该范围的代外结果。

目前,环球智能语音语义商场已相对聚合,龙头霸占厉重份额。据中商家产筹议院、广证恒生等机构数据,正在环球智能语音语义商场中,Nuance、谷歌、苹果、微软、科大讯飞等头部企业占据80%以上商场份额。不久前,微软斥资160亿美元(约 1022亿元百姓币)收购 Nuance的来往已获美邦反垄断准许,达成后商场范畴将进一步聚合。

据Frost & Sullivan预测,旧年我邦智能语音行业商场范畴约为254亿元,估计2024年将到达490亿元。但相对环球,我邦智能语音语义商场方式比力聚集。IDC正在旧年12月宣告的《中邦人工智能软件及使用(2020上半年)跟踪》通知显示,正在智能语音语义使用商场,科大讯飞、百度、阿里商场份额靠前,思必驰、智臻智能等明星创企也占据肯定商场份额。但前述企业合计霸占份额仅有40%支配,商场角逐仍比力激烈。

同时,受限于中英文语义解析分别(叠加方言影响),以及中文语音资源匮乏等身分,海外智能语音巨头,譬喻Nuance、微软、苹果等商场范畴较小,本土企业霸占主导名望。IDC估计,跟着使用场景正在AI家产范畴化中的紧张性一直擢升,异日BATH类公司将霸占更高商场份额。

从此次上榜的20家智能语音企业来看,邦内智能语音企业厉重分为三类:以百度、阿里为代外的互联网科技巨头;以科大讯飞为代外的技艺供职商;以思必驰、云知声等为代外的深耕于笔直范围和细分场景的首创企业,这类企业最众,到达14家。

据艾媒征询统计,截至2019年尾,我邦人工智能创业项目中处于语音识别和语义理会赛道的企业横跨250家,占比达10%,但此中仅有30众企业已达成B轮后融资,也便是说有87%的企业尚处于生长前期。此次上榜的14家首创企业,均达成B+轮后融资。

整个来看,有8家企业处于D轮后融资,囊括思必驰、云知声、出门问问、智臻智能、捷通华声、中译语通、乐言科技、普强音信;此中思必驰正在旧年8元达成Pre-IPO融资,云知声旧年11月冲刺科创板,但本年2月主动撤回申请,上市终止。捷通华声、智臻智能都曾是新三板挂牌企业,目前均已摘牌,不摒除异日登岸A股的可以性。

从融资额度来看,这14家企业披露的融资金额合计横跨117亿元,此中云知声、出门问问、思必驰融资金额最众,分歧到达20亿元、17亿元、13亿元,合计占到总额的比重挨近43%,显示血本对头部企业的追捧显着。不少企业还得到巨头青睐,如思必驰、智臻智能、乐言科技得到阿里投资,京东持有云知声近4%的股份,捷通华声也得到百度加持。

榜单第一梯队企业中,创造于1999年、脱胎于中科大实习室的科大讯飞,是我邦智能语音家产的领头羊,更加正在语音识别范围霸占绝对名望。2017年科大讯飞翔动智能语音行业代外,成为首批邦度新一代人工智能盛开立异平台。

正在技艺研发上,科大讯飞夸大泉源立异、自助研发,目前变成以感知智能+认知智能两大研发目标,正在语音合成、语音识别、语音评测、图文识别、医学影像、机械翻译、自然发言解析等众个焦点技艺方面均有冲破。近年来,科大讯飞的技艺团队范畴太平占比正在60%以上,研发参加也连续增加,旧年占营收比已挨近17%。

正在使用落地上,科大讯飞也渐渐挣脱外界质疑,变成2B+2C双轮驱动、软硬件齐头并进的营业形式,笼盖智能硬件、盛开平台、教化、都会、医疗、汽车、金融、运营商、工业等范围。2019年科大讯飞营收首破百亿,旧年进一步增加至130亿元;净利润近14亿元,同比增加66%。

搜狗也是AI范围的立异者,其正在2016年提出了“自然交互+常识谋略”的永恒焦点政策,连续饱动语音听写、语音翻译、语音交互等技艺研发。目前,搜狗厉重结构AI硬件和AI交互灌音,推出灌音笔、腕外等产物,并具备搜狗分身、搜狗同传、搜狗知音等技艺安静台。

近年来,搜狗正在以语音为主导的人机交互范围,推出了众款“数字人”产物。从环球AI合成主播,到环球首个3D AI合成主播,再到环球首个手语AI合成主播,是搜狗正在语音交互和分身技艺上的一直冲破。

别的,互联网科技巨头也是智能语音范围弗成或缺的脚色,此次入榜的阿里、百度和小米便是此中的代外,厉重营业分歧再现正在天猫精灵、小度和小爱同砚上。天猫精灵是阿里云智能事迹群于2017年宣告的AI智能终端品牌,旧年1月升级为独立事迹部,成为阿里巴谄媚构AIoT及内容生态范围的焦点平台。

小度是百度旗下人工智能助手,并开荒了语音操作体例DuerOS。本年3月,小度智能助手月语音交互总次数达66亿次。旧年9月底,百度将小度拆分独立融资,百度血本及CPE政策领投,IDG血本跟投,融资后估值200亿元。

小爱同砚是小米旗下的人工智能语音交互引擎,搭载正在小米手机、小米AI音箱、小米电视等浩繁小米生态链设置中,月活动用户冲破7000万(截至旧年3月)。旧年11月,小爱同砚5.0正式宣告,从语音助手升级为智能生计助手。

智能音箱是这三大企业争相结构的核心,而依托补贴攻城、低价计谋的互联网玩法,邦内智能音箱商场方式聚合。据IDC数据,旧年中邦智能音箱商场销量3676万,支持三强争霸气象,阿里、百度、小米合计商场份额超95%,此中阿里天猫精灵位居第一(约35%),百度紧随其后(约33%)。但正在大屏智能音箱商场上,百度以超63%的商场份额遥遥领先,阿里和小米合计为36%。

正在语音为主导的人机交互生长趋向下,智能音箱本质上依然成为巨头结构智能家居的入口,这也是以智能音箱为代外的智能家居正在近些年下手走向民众的原由。据eMarketer统计,中邦智能音箱普及率仅有10%,比拟美邦26%的普及率,仍有空阔很大商场空间,中邦商场潜正在用户群体高达2.24亿。

IDC估计称,中邦智能家居设置商场到2024年出货量将到达5.3亿台,相较2019年将增加155%。行动智能家居入口的智能音箱,仍大有可为。但奈何通过打通语音交互、物联网、感触等技艺,真正控制用户需求痛点,仍是不小挑拨。

从生长水准上来看,语音识别是最为成熟、最先获得大范畴使用的的AI技艺。中邦语音识别技艺生长水准已与外洋同步,如百度、科大讯飞、搜狗等主流平台识别凿凿率目前均到达97%以上。阿里巴巴的语音技艺还超越谷歌,被MIT评选为2019年环球十大冲破性技艺。

自然发言经管则正在2016年进入生机膨胀期,但因为进步未完成预期,自2019年后转入破灭期,预期成熟韶华仍有5-10年,其规范使用如数据解读、文本天生等,目前仍处于发端采用阶段。正在这个范围,中邦与美邦则存正在肯定差异。

从此次榜单上的企业来看,语音识别和自然发言经管险些是全盘企业都有结构的技艺。但语音识别等相对容易的单点技艺的冲破,依然难以支持企业正在角逐的红海中取胜。位居头部的5家企业除了语音识别、自然发言经管,还结构了其它众个AI技艺,并努力于调解生长,众模态交互被业内以为是异日趋向。

其它14家首创企业还热衷于结构机械进修/深度进修(算法)、常识图谱(大范畴语义汇集)等技艺,囊括思必驰、出门问问、智臻智能、中译语通、竹间智能、追一科技、乐言科技、智齿科技、达观数据等。通过结构这些技艺,可能进一步饱动语音识别或自然发言经管的技艺冲破,如语音识别凿凿率的一直擢升及其使用就离不开深度进修的功劳。

别的,行动算力措施的AI芯片也有众家企业举办参加。阿里、百度、小米均有正在结构,如百度的智能语音芯片“鸿鹄”已正在智能家居产物上量产出货;思必驰和云知声也有正在研发AI芯片,行动其语音解计划紧张的底层硬件措施,成为其生长政策的构成一面。

从总体使用来看,智能语音商场范畴进步较疾。清华大学数据显示,语音识别和自然发言经管是中邦商场范畴最大的两大AI技艺使用目标,占比分歧约为25%和21%,合计到达46%,横跨谋略机视觉商场范畴(35%)。

从整个落地来看,消费级商场(2C)和企业级商场(2B)是两大厉重形式。2C使用厉重囊括聪颖生计、智能家居、聪颖办公等场景,通过智能语音技艺赋能各样终端,譬喻手机语音助手,阿里、百度、小米的音箱产物,科大讯飞、搜狗的灌音笔产物等。稀有据显示,2018年有近一半智好手机配有智能语音助手,Strategy Analytics估计,到2023年前将到达90%。

相较而言,2B应工具有更高的笔直属性和壁垒,此中智能客服说是最为广泛的使用场景之一。榜单众半企业均通过供应闭系管理计划或打制虚拟的正在线机械人,为电信、金融、电商、政务等行业供应征询招呼、题目经管、智能引荐等营业。智臻智能是最早将AI赋能客服范围的企业,其推出的小i机械人深耕智能客服商场十余年,终端客户逾8亿。

捷通华声则是正在邦内率先推出智能语音助手、电话客服机械人、智能语音外呼机械人、实体智能语音机械人、及时智能语音理会体例的企业。乐言科技推出的乐语助人是一款面向天猫、淘宝等平台的新一代AI智能客服机械人,题目识别率达99%,征询转化率擢升15%。智齿科技则修筑了囊括呼唤中央、正在线机械人和正在线客服等产物,贯穿售前+售中+售后全流程,供应笼盖供职+营销+拘束全场景的营销与供职管理计划。

教化、医疗和汽车也是较为广泛的使用范围。科大讯飞的第一大营业即为教化,正在医疗范围也正在连续结构,正在车载语音范围具有半壁山河;思必驰、云知声、出门问问、智臻智能、捷通华声、来也科技、竹间智能、追一科技、普强音信、智齿科技等企业都有结构这三个行业,聪颖教室、电子语音病例、车载语音等是焦点使用场景。

总体来看,正在智能语音技艺一直冲破的环境下,使用落地也正在连续饱动。但正在已有使用场景的环境下,奈何擢升用户体验,饱动交互改造,奈何饱动企业转型,完成降本增效,发现更众的使用场景,并或许范畴使用,仍是行业内企业面对的协同挑拨。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号