国内首份OCR白皮书出炉公布OCR技术发展三大趋势

2023-10-17 12:03:00
aiadmin
原创
1486

9月28日,正在2020AIIA人工智能开垦者大会上,主办正直式揭晓邦内首份智能文字识别(OCR)才力测评与运用白皮书。白皮书从OCR成长布景、本事沿革、财富成长示状、本事圭表化、成长趋向等众个维度,对而今邦内OCR财富实行了一次精确梳理,全体助推OCR本事财富化加快落地及可接连成长。

OCR是光学字符识别(Optical CharacterRecognition)的缩写,指应用呆板将图像中手写体或印刷体的文本转换为谋略性能够直接统治的形式。动作谋略机视觉周围的紧要分支,OCR规范运用是通过图像文字识别完成音信录入。同时,因为文字和符号包蕴丰厚的语义音信,基于OCR提取文字音信继而实行领会,不妨助助呆板更好地了解图像。

据知道,这份白皮书是由中邦音信通讯琢磨院、中邦人工智能财富成长同盟、腾讯云AI谋略机视觉核心、腾讯太平计谋琢磨部、腾讯优图实行室联结草拟。

借助人工智能本事,近年来OCR职能的不休晋升为财富数字化催生出更庞大的OCR运用场景供应了坚实撑持。同时,掩盖手机、电子产物以及云办事正在内的特别众样化的办事载体,进一步加疾了OCR的普及,接连向社会出产生涯的更众周围分泌。

呈报指出,OCR本事改日成长的三大目标苛重包含一体化的端到端OCR模子、兼具高职能高效力的OCR、从感知到认知的智能OCR。

精确来说,构修一体化的端到端汇集,同时对文字检测和识别实行教练,将成为OCR本事成长的紧要趋向之一。端到端的汇集计划不光不妨节减反复谋略,又不妨升高特点的质料,推进职业职能的改正。同时,洪量的OCR运用须要正在资源受限的搬动端修筑上运转,而今搬动端OCR算法人人以仙游必定的算法精度来换取运转速率,针对搬动修筑计划统筹职能和效力的轻量OCR模子将是改日成长的紧要目标。

其它,从感知到认知的智能OCR来说,OCR本事往往从谋略机视觉周围开拔,改日与自然道话统治本事、常识图谱等更广周围的交叉调和,通过语义及常识的深度开采晋升OCR职能是紧要趋向。别的,正在OCR中引入深化进修和元进修等新的进修范式,让呆板自决进修怎样识别文字,也将成为琢磨热门。

目前,OCR本事已正在金融、保障、医疗、交通、培养等诸众行业有了深远成熟的运用。改日跟着守旧行业的数字化转型,OCR运用鸿沟和场景将进一步扩展,墟市范围将进一步增大。有巨擘机构预测,2025年环球OCR墟市范围将抵达133.81亿美元。

早期受限于本事成长秤谌,OCR厂商往往从特定运用切入,比方车牌识别编制等,酿成了一系列专用修筑。近年来,越来越众的终端修筑及运用均嵌入了OCR本事,并慢慢酿成了从根柢步骤、根柢才力到终端运用的无缺财富链生态,也衍生出了卡证、单子等一系列细分OCR才力,通过组合的形式办事于各个行业。

不难看出,OCR本事慢慢“下浸”为一项根基的才力,为上层分歧的生意运用供应底层本事撑持。以腾讯云为代外的科技巨头和云谋略厂商正正在纷纷加快组织OCR,正在餍足自己内部生意需求的同时,不休对外绽放先辈的OCR才力,OCR已然成为科技巨头才力标配。

正在详细的落地运用层面,目前卡证识别、单子识别等圭表场景文字识别仍旧相对成熟,手写文字识别正在培养、物流等行业的运用也正在不休扩充。庞大动态场景下的OCR本事和运用成为近两年的热门琢磨目标,例如正在无人驾驶、呆板人等场景应用OCR对视场中呈现的文字实行识别等。

丰巢疾递柜通过行使腾讯云联结腾讯优图实行室供应的身份证OCR本事,身份证字段识别精确率高达99%,大幅升高了用户寄件、取件的效力;宁波银行通过采用腾讯云联结腾讯优图实行室打制的智能单子OCR处置计划,将识另外字段精确率晋升至90%以上,更好地餍足了银行生意场景的须要。搜狗广告图片文本审核借助OCR产物办事助助客户主动识别海量的图片文字内容,从而高效地实行广告图片违法内容识别,下降客户生意的违规危险。

值得一提的是,为全体下降OCR干系周围的运用门槛,避免呈现鱼龙杂沓局势,白皮书也初次布告OCR评测圭表和典范。

本年4月,中邦人工智能财富成长同盟制订了《OCR办事智能化分级本事央浼和评估方式》,规章了OCR办事正在效用、职能、太平等方面的本事央浼以及评估方式。7月,OCR办事央浼及评估方式正在邦际电信同盟ITU-T SG16构成功立项,记号着深度进修布景下的OCR评测方式仍旧慢慢被邦际圭表结构所采纳。返回搜狐,查看更众

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号