百度OCR技术现身ICDAR 展示百度AI雄厚实力

2024-06-28 14:52:00
aiadmin
原创
487

指日,百度OCR(文字识别)本事团队亮相文档判辨与识别邦际聚会(International Conference on Document Analysis and Recognition,ICDAR2017),实行了名为《RTRS: Building a Robust Text Reading System for Unconstrained Scene Images》的本事研讨会(tutorial)。研讨会上,来自百度OCR的工程师团队与环球顶尖OCR专家分享了百度OCR识别本事的近期进展状况和产物操纵方面的体验及思量。据悉,正在ICDAR2017聚会实行研讨会(tutorial)分享的本事团队中,百度OCR本事团队是唯逐一支来自企业界的本事团队。他们以奇异的产学贯串本事作风,和丰裕工业级本事怒放生态,吸引了来自环球的近百位文字识别专家的合切。

ICDAR是环球OCR范围公认最巨子的学术聚会之一,由其结构的Robust Reading竞赛也是如今OCR本事范围环球最具影响力的角逐,个中最具离间的OCR竞赛做事是Incidental Scene Text(自然场景随拍文字识别)。正在这项高难度竞赛离间中,百度OCR本事正在检测、识别和端到端三个焦点本事范围,近两年来众次赢得并保留了全邦第一的排名,具备彰着的领先上风。

正在ICDAR本事细节研讨会上,百度OCR团队梳理了近些年业界本事进展的脉络,主动分享了百度OCR本事进展的体验总结,与参会的本事专家们沿途考虑文字识别前沿本事进展趋向。另一方面,百度OCR团队动作工业界的代外,也具体先容了团队正在OCR工业编制研发和产物化历程中的极少告捷体验,助助业界同仁处置本事落地历程中的实质题目。最终,百度工程师先容了操纵于百度系产物生态的基于自然图像寻求/汇集图像场景的通用文字识另外产物操纵矩阵,和聚焦正在证照识别、单据识另外场景操纵处置计划。丰裕的干货分享,使得统统研讨会的换取空气非常热闹,原定3个小时聚会,足足赓续了4个众小时。

百度视觉本事部手下的OCR团队组筑于2011年,原委众年的研发,目前曾经将基于深度进修的OCR本事操纵正在众个操纵场景下,支柱中、英、日、韩、葡、德、法、意、西、俄等十邦说话。同时,贯串产物操纵场景络续采撷磨练数据,再通过百度大脑优化算法,从而得到越来越好的OCR结果和产物体验。目前,百度OCR曾经正在百度系各个产物生态中落地,并修筑起基于自然图像寻求/汇集图像场景的通用文字识另外产物操纵矩阵,和领先的证照识别、单据识别等场景的操纵处置计划。

为了保障用户操纵基于百度OCR本事的产物体验越来越好,百度OCR团队踊跃实行思量、改进、怒放的良性进展道途,勤苦保留本事计划和编制结果业界领先。近两年,百度OCR的众个改进本事收获,正在ICDAR竞赛上众次赢得全邦第一的排名,并有众篇业界顶级会论说文颁发。正在近来的盘算推算机视觉顶级邦际聚会ICCV2017上,百度公告的基于全卷积神经汇集的文字检测论文:WordSup: Exploiting Word Annotations for Character based Text Detection,得到了业内的同等好评。

本事络续冲破的同时,百度OCR本事也通过百度AI本事怒放平台一共怒放给第三方操纵,突破紧闭的研发作态,为开辟者和互助伙伴赋能,踊跃饱励本事正在的确产物上的落地。此前,开辟者陶新乐也体验了百度OCR本事的智能便捷。他研发的白描APP通过百度OCR怒放平台接入百度OCR本事,可将APP内的图片转换成文字,正确率极高,有用地满意用户的智能化需求。白描APP由于图片转文字的效用大获好评,成为Apple Store东西类付费下载榜的前几名,并被网友称为“正确率高到没友人的文字识别OCR APP”。百度OCR本事可操纵于差异场景,利便怒放者探寻通用文档图片录入和检索、自然场景输入和翻译、众种证照检测识别、众种单据外格检测识别等丰裕的产物效用。目前,百度OCR通过AI本事怒放平台曾经稀有千日活动开辟者,并告捷与泰康人寿、太保人寿、百信银行等众家企业实行长远本事互助。

业内人士称,百度OCR再次亮相全邦级学术聚会,显示出百度AI本事正在业内的先发上风、完美组织和浓密蕴蓄堆积。跟着基本才能的进一步怒放,百度OCR本事将得到更众的业界专家和开辟者的支柱,从而蕴蓄堆积更为领先的本事,探寻更众的操纵场景,赋能更众的互助伙伴,缔造更众的价钱。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号