古文识别、“像素级”PS检测……“黑科技”亮相世界人工智能大会

2022-09-23 13:26:00
aiadmin
原创
2388

一篇雕刻正在西周青铜鼎面的钟鼎文难倒了不少观察者,最先“解题”胜利的是合合音讯推出的智能文字识别

本年是全邦人工智能大会举办的第五年,“科技风向标、财富加快器”是这场环球AI范畴的行业嘉会对参展技能与产物的期许。针对图像措置及内容识别中,文档图像质料退化要紧、文字检测及版面说明障碍、非控制前提文字识别率低、组织化智能判辨本领差等环球性困难,合合音讯重心展现了智能文字识别技能的更始效率及财富行使演示,用科技研究产研协调新目标。

合合音讯智能文字识别技能要紧由以“弯曲矫正”为代外的智能图像措置,基于深度研习的繁杂场景文字识别,自然措辞措置(NLP)三大焦点模块构成。智能图像措置技能可对曲面、暗影、摩尔纹等繁杂场景下的文档图像实行精准的矫正措置,为接下来的文字音讯提取、识别创造了优秀的前提;繁杂场景文字识别技能要紧应用手写印刷混排识别,抗强作梗识别,扭曲文字识别等一系列深度研习技能实行文字提取及识别,并联合领先的NLP技能,对识别出的结果实行语义判辨。

本次展现的钟鼎文识别项目,是继旧年的甲骨文识别之后,合合音讯向古文字识别创议的又一次冲锋。大会现场还可运用公司旗下产物“扫描万能王APP”,用“拍图识字”成效一键识别竖排的繁体古籍《桃花源记》,将其转化为易于阅读的横排、简体版本。

合合音讯技能职员先容:“遴选钟鼎文、古籍等素材来识别,是由于与老例文本比拟,鼎面的文字形小周详,竖排的形式也与寻常的文天职别。从载体上看,青铜鼎面存正在弯曲、反光、崎岖不屈的状态,古籍外观也或者有吞吐、框线等成分的作梗,全部识别难度极大。这些题目的处置不单对文物回护和文明传承意思庞大,也有助于技能正在各行业的行使向纵深拓展。”

合合音讯“PS窜改检测”成效是智能文字识别技能的另一大亮点。从私人证件、单子到各样贸易原料,诈骗团伙每每会运用PS过的原料来实行伪装行骗,受害者不胜枚举。该技能要紧采用神经汇集逮捕图像正在窜改经过中留下的渺小踪迹,基于百万级的数据研习图像被窜改后统计特性的蜕化,不单能够剖断图片是否被窜改,还能定位批改区域,以热力求样式展现图片的PS区域窜改置信度,检测切实率远超守旧技能格式和人眼剖断。

“PS窜改检测”是合合音讯智能图像措置技能上风的会集外示,这种直接针对图像特性音讯的窜改检测格式好手业中属于更始行使,笼罩身份证、护照等众种证照识别,合用于保障、银行、证券、政务等众种场景。

创立于2006年的合合音讯正在智能文字识别范畴中已有十众年深耕体味,闭联技能已广大落地各行业,为环球百余个邦度和区域的亿级用户供给数字化供职。据巨擘机构认定,扫描万能王APP针对老例的印刷体文档字符均匀识别率到达99.77%, 手写体文档字符均匀识别率为97.00%;“AI+OCR”行业处置计划可识别上百种卡证、单子、行业单子内容,援救五十众种主流措辞的音讯提取。

据悉,近三年来,合合音讯先后正在ICDAR、ICPR等人工智能邦际竞赛中斩获15项冠军,学术效率正在CVPR、AAAI、ACL、ACMMM等顶会上揭橥,闭联项目获中邦图象图形学学会(CSIG)科技前进奖二等奖。正在本年8月的CSIG图像图形技能寻事赛中,合合音讯插手的赛队夺得总冠军。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号