您的位置:首页 > 宏观 >

新基建带来新机遇 OCR技术发展三大趋势

2020-09-29 17:18:28 来源: 中国新闻网

在工业和信息化部、北京市人民政府、国际电信联盟ITU-T指导的2020AIIA人工智能开发者大会上,主办方正式发布国内首份智能文字识别(OCR)能力

在工业和信息化部、北京市人民政府、国际电信联盟ITU-T指导的2020AIIA人工智能开发者大会上,主办方正式发布国内首份智能文字识别(OCR)能力测评与应用白皮书。白皮书从OCR发展背景、技术沿革、产业发展现状、技术标准化、发展趋势等多个维度,对当前国内OCR产业进行了一次详细梳理,全面助推OCR技术产业化加速落地及可持续发展。

OCR是光学字符识别(Optical Character Recognition)的缩写,指利用机器将图像中手写体或印刷体的文本转换为计算机可以直接处理的格式。作为计算机视觉领域的重要分支,OCR典型应用是通过图像文字识别实现信息录入。同时,由于文字和符号包含丰富的语义信息,基于OCR提取文字信息继而进行分析,能够帮助机器更好地理解图像。

据了解,这份白皮书是由中国信息通信研究院、中国人工智能产业发展联盟、腾讯云AI计算机视觉中心、腾讯安全战略研究部、腾讯优图实验室联合起草。

新基建带来新机遇,OCR技术发展三大趋势

借助人工智能技术,近年来OCR性能的不断提升为产业数字化催生出的更复杂的OCR应用场景提供了坚实支撑。同时,覆盖手机、电子产品以及云服务在内的更加多样化的服务载体,进一步加快了OCR的普及,持续向社会生产生活的更多领域渗透。

尤其是今年4月,发改委明确将人工智能基础设施列入“新基建”范围,作为人工智能应用中最接“地气”,商业推广较为成熟的领域,OCR产业在“新基建”背景下无疑将迎来新的发展机遇,相关技术也将迎来新一轮的变革。

报告指出,OCR技术未来发展的三大方向主要包括一体化的端到端OCR模型、兼具高性能高效率的OCR、从感知到认知的智能OCR。

详细来说,构建一体化的端到端网络,同时对文字检测和识别进行训练,将成为OCR技术发展的重要趋势之一。端到端的网络设计不仅能够减少重复计算,又能够提高特征的质量,促进任务性能的改善。同时,大量的OCR应用需要在资源受限的移动端设备上运行,当前移动端OCR算法大多以牺牲一定的算法精度来换取运行速度,针对移动设备设计兼顾性能和效率的轻量OCR模型将是未来发展的重要方向。

另外,从感知到认知的智能OCR来说,OCR技术通常从计算机视觉领域出发,未来与自然语言处理技术、知识图谱等更广领域的交叉融合,通过语义及知识的深度挖掘提升OCR性能是重要趋势。此外,在OCR中引入强化学习和元学习等新的学习范式,让机器自主学习如何识别文字,也将成为研究热点。

市场规模达133.81亿美元,OCR成科技巨头标配

目前,OCR技术已在金融、保险、医疗、交通、教育等诸多行业有了深入成熟的应用。未来随着传统行业的数字化转型,OCR应用范围和场景将进一步扩展,市场规模将进一步增大。有权威机构预测,2025年全球OCR市场规模将达到133.81亿美元。

早期受限于技术发展水平,OCR厂商通常从特定应用切入,例如车牌识别系统等,形成了一系列专用设备。近年来,越来越多的终端设备及应用均嵌入了OCR技术,并逐渐形成了从基础设施、基础能力到终端应用的完整产业链生态,也衍生出了卡证、票据等一系列细分OCR能力,通过组合的方式服务于各个行业。

不难看出,OCR技术逐渐“下沉”为一项基本的能力,为上层不同的业务应用提供底层技术支撑。以腾讯云为代表的科技巨头和云计算厂商正在纷纷加速布局OCR,在满足自身内部业务需求的同时,不断对外开放先进的OCR能力,OCR已然成为科技巨头能力标配。

多行业场景成熟落地,首次发布OCR评测标准

在具体的落地应用层面,目前卡证识别、票据识别等标准场景文字识别已经相对成熟,手写文字识别在教育、物流等行业的应用也在不断扩大。复杂动态场景下的OCR技术和应用成为近两年的热门研究方向,比如在无人驾驶、机器人等场景利用OCR对视场中出现的文字进行识别等。

在此次发布的白皮书中,腾讯云也公布了其多项OCR领域的典型落地案例。

丰巢快递柜通过使用腾讯云联合腾讯优图实验室提供的身份证OCR技术,身份证字段识别准确率高达99%,大幅提高了用户寄件、取件的效率;宁波银行通过采用腾讯云联合腾讯优图实验室打造的智能票据OCR解决方案,将识别的字段准确率提升至90%以上,更好地满足了银行业务场景的需要。搜狗广告图片文本审核借助OCR产品服务帮助客户自动识别海量的图片文字内容,从而高效地进行广告图片违法内容识别,降低客户业务的违规风险。

值得一提的是,为全面降低OCR相关领域的应用门槛,避免出现鱼龙混杂局面,白皮书也首次公布OCR评测标准和规范。

今年4月,中国人工智能产业发展联盟制定了《OCR服务智能化分级技术要求和评估方法》,规定了OCR服务在功能、性能、安全等方面的技术要求以及评估方法。7月,OCR服务要求及评估方法在国际电信联盟ITU-T SG16组成功立项,标志着深度学习背景下的OCR评测方法已经逐渐被国际标准组织所接受。

在此之中,腾讯深度参与推动OCR领域技术革新和标准制定,帮助企业客观、全面地评价不同OCR服务能力。目前,由中国人工智能产业发展联盟指导,腾讯云开发的天鉴OCR服务引擎自动化评测平台,不仅能够为OCR技术供给方提供技术测试服务,也将发布OCR技术或产品的测试结果,为需求方提供客观公正的选型依据。

关键词:

精选 导读

募资55亿港元万物云启动招股 预计9月29日登陆港交所主板

万科9月19日早间公告,万物云当日启动招股,预计发行价介乎每股47 1港元至52 7港元,预计9月29日登陆港交所主板。按发行1 167亿股计算,万

发布时间: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情况曝光 隐形重仓股多为高端制造业

随着半年报披露收官,公募基金二季度持股情况曝光。截至今年二季度末,公募基金全市场基金总数为9794只,资产净值为269454 75亿元,同比上

发布时间: 2022-09-02 10:45
资讯   2022-09-02

又有上市公司宣布变卖房产 上市公司粉饰财报动作不断

再有上市公司宣布变卖房产。四川长虹25日称,拟以1 66亿元的转让底价挂牌出售31套房产。今年以来,A股公司出售房产不断。根据记者不完全统

发布时间: 2022-08-26 09:44
资讯   2022-08-26

16天12连板大港股份回复深交所关注函 股份继续冲高

回复交易所关注函后,大港股份继续冲高。8月11日大港股份高开,随后震荡走高,接近收盘时触及涨停,报20 2元 股。值得一提的是,在7月21日

发布时间: 2022-08-12 09:56
资讯   2022-08-12

万家基金再添第二大股东 中泰证券拟受让11%基金股权

7月13日,中泰证券发布公告,拟受让齐河众鑫投资有限公司(以下简称齐河众鑫)所持有的万家基金11%的股权,交易双方共同确定本次交易的标的资

发布时间: 2022-07-14 09:39
管理   2022-07-14

央行连续7日每天30亿元逆回购 对债市影响如何?

央行12日再次开展了30亿元逆回购操作,中标利率2 10%。这已是央行连续7日每天仅进行30亿元的逆回购缩量投放,创下去年1月以来的最低操作规

发布时间: 2022-07-13 09:38
资讯   2022-07-13

美元指数创近20年新高 黄金期货创出逾9个月新低

由于对美联储激进加息的担忧,美元指数11日大涨近1%创出近20年新高。受此影响,欧美股市、大宗商品均走弱,而黄金期货创出逾9个月新低。美

发布时间: 2022-07-13 09:36
资讯   2022-07-13

美股三大股指全线下跌 纳斯达克跌幅创下记录以来最大跌幅

今年上半年,美股持续回落。数据显示,道琼斯指数上半年下跌15 3%,纳斯达克综合指数下跌29 5%,标普500指数下跌20 6%。其中,纳斯达克连续

发布时间: 2022-07-04 09:51
推荐   2022-07-04

融资客热情回升 两市融资余额月内增加超344亿元

近期A股走强,沪指6月以来上涨4%,融资客热情明显回升。数据显示,截至6月16日,两市融资余额1 479万亿元,月内增加344 67亿元,最近一个半

发布时间: 2022-06-20 09:41
资讯   2022-06-20

4个交易日净买入超百亿元 北向资金持续流入A股市场

北向资金净流入态势延续。继6月15日净买入133 59亿元后,北向资金6月16日净买入44 52亿元。自5月27日至今,除6月13日以外,北向资金累计净

发布时间: 2022-06-17 09:37
推荐   2022-06-17