曾几何时,微信聊天最怕对方发图:
电话多少,截图发你;快递单号多少,截图发你;地址多少,截图发你......,简直逼死强迫症。
好在有了文字识别(OCR)这类强大、方便的AI工具拯救,摁住图片,一键提取。
但是,如果“截图”是一张表格 (格式多,又复杂) 呢?
手输是不可能手输的。
尽管也能识别出文本信息,但对于工作需转化为Excel格式的,其识别出的杂乱结果又得激起一众强迫症了。
01
工欲善其事必先利其器
事实上,除了日常表格识别需求,
在金融、医疗、物流、电商等行业,由于业务繁杂,催生了大量数据需求,导致数据格式也更复杂,企业在做数字化建设与管理时,单纯依靠人工录入难度大、效率低。
此外,除了常见的有线表格,还存在包含多级嵌套关系的复杂表格类型(如银行流水、体检报告等),这些复杂表格往往会出现单元格合并、跨行、跨列、文字重叠错位等情况,导致单元格元素间的对应关系错综复杂,降低了信息读取的效率,也提升了人工录入的难度。
这时候一款适合的自动识别工具就很重要了。
早前,腾讯云文字识别就推出了表格识别V2,支持中英文图片/PDF内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为 Excel 格式。
在表格识别V2基础上,针对多种难例场景腾讯云文字识别升级推出了表格识别V3。
相比表格识别V2,表格识别V3覆盖场景更加广泛,对表格难例场景,如无线表格、嵌套表格(有线表格中包含无线表格)、表格线断裂等场景的识别效果均优于表格识别V2。
02
科技改变工作方式
AI对生活便利,工作效率带来的积极影响有目共睹。
目前,从小工具到大模型,AI正值新浪潮,各种产品服务呼之欲出。
那么,表格识别V3实际效果好不好呢?
用起来才有答案。
这里我们用同一张原图,分别用表格识别V2、表格识别V3测试表格还原重建效果,通过对比测试可以发现表格识别V2在难例场景下会出现表格线漏识别、表格线过度分割、表格行列关系拆分错误等问题。
V3则能有效解决此类问题,其还原重建指标达到95%以上,字符识别准确率达到96%以上,表现效果更为突出。
难例场景 | 原图 | 表格识别V3 | 表格识别V2 |
---|---|---|---|
背景干扰 | | | |
表格线不清晰 | | | |
表格线密集 | | | |
无线表格 | | | |
表格嵌套 | | | |
综上所测,据相关产品经理介绍,表格识别V3在识别准确率、场景覆盖度、抗干扰性、自动化程度等方面都有着极大优势;
-
基于腾讯优图实验室自研新一代生成式表格结构还原算法,平均技术指标达到96%以上,表格识别精度高。
-
支持各种类型的复杂表格结构还原,包括有线表格、无线表格、嵌套表格等,具有较强的通用性,并且通过亿级样本的海量预训练数据来提高模型的泛化能力和准确性。
-
在背景干扰、线不清晰、线密集、扭曲畸变等多种难例场景下,基于生成式的表格线方案鲁棒性好、抗干扰能力强。
-
能够自动地将PDF、图片中的表格内容转化为Excel数据,大大减少了人工处理的工作量和时间成本。
当然,表格识别只是实现业务基础的一步,随着AI技术创新,从表格智能识别到表格智能处理,乃至智能交互控制也会涌现出不少生产力工具,为企业提质增效,为打工人减少强迫症。
OCR表格识别虽然只解决了“小而痛”的问题,却也能成就“小而美”的垂直应用。
从小工具的实用到大系统的集成,不难看出,OCR技术正逐渐“下沉”为一项基本的能力,为上层不同的业务应用提供底层技术支撑,延伸出丰富的功能服务。
一起期待,让AI科技更好的改变工作方式。
更多腾讯AI产品免费体验与合作联系
欢迎识别下方小程序码进入
一张报销单引发的"吐槽大会" | 戳中打工人的爽点,3步就够了 | AI会是考试作弊的终结者吗?| 腾讯云AI「 承包了一片海 」| 久违了,我我我我的童年照!| 劳模打字人,走出另一条路 | 宝!AI来给你发对象了 | 腾讯云AI「开了一个脑洞」| 当导航念出Rap范儿,有梗有味 | 那些蹭ETC的人,后来都怎么了 | 打工人有没有「会议纪要自由」?|《失控玩家》:AI自我觉醒与程序员的浪漫情书 | 黑产肆虐的背后,人工智能如何剥开“面具”伪装?| 加速普惠AI,腾讯云AI在下一盘什么大棋?| 谁,复制了另一个我?| 那些天籁之音,正在消亡 | 腾讯云财税管家重磅发布,以合规+效率赋能数字化升级 | 用AI,冲破耳朵经济的“黑洞” | 困在流量池的视频博主们 | 看完这篇,我不再疯狂码字!| 错过等一年!| 一场培训引发的“灵魂拷问” | 筑牢金融自主安全锁 | 真假美猴王,谁在撒谎?| 突出贡献单位!| 又双叒叕入选!| 强势助力!| 全球 Top2!| 毕业季,这才是毕业照的最佳打开方式 | 腾讯云费控正式上线企业微信应用市场 | 腾讯云AI牵头制定2项计算机视觉标准 | “你这背景太假了”背后有秘密!| 腾讯发布国内首份金融AI白皮书,聚焦金融行业数字化升级 | 传统培训失宠,谁来拯救HR们?| 那些语音识别尴尬:投宿还是投诉?| 2022AI最佳实践集锦 | AI绘画,治愈着甲方乙方的“恩怨情仇” | 用情绪识别定票价,笑点低的人看剧要抵押房子了?| 春游去哪?用AI测测你最适合去的春游目的地
点击下图可进入「腾讯云AI体验中心」免费体验