产品介绍
行业文档识别(Document Optical Character Recognition,Document OCR)基于行业前沿的深度学习技术,提供表单表格识别、体检报告识别、检验检查单识别、算式识别等多种行业文档识别服务,支持将图片上的文字内容,智能识别为结构化的文本,可应用于智能核保、智能理赔、试题批改等多种行业场景,大幅提升信息处理效率。
产品功能
表格识别
支持图片内常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,支持将识别结果保存为 Excel 格式。
算式识别
支持作业算式题目的自动识别,目前覆盖K12学力范围内的14种题型,包括加减乘除四则运算、分数四则运算、竖式四则运算、脱式计算等。
数学试题识别
支持数学试题内容的识别和结构化输出,包括通用文本解析和小学、初中和高中数学公式解析能力(包括91种题型,180种符号)。
数学公式识别
支持识别主流初高中数学符号和公式,返回公式的 Latex 格式文本。
保险单据识别
支持病案首页、费用清单、结算单、医疗发票四种保险理赔单据的文本识别和结构化输出。
印章识别
支持各类印章,包括发票章,财务章等,适用于公文,票据等场景。
产品优势
能力全面
支持保险、教育、金融、医疗等各类行业文档和表单表格的高精度识别服务,返回结构化信息,助力行业自动化效率提升。
算法领先
基于业内领先的深度学习算法、表格文字的识别准确率在92%以上,算式识别的准确率在94%以上。
鲁棒性强
适应多场景、任意背景,模糊、可容忍透视畸变、光照不均等实际应用中存在的复杂场景,并可实现自动裁边、修正倾斜等。
应用场景
智能核保和理赔
支持体验报告内容结构化提取,结合 NLP 技术,帮助保险公司实现核保流程的自动化。通过识别各类保单中的关键字段和医疗单据中的明细信息,加速完成保险理赔业务。
数学作业批改
通过一次简单的拍照就可以对算式、公式、试题等数学作业进行自动识别,结合结果智能批改功能,有效地提高了老师和家长检查和批改作业的工作效率。
物流单据电子化
实现各类物流表单的快速识别和结构化信息提取,帮助客户进行纸质表单的自动化录入,有效提升流程效率和录入信息准确度。