用深度学习优化OCR,「睿琪」百倍提升票据录入效率

邓三三·2019-02-18 14:35
做出「形色」的公司这次要玩票据识别

企业管理的精益化往往始于与钱紧密相关的财务部门,市面上的财会报销软件也已经是琳琅满目,但管理的优化离不开大量结构化数据的积累。在这个必不可少的前端环节中,财务人员依然需要辨别纸质发票并手动录入,过程低效无趣,且操作误差难以避免。

为解决这一痛点,36氪近期接触的「睿琪智能票据识别平台」(以下简称睿琪)使用人工智能技术对票据进行自动处理,将票据信息录入效率由人力的50小时/千张提升至0.5小时/千张,节省企业人力,降低了财务软件的使用门槛。

只需对着纸质票据进行扫描或者拍照,睿琪就能自动将票据图像“翻译”为结构化数据,单图平均识别时间小于1秒,且支持自动寻边切割、多票一次性识别。此外,睿琪还能自动对数据进行去重预处理、录入对应表单、根据企业需求自动归类票据并存储票据影像等,帮助企业建立全量存储、集合管理的财务共享中心。

由于需求清晰、文本格式标准化程度高,票据识别是一个相对成熟的OCR市场。近几年,深度学习的发展又驱动了这一技术可用性的提升。睿琪负责人徐青松介绍称,传统OCR技术依赖模板匹配或特征提取,其弱点是对图像要求高,应付字体变化、模糊或背景干扰的能力较差。而睿琪所采用的是基于卷积神经网络的OCR技术,能够自动提取字符图像的特征并进行分类,识别准确率高达95%(识别无误的票据比例为95%),具有较高的图像质量兼容度。

卷积神经网络基础的另一大优势体现在识别种类的丰富性上。由于依赖模板,对于客运票、过路费票等种类多样、版式不统一的票据,传统OCR识别技术识别准确率较低。而睿琪现已支持识别增值税发票、出租车票、客运票、过路费票、国际票等13类票据,现有产品中覆盖最为全面的。此外睿琪平台还具备强扩展性,可在两周内开发并训练神经网络,支持全新票据类型。

在产品形态上,睿琪向大型企业提供软硬件一体、可跨区域跨公司的私有云部署方案,向中型企业提供性价比高、方便快捷的SaaS服务,向需要接入识别功能的财务软件厂商提供移动SDK与API。C端用户则可通过APP产品“票小秘”来识别管理票据。

从去年9月产品上线至今,睿琪已服务超过100家企业客户,客单价由千元至百万元不等。金蝶、每刻报销、易快报、泛微OA等厂商都接入了睿琪的票据识别技术。

事实上,纸质票据识别录入繁琐低效这一问题,除了通过AI来解决,电子发票似乎是一个更加根本的解决方案。那么国家对电子发票的大力推动是否会挤压票据识别产品的应用空间?

徐青松认为答案是肯定的,这也是发展的必然趋势。但现有的纸质票据数量非常庞大,3-5年内智能化识别工具的需求不会消失。另外,睿琪也会逐渐支持更多语种方便全球贸易环境中的企业快捷处理海外发票,扩充支持的票据品类。更进一步,睿琪还计划将更多办公场景内的凭证、文档、合同纳入数据结构化处理的范畴

杭州睿琪软件有限公司专注于AI关键技术研发,具有多种应用场景的AI落地经验。他们开发的其他视觉识别产品形色国内首个皮肤病AI辅助诊疗系统都曾被36氪报道。团队规模目前超过200人,研发人员占比80%。

票据识别行业的玩家还包括百度云、网易旗下的有道智云、名片全能王背后的合合信息、主打车牌识别的文通科技、由卡证识别起家的易道博识等。

————————————

我是36氪邓三三,关注企业服务与前沿科技。如果您对项目感兴趣/对行业有思考/正在创业中,欢迎微信唠嗑vicknt1984。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

以及,;IBM将在巴西设立人工智能研究中心​;巴西Fintech公司提供比银行更优惠的贷款利息;圣保罗购物中心接入快递公司 Rappi 实现在线购物。

2019-02-18

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业