墨西哥开始接种中国科兴新冠疫苗 综合消息:突尼斯变异新冠病毒系本土演化而来 中东多国加快疫苗接种进程 长春大众卓越女足昆明集中 开启第二阶段冬训备战新赛季 “春风行动”全面启动 研考初试成绩本月陆续发布 长春市文庙博物馆将举办元宵节线上公益文化活动 美失业率上升“新穷人”领救济 记者探访救济食品分发站 起步就是冲刺!牛年伊始长春多个项目火热开工! 吉林省全力抓好煤矿安全生产监管 全国大部分农区陆续忙碌起来 田间地头一派生机盎然 3天3夜跑了500公里!成都大叔完成极限超跑挑战 4天致8次高铁晚点:铁路部门提醒放风筝远离铁路电力网 26日天宇见证浪漫一幕:"元宵月"巧遇"黄帝星" 猜灯谜、做灯笼 长春市图书馆“闹春图”元宵节系列活动来了 重庆返岗复工农民工达260余万人 返岗率逾六成 美国新冠肺炎死亡人数超50万 超一战二战和越战美阵亡者总和 第五届联合国环境大会召开 中方呼吁采取全球行动应对环境问题 机场“逐鸟人”:黑脸蛋是我们的“标配” 吉林省人社厅发布通知,2021年社会保险缴费有新变化! 伊朗最高领袖:如有需要或将浓缩铀丰度提高至60% 国资委:支持央企加快国有资本的布局优化和结构调整 亚泰广州冬训先“瘦身”再“增肌” 内外援引进工作将全面展开 零距离!揭开天问一号火星环绕器神秘面纱 洮南:强化政务大厅疫情防控 确保群众办事安全 谭德塞:全球各地都进行新冠疫苗接种符合所有国家的利益 智利累计新冠确诊病例超80万例 外企看中国丨专访IBM大中华区首席执行官:我们期待在中国“云”端舞出新姿 嫦娥五号带回月壤 3月将在国家博物馆展出 牛年元宵节 十六月最圆 利益联结产业链上游,伊利全面助力东北地区乡村振兴 春节假期后文旅新风尚 开春如何玩得更尽兴? 长春新区:打造“升级版”营商环境 省运管局指导各地全面有序恢复道路旅客运输服务 游客捞取泉池内硬币引发争议 趵突泉景区回应 一派生机盎然!湖北武汉:开启“全城赏花”模式 澳大利亚学者认为比特币价值被高估 北京汤圆元宵抽检全合格 温馨提示:带冰霜的别买 刚果(金)总统谴责联合国车队遇袭事件 湖南两名男子爆竹炸6条小鱼被取保候审 同时段播放全国第一,实时收视率破1!电视剧《鲜花盛开的山村》,不一样的乡村戏! 挂着名校牌子,收费高,却很孬!有名无实的“冠名办校”值得警惕 联合国人权理事会第46届会议昨日开幕 中方代表发表视频致辞 注意!吉林省这5批次食品不合格! 非洲新冠确诊超383万例 多国持续推进疫苗接种 吉林省退役军人事务厅发布“清明•致敬英雄”主题征文、摄影征集评选活动的公告 @吉林人,坚持完今天,24日气温将回升了! 推动两国关系重回正轨 女童海洋公园爬凳摔伤 脸缝4针 家长要求园方赔偿合理吗? 为中国疫苗投下信任票 多国领导人“带头”接种 海外网评:50万条逝去的生命,美国无法治愈之痛
您的位置:首页 >财经 >

同盾人工智能研究院发表文档图像最新研究成果,性能达到国际领先水平

2019-08-16 14:55:04来源:金融界网站

  金融界网站讯 近日同盾科技人工智能研究院在arXiv上发布了最新研究成果,题为基于文本行的文档图像质量评估框架和文本行图像质量数据合成,该研究成果性能达到国际领先水平,已经被即将于今年9月份举办的第15届国际文档分析与识别大会(ICDAR2019)录用。ICDAR是全球文档图像分析识别领域公认的权威学术会议,从1991年起每两年召开一次。

图片0

  互联网公司的业务流程中经常需要提交一些文档资料进行审核,随着智能手机的普及,通过手机拍照方式上传文档图像已经成为一种主流方式。同时也导致文档图像的数量迅速增加,人工录入和复核文档资料完成业务已经变得异常艰难,因此文档图像的智能分析和识别也变得越来越重要,这也是智能流程自动化(IPA)的核心技术之一。

  比如在健康险核赔中,智能化的流程一般会包括如下几个环节:

  文档图像采集:用户采集图像上传

  文档图像质量评估:系统实时的进行图像质量评估,如果不清晰就直接要求用户重新上传

  文档材料分类:对清晰的文档材料进行自动归类

  OCR信息提取:对文档进行检测、定位和识别以提取文档信息

  信息结构化:用NLP和知识图谱技术对信息进行结构化

  智能核赔:从医、药、病、人等几个不同角度分析风险,并自动理算和核赔。

图片0

  显然,在上述流程中,如果用户上传资料清晰度很差,将会大大降低文档图像OCR的识别精度,进而影响后续的业务流程。所以,很有必要对文档图像质量进行评估,以防止那些低质量的文档图像被上传。

  不同与传统的图像质量评估问题,研究人员发现文档图像质量评估则是对文本行范围内的质量更感兴趣。因此论文作者们提出了一种基于文本行的文档图像质量评估框架,该框架由文本行检测、文本行质量预测和文档图像整体质量评估三个阶段组成。

图片0

  此外,为了训练文本行质量预测模型,该项目合成了一个文本行图像质量数据集,其中包含52,094个文本行图像,并使用分段函数模拟计算对应的质量标签。该算法在目前最难的文档图像质量评估标准集SmartDoc-QA上表现性能优异,超出目前国际上最好的方法10%以上。

  来源为金融界财经频道的作品,均为版权作品,未经书面授权禁止任何媒体转载,否则视为侵权!

免责声明:本网站所有信息仅供参考,不做交易和服务的根据,如自行使用本网资料发生偏差,本站概不负责,亦不负任何法律责任。涉及到版权或其他问题,请及时联系我们。

猜你喜欢