一、应用背景
社会保障事业做为我国社会制度完善的重要内容,关系国计民生,关系社会的稳定与发展,因而越来越受到各级政府的特别关注和大力推动。
为规范社保管理流程,社保中心每天都要对大量的保户资料进行及时的整理、录入、归档管理和提供查询服务,类型数十上百种,信息处理任务非常艰巨,况且随着社会保障体系的深入推广,每天都有大量新的投保单位和个人纳入社保体系,各地社保中心的大量的人力资源在有限的工作时间内,往往需要花大量人力投入在手工录入上,这不但影响了效率,浪费了资金,也影响了业务人员对核心业务的关注和进行和发展。如何推进社保行业管理信息化、特别是投保人档案管理的信息化建设,已成为各地社保中心规范管理和全面发展的瓶颈。
再从行业发展趋势考虑,我国的社会保险制度是五保(养老、医疗、工伤、失业、生育)合一的制度设计,医保信息系统是作为社保信息化建设的重要组成部分而存在的,从未来的趋势看,社保信息化建设必将是全国连网并且五保合一的。因此,如何利用现代信息技术来服务社保事业,更是社保事业发展的必由之路。
二、 应用目的
1、 利用大众网络的表单信息智能采集技术,实现社保中心票证信息录入的半自动化,在全面提高录入效率的同时,将社保中心的管理重点从机械、繁重、低效的人工录入工作中解脱出来,全面提高数据监控和管理水平。
2、 采取最新IT解决技术,将所有重要票证单据扫描成图像后存储,建立每笔业务的精确索引,提高社保中心的信息化程度,为客户开发诸如网上查询、检索等新的服务项目。
三、系统功能特点
1、 对现有的表单进行快速扫描输入
2、 对表单进行自动快速分类
基于Uniwex核心技术开发的应用系统,都能提供当前国际领先的文档自动分类功能。这些功能根据文档的尺寸、图象类型、图象中的关键字、用户定义的模板和探针等进行分类。从而避免手工分类的低效和烦琐的工作,也可以利用这个功能建立文档的查询索引。
3、对表单图像预处理并对指定内容进行识别
经过扫描后的图象常常达不到能够进行内容识别的要求。为了能对扫描的原始图象进行处理,Uniwex技术提供了一系列强大的功能,包括图象的倾斜矫正、文档和表单的定位、图象滤波、去除文字框和齿型框等图象处理技术,为提供高质量的识别结果建造了良好的基础。
4、对识别后的数据进行人机交互校对
首先根据业务中的冗余与校验码由计算机自动进行校对,建立一种分级的校验机制。实时校对时,校对系统可以把识别的各个区域从图像上扣取出来,直接与识别的结果进行对照检查。也可以通过对原始图像的放大缩小直接检查,通过快速查找发现拒识字符或无法识别的字符。
在实际应用中,拒识和误识的字符能通过网络环境以协同工作的方式多人同时校对。对一些无法识别的字可以采取直接同屏比对录入。
5、对扫入的原始单据可按索引查询
目前需要电子化的表单是以一种半结构化的形式存在。一方面它们有供检索的诸如名称、日期等可以结构化的关键字;同时表单的内容又以文字、图像、表格等非结构化的方式表示。因此对这些表单的电子化往往需要对结构化关键字能够分类及自动建立索引,同时也以图像方式保留原始内容,以便查询。
四、结构示意图
表单智能采集系统应用于Windows98、WindowsNT、Windows2000和Windows XP操作系统上,与高速扫描仪一起使用,扫描仪必须符合Twain32规范接口标准。

五、 系统实施流程



六、系统应用价值
| 分类 | 解决问题 | 收益说明 | | 直接收益 | 降低员工劳动强度 | 单据自动识别录入手段减轻了业务人员的录入工作量,可以解决当前参保人员剧增带来的单据录入瓶颈问题 | | 保证数据录入质量 | 单据自动识别录入手段提高了数据准确度 | | 简化业务处理流程 | 将"受理单据à数据录入+数据校对à单据扫描存档"的流程变更为"受理单据à单据扫描à自动数据识别+简单校对+自动扫描单据存档"的模式。把业务人员三次业务处理过程简化为一次连续的业务处理 | | 提高对外服务能力 | 利用精确索引技术将扫描影像和表单采集信息转入社保中心的数据库,可为内部和外部提供便捷的网络信息查询服务,从而全面拓展社保中心的服务广度和深度 | | | | 间接收益 | 减轻系统故障损失 | 系统可独立与业务信息系统运行,提供了信息系统故障时,半自动的应急措施,减轻了业务信息系统故障时的业务损失 | | 为后续管理提供便利 | 利用数据和扫描图像自动分类,以及与后台业务信息系统的接口,可以增强后台业务信息系统的处理能力,简化后续的业务处理工作 | | 支持新业务快速开展 | 通过简单增加新单据的定义文件,即可支持新单据的识别录入。从而快速支持新业务的开展 | | | | 远期收益 | 长期应用节省费用 | 长期应用后,投资从节省的人工费和业务效率提升上返回 | | | | 可能收益 | 建立内部监督系统 | 如有必要,可建立扫描单据图像采集信息和业务系统原始数据的对账手段,加强对业务数据的监督 | | | 七、系统性能指标
1.核心表单信息智能采集技术(FICS)的性能指标:
手写体数字(基于2,000,000以上字符): 准确率97%; 误识率1.4%; 拒识率1.6%; 速度100字符/秒 大写手写体西文: 准确率97%; 速度100字符/秒 西文和数字印刷体: 准确率99.5%; 速度400字符/秒 中文印刷体: 准确率99% 条型码和判断框: 准确率99.99%
以上速度测试采用的是PII, 内存64M的计算机系统
2.应用系统的性能指标:
对手写体数字识别精度不低于97%; 票据的整张处理速度不低于1张/秒; 提供简单快捷的手写体汉字的录入支持; 通过特定的校对方式提供准确的数据; 如果配备25张/分钟的一般高速扫描仪和使用一台PC,考虑到校对及管理所需要的时间,2个人每天用6个小时能处理完6000张票据的扫描录入(如配备一台高档专业高速扫描仪,还可以用更少的时间);如果采用2台扫描仪器和配置2台计算机,4人用3个小时左右的时间应能完成同样的工作量。
| |
| |