欢迎光临大集体!登录 免费注册     大集体市场购物指南集商论坛

浏览:254汉王数据录入工厂软件系统

汉王数据录入工厂软件系统,集合了汉王科技有限公司的国际领先的OCR核心技术及多年从事OCR行业应用的丰富经验,能够轻松实现大批量纸介数据录入、海量数据加工、快速搭建数据录入生产线。汉王数据录入工厂拥有科学而合理的工序流程设计,从扫描文档到最终的PDF、HTML、RTF、TXT、XLS等多格式电子文档,都是在同一个软件系统中完成,工序流畅,操作简易。与此同时,汉王录入工厂还拥有完善的员工管理系统,该系统能够自动派发数据包、智能化协调各工序工作量分配,极大的提高了数据录入生产系统运作的效率。汉王数据录入工厂充分迎合了数字化建设的需求,被广泛应用于大型数据资源库、图书馆、档案馆、出版社、报社、大型企事业单位,同时也成为众多专业数据加工商的首选产品,在业界拥有良好的口碑。

联系方式:010-82786500-8044/13811800444  李先生


参考价格:¥0.00

大集体代购

> 更多商家报价在哪里可以买到:

  • 该物品目前还没有相关的商家推荐,
    欢迎您为大家 推荐相关商家
汉王OCR录入工厂
 
第一部分  背景概述

    互联网的普及,改变了人类获得、拥有、利用、处理、交流知识的方式。但在互联网上,英文信息占97%,法文信息占2%,中文只占千分之几。中文信息资源开发和建设已成当务之急。建设中国数字图书馆工程不仅将扭转互连网上中文信息匮乏的状况,而且将极大促进国民经济新的增长,推动我国信息技术的发展和信息化的建设,同时,图书馆 的工作方式和服务模式将得到跟本性的改变,全面实现自动化、网络化和信息化。目前,我国各级政府对数字化图书馆工程非常重视,国家专门成立了“863”计划数字化图书馆战略小组,北京市把数字图书馆建设列为四项高科技基础工程之一。这是一个运用现代高科技的数字资源系统工程,涉及到信息资源加工、存储、传输、检索和利用的全过程,是信息基础建设的重要组成部分。

    数字图书馆就是对有高度价值的图像、文本、语音、音响、影视、软件和科学数据等多媒体信息进行收集,组织规范性的加工,进行高质量保存和管理,实施知识增值,并提供在广域网上高速横向跨库连接的电子存取服务。同时还包括知识产权、存取权限、数据安全管理等范畴。简而言之,数字图书馆是超大规模的、可以跨库检索的海量数字化信息资源库,能为读者方便、快捷地提供信息的服务机制。数字图书馆的特点是:收藏数字化、操作电脑化、传递网络化、信息存贮自由化和资源共享化。

    数字图书馆作为一个海量、宽带多媒体网络系统,还有很多需要进一步研究开发的技术问题,这些问题主要表现在:

    1) 信息资源建设
    数字图书馆要把文本、声频、视频等各种信息资源整理入库。自动分类、自动标引、自动文摘、工业化的OCR技术等技术都是技术瓶颈所在。 

    2) 存储与压缩
    数字图书馆面临的数据是多种类型的、海量的。如何保存和管理海量数据是系统设计的核心任务之一。

    3) 分类、索引、检索:
    对不同的内容,不同的数据类型需要不同的分类体系和索引机制。检索工具应保证提供给用户的信息恰恰是用户最需要的。因此,海量数据的搜索效率与速度是系统面临的巨大挑战,其中包括中文搜索、图像搜索、语音搜索、智能搜索。

    4) 传输与保护问题: 
    海量信息的快速浏览需要建立一个合理的分层传输机制,保护包括版权的保护和系统安全性的保护。
    基于领先的OCR(光学字符识别)技术和内容管理技术,汉王科技推出包括资源建设、资源检索利用两个重要环节的数字图书馆应用方案。


第二部分   数字图书资源建设

一、“汉王OCR录入工厂系统(网络版)”加工方案:

    信息资源对于网络时代,正如蒸汽机于工业社会,我们致力于信息资源建设,正是在构建未来社会的基石。要丰富网络资源,提高原有信息知识的利用效率,对图书、文献、档案等信息资料的数字化就显得尤其重要。

    但如何将种类繁多的文档资料、行业信息进行自动化处理,以满足各种数字化信息的应用,这就是OCR技术(光学字符识别)在信息数字化建设中起到的至关重要的作用。

    1、总体功能:

    实现大量原始资料的快速扫描录入与保存;
    OCR录入、校对、整理;
    数据库存储、备份、检索和管理;
    对各工序环节能进行监督和调度协调;
    员工岗位的管理;
    质量控制;
    系统管理。

    2、系统特点:

    1) 大量原始资料的快速扫描录入与保存
    各种版式的现代书籍: 横版、竖版、简体、繁体;
    古籍:特别是珍本、善本;
    各年代的报刊杂志及内部资料;
    各年代公文档案;
    各种报表或票据。

    2) 汉字识别之王:国际领先的OCR录入、校对、整理功能

    采用汉王先进的OCR识别技术,识别率高、速度快;快捷精确的横校、纵校、对比校对;支持多种电子文档存储格式:PDF、HTML、RTF、TXT、XLS,方便地实现全文检索,并将逐步与国际标准电子文档格式接轨。

    3) 完善的员工管理功能

    综合了考勤管理、岗位管理、工资管理三大功能,系统自动记录员工出勤情况,自动为各岗位分配工作并记录分配情况及工作量,并根据以上记录情况生成员工工资明细表;提供轻松友好的工作界面。

    4) 自动进行各工序环节的监督和调度协调

    服务器给各岗位分配任务,并进行任务协调,使各客户端的任务既相互独立又形成完整的生产流程,提高工作效率,使得文字处理速度可达到每人班10-12万字,比手工录入的效率提高5-8倍。系统自动进行员工工作量计算、差错量监控,可将整体差错量控制在万分之二以内,从而达到了出版质量要求。

    5) 对本套系统的监控、管理及日常维护,并定期生成安全日志

二、系统结构:

    1、系统网络结构图:


    2、网络拓扑结构:


三、系统功能描述:

    汉王OCR海量录入软件系统具备四大功能:文字自动录入、流水线管理、质量控制和员工管理、系统管理。

    1) 文字自动录入功能
    OCR海量录入系统采用汉王在OCR领域领先的成熟的文字自动录入技术,可实现自动图像预处理、版面分析,能识别中文简体、繁体、英文及混排,多字体多字号文档。

    2) 流水线管理功能
    OCR海量书籍录入系统的操作分为几个步骤:纸质资料的整理、扫描、图像预处理、版面分析、识别、校对和保存。单机OCR系统要求操作员熟悉每个步骤:扫描、图像预处理、版面分析、识别、校对和保存,这种串行的工作方式会降低效率,对操作员技能要求也较高。但是,如果将冗长、复杂的生产过程合理地划分成若干道工序,每道工序操作简便,合理安排工作岗位,并行操作,生产效率和质量就能得到很大的提高。OCR海量录入系统就是采用生产流水线管理方式,根据OCR技术和操作的特点,将生产过程划分成以下几道工序:


四、工序说明:

    1) 图书资料整理:
    为了便于扫描和以后的查询、检索而进行的图书分类、拆装、命名、编号等。

    2) 扫描:
    扫描是纸质文稿图像输入计算机的过程。一般把相关文稿顺序扫描,在扫描质量控制程序自动检测并修正后,自动保存到数据库中。

    3) 图像处理:
    为了提高识别率,对图像进行“消蓝去污”的处理,即去掉图像上影响识别率的噪音如麻点、下划线等,图像质量控制程序自动监测图像处理质量。

    4) 版面分析:
    能自动进行版面理解并定位,判别划框区域是横排文本区、竖排文本区、表格区还是图像区,并对不同属性的区域以不同颜色的线框标识出来。自动版面分析在后台运行,操作人员可在前台进行确认,必要时对自动版面分析结果加入手工干预。

    5) 识别:
    把文字图像转化为计算机文字内码,可以识别印刷体和手写体中文(包括简体字和繁体字) 、表格、中英文混排, 识别出来的文字内码可以是GB码、BIG5码、GBK码或者Unicode码。识别过程在后台运行。

    6) 纵向校对:
    具有很强的查错、纠错能力。纵向校对是将一个图像或若干个图像中识别成同一个字的文字图像列在一起显示,并以突出颜色标出可疑字,便于操作员发现错误和修改。

    7) 横向校对:
    这是传统的人工校对方法,操作员直接对比识别结果文本和图像,以发现识别错误文字。系统自动调出文字对应的图像,进行比对。同时,以醒目的颜色标出识别可信度不高的文字。

    8) 版面还原:
    将识别并修改好的文本还原成跟扫描文稿版面的布局一样、可以供计算机阅读和查询检索的RTF、PDF、HTML、SGML/XML格式的数字文档。

    9) 数据入库:
    版面还原数字文档的保存。

    10) 质量控制和员工管理:
    质量控制是为了保证和控制系统的录入质量而采取的一整套方法与措施。主要是在各工序中加入对员工工作完成情况及差错量的监控和工作量的计算,以求将整体差错量控制在万分之五以内。
    员工的工作态度将会直接影响到数据录入的质量和工作效率,要使员工保持一种积极的工作态度,必须有好的管理制度和客观的评价标准及依据。OCR 海量录入系统还可以详尽地提供员工考勤情况和工作质量数据,对员工的工作情况给予公正的评估。
    员工管理系统在整个系统中处于支配地位。该部分由考勤管理、工资管理、质量控制、工作分配、返工单管理和建立用户等几个模块组成。

    11) 考勤管理:
    记录各员工的出勤、缺勤状况。

    12) 岗位管理:
    记录各岗位的工作分配及员工的工作量、差错量(质、数量的差错要求控制在万分之五以内)的状况。

    13) 系统管理功能
    “OCR海量录入软件系统”是一个大型的Intranet网络系统,它包含成千上万的加工数据资料和员工详尽的工作信息。管理人员通过简明友好的系统管理界面可以方便地查询数据、备份数据和系统维护。OCR海量录入系统还提供安全日志,供管理人员查询。
 
五、系统逻辑模型:



六、说明:

    整个系统围绕两个互相联系的数据库:员工管理数据库、OCR扫描文件数据库展开工作。

    员工管理数据库由员工信息表、工种信息表、员工考勤表、员工工作量表、班次表、工资管理表等构成一个完整的员工资料库。员工依流程指定的步骤登录、考勤、申请工作、执行操作并接受管理监督。

    OCR录入资料数据库经由扫描录入、图像处理、版面分析、识别、纵校、横校、版面还原等工序处理最终形成。

    其中在信息传输上采取申请任务方式与分配任务方式相结合使用:

    1) 申请任务方式:

    用户完成一件工作包的同时查看是否有已经分配的工作包,如没有,则申请另一个工作包。 

    2) 分配任务方式:

    由管理员分配工作包给每一个员工。
    为对此流程进行有效管理,我们建立了原始工作包表、工序跟踪表、返工单表、员工工作分配表、工作包表等。



大集体会员常用标签


会员对"汉王数据录入工厂软件系统"的评论

第一个为 汉王数据录入工厂软件系统 物品

我来说两句。。。

力荐 推荐 还行 较差 很差

                    



最新编辑过的会员

谁用这款物品

喜欢这款物品的人也喜欢