1.2.2 数字化加工的作用

对出版社开展数字出版来说,将出版社的存量资源和新产出的增量资源内容进行电子化、代码化入库,进行基于整书元数据的XML标引,它的作用在于建设CRM系统,实现内容信息的跨媒体出版。历史资源的数字化整理加工,是一件最基础、最基本的工作,每种出版物的全部信息都要通过数字化加工进入CRM系统,实现从一个入口直接找到相关的信息;对系列丛书能够有效关联,甚至实现资源之间的有效关联;对多版本信息也要各自独立加工、入库管理,并且不同版本之间也能够进行有效关联。

数字化信息资源的建设与管理对现有印刷品的数字化需求越来越强,OCR技术应用成为CRM系统建设中的重要阶段,同时也是数据加工的核心技术。经OCR技术处理的电子文档,可广泛应用于各种电子出版物、网络资源、各种大型文献资料数据库、数字图书馆等众多领域,也是出版社内容信息资源开发利用的必经阶段。

由于出版社对存量出版资源的数字化整理加工的需求不一样,因此,加工的层次有初级和高级之分。最常见经过数字化加工的图像PDF文件格式,能够将纸质文档转换成图像文档进行阅读;或者进一步,将文档内容转换成计算机代码,保持图书的原版原式进行阅读。通常,这种实现了纸质文档向图像文档转换的图书内容,能够满足出版社最基本的出版资源电子化、代码化需求,以及读者最基础的阅读需求。为了满足未来数字出版新商业模式对数字出版产品的要求,还需要实现元数据内容的自定义和可扩展,以及基于内容的深度标引,以期能够满足“一次制作、多个渠道、重复使用”的跨媒体、跨渠道出版需要。

通过数字化加工,能够使内容在纸本上、屏幕上显示阅读,不断开发创造数字阅读的新模式,出版传播的新模式,以及出版企业盈利的新模式。