1.7 非结构化加工需要说明的问题

1.7.1 精排PDF文档中的问题

(1)版式线处理

版式还原的纯文本单层PDF文档,即精排加工,排版仍要求与原纸质图书版式一致,因此,对于版式中原有上下边版式线条的地方,仍需要采用矢量图重新排版加线,如图1-17所示的上边版式线。

图1-17 重新排版的矢量图线条及不同字体字号矢量字

(2)字体保留

精排加工中套用原纸质图书的版式,文字层的文字可以各种字体显示,如图1-17的加工界面中显示的文字层,有三种不同字号的字体,黑体、仿宋体及宋体,这是和双层PDF加工文字层统一为宋体不一样的地方。

(3)图表显示

在精排的文档中,图片和表格均能够保持原书中的样式和位置,如图1-18所示。

图1-18 单层PDF文档中的表格仍保留原貌示例

(4)矢量字特点

精排中的字是矢量图,理论上讲可以无限制地缩放,不变形、不发虚。无锯齿状出现是单层PDF文档的典型特点,能够符合印刷质量的要求。被放大3200倍时得到的“是”字字形仍然清晰,如图1-19所示。

图1-19 纯文本单层PDF文档矢量字

(5)成本因素

双层PDF文档加工时,需要人工干预的工作量较少,但精排加工需要人工干预的工作量较大,因此,在考虑加工的成本因素时,要综合选择合适的数字化加工类型。