第三节 连续性资源组织的含义、内容
一、连续性资源组织的含义
连续性资源组织是众多资源组织中的一种。对于资源组织(Resource Organization)的这一概念,学者给出诸多理解,有称为信息组织(Information Organization)的,也有称为知识组织(Knowledge Organization)的,还有理解为二者之和,如基于叶鹰“由于元数据主要关注文献资源的形式特征而较适宜信息组织,以及由于本体论主要关注文献资源的内容特征而更适合实施组织”之观点,王松林认为,资源组织可分成信息组织和知识组织。
其实,不管是信息组织还是知识组织,最主要的区别点就是研究对象是基于元数据的形式特征还是基于本体的内容特征。纵观国内外相关研究文献,可以发现,国外比较重视资源信息组织的外延拓展(形式特征),而国内比较重视资源信息组织的内涵深化(内容特征),而且,国内学者更多定义为信息组织,代表性的著作有司莉的《信息组织原理与方法》(武汉大学出版社,2011)、戴维民的《信息组织》(高等教育出版社,2009)、马张华的《信息组织》(清华大学出版社,2008)等等。
本书讨论的对象是广义的资源组织,即王松林书中的“资源组织”:基于元数据的形式特征组织和基于本体的内容特征组织,包含了司莉、戴维民、马张华等的“信息组织”,是传统的编目和分类主题标引的相加和组合。
概括起来,目前国内学术界对资源组织的定义都基于三个点:一是采用一定的标准和方法;二是以资源的内容特征描述、揭示和序化为对象;三是以用户对资源的检索和利用为目的。所以,笔者对连续性资源组织的理解就是采用一定的标准和方法,以连续性资源的基于元数据的形式特征和基于本体的内容特征为对象,实现用户对连续性资源检索和获取的信息和知识组织。
二、连续性资源组织的内容
连续性资源组织的具体介绍内容见图1-1。
图1-1 连续性资源组织内容
(一)传统的连续性资源组织
传统的连续性资源的组织其实就是印刷型连续出版物的组织,连续出版物的组织模式概括起来就是单一的线性的组织模式。形式组织模式有在版编目、手工编目、计算机编目、联机编目以及RDA模式等;内容组织模式有分类标引、主题标引和线性重组的模式:目录、索引和文摘。具体的组织方法有分类法(体系分类、组配分类法、体系-组配分类法)、主题法(受控标引、自由标引、混合标引)、分类主题一体化。
形式组织模式采用的标准有:国际标准书目著录(连续出版物)(ISBD(S))、(GB/T3792.3-2009)《文献著录第3部分:连续性资源》和(GB/T3792.3-1985)《连续出版物著录规则》、《西文连续出版物著录规则》、国际标准:AACR2、CONSER标准记录文件和RDA、国内标准:《西文文献著录条例》和《中国文献编目规则》、国际标准:USMARC和MARC21、国内标准CNMARC等。
内容组织模式采用的标准有:《杜威十进分类法》(简称DDC)、《中国图书馆分类法》(简称《中图法》)和《中国图书馆分类法.期刊分类表》(简称《期刊表》)、《国会图书馆标题表》、《汉语主题词表》、《中国分类主题词表》。它的结构模式是有序化的规范的需要人工干预的线性+盒装结构,盒装结构主要指层层等级划分的分类法,像层层套装的盒子。
采用的方法有著录法、标目法、机读目录法、分类法、主题法、传统连续性资源组织方法的网络化等。
(二)网络型连续性资源组织
网络型连续性资源组织是指在网络环境下连续性资源的组织,其实主要是电子期刊及其数据库的组织。网络环境下的电子期刊的组织模式经历了解构和重构的组织模式的变化。解构主要是指随着互联网的发展为了消除“知识孤岛”而出现的搜素引擎和开放存取期刊的组织模式以及后来出现的自主标签。但是随着这种自由组织模式种种弊端的出现,电子期刊等连续性资源的组织模式重新回到有序化且需要人工干预的阶段,但这种重构的模式和传统分类主题又有着诸多不同,因为组织的对象从印刷版变成了电子和网络资源。所以,重构的模式变成了数据库尤其是全文数据库+异构数据库整合、导航(数据库导航+电子期刊导航+学科信息门户导航)、数字图书馆以及电子期刊编目等模式。在这种由自由结构又回到自主有序重构的模式,采用了文件、超文本/媒体、数据库、网页/站、大众分类法,还有MARC、元数据、FRBR等编目方法。此外,传统的MARC、分类法和主题法在网络环境中由于它的知识化仍然在被采用,有的是原装,更多的是被改造后的采用,尤其是叙词表。
这个阶段连续性资源组织的标准有点杂,形式组织标准有:中西文电子期刊编目标准、电子期刊编目使用的工具与文献资源以及CADAL数字化文本——元数据著录细则(V.2.0),在内容组织方面,首先有数字图书馆CADAL项目的系列内容组织标准,如《多维度标签分类标准》、《数字图书馆知识标引规范》和《数字图书馆知识服务标准》等。但是和传统阶段比起来很多几乎没有事实性的标准,都是一些语言和技术的标准,如网页信息组织的相关标准——SGML、HTML与XML。国际上主要是2005年美国AN SI/N ISO修订颁布的Z39.19-2005《单语种受控词表编制、格式与管理规则》以及ISO 25964:信息与文献工作——叙词表及与其他词表的互操作等等。国内的相应标准分别是GB/T 13190-1991《汉语叙词表编制规则》与GB/T 15417-1994《文献多语种叙词表编制规则》都是20世纪90年代以ISO 2788和ISO 5964为参考编制和修订的,主要适用于手工编制叙词表,兼顾一些计算机固执应用,很显然和ISO 25964比较起来,明显滞后。它的结构模式是链式+树形结构。
(三)语义型连续性资源组织
语义型连续性资源的组织模式是指在语义环境下,组织模式由原来的语法转为语义,更强调彼此间的语义和关联。在这种背景下,引入了本体的概念,连续性资源组织的模式发生了改变,如语义搜索引擎、自主标签+本体=关联标签,指出自主标签最大的缺点就是语义模糊性和语法结构拼写缺乏控制性,导致的垃圾标签、缺乏层析和控制等不利因素,本体的语义关联的特性正好弥补了这些缺陷。此外,本体、语义和关联这些理念在大学数字图书馆国际合作计划CADAL中得到了运用和体现,比如CADAL的信息组织中运用了多维分类标签(类似关联标签),知识组织中运用了知识标引和知识服务等模式。采用的方法有本体,CADAL中的多维标签法、知识元抽取法、学科分类法等。
这个阶段采用的标准从严格意义上来讲也是没有事实性标准,有的只是本体编码标准:基于XML的本体编码语言标准OWL和基于RDF的本体编目语言标准SKOS。另外,在CADAL中制定了一些具体的信息组织标准:《多维度标签分类标准》(CADAL 31001—2012)和知识组织标准:《数字图书馆知识标引规范》(CADAL 41101—2012),《数字图书馆知识服务标准》(CADAL 41102—2012)等。它的组织模式是网状+多维结构。
(四)语格型连续性资源组织
语格型连续性资源组织是指在语义和网格结合的背景下的组织模式,不仅强调彼此间的语义关联,还有异构、映射等集成式组织模式,尤其是概念格和知识地图的引入,连续性资源的组织模式以可视化方式被呈现。比如基于概念格的关联标签,基于概念格的开放存取期刊的关键词分析;本体和概念格的互补融合:基于概念格的异构资源领域本体构建(概念—本体)、基于概念格的跨本体映射(本体—概念)以及多本体协同知识地图。数字图书馆中连续性资源知识组织的最终目标毕竟是以人为本,为用户提供知识服务,在多维度语义聚合的情况下,从知识组织的可视化到用户需求分析的可视化,再到检索结果的可视化。采用的方法有知识地图、本体+知识地图、概念格等,未来连续性资源的组织方法应该是多种方法的集成:传统组织方法(分类主题)+大众分类+本体+知识地图+概念格+数字图书馆。这个阶段基本上没统一的组织标准可以遵循。这个阶段的组织模式是立体+晶格结构。