1.3 以数据为驱动的现代图书馆知识重构

当现代出版业以原生数字资源为出版对象时,图书馆的主要收藏对象也完成了以数字内容为中心的资源平台升级。这一平台的构建彻底颠覆了图书馆的原有结构,资源由“白纸黑字”静态模式转变为可以断“章”取“节”的动态模式。一本书可拆分,可重组,可与多人同时阅读分享。特别是随着电子图书阅读器及移动阅读的推出,随时随地享受阅读服务成为潮流。

面对这一变化,图书馆的应对能力却一直在传统与现代之间徘徊,尚不能适应技术快速更新的信息环境。图书馆仍将重点放在内容本身,如:数据库、数据的典藏与保护、甚至数据的创建,未将重心转移到数据的最终利用,去俯身关心“究竟谁在使用这些数据,它们又是如何被使用的”。这在图书馆的人员招聘上也可见一斑,技术是招聘的首要条件,图书馆学及信息管理学知识是次要或是不需要的。图书馆专业馆员似与数据库管理员等同起来,图书馆管理也似乎等同于数据库管理,使得专业图书馆馆员不仅对“知识需求产生的方式”缺乏了解,还不了解“这种需求产生时,他们的图书馆为何未能予以满足”(兰开斯特,2011)。

正是这种以技术为主要目的的建设思路,使图书馆的技术进步未能与行业同步发展,图书馆的解构也只是消解原来的结构,没有能完全构建起新的业务模式。要改变这种状况,重构图书馆,除了引进性能先进的计算机及网络技术,还要建立起适应用户需求的知识服务环境,完成图书馆自身职能的更新与完善。同时,重视图书馆之间的合作,提升图书馆的公共竞争实力。

1.3.1 从内容到数据的构建策略

近年来,图书馆的实践证明,如果仅依赖于现成的资源完成类似于传统图书馆的信息借阅服务,那么,用户就会像选择搜索引擎远离图书馆门户一样,利用网络资源而远离所谓的数字图书馆。在信息社会里,越来越多的信息网站承担了提供信息服务的任务,信息提供者的优势已不是信息内容本身,而是基于信息内容的数据挖掘、数据关联等深度知识发现服务。

1.3.1.1 基于数字图书馆的资源与服务定义

网络信息技术使图书馆资源与服务的内涵与外延都得到拓展,资源与服务的结合越来越紧密,资源决定服务,服务也对资源提出更高要求。从发展趋势看,两者必将达到高度统一。根据资源载体、内容及服务特性,图书馆文献资源大致可分为静态资源与动态资源两大类。这两类资源的区别正是内容与数据的区别,从定义可以体会两者间的差异。

· 静态资源(static resource):是指资源在服务之前生成,并且在服务过程中,内容与载体形态保持不变,具有可复制、单向传播、内容确定等特性。静态资源包括印刷型纸本资源及以纸本内容为基础的数字化资源,绝大多数静态资源可通过购买方式获取。

· 动态资源(dynamic resource):是指资源以人或信息系统为载体,其内容在服务中产生,并通过服务发生改变,具有互动性、可塑性、不可复制、服务智能化及价值不确定性等特性。动态资源两种:一是数字资源中各种数据分析工具及软件提供的根据用户需求定制的数据分析与评估信息;二是图书馆收集或组织的各种以人为主体的资源与服务,如学术讲座、悦人图书馆(living library、human library)、虚拟咨询等服务或活动。因此,动态资源既是一种资源形态,又是一种服务,也可称之为“深度资源”。

从以上定义分析,静态资源与动态资源的区分不是载体的区别,而是内容与表现形式的区分。不是所有的数字资源都是动态资源,只有经过互动,产生新内容的资源,才可称为动态资源。从本质上说,动态资源是一种数据结果或活动结果,需要通过人的组织或数据分析平台才能产生,具有不可复制的个性化特征。

静态资源和动态资源对应不同的服务类型,分别称作资源型服务和知识型服务。这两种服务的定义如下:

· 资源型服务:是指以静态资源为用户提供的图书馆服务,如图书借阅、资源推送。在资源型服务过程中,资源状态通常不会发生改变,是一种“中介”性质的服务。

· 知识型服务:多属“读者决策服务”(patron-driving service),一般由用户驱动。服务过程以“人”为主体,以“问题”为核心,经过双方或多方互动,通过思想的碰撞、知识或智慧的交流,通过服务可产生动态资源。一般情况下,图书馆根据用户需求,组织馆内或馆外专家,针对用户提出的问题或学术热点问题,利用静态资源及专家自身的知识或经验,在数据分析工具等辅助下,通过双方共有的物理空间或虚拟空间,解决用户问题。

· 知识转化场(know ledge place):是指知识创造和应用、知识资产配置过程中的基地(平台),是以虚拟性的、心理上的,或物理性的场所为存在母体的一种相互关系(野中郁次郎等,2012)。

以上定义说明资源与服务的关联性,以及从静态资源到动态资源的必要条件——知识转化场。场是知识创新的重要媒介,隐性知识(相对显性知识而言)无法脱离“场”而独立存在。场的作用是为服务主客体提供一体化以及相互渗透的过程,即在静态资源的内容基础上叠加“场”的信息,就可以将隐性知识转化为新的显性知识。因为“场”的存在,静态资源与动态资源存在着相互转化关系(见图1-1)。当动态资源形成固定可重复服务的知识内容,则生成静态资源,转化为资源型服务;当静态资源与知识型服务相结合,在知识转化场的作用下,则可转化为动态资源。

图1-1 资源与服务关系

1.3.1.2 基于数据的数字图书馆动态构建策略

处于信息时代,信息资源已从“稀缺”转向“过剩”,以馆藏为基础,解决“信息稀缺”为目标的图书馆“传统组织结构、实践以及观点都日益走向一个死胡同”(张晓林,2012)。准确地说,图书馆稀缺的不是内容,而是根据用户需求从内容中分析得出的数据。这个从内容到数据的变化就是动态资源的创建过程,也是数字图书馆的构建重点。如何利用静态资源与动态资源的特点,将两者有机地结合起来,寻找“知识转化场”,提供分享知识、创造及运用知识的共有物理空间或虚拟空间,则是图书馆的资源与服务重构的目标。

用户对图书馆动态资源的需求,随信息技术的发展而增长。通过百度、谷歌等搜索引擎,用户只能获取浅服务,搜索引擎目前对知识的组织与管理无法满足用户对深度服务的需求。用户对深度服务的需求是图书馆构建动态资源与知识型服务的主要动因,可以说动态资源是由用户驱动的“读者决策服务”,是对传统资源与服务的解构与颠覆。相对于资源型服务来说,知识型服务属深度服务,是由服务提供者对用户需求进行分析,对资源进行内容挖掘后做出的一个解决方案。这个解决方案是在知识转化“场”内对资源的组织与利用,是资源的再生。

由于知识型服务本身就是一个知识创新的过程,图书馆必须提高资源的再生能力,重视服务过程的管理,特别是知识转化“场”的组织与建立。因此,动态资源与知识型服务在构建策略上,要重视以下四个发展方向:

1.动态资源组织管理由浅标引向深标引发展

动态资源与传统资源不同,具有不可复制性。用户关注动态资源文本中的每个细节,希望通过搜索获取细化的内容。资源在收集、订购、组织、管理、流通服务过程中,每个步骤都可因服务对象与需求不同而不同,对资源的管理也具有动态性要求。因此,动态资源注重内容挖掘,资源标引也向深度标引发展。深度标引超越了文献书目层的揭示与描述,是对文献内容的文本知识标引与描述,以满足用户对知识服务的需求。

2.知识转化“场”的组织与建立

知识型服务是一种以知识管理员为主角的组织活动,需要建立提供服务的“场”。所谓场,是“分享、创造及运用知识的动态的共有情境”,“在这个场所里信息通过解读并赋予含意,然后转变成知识”(竹内弘高 等,2006)。场不仅是一种组织形式,而且是一种对创造进行组织的方式。

如何将“场”嵌入适当的物理空间或虚拟空间,设定一种合适的场开展知识创造和知识应用,对知识型服务具有重要意义。在服务过程中,将各种“场”有效利用,可以最大限度地激发知识的活力。借助“场”的传递,可以完成服务双方对隐性知识的转移和孕育,进而形成显性知识和创新。“场”不是孤立的,而是需要组织的。在知识创新中,“场”是关键因素之一。因此,信息服务竞争中,“场”是一个重要的平台,是服务增值,知识增值的催化剂。

3.动态资源与知识型服务的过程管理

动态资源具有互动性及可塑性特点,它的服务过程往往存在某种不确定性,整个过程不可复制,具有唯一性的特点。记录服务过程,规范动态资源生命周期管理是知识生成的重要环节。可以说,过程管理是动态资源与知识型服务成败的关键(见图1-2)。

图1-2 资源与服务过程

4.动态资源与知识服务的智能化倾向

动态资源属于用户驱动的服务型资源,用户的需求与服务过程的互动,对图书馆的传统服务与服务平台提出了新的挑战。用户对图书馆的服务需求无处不在,传统的服务已无法满足用户的个性化实时获取要求。因此,图书馆须具备挑战“读者决策服务”的能力,从业务流程、技术平台上改进或创建新的服务模式,将动态资源与知识服务嵌入过程中,通过技术手段整合服务流程,将图书馆的人、资源、服务三者融合在一起,提高平台的呈现能力与智能化服务能力。

另外,作为开放资源的海量科学数据将成为图书馆的重要资源对象,如何开放动态地利用海量数据?显然,依靠人工处理是行不通的,“必须利用计算机才能对海量数据进行分类聚类、抽取要点、发现关系,分析揭示隐藏着的知识结构、趋势和变化,构建知识架构(know ledge profiles)和知识地图(know ledge maps)”(张晓林,2012)。

1.3.2 从数字图书馆到数字知识空间的构建策略

图书馆虽然已在数字环境中经过二十多年的历练和发展,但是它的服务仍偏重于基于文献资源的集成服务模式,与传统服务模式同出一辙。图书馆不得不面对这样的现实,由商业数据库商及出版社主导的文献资源供应体系,将图书馆绝大多数信息资源局限于传统的书刊资源,而基于描述性元数据的资源整合与发现系统,缺乏语义搜索与知识发现服务功能。目前,图书馆广泛使用的“基于集成服务的数字图书馆提供的馆藏数字信息资源集成检索与获取服务面临着迅速边缘化的严峻挑战”(孙坦,2013)。而数据库商却再次走到图书馆的前面,他们提供的第三方知识服务产品在开放信息环境或用户知识环境中,支持用户进行科学信息内容的分析、可视化,并建立个人机构知识库,管理各类知识资源。因此,图书馆要建立来自第三方的文献资源分析、管理与挖掘平台,受到数据库商的各种限制。要改变被动局面,开放合作是数字图书馆的最佳选择,联盟式数字知识空间能使参与各方享受到大数据时代共性与个性的最优资源获取与资源服务。因此,对数字图书馆来说,外部业务的构建与内部业务一样重要,如何构建数字知识空间也将是数字图书馆的研究重点。

数字知识空间的构建要符合共性发展的趋势,也要符合个性发展的需求。从宏观层面确定空间的发展政策,确保基于资源内容与资源服务的共建共享具有实践指导意义。这些构建策略包括开放合作、资源整合、协同管理、技术外包、标准规范及永久保存等六个方面。

1.3.2.1 开放合作策略

开放合作是图书馆的首要发展战略,在传统图书馆领域,图书馆实现了在线联合编目,并形成了世界最大的联合目录WorldCat(www.worldcat.org)。而今,WorldCat成为传统图书馆合作的典范,它为数以万计的成员提供元数据管理、检索、资源共享及馆藏管理等服务,在全球170个国家拥有72000个成员馆和372,088,2924条书目记录数据来源于全球图书馆资源:http://www.oclc.org/zhcn-asiapacific/worldcat/catalog.html.[2016-09-28]。

在大数据时代,图书馆更需要像WorldCat一样联合数字知识集成目录。面对信息过剩的难题,图书馆除了资源合作,还扩展到知识组织与管理的合作、知识服务的合作及知识发现的合作,更多地解决海量灰色资源及科学数据的发现、组织、管理与利用。通过数字知识空间的合作,将图书馆转化为支持合作学习、合作研究的新型公共知识平台。

开放合作策略将数字图书馆在数字知识空间连成整体,利用合作平台,充分利用开放信息与开放数据,降低图书馆整体的运行成本,提高“信息速率”。对数字图书馆来说,合作就是竞争力,合作就是生命力。

1.3.2.2 资源整合策略

数字知识空间的资源将大大扩展,任何具有文化特性、知识特性的信息数据都会成为空间资源的一部分。传统意义的图书馆、档案馆、博物馆等公共基础文化机构在数字知识空间将逐渐合为一体,文献、档案、文物等数字资源将登陆同一平台,形成荟萃人类文化遗产、世界档案、历史文献以及先进科技成果的超级知识空间。

资源整合将成为数字知识空间的重要功能。由于数字知识空间不受文献类型、阅读对象、收藏功能、社会功能等限制,具有最广泛、最复杂的数据来源。因此,建立资源整合机制,制定资源整合策略是数字知识空间的重要战略任务。资源整合战略不仅对资源存储技术、标准规范制定、资源组织管理、资源知识服务等空间内部职能产生积极影响,而且将改变整个网络信息环境对知识组织、知识管理及知识服务的诠释。

1.3.2.3 协同管理策略

数字知识空间是公共空间,由多个数字图书馆组成。协同管理策略可以为空间成员提供与数字资源相关的元数据管理、数据共建共享、资源检索与发现,以及学术知识创新等服务。数字知识空间在元数据管理与数据的共建共享上,比传统图书馆具有更大优势。图书馆购买的数据库资源有大量重复,各个图书馆单独购买维护资源发现与整合平台,资源配置工作都是重复劳动。如果图书馆建立区域或全国性数字知识空间,资源的配置可以协同完成,资源的检索与发现以及知识创新服务可以在数字知识空间实现。

数字知识空间的协同管理将提供资源合作共建策略,以降低采购资金成本和人力成本,同时规范数字资源采购市场;还将为数字知识空间的成员单位提供资源配置的协同管理,以保证成员馆都能享受元数据管理服务,元数据管理服务可以由成员馆共同完成,或者由数据库提供付费服务。当然,数字知识空间最大的优势是可以联合收集管理开放资源,为平台上所有的用户与图书馆提供“知识转化场”,共同享受知识发现与学术知识创新服务。

1.3.2.4 技术外包策略

数字知识空间离不开计算机技术和网络技术的支撑,而技术非图书馆强项,要建立技术先进的合作空间,技术外包是首选策略。技术外包策略实际包括两个方面:平台和软件的定制以及维护、升级等专业技术服务。

技术外包的优势是可以利用成熟的商用平台和软件,借鉴平台或软件的信息服务与管理思路,定制空间所需的服务,节省开发人力和时间。另外,数字知识空间的需求来自各个成员馆,需求和层次差异较大,无法一一满足,只能求同存异,利用市场成熟产品和软件来设置共同需求,以及定制相对集中的个性需求,以节省开发成本。

外包的优势还在于技术的可持续发展性,平台的后续维护和功能升级对数字知识空间的发展非常重要。数字知识空间的使用量大,用户众多,技术维护任务非常繁重,依靠成员馆零散力量,人力成本高,效果差。而技术外包可将后续维护和功能升级写入技术合同,以保证数字知识空间在合同期内得到较好的服务。

1.3.2.5 标准规范策略

数字知识空间不仅是数字图书馆联合同盟体,一个扩大版的数字图书馆,而且将是一个覆盖人类文化与文明的超级知识空间。在数字图书馆建设过程中,标准规范建设是一项保障性的战略措施,数字知识空间的标准规范建设也同样具有战略意义。数字知识空间的标准规范策略是标准规范建设的指南,它既具有宏观性,又必须关注中观与微观细节。

宏观层面,要建立标准规范的建设标准与规范,体现整个建设体系的发展政策与框架结构,规定标准规范的建立与维护机制、标准规范采用的现行标准与规范集、标准规范的文本格式与书写规则、标准规范的执行范围等。

中观层面,要根据数字知识空间的数据管理及业务管理要求,制定数据与数据的关联表,设置核心标准与专项标准,建立标准规范协同工作平台,实时发布与修订标准规范,提供标准创建与维护工具,形成数字知识空间的标准规范知识库。

微观层面,围绕资源、服务与技术三个方面,建立资源的购买、使用、制作、评估、版权与管理等各个环节的标准规范;建立与数字知识空间相关的各类技术标准规范,如资源存储、发布、仓储、服务协议与接口、安全标准等;建立资源服务协议,资源获取、文献传递、知识服务等标准规范。

1.3.2.6 永久保存策略

资源永久保存一直困扰着图书馆,从传统图书馆的纸本文献到数字图书馆的电子文献,永久保存除了受到空间的限制,还受到技术和经费的限制。目前,多数图书馆都独立完成馆藏文献的永久保存任务,由于资源内容重复率极高,造成馆藏空间的浪费。而数字知识空间的重要目标就是为图书馆提供馆藏文献以及非馆藏文献的长期保存任务,通过协同保存策略不仅为成员馆保存资源,而且为成员馆提供资源服务。从需求分析,数字知识空间的永久保存策略可分为资源永久保存策略、元数据永久保存策略和数据永久保存策略。

资源永久保存策略分集中保存与分布式保存两种形式。集中保存适用于纸本文献(采购获取)以及开放信息资源(无版权)的长期保存。纸质文献可以在一个地区中心馆设立核心样本库,图书馆间通过协议完成场地租借及馆际互借服务。开放信息资源的集中保存则从信息资源的标准化存储出发,在数字知识空间建立开放信息资源库,由成员馆协同完成开放资源创建与使用规则。当然,集中保存需要图书馆间达成共建协议,成立建设基金,共同承担文献保存责任。集中保存也可作为政府公益事业,向政府申请公益基金,由政府、数字知识空间及图书馆三方共同出资保存纸质文献与开放信息资源。资源分布式保存模式,适用于特色资源以及数字资源的长期保存。特色资源一般对图书馆来说具有特殊意义或价格昂贵,集中保存会降低文献的保存意义。数字资源因使用权与所有权分离,图书馆购买情况较复杂,且数据库商并不一定提供本地的镜像,因此,集中保存只能在国家层面实现。在地区数字知识空间,数字资源的长期保存只能采取分布式保存模式,由数字知识空间协调完成地区内数字资源的分布与保存。

元数据永久保存策略从表面看似乎与传统的联合目录作用相同,将成员馆资源信息与服务信息汇聚在一起,提供联合目录及联合服务。其实不然,数字时代也是元数据时代,元数据的范围已大大超越传统图书馆,除了文献目录信息以外,还保存数字知识空间(数字图书馆)的资源增值信息、服务信息、技术信息、管理信息等诸多数据资源。元数据作为文献资源的检索依据、服务依据、评价依据,是信息环境中最重要的数据资源构成。特别是当数据之间利用关联技术进行整体管理时,元数据成为数据关联、数据测试、数据分类、数据汇聚及数据评估的底层基础。所以,元数据是一种生命周期过程管理数据,记录了资源内容在检索、发现、评估中发生的改变,是增值的内容服务,可独立于资源而存在。元数据也是一种客观评价体系,它具有实时记录数字知识空间一切活动特征的功能,并可通过数据评价标准,对整个数字知识空间的资源及服务做出评价。在数字知识空间的整体框架中,元数据标准贯穿整个管理过程,是数字知识空间目标的具体表现。

数据永久保存策略是针对科研过程数据而制定的。数据资源是大数据时代的产物,科研活动的各个阶段无时无处不产生数据。这些数据在科学研究领域的作用已日益重要,虽然数字图书馆还未将开放数据纳入收藏范围,但数据与文献间的关联已把图书馆与科学研究的过程紧密地联系在一起。未来图书馆不仅是文献的图书馆,还应是数据的图书馆。数据资源将成为图书馆的重要资源,并与文献共同构成知识综合体,实时记录科学的研究成果,以及数据在科学研究过程中发生的各种变化,为研究者提供即时的数据以及数据背后的支撑文献。

从数字图书馆到数字知识空间,数字图书馆要改变的是存在方式。作为开放信息环境中最重要的知识服务提供方,数字图书馆的无边界化应该比传统图书馆更彻底,也更具实践性。数字图书馆的重构不仅是一个传统意义上的独立图书馆的构建,而且是一个现代意义上的图书馆公共体系的构建。网络无界线,数字图书馆自然也无界线,重构的目标就是消除界线。这些界线包括外部的图书馆与图书馆间的界线,也包括图书馆内部的业务界线,如资源与服务的界线、保存与利用的界线、实体空间的界线等人为的或天然的界线。

综上所述,图书馆的“消亡”实质上是传统的“消解”,不是简单的功能“消失”,而是传统的“解构”与现代的“重构”,旨在创建一个和而不同、有实体空间支撑的真实数字世界,从而使图书馆在重构中获得新的生命力和竞争力。