- 语文词典语义类别释义的多维研究
- 冯海霞
- 8881字
- 2024-11-01 03:28:15
第三节 课题的理论及工具支撑
一 世界辞书编纂与语言学研究
辞书编纂的历史,已有3000多年了。词典编纂经历了由无意识被影响到积极地吸收、借鉴语言学的研究成果的漫长过程。
最初阶段的辞书,都始于经验、直觉和实用,为了启蒙、释难、交流(翻译)、读经、正音、正形、辨义等。最早的是难词词典:编于公元前2300年前中国的《尔雅》;约公元前5世纪,希腊人编出了《荷马史诗难词表》;公元8世纪末至9世纪初,阿拉伯世界为教徒读经解释难词编出的《真主的书》;1623年,第一本命名为《英语词典》的副标题就是《难词汇释》。
除了难词词典,还有供交流需要的双语、多语词典:11世纪的《阿拉伯·波斯语词典》,1596年编出的《俄语注释斯拉夫语简明词汇》,1627年编出的《斯拉夫俄罗斯词汇》,约翰逊等编出的《波斯语—英语词典》《阿拉伯语—英语词典》《拉丁语—英语词典》,1073—1074年编成的《土耳其诸语言汇编》,1598年的《拉丁语—捷克语—德语—希腊语词典》,1786—1787年俄国出版的《全球语言的比较词汇》。
以上的辞书仅是在“实用”目的驱动下进行的编纂实践,传统语文学环境下的语言学还没有成为一个独立的学科,更无对词语科学、系统的研究,也就无所谓对词典的编纂产生多少积极的影响。
(一)历史语言学与历史性词典
17—18世纪的欧洲,在语言哲学中占主导地位的是反历史主义的“语言机械论”。不过,深受康德影响的思想家和语言学家洪堡特极力反对这种思潮,他认为“语言的历史只是整个文化史的一部分”。19世纪70年代出现的青年语法学派正式提出历史主义,强调语言是随时间变化的现象。按照历史的编纂原则实践的辞书有:《德语大辞典》《牛津英语词典》《日本国语大辞典》和《汉语大词典》。足本的词典对语言兴趣者来说具有高度的词库性和研究性。
在历史主义思潮中,也产生了一些历史比较语言学理念。其促使辞书界出现了一批新成果:《古斯拉夫语—希腊语—拉丁语词典》《民族分裂前印度·日耳曼基础语词典》《梵德大词典》。它们貌似语言交流对照词典,实际是体现比较语言学的新成果。
(二)词语的规范研究与规范性词典
真正科学的词语研究,在欧洲的开始阶段是15—17世纪。欧洲新语言研究工作的开展,是在对语言的规范性和反历史主义的标志下进行的。18世纪50年代的《英语词典》大体结束了当时英语在拼写、发音和语义方面的紊乱局面,树立了英语语言方面的权威。英国1911年出版的《简明牛津词典》、俄国 1949年出版的《俄语词典》、中国 1960年出版的《现代汉语词典》和法国1972年出版的《小罗贝尔词典》,都是在对词语规范性研究的基础上进行编写的。
(三)描写语言学与描写性词典
随着以布龙菲尔德为代表的美国结构主义描写语言学的迅猛发展,现代语言学向传统语言学提出了挑战。描写主义者认为对语言事实加以评判是做不到的,阻遏语言的变化更是徒劳。故赵元任先生明确指出“编词典的人只能记录事实,他们无需要自己的思考,也不应该有自己的思考”。受描写语言学思想影响的辞书典范是:1961年出版的《韦氏三版新国际英语词典》。它抛弃规范性和历史的理念,力求客观描写当代英语词语,尽量全面、系统、客观记录活语言的真实情况(不是记录最好的语言),取材不限于典范作品,还有口语、广播、报刊等。
(四)功能主义与学习词典
布拉格学派,也称功能语言学派。它在20世纪30年代处于鼎盛时期。到了40—50年代,在哲学领域出现了功能主义,它认为文化产生的原因是需要,完成其功能就是满足需要,因而要了解一种文化,就要对它做功能的研究。70年代,韩礼德把语言功能学说推到了新阶段,全面研究了语言、言语变体、语言各级成分的功能。在语言学和哲学影响下,词典学开始受功能主义影响,其突出代表是英、法、德、美、俄、日等国家出版了多系列学习词典。它们开始转变编纂理念:(1)由语言本位转到用户本位,为不同语别、级别用户编不同的词典;(2)功用由解码为主转到编码为主,注重语言的生成、输出;(3)由释义中心论转到用法中心论,全方位、多角度地揭示词的语义、语法信息,特别是语用信息。一部好的积极型学习词典既可以成为各种语言理论研究的对象,又必定促进对该语言的实际掌握。
(五)搭配、语境的研究与词典编纂
现代意义的搭配研究的标志应是20世纪50年代弗斯第一次提出科学概念——搭配。此后从语义、语法、语用的角度研究出固定搭配、典型搭配、常见搭配和特殊搭配等。同时,语料库建设也促生了一些科学意义的搭配词典:《BBI英语搭配词典》《现代俄语详解组配词典》和《牛津英语搭配词典》。1987年的《柯林斯合作英语词典》首次突破传统的释义方式,开创了“句型释义”模式,是对弗斯的“意义取决于搭配”理论的实践。《朗文当代英语词典》(第3版)在很多词条中也采用了句型释义。
法国语言学家特斯尼耶尔把化学的配价理论引入语言学,渐渐发展出配价语法。德国语言学家恩格尔认为“配价是含有语义的句法范畴”。由这一理念演绎出了配价词典,如《德语动词配价辞典》《德语形容词配价辞典》《德语名词配价辞典》《英语配价词典》,中国也编了包含配价理念的《动词用法词典》《现代汉语实词搭配词典》。
(六)基于语料库的词典编纂
语料库,已经产生半个多世纪。利用“英国国家语料库”,开发了《柯林斯合作英语词典》《牛津高级学习词典》《朗文当代英语词典》《钱伯斯基础英语词典》等。
美国语言学家戴维斯(Mark Davies),主持建设包括“美国英语在线语料库(COCA)”在内的三个大型语料库。基于语料库,他编辑出版了三部词频词典。曾相继担任柯林斯系列英语词典、牛津当代英语系列词典主编的著名计算机语言学家、语料库词典学家汉克斯(Patrick Hanks),结合认知语言学相关理论和语料库语言学方法提出了词语语义研究新理论——“常态与拓展理论”。在其理念指导下已经实践性地编纂了700个动词的用法词典(pattern dictionary)。当代语文词典的编纂几乎无不是建立在语料库基础之上的。
(七)认知语言学与认知词典
20世纪后半叶,随着认知语言学研究的不断深入,促进了词典编纂“革命”性的变化。其中原型理论和元语言(语义元素)的研究对词典的释义具有高度的借鉴作用。
原型(prototype)是物体范畴中最典型、最具代表性的成员,其他成员所具有的典型性则程度不等。《新牛津英语词典》前言中明确其充分利用了当代语言学家及认知科学家分析词义及其使用的新技巧,最突出的是强调用法和语义的“中心和典型性”,从而宣称自己使用了“原型释义法”,摒弃了传统“经典范畴释义”的方法。
认知语义学的概念化分析认为,一个概念必须用一些更简单,而不是用一些更复杂或同样复杂的概念来定义。1978年的《朗文当代英语词典》用2000个常用词释义,是实践元语言理论的首部辞书。后来,《柯林斯合作词典》《剑桥国际英语词典》《牛津高阶当代英语词典》都把释义用词限定在一定数量的常用词范围内。
认知语言学研究不但影响到词典的微观结构,而且对词典的整体架构也产生了影响。普林斯顿大学基于认知语言学对同义词集合和语义关系的描述原则,首先推出了机读义类词典——Wordnet。20世纪90年代后,各国竞相开发本国语言的Wordnet语义词典。1997年,美国加州大学基于框架语义学,根据框架元素、配价和语义关系构建了 FrameNet 在线语义词典。
对于辞书编写产生影响的语言学研究远不止于此,语言的语音、词语、语法、符号、话语、篇章等研究都或多或少地促进着词典的编纂进程。当然,正如所有的语言学理论相对于语言事实而言都具有非周边性一样,也不是所有的语言理论都可以被借鉴到词典的编纂实践中来。我们要以积极的态度、辩证的眼光来看待语言研究与词典编纂的关系。
二 语言词语的系统论
按照系统科学的观点,世界上任何事物都是以系统的方式存在的,因而人们的认识活动,只有用系统方法去研究对象,才能获得正确的即符合事物实际情况的认识。[54]
由奥地利生物理论家Bertalanffy等学者提出的系统论是20世纪最有影响力的现代科学方法论之一,它不但对20世纪的自然科学贡献巨大,而且也被运用到了人文学科领域,并同样产生了重大的影响。从系统的角度来认识语言是这一理论在语言学领域中得以应用的反映和体现。自索绪尔以来,学者普遍认为语言是成系统的。但是,在20世纪上半叶语言学界流行着的是语法有系统,语音有系统,而词语是一盘散沙的观点。60年代词语是具有系统性的观点开始出现,但受到强力的“辩难”。直到80年代,这一观点才慢慢被学术界接受。但在这个阶段,也仅仅只是推理的假说,处于理论上的自觉。这种假说或理论的自觉大致基于以下三个理论依据:第一,客观事物是成系统的,反映它的词义自然也是成系统的;第二,思维是成系统的,体现概念的义位自然也是成系统的;第三,洪堡特把语言结构比喻为一张巨大的有机网络整体。先哲们提出了一个古老的假说:“词义是成系统的”,并不断地进行理论上的推导和事实上的证明。
近半个世纪,无数学者的研究把假说证明从幼儿低谷阶段推到了发现高强度无数事实的发展时期,最后使其攀上假说证明的高峰,并充分印证了这个假说的真实性:义位处在聚合和组合的系统性中,且某些聚合群是具有层级性的系统。总之,“我们生活的时代的特征是在一切科学中都用结构主义取代原子主义,用普遍主义取代个别主义的趋势”[55]。当然,正如黑格尔从实在论出发,以生物分类的复杂性为根据,说“自然界到处通过中间的和不完全的形成物把本质界限混淆起来,这些形成物总是跟任何固定的区分带来一些相反的例证”[56]。词语也有其非系统的一面,但这是词语的非本质的现象。
词语的系统性决定了释义系统性。传统语文性辞书编纂思想是原子观占主导地位,现代语文性辞书编纂思想是整体观占主导地位。这种转变导源于20世纪以来的语言哲学、语言学和心理学等的新思潮。在这种思潮下,《简明牛津英语词典》《小罗贝尔法语词典》《俄语词典》和《现代汉语词典》等现代中型语文性词典诞生了。但是“现在语文性辞书编纂法中从前只是有以‘相关条目’为代表的整体观雏形,还远不成体系,亟待充实、推进、完善”[57]。
Апресян曾提出辞书编纂中对语言进行整体观描写的六个总原则[58],其中每个总原则又包括了一些细原则、细目。如“语义”之下有十个细则、十个细目。在这些细则与细目中,他多数讨论的是一个词位或一个义位内部的多种信息整体。张志毅、张庆云吸收现代语义学之精华,从另一个侧面以语义场整体观的角度对语文辞书编纂作了理论指导性的推进。他们认为“只有掌握了底层语义场,才能从整体观了解场内缺少的义位(或词项)。……只有掌握底层语义场,才能从整体观了解场内义位的价值。……只有掌握底层语义场,才能从整体观统一场内各义位的释语模式”[59]。同样,章宜华也在评述“意义与系统的关系”论题中总结说:同一语义场的词是以各种方式相互联系、相互释义的,借助语义网络释义既可以使释文简洁明了……然而在词典编纂过程中,词目的顺序排列把自然语义场割裂开来,我们有必要建立有效的释义模式和完整的参照体系,把同一义场的语言单位重新联系起来。[60]章宜华的总结无疑给释义的研究提出了新的课题。夏立新[61]也认为:处于同类词语集(lexical set)词目中的词,词典应该统一处理。他将汉语中的学习词典与《朗文当代英语词典》进行了对比,发现现有词典在这方面做得不够,进而提出了在词语集(语义类别)的基础上构建释义模块的设想和具体步骤。可以说,义位的系统观为我们打破字母的排列顺序,建立以语义类别为聚合的小系统单位,进而为实现整个词典的大系统性提供了有力的理论支持。
三 语义描写的关系论
索绪尔的结构语义原理认为:语言是一个由语言成分之间相互依赖的关系所组成的结构体系。这个原理对语义的描写就表现为语义的关系论。他强调符号的内指性,认为意义可以靠系统内部的相互关系得到实现,而无须到系统外去找所指对象。德国语言学家 Trier 确立并发展了“语义场”理论。其主要的观点是:语言中的全部词语可以看成一个系统,这个系统处在相对稳定的状态中,系统中的每个词项按意义聚合成为若干个语义场,每一个词的意义都取决于与同一场内其他词的关系。这无疑是索绪尔语言系统观点的具体实践。可见,对于语言来说,语义单位本身并不最重要,语义单位之间相互关系才是最重要的。系统性这一研究模式就是研究语义单位的相互关系的。从整体论(非原子论)观点看,义位是属于语言整体的。因此一个义位(哪怕是最个别的义位),要得到正确的理解和解释,只孤立地看义位本身不行,而是要考察义位在词义系统中的位置,只有系统才给个体以质的规定性。这种强调从语言的内部关系来分析语言,包括语义的——义位价值的“差异观”给我们带来了很大的启示:对处于典型群中的义位进行实践释义时,必须以系统的关系论理念贯穿始终,即在意义的构建中,义位必须与群中其他义位的关系为取舍标准,对自身的语义特征进行选择性凸显描写。这也是衡量已有词典释义系统性强弱高低的一个工具。如《现代汉语词典》对于“熊”“黑熊”“棕熊”和“北极熊”的释义:
【熊】哺乳动物,头大,尾巴短,四肢短而粗,脚掌大,趾端有带钩的爪,能爬树。主要吃动物性食物,也吃水果、坚果等。种类很多,如棕熊、马来熊、黑熊。有的地区叫熊瞎子。
【黑熊】哺乳动物,身体肥大,尾巴短,脚掌大,爪有钩,胸部有新月形白斑,其余部分黑色,性孤独,会游泳,能爬树,也能直立行走。也叫狗熊,有的地区叫黑瞎子。
【棕熊】哺乳动物,身体大,肩部隆起,毛色一般棕褐色,但随地区不同而深浅不一。能爬树,会游泳,吃果、菜、虫、鱼、鸟、兽等,有时也伤害人畜。
【北极熊】哺乳动物,毛白色带黄,长而稠密,鼻子和爪黑色。生活在北寒带,善于游泳。也叫白熊。
可以看出,《现代汉语词典》对于四个义位的解释,让我们几乎无从看到其间的联系性。我们猜想词典的编者应该把它们都作为一个个独立的义位进行了细致的刻画。“熊”是这个典型群中的属概念,“黑熊”“棕熊”“北极熊”是这个属的下位“种”,因而在后三者释义的时候,应该选择最近的上位属“熊”作为它们的类别属词,进行语义特征的凸显选择,也就是在属——熊释义的基础上类比构建释义。既然“熊”是上位属概念,它的义征应该是下面三个种义位都具有的特征,所以“黑熊”的身体肥大、脚掌大、爪有钩、性孤独、能爬树或作为“熊”的基本特征已被释义,或是非区别特征都应该被省略。同样的是“棕熊”的:能爬树、会游泳、吃果、菜、虫、鱼、鸟、兽等也可以删除;而“北极熊”中的:长而稠密似乎是非区别特征。整理后的释义应该是如下:
【黑熊】熊的一种,胸部有新月形白斑,其余部分黑色。能直立行走。也叫狗熊,有的地区叫黑瞎子。
【棕熊】熊的一种,肩部隆起,毛色一般棕褐色,但随地区不同而深浅不一。有时会伤害人。
【北极熊】熊的一种,毛白色带黄,鼻子和爪黑色。生活在北寒带,善于游泳。也叫白熊。
这样一来,同一类别词目群中的词应该具有同样的释义模式的系统性和词典释义的经济性、明晰性原则被几近完美地整合在释文中。当然,这是基于我们假设认定“熊”的释义是无可挑剔的基础上的。
可见系统观给我们为什么提出以“语义类别”的角度释义的一个理论支撑点,而结构主义的关系理念为系统性释义提供了更好的途径和方法。典型群的确立,群中义位关系释义理念的形成,将为我们实现系统性释义提供坚实的底层网络基础。
四 认知语言学的基础概念词
对于人类是怎样最有效地对事物进行分类和组织的,认知科学家发现了一个重要的层面,基本范畴层面。在此层面上形成的范畴叫作基本范畴,而且对基本范畴的各种研究表明,范畴结构中各层级所有的信息量和实用性是不同的,在建立范畴过程中基本范畴层次在认知上比其他层次更加显著。在此等级上,大脑的经验范畴与自然界的范畴最接近,最匹配,人们更容易感知和记忆。基本范畴是人们处理自然事物最有效、最有力的工具。所以人类是从基本层次范畴来认识事体、理解世界的。以基本范畴为基点和参照点,向上发展为上位范畴,向下区分为下属范畴。而语言上表达这一层次概念的词就叫作“基本层次词”(basic level terms)或基本概念词。基本概念词具有以下几个特点:(1)使用的高频性;(2)简洁、无标记性;(3)认知意义上的直观,完形性;(4)构词能力强,基本义具有容易发生转喻、隐喻的扩展性。
词典是对词语系统的反映,词典的释义是对编码压缩进词语中的意义的释放与描写。根据认知语言学的理解,概念即是意义,所以,我们暂时认为释义即是人类认识世界的结果——概念范畴在词典中解码性还原。那么,在释义过程中,我们有理由按照认知的程序,以与世界相互作用最直接、最基本的词语为切入点和基础,进而对其他词语义位进行释义。基于认知语言学中基本范畴词的理论的启示,我们对类别典型群释义中提出基础义位和非基础义位的概念。基础义位是典型群中词形相对简单,使用频率较高,大体相对应于认知语言学提出的基础范畴词。典型群中基础义位的确立是为释义的经济性服务的。如“看”这个汉语典型群中共计80多个义位,我们认为,其中“看”被确立为基本义位,进行详尽扩展式释义,然后将“看”当作一个整体意义模块,整体进入其他的非基础义位中,非基础义位则在“看”的平台上,再进行语义特征的选择性凸显。这种以基础义位为参照点为其他义位释义的方法,不但体现了释义的系统性和经济的原则,也达到了“意思↔文本”理论中所倡导的“最大集合原则”。当然,不同民族典型群基础义位的选择可能会不同。这如同传统的词典编纂所使用的属概念:如“鹅”我们选择了“家禽”而英语则选择了“waterbird(水鸟)”一样有区别。
五 词典的可比性
我们打算选择Concise Oxford English Dictionary 10 Edition(《简明牛津英语词典》第10版,以下简称为《牛津》)和《现代汉语词典》第5版(以下简称为《现汉》)为释义的参照蓝本,必要时也参考Longman Dictionary of Contemporary English第4版(《朗文当代英语词典》,以下简称为《朗文》),Collins Cobuild English Language Dictionary第3版(《柯林斯合作英语词典》,以下简称为《柯林斯》)。
众所周知,《现汉》和《牛津》这两部词典就性质、篇幅、使用对象来说,都相当接近。二者都是规范性的、中型的语文词典,都以中等以上文化程度的母语读者为使用对象。不但如此,二者都是各自领域同种类型辞书中的佼佼者。《牛津》是一部世界著名的中型语文词典,其发行量长期位居牛津系列辞书之首,在英语界一向享有很高的声誉。该词典自1911年问世以来,在几代数十位学者近百年的努力下,经过9次的修订,于1999年6月推出了第10版。同样,《现汉》也在海内外享有盛誉,是中国语文辞书的楷模。自1978年正式出版后,在两代人的努力下,经历1983年和1996年的修订以及2002年的增补过程后,于2005年6月推出了第5版。因此,拿这两部词典做释义范畴上的横向对比,寻找和发现自身特点与问题,来扬长补短,可谓是“门当户对”。
《朗文》是顺应时代的需要而诞生的一种外向型的积极学习型中型语文词典。它多以非母语读者为使用对象。《朗文》以它释义的通俗、细化和限制性释义语言为特点而赢得人们的赞誉,其实用化的倾向是我们所要努力的方向。《柯林斯》是一部先进科学技术与当代语言学理论结合而成的优秀外向教学性词典,其编纂最具特色部分——语境性完整句子释义,被誉为“COBUILD式释义”在典型的语境中交代词义,弥补了传统释义方式过分强调词义的概括性与抽象化,避免了一味单独地、抽象地揭示词义从而经常导致“只剩三条腿的狗不是狗”的尴尬局面的发生。所以,必要时,我们会借助《朗文》《柯林斯》中的释义作为旁证比较的对象。
六 语义类别确立的工具
如果说词语意义的系统观的流行是来源于理论上的自觉,那么也不可忽视实践的影响。《同义词词林》(以下简称为《词林》)便是一部在对现代汉语词语进行系统建构上具有开拓性意义的实践作品。《词林》把近7万个词语以有序的语义联系呈现在人们面前,使词语语义存在系统性的理论模糊在实践上明晰起来。所以,《词林》可以当之无愧地被称为中国现代第一部语义分类词典。后来,多种分类词典迭出不尽,如《现代汉语分类词典》[62]《简明汉语义类词典》[63]《现代汉语分类词典》。[64]“以词义为主,兼顾词类,并充分注意题材的集中”[65],可以说是它们的共同点。《词林》有一级类12类,二级类94类,三级类1428类,三级类下面又按代表词分出词群,共3925个词群。应该说无论是在收词的数量上,还是分类层次的丰富与细致上,都可以算是这一类词典中的佼佼者。
近来,随着计算机处理自然语言的出现和需求,顺应这一趋势的新型词语语义分类词典开始出现。其中的代表者是王惠、詹卫东等的《现代汉语语义词典》。董振东与其子董强携手共同建立的“知网”(HOWNET)。虽然词典的名字是“语义”词典,但是《现代汉语语义词典》为适应计算机的“批处理”对词语进行系统分类的标准是“语法分析为主,语义分析为辅”,用他们自己的话说:“我们的语义分类体系是为了辅助语法分析而设计的,因此,语义分类的标准及分类深度均应从为语法分析服务的角度来确定。应用语义知识应着重于解决那些仅靠语法规则难以解决的问题。这应该是我们的唯一标准。”[66]它除了把名词、动词、形容词作为最上一级的分类外,在下级语义层的划分中也突出了便于语法处理的属性。例如,动词大范畴下,“行为”类中又分出“自变”“促变”“自为”“自移”“搬移”“对待”“给予”“获取”“创造”“遭受”10小类,这些小类蕴涵着对于动作主体、方向、客体、结果等参数的考虑,而这些因素会直接影响到动词的语法搭配规则与搭配对象。“知网”是专用于计算机的语义分类词典,它依靠计算机强大的超文本关联能力显示其内在的语义关系,是真正以网络状态出现的一个词语网。“知网”的语义分类,是用“义原”将相关的语义类串联起来进而实现义类层级分类的方法:“知网”的核心就是给每一个词标出若干“义原”。这些“义原”是一个语义系统所蕴涵的最重要、最基本的语义要素,数量有限,约2000 多个;义原蕴涵于每个词之中;每个词都拥有最具区别特征的若干义原;给每个词标出的义原是有限的,在个位数范围之内。如此种种,使“知网”虽然在形式上仍有着与其他语义分类词典相类似的语义层与语义类,但实质上将所有词语关联起来的却是那些“义原”。应该说这种立体化、网络化的系统是无法在平面化、纸质化的词典中实现的。
从上面的论述中,我们不难发现,适用于本研究目的的工具首选应该为《同义词词林》,尽管存在着些许的不足。