第一章 文言概说

第一节 文言和白话

内容提要:一、语言和文字,其性质和关系。二、语言和文字不能一致,口语变动快,笔语变动慢;两类笔语:能听懂的语体文,不能听懂的超语体文。三、汉字不以标音为原则,因而读音有变异性,两个时代笔语的距离近,有助于超语体文的发展。四、用图形表示语体文(白话)和超语体文(文言)的关系;文言和白话的界说。

文言和白话是互相对待的两个名词:在早先,没有白话,也就无所谓文言;将来文言不再在一般社会里头通行,白话这个名称大概也要跟着消灭。本文不打算比较文言和白话的优劣,无论从艺术方面或是从实用方面来看;本文要讨论的只是文言和白话的性质和二者之间的界限。

文言和白话是中国特有的问题,要明白这个问题,必得略述中国语文的历史;而寻根究底,恐怕还得先从语言和文字的性质讨论起。“语言”是什么?是人类用来表情达意的声音符号系统。“文字”呢?“文字”有两种意义。一种是“文字学”一词里的“文字”,也就是许慎的书名《说文解字》里的“文字”,是一个个单字,这不是我们这里讨论的主要对象。用来和“语言”对举的“文字”是朱子所说“看文字当如猛将用兵”的“文字”,是连缀成文的字。这样意义的“文字”可称为表情达意的形象符号系统。这两种符号系统之间是怎么样的关系呢?文字的起源大致和语言无关,图像可以示意,如美洲土人的表意画是很好的例子;这样的文字,如果可以称为文字,可说是一种独立的形象符号系统。古代埃及和中国的象形字是这种系统的残留物;公路旁边用三曲的线表示弯道,指路标上用一只手或一个箭头表示“由此去”,汽车上漆一个红色的十字表示是救护车,这些是现代还在应用的表意符号。

声音符号和形象符号比较,有两点较胜。一、使用较快。画一个人的形象多慢,说一个“人”字多快!(又如说“千军万马”,那得画多少时间?)二、人类的情意越过越繁复,形象符号不能胜任,只有变化无穷的声音符号才可以勉强对付,例如“人来”、“人去”还可以画,“物在人亡”怎么画呢?“人之初”也许还可以画,“性本善”就毫无办法了。可是形象符号也有一个优点,具有相当的永久性。因此形象符号并没有被完全摒弃;但是终于丧失了独立性,被声音符号系统吸收过去做附属品或代用品;文字成为语言为特种用途——传远方,遗后世——而采取的形式。到了这个时候,形象符号(文字)不再能够直接和意念发生联系,必须透过声音才能引发意义。

这个道理,在使用拼音文字的西洋人看来,本是再明显不过的。他们写字所用的那些字母,最初虽然也是象形的,但传到现在的欧洲民族手里,一开头就只代表声音。但是中国社会里头一向有一个错误的观念,以为文字和语言是不相统属、并驾齐驱的两个系统。其实稍微思索一下就知道不确。论中国字的起源,象形、指事、会意之类原是和声音无关,是上文所说独立的形象符号。但是我们不可把起源和现状混为一谈。看了“”这个形象,也许知道它代表一个什么东西,写成“日”之后,怎么能知道它是太阳而不是窗户格子(甚至一条肥皂),假如不同时知道它的声音?我们的眼睛看见“太阳”这两个点划撇捺的集团,我们的脑筋里头立刻把它翻译成tàiyáng这一串声音,然后引起了关于一个天上的红的圆的光芒四射的物件的意念;要是读文言,看见“日”字就先翻成rì再翻成tàiyáng。因为经过长期的训练,这种翻译很快的做了,如果不是有意加以反省,竟不觉得有这回事。有些人,尤其是文字的训练不够的,看书非念出声音来不可,要是强制他不念,他就会感觉看不下去,这就是脑筋里翻译做得慢的缘故。我们更不可把单字和连贯的文字混为一谈,在连贯的文字里,哪怕是最早的甲文、金文,这些形象符号也已经非转换成为声音之后不能达意了。

总之,就现在世界上的语文而论,无一不是声音代表意义而文字代表声音。语言是直接的达意工具,而文字是间接的;语言是符号,文字是符号的符号。语言是主,文字是从。因为语言和文字有主从之别,语言可以包括文字:西文“语言”一词(如英语的language)都是这样的含义,而用“口语”和“笔语”来区别其表现形式为声音的还是形象的。中国则用“文”和“语”相对待。(这当然有它的历史的原因)

笔语是口语的代表,已如上述。但笔语是否完全和口语符合呢?这就是所谓“言文一致与否”的问题。这个问题的答语要看“一致”二字作何解释。要是指绝对的一致,那是古今中外都没有过的事。例如语调是语言里极重要的成分,可是文字里表示不出,就不能算是绝对一致。要是丢开语调不说,也只有现代的一部分剧本和一部分小说里头的对白可以算是一致,大多数文字是和实际语言有出入的。

何以文字会和语言有出入呢?有时候是为的图省事,把不重要的语词或语词的一部分省去不写,如电报、新闻标题、广告之类。古代书写工具不方便的时代,这个趋势也许更普遍。

但是最重要的原因是语言的变动性。我们知道,语言是不断地在变动的,这就造成笔语和口语不尽符合的机会。语言有三个因素:语音、词汇、语法;这三个因素都常在变化之中。语音变动的原因还不十分清楚,但变动相当大,同样几个词同样组成的一句话,过了三五百年会完全听不懂(正如同样一句话隔了三五百里会完全听不懂一样)。语法的变动也许和思想的方式有一点关系,还难说定;但变动的程度比语音要小得多。变动最大的是词汇。词汇的变动有时候也说不出道理(和方言的消长也许有关),如古代说“畏”,现在说“怕”;古代说“寒”,现在说“冷”。但大多数语词的变动和文化的变动有密切的关系:新的事物、新的意念不断地增加,新的语词也就不断地增加,比如“飞机”、“升旗”、“特务”这些语词都是三五十年前的词汇里所没有的编者按:本文作于1944年。;同时,许多语词跟着旧时代的事物和意念一同死去,如“花翎”、“制钱”之类。越是文化变动得剧烈的时代,词汇的变动越大;我们生在这样的一个时代,这个道理不需要多说。这种种变动发生于口语,自然也反映于笔语,换句话说,文字也要跟着时代变。但是笔语却因此有了和口语参差的可能,因为笔语里可以保存一些口语里已经舍弃的早一时期的成分——词汇和语法。

我们说过,笔语是口语的代用品,何以它又会包容口语里所已抛弃的成分呢?它不要人懂吗?这里,我们必须明了一个技术上的事实和一个社会学上的事实。第一,笔语是写在纸上的,不像口语瞬息即逝;写的人可以仔细琢磨,看的人可以从容玩索。因此笔语比口语更胜任修辞上的变化,而这些修辞上的变化往往要利用非口语的成分。其次,更重要的事实,笔语和口语通行的范围有广狭之分。口语是一个社群里人人天天使用的工具,笔语却只是其中一部分人有时候使用的工具。普及教育,人人要识字,在欧美是19世纪的产物,在中国是正在努力尚未成功的工作。在早先,假如这少数知书识字的人相互之间能了解,那么笔语里包容一点口语以外的成分又何妨。正好比各种行业有“市语”,江湖上有“切口”一样,不过不一定像它们有“不足为外人道也”的味道罢了。这就是笔语和口语参差之有可能变成事实的缘故。

可是识字大有程度之差,从略识之无到精通文墨,当中有很大的距离。文人哲士之间唱和论议所用笔语虽无妨离开口语十万八千里(甚至用另外一种语言,如几百年前欧洲学者之用拉丁文或现在中国学者之用英、法、德文),但是文人有时要写一点什么给识字不多的人看,例如官府的文告,甚至给不识字的人听,例如歌词剧曲,就不得不接近口语下笔。略识之无的人有时候自己也要写封信写张契,那就更不会离开口语多远。所以,每个时代的笔语都可以有多种,有和口语大体符合的,有和口语距离很近的,也有和口语相去甚远的。这些形形色色的笔语虽然一种挨一种,构成一个不断的系列,但是当中也未尝不可划出一道界限:听得懂和听不懂。虽不完全相符而仍然听得懂,只是“走样”而已;听不懂则是“脱节”了。我们可以用这个标准把一个时代的笔语(文字)分成两类,凡是读了出来其中所含的非口语成分不妨害当代的人听懂它的意思的,可以称为“语体文”,越出这个界限的为“超语体文”。语体文有接近超语体的,超语体文也有接近语体的,完全系于所含非口语成分的多寡;只是量的差别而已,但是量的变异确可以产生质的变异,由听得懂变成听不懂。(听得懂与听不懂牵涉到内容问题,此处假定内容不成问题,即同一为听者所能把握的内容)。

由于语言的常常变动,甲时代的口语到了乙时代成为古语,甲时代的语体文到了乙时代自然也会变成超语体文。但是乙时代所有的超语体文,尽管所含甲时代的成分之多已经超出乙时代人耳听能懂的范围,可未必就是甲时代的语体文。拟古之终于是“拟”,以及伪造古书之必然要被觉察,都是这个道理。

要是一个社会里头一般应用是以语体文为主,我们就说它是言文一致;要是通行的是超语体文,我们就说它是言文不一致。假如我们对于言文一致采取较宽的看法,我们就可以这样说。

上面分别语体文和超语体文,用听懂与否做标准,但文字是让人看的,听不懂是否也就看不懂呢?这就牵涉到笔语所用符号的性质问题。上面说形象符号被声音符号吸收了去做代用品;这种吸收有完全和不完全的分别。完全的吸收,如西文的字母,每个字代表一个比较单纯的声音。不完全的吸收,如中国字,即所谓汉字,每个字代表某些个声音的结合体。形象和声音的联系,在用字母拼写的文字是有规则的,自发的(这自然也有程度的差别,如英文拼法就不及法文有规则,更不及德文,但原则是相同的);在中文是不规则的、独断的。比如说我写个sprogal,不但英语里没有这个字,恐怕所有欧洲语言里都没有这个字,但凡是应用这套字母的人民都会照他们各自的拼音习惯读出大同小异的字音;可是假如我写个“”字,连我自己都不知道该怎么读。

不以标音为原则,这是汉字的特色。这个特色产生几个重要后果。第一,汉字读音的变异性。在西文,一个语词的语音变了,这个语词的写法也得跟着变,例如古英语的faeder和hām到了近代英语成为father和home(这也是大概的说法,拼法的变换常有落在语音变换之后的趋势,现代英语、法语都是例子)。中文则不然,由于声音和符号的联系不密切,声音变了符号可以不变,换句话说,一个字在不同的时代可以代表不同的声音,例如古代的b‘iu和ka这两个语词在现代已经成为fù和jiā,可是我们仍然用“父”和“家”这两个符号来代表。这是一个异常重要的事实,很多学者认为这是汉字的优点。其次,汉字标音的困难。这么多的形象符号,几个乃至几十个形象代表同一个声音是自然的结果。因此一个语词往往可以有好几个写法,例如“彷徨”、“傍偟”、“方皇”、“旁皇”(朱起凤《辞通》里搜集这类语词甚多),尤其是翻译外来的语词,如“佛陀”、“浮屠”、“浮图”同译一词。人名地名的译音更不用说,常看现代的翻译作品的一定深知这个麻烦。其实古代也是如此,“印度”、“信度”、“身毒”之类的例子甚多。第三,汉字认识的困难。学习拼音文字,只要认识二三十个字母并学会若干拼法习惯,就可以阅读纯粹的语体文和直率地写出他胸中的话。汉字则至少要分别认识两三千字才可以得到同样的效果。

因为我们握有这种特别的笔语工具,我们的语文发展就有和一般西文不很相同的历史。第一,缩短两个时代的笔语的距离。汉字的读音变异构成他的超时代性。早一时代的语体文,假如用原来的语音读出来,次一时代的人已经听不懂,但他们仍然可以认识这些字形,读以当时的语音而勉强懂得一大半或一小半。耳朵里死了的,眼睛里还活着。这就是说,语言的三个因素有一个在笔语里不生影响。这就产生了一种西洋人羡慕得了不得的奇迹:两千年前的文学我们可以无须有超出学习现代语文的努力而了解并欣赏。例如“羊牛下来”这句诗,假如周朝的诗人用他的语音吟给我们听,我们决不会懂;但因为凑巧这句诗里的四个语词的变化都只限于语音,笔语不受影响,所以这句诗就有了“万古如新”的性质。这当然只是一个例外,有些语词的变化事实上已经不限于语音,例如“耳”已经成为“耳朵”,“发”已经成为“头发”,但是我们见了“耳”和“发”还是容易认识它们的意义,因为无需同时理会读音的差异。只有一个语词已经死了,或者已经不照古时候那样用了,这才非经过特殊训练不会认识。把这几种情形加在一起看,汉字无疑义地有缩短两个时代的笔语的距离之用,也就是让学会次一时代的笔语的人学习早一时代的笔语更加容易。

其次,上面所说两个时代的笔语都假定是语体文,事实上汉字又使中国的笔语比用拼音字更容易保存古代成分。人们的惰性有作用,明明已经说“耳朵”了,但是一个“耳”字既可以代表,何必多麻烦,而且“朵”这个音究竟应该怎么写呢?(汉字标音的困难见上。)不写也罢了。口语明明已经说“眼”或“眼睛”了,换一个新字麻烦,就仍旧写上一个“目”字。推而广之,“耳朵眼睛都好”不妨写成“耳目健好”。文人学士的好古的脾气也有它的作用,“耳目健好”当然比“耳朵眼睛都好”古雅些。

又其次,汉字认识的困难使中国的读书识字的人数常常维持很低的比率。而既读书识字则了解较早的笔语又比较容易,如上所述。所以社会里需要较纯粹的语体文的人特别少,因而口语对于笔语的控制力也特别小。

这几个条件都有利于超语体文的发展。中国的超语体文之特别发达,且一直成为通行的笔语,追究起来和汉字的性质有莫大的关系。

以上说明口语和笔语,语体文和超语体文的关系,一般的情形和中国所特有的情形。下图可以表示一个大概。这里甲、乙、丙、丁是四个相次的时代,点线所包含的区域代表口语,画了斜线的区域代表语体文,空白的区域代表超语体文。甲时代假定是最早的时代,这个时候的文字很少和语言密切符合的,但不害其为语体文,事实上这个时期还无从产生超语体文。到了乙时代,甲时代的口语有一些成分留下,另有一些成分被废弃,同时在另一端增加了新的成分。如此一个个时代下去,口语的区域,逐渐往右移动,语体文的区域也跟着往右移动,这个表示笔语追随口语的情形。同时,语体文和口语符合的范围加大,到了丁时代就有了差不多和口语密合的语体文。时代越后,不但语体文的活动范围放宽,超语体文的范围也同样加大,这正表示语文遗产的逐渐累积。

现在可以回到本文开头的问题:文言和白话的界限何在?有人以为文言和白话的分别就是超语体文和语体文的分别:图中AA′线代表这个界限。胡适的《白话文学史》上溯秦汉,似乎是采取这个分法。这种分划的好处是简单,但有一个毛病:语体和超语体是相对的,甲时代的语体文到乙时代会成为超语体文,而一般人心目中的文言和白话的分别是固定的。第二种分法,如图中BB′线,是以现代人听得懂的为白话,即包括最近一时代(假定为明清至现代)的语体文,及更早一时代(假定为唐宋元)的一部分语体文。这个分法倒也简单,但如某些语录、某些白话词等,虽然现代人听不懂,但大家都承认是白话,不是文言。第三种分法是把唐宋以来的语体文都算作白话,如图中CC′线所划定:这里包括一部分就现代而论应该算作超语体的东西(图中BB′线以左),即某些语录、某些白话词以及明清人的一些曲文等,这是和第二种分法不同之处;同时拒绝了更早的语体文(图中甲乙两段AA′线以上),这是和第一种分法不同之处。这种分法多少带几分武断性,不像前两种之各从一个原则出发;但这似乎是一般人区别文言和白话的办法。

这第三种区分法,除最符合多数人的直觉外,是否也有理由可说呢?我看是有的。唐以前的语体文似乎都不很纯粹,唐朝和尚的语录和宋朝人的平话才大胆地完全呈露语体的面目。唐宋的语体文,即令有一部分就现代口语说已经是超语体,只要我们熟悉了它们的词汇和小小的语法差异之后,我想仍然是可以听得懂的(正如欧洲人对于他们较古的作品一样)。至于照这种区分所划定的文言,那就无论曾是某时代的语体文与否,怎样学习也不能用耳朵去了解,必须用眼睛去看。读熟一篇文言文再去听别人背,这是另外一回事;这里所谓听得懂是听自己没有读过的文字。这个用耳和用目的分别和汉字的读音演变有极大的关系,许多单音语词在唐以前可以用读音去区别,而宋以后非用眼睛去看就不能分别了。从这一点看,普通人的直觉的看法不为无理。

由此,我们可以给“文言”和“白话”试着定一个界说。白话是唐宋以来的语体文。此外都是文言;其中有在唐以前可称为语体文的,也有含有近代以至现代还通用的成分的,但这些都不足以改变它的地位。白话是现代人可以用听觉去了解的,较早的白话也许需要一点特殊的学习;文言是现代人必须用视觉去了解的。

(见《吕叔湘语文论集》,节录后经作者看过)