第一節 語源

語源學,顧名思義,就是一門研究語源的學科。但何爲語源,語源學是否就是“語源”和“學”兩個概念的簡單累加,語源學與同源詞的研究又有什麽樣的關係?這些都是在對章太炎語源學理論進行全面研究前需要解決的問題,所謂“名正則言順”。

語源,亦作語原,又稱詞源、語根。何爲語源,這是值得研究的。下面結合各大工具書以及各家對“語源”的定義,相互比較,進行分析,概括出我們認爲較爲合理的“語源”定義。

首先介紹並分析英語工具書對“語源”的定義:

英國《不列顛百科全書》(Encyclopedia Britannica)對單詞etymology的解釋爲:the history of a word or word element,including its origins and derivation.[1](關於一個單詞或者詞素的歷史,包括他的起源以及衍生。)

《牛津高階英漢雙解詞典》(Oxford Advanced Learner's English-Chinese Dictionary)對單詞etymology的解釋爲:account of the origin and history of a particular word.[2](對某一特定單詞的起源及其歷史的解釋。)

etymology,譯爲語源、詞源、語源學、詞源學,英語etymology起源於希臘語ἐτυμολογία,直譯爲“關於詞的真意的科學”,何爲“詞的真意”,我們認爲應當爲本義,或者爲殷寄明總結的“語源義”[3],從兩本英語工具書也可以看出,它們雖然對etymology的定義有所區别,但是共同點都指向詞的“起源”。另外,除了“起源”,對“語源”的定義還共同指向詞的“歷史”,這是非常重要的一點,也是把etymology翻譯準確的關鍵。歷史有源有流,有開始有發展,那麽從這一點上來説《不列顛百科全書》比《牛津高階英漢雙解詞典》要更準確些,因爲後者把“歷史”與“起源”並列在了一起,而前者則把“起源”包括在“歷史”中,可見前者的邏輯性顯然强於後者。另外前者還强調derivation這一概念,這是需要肯定並引起注意的,同樣這個詞也是把etymology翻譯準確的關鍵。因爲這個詞是在反映詞語或者説語言發展的一般規律。derivation,我們翻譯作“衍生”,其實它的意思非常豐富,有:起源、發展、派生、衍生等義,而且它尤指詞語的派生,它反映的是一個過程,而語源學正是研究這個過程的一門學科,不僅僅只研究源頭這個點時間,更要研究發展、派生這樣一個段時間。讓我們回過頭來再看etymology,這裏究竟翻譯爲“語源”準確,還是翻譯成“語源學”準確?我們認爲應當是後者。語源肯定是指語言的起源,而它的發展、派生則不屬於源的範疇,而是屬於流的範疇,從源到流,就是從現象進入到本質、從結果進入到原因的過程,也就是從“語源”進入“語源學”的過程。這是英語的etymology一詞給我們的啟發,但是英語屬於印歐語系中日耳曼語族下的西日耳曼語支,因爲歷史的原因,它的形成以及與同一語族中其他語支的關係比較複雜,而印歐語系的語源學很大程度上是基於歷史比較語言學(historical comparative linguistics)的基礎而進行研究的,這與來源和發展都較爲單一的漢語是不同的,漢語的語源學更多的是基於歷史語言學(historical linguistics)的基礎而進行研究的,主要從歷史文獻以及方言中尋找材料,同時輔以親屬語言的研究。從這一點看,英語對etymology的定義顯然是不能照搬到漢語的“語源”中來,但亦起到非常大的參考作用。

下面介紹並分析日語工具書對“語源”的定義:

《廣辭苑》“語源·語原”條作:個々の単語の成立·起源。単語の原義。「鍋なべ」を「肴な瓶へ」とする類。「―を探る」[4](語源·語原,每一個詞的出現與起源。詞的原義。類似的例子:將“鍋”解釋爲“裝菜的器皿”。)

《學研漢和大字典》“語源”條作:語源=語原。ある語の最も古い形と意味。また、ある語の成立の起源とその歴史[5]。(語源=語原。某個詞語最古老的形態和意義,以及該詞語起源及其歷史。)

日語隸屬於何種語系雖然仍有争議,或説隸屬於阿爾泰語系,或説單爲日本語系,雖然漢語與日語分屬不同的語系,但因爲歷史上日語受漢語的影響深遠,所以日語與漢語不論從形態、語音、詞義都有著密不可分的關係,尤其是日本大多數漢字的本義(語源義),就是我國漢字的本義(語源義),所以日語工具書中“語源”一詞的釋義對我們的研究也是非常重要的。“語源”在日語中亦作“語原”,兩本工具書在對“語源”進行解釋時都指向了“出現”與“起源”,這一點與英語工具書對etymology的解釋的重點一致。而《廣辭苑》没有提到詞語的發展或者歷史演變,而《學研漢和大字典》則涉及到這一點,即“該詞語出現的起源及其歷史”,説明在《學研漢和大字典》的編者看來,“語源”是一個變化發展的過程,而從字面就可以看出“語源”是相對固定的,而非不斷變化發展的,所以説在這一點上,《學研漢和大字典》顯然不如《廣辭苑》的邏輯性强。《廣辭苑》科學地指出“語源”是“每一個詞的出現與起源。詞的原義”,這樣的指向性就很明確,即“源”。下面我們用章太炎語源學實踐來進行驗證:

《説文》:“入,内也”;“内,入也。”古文以入爲内。入者象從上俱下,爲初文,内乃變易字也。……内又孳乳爲汭,水相入也。爲軜,驂馬内轡繫軾前車也。爲訥,言之難也。(《文始二·陰聲隊部甲》,207頁)

其中“入”當爲源,即爲“由外到内”這一意義最古老的文字形態,它是相對固定的。而内、汭、軜、訥等字都是從“入”發展而來的,卻不能取代“入”的源頭地位,因爲它們雖然都包含“由外到内”這一意義,但是比起“入”來要具體,内指入門、汭指入水、軜指馬内側繫於軾上的韁繩、訥指言入口(言難出),所以不能完全表達“由外到内”這一抽象的意義。又如:

《説文》:“八,别也。象分别相背之形。”變易爲𠔁,别也。……又變易爲必,分極也。……次對轉諄又變易爲分,别也。……又旁轉泰孳乳爲别,分解也。(《文始三·陰聲至部甲》,241頁)

其中“八”當爲語源,即表示“分開”這一意義最古老的文字形態,徐中舒《甲骨文字典》“八”字條言:“甲骨文乃以二畫相背,分相張開,以表示分别之義。”[6]它是相對固定的,而𠔁、必、分、别都是從“八”發展而來的,卻不能取代“八”的源頭地位。

但如果按照《學研漢和大字典》所説的語源包括“該詞語起源及其歷史”,那麽就是把入與内、汭、軜、訥,八與𠔁、必、分、别放到同樣的地位,這樣一來誰都可以當源頭,這顯然是與邏輯和事實不相符的,因爲相對入和八而言,其他字肯定出現的較晚。所以在這一點上,《廣辭苑》要優於《學研漢和大字典》。

我們再回到《學研漢和大字典》對“語源”的解釋,其中“某個詞語最古老的形態和意義”也是有問題的。眾所周知語言最大的載體是語音,但也是有其他載體存在的,比如手勢,而且手勢的起源可能比語音還要早,美國手語研究之父和手語學研究的奠基人——威廉姆·斯多基(William C. Stokoe)就從人類進化的角度證明了手語語言爲有聲語言的産生和發展奠定了基礎[7]。那麽一般意義的語源指的是指口語形式還是指手語形式呢?當然應該是前者。這樣《學研漢和大字典》就不能把“語源”定義爲“某個詞語最古老的形態”,而應該定義爲“某個詞語最古老的語音形態”。

通過對英語和日語工具書中“語源”定義的分析,我們可以確定“語源”的要素有以下三個方面:1.詞的起源;2.最古老的語音形態;3.僅指源而不涉及流。

我們再看看我國的語言學家是如何定義“語源”的:

《漢語大詞典》“語源”條作:語源,語詞的聲音和意義的起源[8]。“詞源”條作:詞源,語詞的源頭[9]

任繼昉在《漢語語源學》中對“語源”的定義:語源,是語言中的詞和詞族的音義來源。語源是一個總概念,它又可分爲詞的語源和詞族的語源這兩個層次[10]

殷寄明在《語源學概論》中對“語源”的定義:語源是文字産生之前口頭語言中語義與語音的結合體,是後世語言中的語詞音義的歷史淵源,是語詞增殖、詞彙發展的語言學内在根據[11]

雖然我國語源理論方面的研究不見得比英、日兩國走得遠,但从以上三則材料可以看出,我國的語言學家最起碼在對“語源”的定義的確有值得稱道的地方,主要表現在以下兩個方面:1.三者皆明確指向語詞的起源,而且皆没有出現“發展”“派生”等字眼,雖然殷寄明涉及到“歷史”一詞,但他是指向“歷史淵源”,即“源”,而非“流”,可見我國的語言學家清楚地明白“語源”和“語源學”的區别,“語源”重在“源頭”,而“語源學”既重“源頭”又重“流變”;2.三者皆涉及到“音”“義”兩個概念,而英、日兩國卻對此毫無涉及,這方面,我國的語言學家顯然有過人之處。這兩個概念對“語源”的定義太爲重要,這是它之所以區别語言學其他範疇的關鍵所在。語源一定是語詞音和義的結合體,而且是某個語詞約定俗成後的最古老的語音和意義的結合體,而這個結合體是與字形無關的。作爲象形文字的漢語,我們的語言學家能突破字形的束縛,從語詞的語音形態去探尋語源,反而比有拼音文字背景的外國語言學家走得遠,這是非常不容易的。這説明我國的語源學雖然在理論層面“先天不足”,但是我們對小學研究的優秀傳統,特别是清代小學家因聲求義的突破,對我國語源學的發展是極爲有利的。

當然我國的語言學家對“語源”的定義也存在一定的問題。首先看《漢語大詞典》的定義:語源,語詞的聲音和意義的起源。這裏存在兩個問題:1.定義過於簡單,只是進行簡單的擴詞性質的解釋,而没有任何描述性的内容;2.聲音的起源和意義的起源不是同時的,一般情況下是意義早於聲音,一種意義可以由多種聲音進行表示,那這樣是無法進行語源研究的,因爲這是没有確定性的研究,爲了避免這種問題,必須把音義作爲一個結合體後再來探索這個結合體的源頭。另外《漢語大詞典》對“詞源”的定義“語詞的源頭”,太過簡單,同時没有指出語詞哪一方面的源頭,在這裏就不再進行分析了。

再看任繼昉對“語源”的定義。“語源,是語言中的詞和詞族的音義來源。語源是一個總概念,它又可分爲詞的語源和詞族的語源這兩個層次。”他的定義有兩方面的内容,一爲對“語源”的概括,二爲對“語源”的分類,這樣的定義顯然比《漢語大詞典》更具有説服力,但依然存在兩個問題:1.對“語源”的概括爲:“語言中的詞和詞族的音義來源。”這和《漢語大詞典》是同一個問題,即音的來源和義的來源往往不一致,必須成爲一個結合體後再去探求這個結合體的源頭;2.任繼昉把語源分類成“詞的語源”和“詞族的語源”,這是值得商榷的。讓我們先看看殷寄明對任繼昉關於語源的分類提出的質疑:

另外,語源也没有必要劃分爲詞的語源和詞族的語源。因爲同源詞族是同源詞的集合體,而同源詞是由相同的語源孳乳分化出來的語詞。[12]

我們同意殷寄明的觀點,即這樣的劃分是没有必要的。同時我們認爲,不僅是没有必要的,很可能還是錯誤的。因爲“詞”有語源是毋庸置疑的,而“詞族”是不能説有没有語源的。某個詞族由若干同源詞構成,這些同源詞又是從同一個語源發展、衍生下來的,關係如下圖:

(圖一)

從上圖可以看出語源和詞族如要發生關係必須通過同源詞(A、B、C、D……X)進行中介,而缺少了同源詞這個環節,語源、詞族這兩者是無法形成直接關係的,既然形不成直接的關係,那麽“詞族的語源”這個概念就是不存在的。爲了方便理解,我們仍然舉章太炎《文始》中以“入”和“八”爲語源的例子:

《説文》:“入,内也”;“内;入也。”古文以入爲内。入者象從上俱下,爲初文,内乃變易字也。……内又孳乳爲汭,水相入也。爲軜,驂馬内轡繫軾前車也。爲訥,言之難也。(《文始二·陰聲隊部甲》,207頁)

《説文》:“八,别也。象分别相背之形。”變易爲𠔁,别也。……又變易爲必,分極也。……次對轉諄又變易爲分,别也。……又旁轉泰孳乳爲别,分解也。(《文始三·陰聲至部甲》,241頁)

在例子中,以“入”爲語源的同源詞共有五個,分别爲入(同源詞A)、内(同源詞B)、汭(同源詞C)、軜(同源詞D)、訥(同源詞E),它們共同構成了表“由外到内”的一組詞族。以“八”爲語源的同源詞共有五個,分别爲八(同源詞A)、𠔁(同源詞B)、必(同源詞C)、分(同源詞D)、别(同源詞E),它們共同構成了表“分開”的一組詞族。“入”爲語源的同源詞表示爲下圖:

(圖一a)

“八”爲語源的同源詞表示爲下圖:

(圖一b)

再進一步研究的話,我們可以發現圖中理論上一共存在六組關係,即:

1.詞的語源;

2.同一語源的詞;

3.詞的詞族;

4.同一詞族的詞;

5.詞族的語源;

6.語源的詞族

這六組理論上的關係,前面四組關係顯然是存在的,因爲不論在邏輯上還是實際操作上都是説得通的,在以上所舉章太炎《文始》二例中,詞的語源爲“入”和“八”;同一語源的詞爲“入:内:汭:軜:訥”和“八:𠔁:必:分:别”;詞的詞族爲“由外到内”和“分開”;同一詞族的詞亦爲“入:内:汭:軜:訥”和“八:𠔁:必:分:别”。

但是不論在邏輯上還是實際操作上“詞族的語源”和“語源的詞族”都是不存在的,在以上所舉章太炎《文始》二例中,詞族的語源表現爲:“由外到内”的語源是“入”,“分開”的語源是“八”;語源的詞族表現爲:“入”的詞族是“由外到内”,“八”的詞族是“分開”。這顯然是不對的。因爲在“詞族的語源”這一關係中,不是所有表“由外到内”的詞(字)都是以“入”爲語源的,如:進、來、至等;不是所有表“分開”的詞(字)都是以“八”爲語源的,如:開、啟、展、張等。而在“語源的詞族”這一關係中,“入”不但表“由外到内”義,亦表“接納”“參與”等義(雖然“接納”和“參與”與“由外到内”有聯繫,但亦有分别,不能視作嚴格意義上的同一詞族);“八”不單表“分開”義,亦表“數字”“八姓”等義。

如何在邏輯上把“語源”和“詞族”聯繫起來,上面已經説過,必須利用同源詞這個概念,用文字表達出來則爲:“同一詞族中各同源詞的語源”“同一語源發展而來的同源詞所集合成的詞族”。而如果按照任繼昉對“語源”的分類,語源、詞、詞族的關係如下圖:

(圖二)

從上圖可以看出兩個問題:1.“詞”與“詞族”不發生直接關係,而是通過“語源”作爲中介發生關係。“語源”是源頭,“詞”是支流,只能以支流爲中介,怎麽能以源頭爲中介,這顯然是説不通的;2.“語源”與“詞族”直接發生關係,這麽一來,作爲中介的同源詞就起不到任何的作用。這種錯誤是由於任繼昉把“詞”與“詞族”看做是並列關係,而不是包含與被包含的關係。邏輯發生錯誤,所以結果就發生了錯誤。

邏輯上有錯誤,那麽在實際操作中是否也如此,我們舉例來進行分析:

:哨弁,本由打獵而來,其哨字是字之借,打獵時嗾使犬也。古獵時之名(?)。凡从肖聲字皆有小義。(《筆記·口部》,69頁)

:柴,凡从此者多有小意。佌(《詩》:“泄泄”、“佌佌”),鮆(《方言》“短小曰鮆”)。(《筆記·木部》,243頁)

雖然説章太炎第一組同源詞的分析太過絶對,因爲不是所有“从肖聲字皆有小義”,但基本上是可以成立的,如肖(小肉)、哨(不容)、消(除去)、銷(鑠金)、稍(禾末)都是有小義的,那麽如果按照圖二則表現爲:

(圖二a)

第二組同源詞,章太炎“凡从此者多有小意”的判斷是可以成立的,如柴(小木散柴)、鮆(《方言》“凡物生而不長大,亦謂之鮆”)、佌(小也)、玼(玉斑多小),而語源“此”亦有小義,李孝定《甲骨文字集釋》“此”字條言:“陳邦福曰:《鐵云藏龜拾遺》‘第八’葉云‘烄有雨’。邦福案:當釋此,祡之𡞞。《説文·示部》云:‘祡,燒祡燓燎以祭天也。’”[13]燒祡祭天,祡自然變小。那麽這組同源詞按照圖二則表現爲:

(圖二b)

通過以上兩圖我們會發現兩個問題:一、詞族“小”從何而來?如果光從“肖”和“此”,我們是不能確定“小”義的,因爲“肖”還有“相似”“仿效”等義,而“此”還有代詞、副詞的用法,只有同表“小”義的詞和在一起(要符合音同或音近的原則),那麽才能歸納推理出“小”的意義。换言之,如果没有“哨、消、銷、稍”和“柴、鮆、佌、玼”作爲中介,而只有“肖”“此”,我們是推不出“小”義的;二、没有了同源詞這一環節,那麽所有表“小”的語源的字,不僅是“肖”“此”,還有“幺”“小”“丁”“丶”“子”“末”“𡿨”“𠂤”“尗”等可能成爲語源的字(語源一般都是非常簡單的字,然後在語言發展中不斷變的複雜)因爲没有同源詞作爲參照和比較,那麽它們就没有任何區别義了,只有一個共同義“小”,這顯然是不符合語言發展規律的。

最後我們看看殷寄明對“語源”的定義。“語源是文字産生之前口頭語言中語義與語音的結合體,是後世語言中的語詞音義的歷史淵源,是語詞增殖、詞彙發展的語言學内在根據。”他的定義有三方面的内容:一解釋何爲“語”以及“語”的産生時間;二解釋何爲“源”;三爲“語源”的作用。後兩方面的内容基本是正確的,如果能把“是語詞增殖、詞彙發展的語言學内在根據”改作“是語詞增殖、詞彙發展的語言學最重要内在根據之一”則更好,因爲語詞增殖、詞彙發展不僅是因爲語源的派生,還有其他方面的原因,比如外來語的影響、新事物的出現等等,這一點殷寄明在後面也談到了,但如果能在定義中就反映出來則更好。

我們主要看第一點,即對“語”的解釋以及對“語”産生時間的分析。殷寄明認爲“語源”中的“語”是“文字産生之前口頭語言中語義與語音的結合體”,這個定義是有問題的,首先要肯定的是語源確實是語義與語音的結合體,而且語源一定是産生於文字出現之前的口頭語言之中,但是口頭語中關於某一個概念的音義結合體肯定是多種多樣的,你説a,我説b,他説c,a、b、c都是這個概念的音義結合體,那語源是a、還是b、還是c、還是所有的音義結合體?都不是,而是約定俗成後的那個最古老的音義結合體,之前的a、b、c我們先暫時稱它們爲“前語源”。這裏爲什麽要强調“約定俗成後的最古老的”?原因有二:一、只有“約定俗成”了才有真正意義上的語源出現,雖然這樣的音義結合體也和之前的a、b、c一樣,也是偶然結合的(當然它也可能a、b、c中的任意一個),然而一旦“約定俗成”後,這個結合體就被所有説這一語言的個體所接受並開始使用,這樣“約定俗成”的語源才有研究的價值。二、一定要是“約定俗成後的最古老的音義結合體”,因爲語言是不斷變化發展的,對於某個概念還會形成新的音義結合體,如:1、2、3,我們先暫時稱它們爲“後語源”,它們也很古老,而且它們一定是從約定俗成後最古老的那個音義結合體發展而來的,但是它們並不是被所有説這一語言的個體所接受並使用的,這樣的音義結合體有研究的價值,研究它們的價值在於:如果經過語言的長期發展,我們對語源已經把握不準確,那麽可以通過後來的這些音義結合體來上推語源。從a、b、c到語源再派生出1、2、3,這一過程有兩種可能,主要看約定俗成時那一個音義結合體是新的,還是a、b、c中的某一個,如果是新的我們用N(NEW)表示,如果是a、b、c中的某一個,我們就用A表示(爲了製圖的方便,默認從a而來),過程見下圖:

(圖三)

從上圖可以看出,“約定俗成後的語源”這一環節至關重要,因爲至此真正的語源才出現,在此之前一定也有音義的結合體,但是它們的語音和語義是什麽我們幾乎是不知道的,對兩者的研究也基本是不可逆的(所以在圖三中我們用了單箭頭表示前語源與語源的關係),唯一能知道並可逆的只有“約定俗成後的語源A”情況下的“前語源a”,而如果是“約定俗成後的語源N”的情況,那之前所有的意義結合體都是不知道的。然而後語源卻是可知的,對“約定俗成後的語源”和“後語源”的研究也是可逆的。

我們以表“火”義的一組音來進行例證,因爲火是任何一個民族最基本的詞彙,故它具有代表性。通過比對漢藏語系中部分民族“火”義的讀音[14],如:藏語拉薩話me、普米語mɐ┒;壯語fei2、侗語pui1、湘西苗語tə33、黔東苗語tu11。嚴學宭在經過比對後,得出這樣的結論:“兩相對比,知漢語‘𤈦’字可與藏緬、壯侗兩個語族‘火’的讀音對應,‘𤈦’字原始讀法應爲*xmwjəd,其複聲母之*m可與藏緬語的聲母m_相當;*x在合口*wj前要變f_,先是重脣p,後又變輕脣f_,這可與壯侗語的聲母p/f相當。再就是元音相近,韻尾*d消失,變成-i了。因此這組同源詞的原始型可擬作**xmwəd,則便於解釋後世讀音分歧之故。”[15]那麽這組同源詞按照圖三則表現爲:

(圖三a)

在圖三a中,因爲前語源我們是無法得到的,它只存在於理論中,所以我們無法表示其確切的形態。而根據嚴學宭的比對,我們定此語族的語源爲**xmwəd,它是經過約定俗成後最早的語源,而下面的都可以視作後語源,其中*xmwjəd即是漢語“𤈦”的原始讀法,它與其他六音都是從語源**xmwəd發展而來的,是可知的;另一方面,它們在音義上都有所聯繫,當我們不清楚真正的語源爲何時,可以通過音理上的聯繫和規律,上推至語源。以上兩點證明了我們之前在邏輯上的推理是可行的,即對“約定俗成後的語源”和“後語源”的研究是可逆的。

另外可以發現,“約定俗成後的語源”並不是我們空想而來的,這一概念也在其他語言學家對“詞源學”的定義中得到了證明。瑞士語言學家索緒爾在《普通語言學教程》中説到:

詞源學既不是一門分立的學科,也不是演化語言學的一部分,它只是有共時事實和歷時事實原則的一種特殊應用。它追溯詞的過去直至找到某種可以解釋詞的東西[16]

“直至找到”是一條非常重要的線索,短短四個字,給我們提出兩個問題,第一:找什麽?第二:什麽時候才算找到?首先回答第一個問題,找什麽?找“某種可以解釋詞的東西”,這個東西就是“語源”(或者按照索緒爾的觀點是“詞源”)。接著回答第二個問題,什麽時候才算找到?索緒爾提到“直至”這個詞,這説明對語源(詞源)的尋找一定有個盡頭,是可知的;同時説明在語言發展的歷史上,存在著一個時刻,這個時刻出現了(出現的方式或者是繼承或者是新生)一個我們稱之爲“語源”的東西,這個東西開始解釋(派生)其他的詞,並爲説這一語言的個體所接受並開始使用。而這個時刻正是我們所一直强調的“約定俗成”這個階段。對索緒爾關於“詞源學定義的分析,也證明了“約定俗成”這個階段對真正語源的形成是至關重要的。

通過以上的分析,我們嘗試著在殷寄明對“語源”定義的基礎上進行改進:語源是文字形成之前口頭語言中經過約定俗成後最古老的語義和語音的結合體是某一個詞或某一批詞包含於同一詞族内的歷史源頭