stone-stone


这个问题这两天每天都蹦出来,乍一看是个不想回答的问题,但是看到有很多有深度的讨论以及搞笑的回答,我看看我能不能蹭蹭热度说两句好了。应该给这个类型的问题来个了断。@下北泽慧音 曾经给我看过一篇博客文章,我觉得写得非常好,当时我们想把这篇文章翻译翻译,但一来觉得

这个问题这两天每天都蹦出来,乍一看是个不想回答的问题,但是看到有很多有深度的讨论以及搞笑的回答,我看看我能不能蹭蹭热度说两句好了。

应该给这个类型的问题来个了断。

@下北泽慧音 曾经给我看过一篇博客文章,我觉得写得非常好,当时我们想把这篇文章翻译翻译,但一来觉得太长,二来怕数学上的东西讲得不够严谨贻笑大方,所以大家可以自己去看原文。

(2021 11 1更新: @下北泽慧音 已经把它翻译成中文:https://zhuanlan.zhihu.com/p/341274174)

Thomas Pellard认为每一个历史语言学的学生都应该读这篇文章。

这篇文章的第一句就很引人入胜,作者开篇就说很多人喜欢把关系遥远的语言中,某些长相相似的词汇列举出来,并声称这些相似“绝不是巧合”,因为有“太多”的“同源词”。而当语言学家耐心地给他们解释的时候,他们却往往并不会被说服。

但你找到的“同源词”,真的“绝不是巧合”吗?两个语言中,含有相似词汇的概率究竟能有多大?要不要算一算?其实不是很难算。我们可以用二项式概率(binomial probability)来计算,在n个词中,有r个相似词汇的概率:

p(r) = (n!/(r!(n-r)!))\cdot p^r(1-p)^{(n-r)}

假设有1000个词吧,n=1000,那么从1到6个相似词汇的概率分别是:

p(1) = 0.368p(2) = 0.184p(3) = 0.0613p(4) = 0.0153p(5) = 0.00305p(6) = 0.000506

那么,我们在1000个词汇中找到1到6个相似词汇的概率就是把以上的p都加起来,即0.632。也就是说,你有超过六成的可能在两个毫不相关的语言中找到1到6个所谓“同源词”。

因此,如果你在汉语和阿萨巴斯坎语中找到一两个形状相似、意思相近的词,我完全不会惊讶。

这篇博客后边的部分很精彩,有兴趣可以自己去看一下。已经看过的可以分享一下心得。

当然,如果题主没有受到过任何历史语言学的训练,我们谁也不应该批评题主,反而应该鼓励一下。因为毕竟有更多的人完全不会去考虑语言的问题。不过,同时在尊重事实的原则下,要提醒题主,这样的比较在21世纪的今天是落后的,甚至20世纪、19世纪、18世纪,一直退回到9世纪,可能都是落后的。为什么?

9世纪的北非大陆,早就有人对语言的相关性作出了虽然初步但较为准确的比较。今天阿尔及利亚的提亚雷德,当年是鲁斯塔米德王朝的都城。犹大·伊本·库莱什(希伯来语:Yhvdh Abn Qrysh;阿拉伯语:Yhwḏā Bn Qryš)就出生在这里。据说他原来是个医生[1]。他是犹太人,当然笃信犹太教,并对宗教事务非常热心。有一天,他听说非斯(今天摩洛哥境内)的犹太人居然废止了《希伯来圣经》塔古姆(Trgvm)译本的使用。塔古姆指的就是用当地语言翻译的《圣经》。我们知道,犹太人是一个不能以语言定义的群体,因为分布在世界各地的犹太人使用不同的语言,在阿拉伯世界居住的犹太人,自然以当地的阿拉伯语为母语。如果一旦废除了塔古姆,当地的犹太人就面临着不能阅读《圣经》的危险,毕竟学习希伯来语也是一件不容易的事儿。库莱什认为塔古姆也是犹太教的优良传统,是从古至今人们一直在使用的,并没有对犹太教的传承造成问题,反而有推动作用。

于是库莱什就写了一封长信给在非斯的犹太教信众。在这封长信里,伊本·库莱什为了解释各种语言的重要性,他为语言进行了历时的纵向比较和共时的横向比较。他比较了《希伯来圣经》中所用的希伯来语与《塔木德》和《米书拿》中所用 的希伯来语,又把这些书面希伯来语与当代希伯来语进行比较; 同时,他还拿希伯来语跟阿拉姆语和阿拉伯语作了比较。其中,与阿拉伯语的比较尤为系统,占了一章的篇幅。伊本·库莱什总结出 561 个在希伯来语中与阿拉伯语相似的词汇,比如说希伯来语的dimʕā“眼泪”和阿拉伯语的damʕa“眼泪”;或者希伯来语和阿拉伯语相对应 的字母,比如在希伯来语出现yod的这个字母,阿拉伯语必然是wāw,希伯来语的shin 必然对应阿拉伯语的sīn或thā,而希伯来语的sīn,对应阿拉伯语的shīn,等等。伊本·库莱什又发现,希伯来、阿拉姆和阿拉伯三种语言动词的词缀都差不多,都分别使用互相对应的ʔ-、y-、t-、n-作为人称前缀,又使用-t、-m、-n、-y、-w作为人称后缀[2]。

我们可以发现,伊本·库莱什所做的事情,已经跟十个世纪以后的历史语言学家做的事有点相像了,他在找对应关系。是的,当我们怀疑两种语言有同源关系的时候,我们不是把相似的词汇挑出来,而是要比较它们音位之间的对应,只有找到对应关系才能让人信服。一千二百年前的伊本·库莱什已经意识到这点并付诸实践,所以我们在一千二百年前已经可以有点相信闪米特语系的存在了。

在这个意义上,伊本·库莱什比后世十七世纪的马克·苏埃利奥· 范·博思瀚(Marcus Zuerius van Boxhorn),十八世纪的蒙博杜勋爵(Lord Monboddo)以及大名鼎鼎的威廉·琼斯爵士(Sir William Jones)更加高明,而且还领先了人家将近千年。

因此,如果说对历史语言学感兴趣,那么就必须知道前人做了什么、怎么做的,什么路行得通,我们要走下去并在此基础上发展出更好的更有效的东西。

我们不要被九世纪的人比下去了。

整齐的对应关系可以大大降低语言比较的偶然性。当然,我们还可以使用别的方法加以佐证,尤其是在我们确信两者同源,但因为对语言的理解还不够难以得出整齐对应关系的时候。比如我们可以寻找双音节词或者多音节词。如果是单音节词的相似更容易处于偶然,那么双元音词或者多音节词相似出于偶然的概率就要小得多。

沙加尔和徐世璇(2002)在讨论哈尼语中的汉语借词的历史层次时,重点指出了双音节词的重要性,当然他们是在讨论借词层次的判别,同源词的判别亦然[3]:

双音节词的另一个作用是将偶然相似的可能性减小到最低限度,在汉藏语言范围内实际上消除了将同源词误作借词的危险。

在Lai et al (2020)寻找西夏语和西部嘉绒语组语言的共同创新时,他们也重点寻找了双音节词的同源词。具体可以参考:

只是,在使用双音节词的时候,我们需要对所研究的语言有一定的知识,综合各方面考虑,才能下结论。虽然“石头”是双音节词,但是…… 但是后边的话就不想多说了。

还有一个较为重要的点是,我们在比较语言的时候,一定要考虑到语言的形态。比如说“石头”这个词的词源是较为透明的,是“石”和“头”两个部分组成,各有其原义,是一个复合词。而stone则不能拆成“相对应”的s和tone,一个表示“石”,一个表示“头”。相信很多别的答主都已经讲了这些词的词源了。

形态的变化加上语音的变化,会使很多词汇的结构变得模糊,甚至把几个音节缩成一个音节。这时,我们就有很大的可能看不出它跟某一个其它语言的词是同源词。所以我们首先需要把这个词汇的来源研究出来,才能水落石出。比如说,法语的ʃɛn,只有一个音节,如果你对法语本身的历史完全没有了解,你根本不会把它跟西班牙语的kaˈðena联系在一起。

在很多汉藏语系的语言中,尤其是那些形态较少、语法接近孤立语的语言,有很多词汇很可能包含了许多派生的过程,比如上古汉语(白沙)食 *s-m-lək-s > sì (箪食壶浆的“食”),根据白沙的说法,可能经历了三次派生,而今天我们只看到一个简简单单的音节,如果我们不把它还原成上古汉语,我们能知道它可能跟绰斯甲语的njæ̂ʁ '舔'、藏语ལྡག་ ldag有关系吗?然后有些人可能会把它跟英语的lick比较,然后我就不comment了。

不针对对象语言进行深入地研究和学习,就想做历史语言学的比较。这是不可能的。

我在硕士的时候,有一个老师叫Jean Léo Léonard,在一次历史语言学的课上,面对某一个抬杠的学生(我们在讲罗曼语的历史,基本上都是定论),他说:

你来这里不仅仅是练习方法,而且是来学习的。

言下之意,你在这堂课上没有opinion。是的,不学习,就没有opinion。

当然,说到最后,我也是胡乱比较的一份子,还随手画成了漫画。比如可以看看这个回答:

参考

^van Bekkum, Wout Jac. 1982. The’risala’of yehuda ibn quraysh and its place in hebrew linguistics. Historiographia Linguistica 8(2-3). 307– 327.^Téné, David. 1980. The earliest comparisons of Hebrew with Aramaic and Arabic. Amsterdam Studies in the Theory and History of Linguistic Science Amsterdam 20. 355–377.^沙加尔, & 徐世璇. (2002). 哈尼语中汉语借词的历史层次. 中国语文, 1, 55-56.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至举报,一经查实,本站将立刻删除。