英語,法語,德語,漢語,這些語言竟然都有個共同的祖先?

對於所有語言來說,詞語排列中的信息總量都是相同的,即使這些語言之間毫無聯繫。這種一致性暗示著所有語言都有個共同的祖先,或者人類大腦在處理語言時存在普遍性。

“具體使用哪種語言無所謂。”英國曼徹斯特大學系統生物學家馬塞洛•蒙特穆羅(Marcelo Montemurro)說,“即使是漢語、英語和蘇美語這樣複雜的語言,通過測量詞語排列順序也可以發現一些語言共有的特點。”

語言通過選擇詞彙和排列詞彙來表達含義。有些語言,例如芬蘭語,大部分含義都在單詞以及前後綴本身,而詞語的排列順序基本是自由的。其它語言,例如英語,就比較嚴格——“李雷愛韓梅梅”與“韓梅梅愛李雷”的意義完全不同。

英語,法語,德語,漢語,這些語言竟然都有個共同的祖先?

語言通過選擇詞彙和排列詞彙來表達含義。圖片來源:pixabay.com

蒙特穆羅意識到,通過計算文本中的“熵”(也就是表示詞彙平均分佈程度的量),他可以將詞語順序中所包含的信息量化。他和合作夥伴、阿根廷國家原子能委員會的戴米安•扎內特(Damián Zanette)利用信息學方法計算了來自八種語言的幾千個文本的熵,包括英語、法語、德語、芬蘭語、塔加路語、蘇美語、古埃及語以及漢語。

之後,研究者將這些文本中的詞彙隨機重新排列。他們用到的文本包括莎士比亞全集、物種起源、以及蘇美人的祈禱文。

“如果我們將所有詞彙弄亂,破壞原來的文本,那麼詞彙還能完好地保存下來。”蒙特穆羅說,“我們所破壞的只是語言結構,也就是我們用來編碼信息的方式。”

但奇怪的是,在最初有規律的文本與弄亂之後的文本之間,熵的差異無論在哪種語言中都是恆定的。蒙特穆羅認為,這種熵的差異可以用來衡量詞語順序所包含的信息。因此,當文本被弄亂之後,所失去的信息大約是每詞3.5比特。

“我們發現了十分有趣的現象:所有語言這種熵的差值都是相同的。”他說,“出於某種原因,這些語言的詞語排列方式都在這一框架中演化。”

蒙特穆羅認為,這種一致性也許反映了人類大腦的某種認知侷限,或者它能讓我們更深入地瞭解語言進化。

認知科學家仍舊在爭辯,語言是否有普遍特性。一些開創性的語言學家提出,語言可以根據一系列規則演化,因此會產生相似的語法與結構特徵。但上個月發表的一項有關幾千種語言的句法與結構研究表明,並不存在這類規則。愛丁堡大學的語言學家肯尼•史密斯(Kenny Smith)認為,語言的普遍特徵可能表現在更高級的組織結構上。

英語,法語,德語,漢語,這些語言竟然都有個共同的祖先?

語言的普遍特徵可能表現在更高級的組織結構上。圖片來源:pixabay.com

“也許這些粗枝大葉的特徵所影響的是語言中真正重要的方面。”他說,“製造詞彙並制定詞彙排列的法則,才是語言中最基本的功能。而傳統語言學家總是在錯誤的地方尋找語言的普遍特徵,他們所研究的並不是語言的最基礎部分。”


排版:昕暘

英語,法語,德語,漢語,這些語言竟然都有個共同的祖先?


分享到:


相關文章: