呂律:最早的平行語料庫和最早的機器翻譯系統是什麼?

呂律德語老師本今日頭條號:呂律德語老師,中的所有文章,均是我——呂律原創或編譯。我所有文章中採用的圖片,除少數我自己拍攝外,均出自網絡免費的版權公開圖片。

如果喜歡,歡迎轉發微信朋友圈。如有媒體或者其他自媒體想轉載我的文章到其他平臺,請聯繫我授權並標明我這個作者的姓名及職業——呂律德語老師,及標明文章出處:即“出自呂律德語老師的微信公眾號:律一德語學習室(lvlvgerman)”,以及“出自呂律德語老師本今日頭條號:呂律德語老師”。本人版權所有, 違者必究!

——聲明人:呂律(北外網絡與繼續教育學院多語種部德語培訓教師,兼編輯翻譯和寫作者,篤信終身學習。我的聯繫方式:電話:0086-18101072751,電子郵件:[email protected],2019年底升級為[email protected], 微信號:nickel0321(呂律),微信公眾號:律一德語學習室(lvlvgerman)。

我的獨著專著《呂律 :日耳曼文化譜系下的德國——多維度比較思辨分析》一書我和河南人民出版社的編輯老師商量之後,保留為近四十五萬字左右的修改稿,我就不大量刪減內容了。感謝河南人民出版社老師的理解,還專門擬定了合同補充協議。這是我的第一本專著,我想盡量人文社科和自然科學領域都介紹些,完整些。非常感謝。


專著和譯著不一樣,前者是我自己寫,後者是我把歐美國家的人用德語或英語寫的內容翻譯成目標語言。


我已經有幾本譯著了。翻譯過程中藉助機器翻譯也是時不時的事。在各行各業用機器助力人力,是必需也是趨勢。


機器翻譯的語料庫通常有三類:平行語料庫,多語語料庫和可比語料庫。語料庫方面的內容我之前簡單介紹過一些,今天簡單介紹一下最早的平行語料庫和最早的機器翻譯系統。這都是人類具有開創性的語言轉換革新。


最早的平行語料庫(parallel corpus, Parallelkorpus)


人類歷史上第一次出現跨語言的平行語料,是製作於公元前196年的羅賽塔石碑(Rosetta Stone),上面同時使用了古埃及文、古希臘文以及當地通俗文字,來記載古埃及國王托勒密五世登基的詔書。這是翻譯的重大里程碑。用不同的語言描述同一件事。


最早的機器翻譯(MT, MÜ)系統:


機器翻譯的概念最早可以追述到17世紀的歐洲啟蒙時期,1629年,笛卡爾(Rene Descartes)提出了把不同的語言中相同含義的詞彙以統一符號表示的觀點, 萊布尼茨(Leibniz), 貝克(Cave Beck), 基爾施(Athanasius Kircher),以及貝希爾(Johann Joachim Becher)等人曾經試圖編寫類似世界語言的詞典,先後提出過發明新語言的構想,先後進一步設想過組義構詞法的具體方案。


20世紀初期就有很多科學家和發明家提出了機器翻譯的理論與實際計劃。


1903年,發明並致力使用國際人工語言Ido的法國邏輯學家,數學家古圖拉特(Louis Couturat ,1868-1914 )和洛(L. Leau)出版了一本《Histoire de la langue universelle》(History of the Universal Language,通用語言的歷史)。


在這本書中,古圖拉特提及:


1902年,德國學者裡格(Wilhelm L. Rieger) 在其書中提出過一種數字語法(Zifferngrammatik),認為這種語法加上詞典的輔助,可以利用機械將一種語言翻譯成其他多種語言,並首次使用了“ein mechanisches Uebersetzen“(機器翻譯) 這一表達。


1905年,Rieger又在其理論基礎上出版了《Weltkorrespondenz auf Grundlage der Ziffern-Grammatik》(在數字語法基礎上進行世界通訊) 一書。


到了二十世紀三十年代,世界各地掀起了研究機器翻譯機器的熱潮。法國亞美尼亞裔科學家阿爾楚尼(George Artsouni)提出了用計算機來進行翻譯的構想。並設計了一款名為機械腦(mechanical brain)的機器。


同樣在20世紀三十年代,俄羅斯發明家特羅揚斯基(Petr Smirnov-Troyanskii)設計了一種用機械方法來把語言從一種轉換到另一種的機器,並隨後計劃在此基礎上研製一部”電子機械機” (electro-mechanical machine)。


可惜的是,這兩個申請了專利的翻譯機器,在當時因戰亂等各種原因都沒有引起世人的重視。


到了20世紀40年代,隨著1946年世界上第一臺電子計算機ENICA,被計算機先驅埃克特(John Presper Eckert, 1919-1995)和莫希萊( John Mauchly,1907-1980)設計並製造出之後,科技界出現巨大革新,同樣在語言轉換領域,也是重新掀起了研究機器翻譯的世界熱潮。


信息論的先驅之一,科學家沃倫-韋弗( Warren Weaver,1894-1978)提出了用計算機來進行語言轉化。韋弗在1947年3月4日還給控制論學者維納(N.Wiener)寫信,討論了機器翻譯的問題。1949年,他寫了一系列機器翻譯的文章,出版了韋弗備忘錄(Weaver-Memorandum),正式提出了機器翻譯的問題。


呂律:最早的平行語料庫和最早的機器翻譯系統是什麼?

Warren Weaver


韋弗被視為機器翻譯的鼻祖,他拋卻了詞語文本的含義,轉而視其為密碼。在美國和歐洲,他的團隊和繼任者在工作時遵循著一個原則:任何語言都是由一堆詞彙和一套語法規則組成,只要把兩種詞彙放到機器裡,按照人類組合這兩種詞彙的方法,就能創建出一套完整的規則,機器就能破譯密碼。


在不斷地努力研究後,在1954年的一次實驗中,韋弗成功地把幾十句俄文自動轉化成英文,這被視為機器翻譯可行的開端。


雖然韋弗認為機器翻譯是藉助通用語言(universal language)或中間語言(Interlingua)進行解密碼的過程,與現代機器翻譯的理論有出入,但是韋弗因其開創性的工作被視為“機器翻譯之父”(Vater der maschinellen Uebersetzung),而且,他和香儂(Claude Shannon)一起,被視為信息論的奠基人(Begründer der Informationstheorie)。


_______________________________________


以下是我給我自己總結一下,也提醒我自己要規劃好時間,不能拖拉,在2020年這個不平靜的一年裡也要沉下心來,紮紮實實做好每件事(進展不斷更新):


我已完成,已交初稿和修改稿給出版社,但是還需要不斷刪改的一部獨著專著是:

“呂律 著:日耳曼文化譜系下的德國——多維度比較思辨分析,呂律2020年3月19日已交初稿給河南人民出版社的編輯老師,2020年4月19日和24日呂律已經把兩個修改稿交給河南人民出版社的編輯老師。經與編輯老師的協商,呂律保留原近45萬字的修改稿,編輯老師不採用刪減稿。預計2020年底前出版”


我還沒完成,爭取2020底之前會陸續交稿給各出版社的三部獨著專著和一部譯著是:

“呂律 編著:人工智能時代主題型德語學習——學科視野下的德語二十主題, 呂律推遲到2020年底交給相應出版社。預計2021年出版


呂律 編著:德語TestDaf 和DSH寫作思路和模擬題分析,呂律推遲到2020年底交給相應出版社。預計2021年出版。


Lu Lu (呂律 著):Christa Wolfs Kein Ort. Nirgends. und Kassandra. 呂律2004年在德國寫的德語碩士論文。預計2021年找一個德國出版社出版


Thomas Rappold: Peter Thiel,呂律待譯,[德] 托馬斯-拉波爾特:彼得-蒂爾傳記,呂律2020年6月10日之前要交譯稿給出版社。預計2020年下旬出版”


預計2020年各出版社會出版的我的一本獨著專著,一本譯著和一本合譯譯作及一本我參與翻譯了三個篇文章並撰寫三篇綜述的譯文集共五本書是:

“呂律 著:日耳曼文化譜系下的德國——多維度與比較思辨分析,鄭州:河南人民出版社。預計2020年出版(呂律已寫完2020年3月19日交了初稿給出版社,2020年4月19日和24日呂律已經把兩個修改稿交給河南人民出版社的編輯老師。經與編輯老師的協商,呂律保留原近45萬字的修改稿,編輯老師不用刪減稿。預計2020年底前出版)


[德] 托馬斯-拉波爾特(Thomas Rappold):彼得-蒂爾傳記,譯者:呂律,北京:北京卓文天語文化公司,預計2020年出版(呂律待譯,2020年6月前交稿給出版公司)


[英]亨利·吉爾貝(Henry Gilbey):《釣魚》,譯者:呂律,林敦來,唐銘,王晨光,北京:旅遊教育出版社, 本來預計2019年出版, 受疫情影響,推遲到2020年出版(呂律已翻譯完統稿完2018年下半年已交稿給出版社)


吳璟薇主編:德國媒介思想精粹,預計由上海復旦大學出版社出版,預計2020年出版,呂律2019年中旬和下旬開始參加此翻譯項目後,翻譯了其中的三篇德譯中文章(Assmann, Hoeflich,Weber。還有一篇Schaeffle 的文章是花體字呂律因為時間有限,所以推辭不翻譯了),並寫了三篇綜述(Hoeflich,Weber,Schaeffle)(呂律已翻譯完,寫完,2020年1月下旬前全部交稿給項目負責人)”


預計2021年各出版社會出版的我的一本參與翻譯了兩期報紙的譯文集和我的三本獨著專著是:

“陳力丹主編:新萊茵報編譯,第一集(1到25期),北京:人民出版社, 預計2020年或2021年出版,呂律2019年中旬開始參加此翻譯項目並翻譯了其中的21和22期報刊(呂律已翻譯完21和22期並於2020年2月中旬前全部交稿給項目負責人)。(呂律2020年4月已詢問項目負責人,該書因編輯量大,可能2020年出版困難)


呂律 編著:人工智能時代主題型德語學習——學科視野下的德語二十主題, 呂律推遲到2020年底交給相應出版社,預計2021年出版


呂律 編著:德語TestDaf 和DSH寫作思路和模擬題分析,呂律推遲到2020年底交給相應出版社,預計2021年出版。


Lu Lu (呂律 著):Christa Wolfs Kein Ort. Nirgends. und Kassandra. 呂律2004年在德國慕尼黑大學讀書時寫完的德語論文,呂律預計2021年找一個德國出版社出版”


每一年我總有各種計劃,有的拖來拖去,時間越拖越久。一定要規劃好時間,不要拖拖拉拉。總結一下,也是催促我自己。今年要加速度了。



歡迎閱讀我近幾日寫的微信公眾號文章:

[德語語言]再談機器翻

[人物介紹]戴蒙德的《劇變》:這些國家如何自救

[德語語言] 基爾克的“法人有機體”說,是什麼

[德語語言]“國際法”起源,基本原則和機構,及德語表

[德語語言]甲方和乙方,德語怎麼說

[德語語言]負油價!?及相關德語表達

[德語語言] Peter Thiel 和其

[德語語言] 終於又交稿

[德語語言] 什麼是世界視角?

[德語語言] 一個德國人從生到老的權利和義務-節選

[德語語言] 聽聽這些德國人怎麼說“教育”

[德國國情] 保守主義和(新)自由主義

[外國國情]一個國家的這些

[德語語言]硬實力,軟實力,巧實力,銳實

[我國我家] 如何削減篇幅,是個難

[我國我家] 總結一下,我要加油,不能拖拉了!

[德語語言]我如何在德國出版我這本德語獨著書籍

[德語語言]我這三本獨著書稿的目錄

[德語語言] 我這樣上德語DSH寫作課,以及我預計2020要完成的四本獨著書稿和

[德國國情] 我這樣上德國國情和國際關係理論

[我國我家]七律-懷念姥姥

[德語語言] 德語中“清明節”怎麼說?

[人物介紹] 羅薩的加速度中的集體減速

[德語語言] 多區域產業鏈中心?

[德語語言] 有限的全球化?!

[我國我家] 我的新書稿我推遲到四月初交稿 [我國我家] 我待交稿的新書稿-前言和最新目錄

[我國我家] 我待交稿的新書稿-前言

[德國國情] 歐盟是聯邦,邦聯還是國家聯盟?

[德國國情] 托馬斯-曼的入世宣言,及曼式兄弟和“德國問題”

[德語語言] 糧食保護主義?守好大糧倉和小糧倉

[國情對比] 指數!從“卡爾達肖夫指數”到“基尼係數”,及中美德英新等國“採購經理指數”簡單比較

[人物介紹] 行動者氣質

[我國我家] 我的新計劃-補充

[我國我家] 我的新計劃 [人物介紹] 阿克洛夫的《動物精神》和泰勒的《錯誤行為學

[我國我家] 四十四歲生日

[德語語言] “鬆散社會”和“緊密社會

[我國我家] 世時難料,努力生活!

[德國國情] 再提世界偏見地圖

[德國國情] 我待交稿的新書稿目錄-還在不斷修改

[國情對比]防疫戰疫!——中美歐德日法英新等地“防疫機構”簡單介紹

[人物介紹]囚徒困境和群體免疫——合作的進

[國情對比] 國家緊急狀態法!——中美德日英俄國“緊急狀態法”簡單比較

[德語語言] 什麼週期?——"經濟週期"的幾個重要理論

[德語語言] "牛市"和"熊市"的來源及德語表達

[德語語言] 你是“生存主義者”嗎?“生存主義”德語怎麼說?

[國情對比] 德語中“熔斷機制”怎麼說?中美英韓日新“熔斷機制”簡單比較

[國情對比] 中美印巴德英日等國“棉花”種植發展歷史簡單對比

[國情對比] 中美德英日等國“綠色建築”評價標準及政策簡單對比

[德語語言] 什麼是西域三十六國?

[德國國情] 怎麼德國觀察?

[德語語言] 德語中“合同”怎麼說?

[我國我家] 出版經費解決了!

[德國國情] 德國是不是移民國家

[人物介紹] 特拉諾瓦的造物還原——改變世界的37種物品

[德語語言] 德語中“熔噴布”怎麼說?

[國情對比] 為什麼“比較”很重要?

[德語語言] 德語中“閏年”怎麼說?

[國情比較] 日耳曼文化譜系下的德國觀察——多維度與比較視角分析

[我國我家] 我待交稿新書的目錄

[外國國情] 一個國家的“矛盾”

[外國國情] 一個國家的 "過去和現

[外國國情] 一個國家的"地位提升"

[人物介紹] 格里什的智能機器如何思考[德國國情] 19世紀上半期的各種“主義” [德語語言] 斯賓塞的社會有機體理論 [人物介紹] 舍夫勒的著作 [人物介紹] 彼得蒂爾的從零到壹 [外國國情] 為什麼1848年英國沒有爆發 [德語語言] 1844年政治經濟學書稿簡介 [德語語言] 資本論 [德國國情] 馬克思朋友圈裡的NO1 [德國國情] 德國的未來?


歡迎大家關注我的微信公眾號:律一德語學習室(lvlvgerman),歡迎掃碼關注,謝謝!歡迎在微信朋友圈轉

載。——呂律

呂律:最早的平行語料庫和最早的機器翻譯系統是什麼?

如想把我的文章轉載分享到其他網絡平臺,請務必標明“出於呂律德語老師的微信公眾號:律一德語學習室(lvlvgerman)”以及我的姓名及職業。

有任何問題,請聯繫我——呂律德語老師:

電話:18101072751

電子郵件:[email protected](2019年12月4日升級為[email protected])

微信號:nickel0321(呂律)


我的個人網絡平臺賬號及我的其他主要用來轉載我微信公眾號:律一德語學習室(lvlvgerman)部分文章的個人網絡平臺賬號,歡迎關注!

個人微信公眾號:律一德語學習室(lvlvgerman)(2016年申請,2017年2月開始寫文章,每日更新)

個人微信公眾號備用號:呂律德語老師 (lvlv-Life-Leben)(2018年2月新建,備用,不定期更新)

個人喜馬拉雅電臺:律一德語學習室(2017年3月申請,主要是初級德語會話音頻)

個人微博號:呂律德語老師(2017年8月申請)

個人頭條號:呂律德語老師(2017年8月申請)

個人知乎賬號:呂律(2017年10月申請)

個人知乎專欄:呂律:律一德語學習室 (2017年10月申請)

個人豆瓣閱讀專欄:呂律:我的德國生涯系列(我的豆瓣賬號:nickel0321) (2018年1月申請,4月初電子書已在“豆瓣閱讀”出版上架,歡迎購買。還會繼續寫);呂律:一個北京德語老師的生活感悟;呂律:一個沒有孩子的“孩子王”的前半生;呂律:我的德國生涯系列(續)

個人每日德語聽力頻道:呂律:新編德語語音和入門(2019年底申請入駐)

歡迎關注,一個人的力量是有限的,多提意見!


分享到:


相關文章: