建立維吾爾語中介語語料庫基本設想

「邊疆時空」楊文革 | 建立維吾爾語中介語語料庫基本設想

楊文革


新疆農業大學中國語言學院院長,教授。主要研究方向為雙語教學、漢維語語法對比研究。主持“維吾爾語中介語語料庫研究”國家社科基金項目1項;參加全國教育科學規劃項目等3項,自治區項目1項。主編、參編《大學漢語精讀》等教材15部,發表論文20餘篇。


摘要:建立維吾爾語中介語語料庫的意義在於:第一,可以對維吾爾語學習者的大量語言樣本進行量化分析,為維吾爾語中介語研究、維吾爾語本體研究以及偏誤分析提供真實可靠的語言數據。第二,為研究者提供比較全面的能夠反映維語學習者的各種語言厲性、個體特徵等信息。第三,為確定教學難點重點和語言項目的教學次序提供參考標準。第四,為維吾爾語教材編寫提供可靠的參考。運用中介語理論、語料庫語言學的理論是建立維吾爾語中介語語料庫的基本思路維吾爾語中介語語料庫主要由生語料庫、熟語料庫、統計信息庫、相關信息庫等構成,建庫須遵循語料真實性、語料的平衡性、語料標註體現維吾爾語特點、學生背景信息完備性、便捷性等五項原則。

關鍵詞:維吾爾語 中介語 語料庫

「邊疆時空」楊文革 | 建立維吾爾語中介語語料庫基本設想


Selinker於1969年提出了中介語(interlanguage)概念,並於1972年在其題為“中介語”的論文中進行了詳細論述。Selinker認為,中介語是一個單一的語言系統,這個系統是由不同的心理過程生成的規則構成的,並歸納了產生中介語的五大原因:語言遷移、目的語規則泛化、訓練造成的遷移、學習策略與交際策略。從此中介許成為第二語言習得研究的重要課題。中介語理論的產生使20此紀70年代的應用語言學研究進入了一個新時代,它擴展、深化了語言的對比分析,為第二語言學習的偏誤分析奠定了理論基礎。

中介語理論於20世紀80年代初傳入我國,對外語教學和外語測試以及對外漢語教學產生了巨大的推動作用。1984年魯健驥先生髮表了“中介語理論與外國人學習漢語的語音偏誤分析”一文,首次引進“偏誤”與“中介語”兩個概念,文章在國內產生了較大的影響,使得偏誤分析和中介語研究成為第二語言習得研究的中心課題。隨後,孫德坤、王永德、盛永生、徐子亮、司聯合、王建勤、韓照紅等學者對中介語的概念、中介語的來源及產生的模式、中介語的性質和特點、研究方法、研究的意義和策略以及中介語與對比分析、偏誤分析的關係進行研究,取得顯著的成果。


一、國內外中介語語料庫研究現狀



語料是中介語研究的重要依據。早期對中介語的研究採用的語料基本是教師或者學者個人零星的統計和收集,無法實現對中介語的科學統計分析和定量分析研究。因此,中介語語料庫的建設成為中介語研究的迫切需要。20世紀90年代,隨著計算機技術迅速發展,中介語語料庫得到了迅速發展,國內外一批針對第二語言學習者的中介語語料庫相繼建立。比如,國際上針對英語學習者的語料庫有:比利時Louvain大學建立的“國際英語學習者語料庫”和“國際英語口語過渡語語料庫”、Longman出版集團建立的“朗曼學習者語料庫”、劍橋大學出版社建立的“劍橋學習者語料庫”、Jozsef Horvath建立的“匈牙利英語學習者語料庫(JPU)”、波蘭Lodz大學英語系和英國蘭卡斯特大學語言學與英語系合作建立的“波蘭英語學習者語料庫”(PELCRA)、瑞典Uppsala大學建立“瑞典英語學習者語料庫”(USE)、日本明海大學建立的“日本英語學習者語料庫”(JEFLL)、美國蒙特克萊爾州立大學建立的“美國的英語學習者語料庫”(MELD)等。針對我國英語學習者建立的語料庫主要有:2001年約翰·彌爾頓建立的“香港高中生英語語料庫”、1994年香港大學教育學院建立的“香港初中生教學語料庫”、1996年何安平建立的“中國英語教育語料庫”、1999年桂詩春、楊惠中建立的“中國學習者英語語料庫”、2005年楊惠中、衛乃興建立的“中國學習者英語口語語料庫”、2005年文秋芳、王立非、梁茂成等建立的“中國英語學生口筆語語料庫”等;針對外國留學生學習漢語建立的中介語語料庫有:1995年儲誠志、陳小荷等建立的“漢語中介語語料庫系統”、2009年周文華、肖奚強等建立的“夕國學生漢語中介語偏誤信息語料庫”、2008年張舸建立的“留學生中介語語料庫”、2005年王茂林建立的“留學生漢語中介語語料庫”、2005年崔希亮、張寶林等建立的“HSK動態作文語料庫(1.1版)”。這些語料庫的建設為研究者提供了翔實、可靠的中介語語料,使中介語研究建立在科學統計分析和定量分析研究基礎之上,更加客觀、真實地反映了語言學習者的習得規律和過程,極大地促進了國內英語教學和對外漢語教學研究、教材建設、語言測試等工作。


二、維語中介語語料庫建立的意義



與國內英語和對外漢語中介語語料庫建設相比,目前,新疆在中介語語料庫建設方面相對滯後,處於起步階段。現建成的僅有2005年由海峰、崔新丹等建立的“維漢中介語語料庫”,該語料庫主要是針對新疆少數民族學生學習漢語而建立的中介語語料庫,而針對維語學習者的中介語語料庫還沒有建立,是一項空白。

近年來,隨著國家西部大開發戰略的實施、援疆工作的全面開展以及新疆“雙語”教學的不斷推進,各行各業對精通維漢語的“雙語”人才的需求逐年增加,維吾爾語學習得到了高度重視。2008年以來新疆自治區對維吾爾語專業實施了“少數民族語言人才特培計劃”以及“雙語翻譯人才特培計劃”等措施,從招生規模、培養經費、實踐教學及推免研究生等方面給予了政策上的扶持,大力推進了維吾爾語專業人才的培養,提升了我區高校維吾爾語專業人才的培養質量。但是,由於種種原因,我區高校維吾爾語專業人才的培養質量還有許多方面不盡人意,比如,維語教學質量還需進一步提高;學生的維語表達能力還不能完全適應用人單位的工作需要;維吾爾語及維吾爾語教學研究得還不夠深人,特別是對維吾爾語習得規律的研究還相對滯後。筆者在中文期刊網上查閱了近四十年有關維吾爾語中介語研究文獻,統計後僅有9篇,其中1990年之前發表的1篇,1990年至1999年發表的1篇,2000年至2009年發表的4篇,2010年以後發表的3篇。研究內容主要涉及語法、語音偏誤等方面的研究,具體為:關於維吾爾語學習“格”偏誤分析的文章3篇;關於維吾爾語學習語音偏誤的3篇,關於漢維中介語對比的1篇;維吾爾語學習偏誤類型概括的2篇;有關維吾爾語中介語語語料庫建設方面的文獻未見一篇。可見,對維吾爾語中介語及維吾爾語中介語語料庫的研究還沒有得到足夠的重視,這與對外漢語教學及少數民族漢語教學相比相對滯後,也和自治區大力扶持維吾爾語專業發展的思路是不相適應的。因此,進一步加強維吾爾語中介語及中介語語料庫的研究對提高維吾爾語教學質量及維吾爾語研究等就顯得至關重要。

維吾爾語中介語的研究離不開大量真實的中介語語料。而大量的真實的維吾爾語中介語語料的收集必須藉助語料庫語言學及中介語理論等知識,建立專門針對維吾爾語學習者的維語中介語語料庫。考察國內外中介語語料庫建設成果,我們認為維吾爾語中介語語料庫的建設具有以下幾點意義:

第一,維吾爾語中介語語料庫建設可以對維吾爾語學習者的大量語言樣本進行量化分析,為維吾爾語中介語研究、維吾爾語本體研究以及偏誤分析提供真實、可靠的語言數據。目前,國內無論是對維吾爾語中介語的研究還是維吾爾語本體研究所採用的語料大部分是研究者或教師在教學過程中零星採集語料,往往代表是一個“點”上的語料,比如,或是某個學校維吾爾語專業學生學習維吾爾語過程中的語料,或是學習某一門課程所產生的語料,或是針對某個章節某個問題採集的語料等。因此,這些語料都缺乏一定的代表性。維吾爾語中介語語料庫所採集的語料應該“點面結合”,儘可能窮盡性地蒐集各個學校各年級所有學生學習維吾爾語過程中產生的維吾爾語中介語語料,保證所採集的語料富有代表性,為維吾爾語中介語研究、維語本體研究及偏誤分析研究提供可靠的語言數據。

第二,維語中介語語料庫的建設將為研究者提供比較全面的能夠反映維語學習者的各種語言屬性、個體特徵等信息,為全方位地探索維語學習者語言特徵提供重要參考依據。影響語言學習者習得效率的因素是多方面的,有智力方面的因素,也有諸如年齡、性別、學習環境、情感態度等非智力方面的因素。維吾爾語中介語語料庫建設可以為研究者提供維語學習者相關的一些語言屬性及個體特徵,比如,性別、民族、年齡、學習階段、所在學校、學習維語時間等信息。這為全方位地探尋維語學習者習得規律提供了重要的參考依據。

第三,維吾爾語中介語語料庫的建設將為確定教學難點重點、語言項目的教學次序提供參考標準,能夠對各種標準化維吾爾語測試和作文評分提供可靠依據。在第二語言教學過程中與目的語差別較大的地方通常是教學的重點和難點。呂叔湘曾指出,“第二語言教學要有的放矢”,“學生難以理解、經常出錯或者避而不用的語法現象都是難點”。“有的放矢”就是指第二語言教學要有重點難點,不能“泛泛而教”,否則難易取得理想的教學效果。那麼,如何把握維語教學的難點重點呢?“國內外長期教學的實踐經驗告訴我們,最重要的也是比較好操作的,是從教學偏誤和語言對比中提取難點”,“偏誤是由於母語的負遷移而產生的,因而由負遷移產生的偏誤,往往是習得第二語言的難點”。如何掌握教學中的偏誤呢?筆者認為,維吾爾語中介語語料庫可以幫助教師便捷地實現對語料庫中的偏誤類型進行檢索,對“學生經常出錯、難易理解的或避而不用”偏誤類型進行歸納,確定教學重點難點,做到“有的放矢”地教學。同時還可以對維吾爾語學習者的習得過程中產生的偏誤類型進行定量統計分析,為語法項目的編排順序以及維吾爾語語言能力測試提供重要的參考依據。

第四,維吾爾語中介語語料庫的建設可以為維吾爾語教材編寫提供可靠的參考。教材的設計和編寫應服務於教學,適應於教學,應有助於學習者對教材及教材以外的語言事實的理解和掌握。因此,教材的編寫要把握學習者習得規律,有助於學習者理解和掌握所學語言。維吾爾語中介語語料庫可幫助教材編寫者完成對維語學習者習得規律的把握。


三、維語中介語語料庫建設思路、

構成及建庫原則



維吾爾語語料庫的建設將運用中介語理論、語料庫語言學的理論和方法,蒐集不同背景和不同學習階段維吾爾語學習者的書面語語料60萬詞(指由詞幹與構詞詞尾或構形詞尾構成的詞符串)以上,並對語料屬性、詞彙、語法等單位進行計算機處理,形成熟語料,以實現對各種條件和要求下的語料數據進行便捷的機器檢索和提取。語料收集對象主要針對新疆高校維吾爾語專業的本科生、非維吾爾語專業本科生、公務員維吾爾語培訓班學員、幹部維吾爾語培訓班學員等,蒐集上述學習者在學習維吾爾語過程中的成段成篇的語料,包括作文考卷、作文練習、作業、漢譯維等,並對這些語料進行偏誤類型標註。同時完整地記錄每篇語料及寫作語料學生的背景屬性。這些背景屬性包括姓名、性別、族別、身份、年級、班級、所在學校、學習維語的時間、寫作語料的時間、語料來源、語料類別等內容。

根據對外漢語中介語語料庫建設成功經驗,維吾爾語中介語語料庫主要由生語料庫、熟語料庫、統計信息庫、相關信息庫等四部分組成。生語料庫存放未經任何標註的各高校維吾爾語學習者書面表達形式的語料,即寫作語料,主要包括平時的作業、試卷中的所造的單句、語段、作文等。這些語料產出者的相關背景屬性信息必須完備,便於按相關信息庫提供的各種信息進行檢索與輸出併力爭使這些語料的中部分語料有電子掃描版,可以直接呈現語料原貌,便於對維語學習者詞語拼寫偏誤進行研究。熟語料庫:存放經過標註加工過的維吾爾語中介語語料,即從詞、維吾爾語語法範疇、語篇、標點符號等角度進行偏誤標註的語料。統計信息庫:存放各種統計數據,比如,詞信息統計(詞量及詞頻統計、詞的各類偏誤統計);各類語法範疇的統計(各類語法範疇的句量統計、涉及各類語法範疇類型的偏誤句的統計);語篇信息統計(形式連接偏誤統計、語義連接偏誤統計);標點符號信息統計(各種標點符號的用量統計、各種標點符號的偏誤統計)。相關信息庫:存放學生相關背景信息和語料相關信息。學生背景信息包括:姓名(以代碼形式顯示)、性別、族別、身份、年級、班級、所在學校、學習維語的時間等內容。語料信息包括:標題、文體、字數、寫作語料的時間、語料來源、語料類別等內容。

維吾爾語中介語語料庫建設遵循以下幾條建設原則:第一,語料真實性原則:所採集的語料必須是“原汁原味”的維吾爾語學習者習得維語過程中產生的原始語料。“語料錄人採取實錄原則,語料標註也要忠實原作,最大限度地保持語料原貌。錄入時對語料不做任何修改訂正,詞、短語、句、篇、標點符號等方面的錯誤和書寫格式均原樣錄入,以全面反映學生的實際語言表現”。第二,語料的平衡性原則:採集語料時從不同的學習階段、不同的學校等方面考慮,保證語料的均衡,比如,一年級到四年級的語料、近四五年的語料以及各學校提供的語料量等都得保證一定的比例。第三,語料的標註體現維吾爾語特點的原則。維吾爾語屬於黏著語,附加成分、虛詞、詞序、語調是維語常見的語法手段。維吾爾語的語法範疇有:數、格、人稱、語態、能動一非能動、肯定一否定、式、體、時、級等語法範疇。構詞詞尾和構形詞尾附著在詞幹上,形態變化非常豐富。因此,對語料標註時要充分考慮維語的這些語法特點,應從維語的這些語法範疇人手進行標註。第四,學生背景信息的完備性原則。蒐集語料時注重學生信息的完備性,保證每一篇語料能和學生背景信息一一對應,“注重收集同一名學生/同一個學生群體在不同學習階段/不同年級的語料。這部分語料能夠反映學生的整個學習過程,在研究上有重要意義”。第五,便捷性原則:維吾爾語中介語語料庫具備系統穩定、界面友好、方便快捷、檢索功能等特點。


四、結語



維吾爾語是我國使用人口超過千萬的少數民族語言之一,學習維吾爾語有利於新疆的民族團結、社會穩定、經濟建設。維吾爾語中介語語料庫是我國首次針對維吾爾語學習者擬建立的專用語料庫,該語料庫的建設將為維吾爾語中介語研究、維吾爾語教學研究、教材編寫、維吾爾語水平測試、維吾爾語本體研究提供寶貴的語料資源,使維吾爾語偏誤分析研究步人科學統計分析和定量分析的研究思路上,研究成果更具代表性和真實性。


【注】文章原載於《新疆大學學報》(哲學·人文社會科學版)2013年第3期。


聲 明


分享到:


相關文章: