建立维吾尔语中介语语料库基本设想

「边疆时空」杨文革 | 建立维吾尔语中介语语料库基本设想

杨文革


新疆农业大学中国语言学院院长,教授。主要研究方向为双语教学、汉维语语法对比研究。主持“维吾尔语中介语语料库研究”国家社科基金项目1项;参加全国教育科学规划项目等3项,自治区项目1项。主编、参编《大学汉语精读》等教材15部,发表论文20余篇。


摘要:建立维吾尔语中介语语料库的意义在于:第一,可以对维吾尔语学习者的大量语言样本进行量化分析,为维吾尔语中介语研究、维吾尔语本体研究以及偏误分析提供真实可靠的语言数据。第二,为研究者提供比较全面的能够反映维语学习者的各种语言厲性、个体特征等信息。第三,为确定教学难点重点和语言项目的教学次序提供参考标准。第四,为维吾尔语教材编写提供可靠的参考。运用中介语理论、语料库语言学的理论是建立维吾尔语中介语语料库的基本思路维吾尔语中介语语料库主要由生语料库、熟语料库、统计信息库、相关信息库等构成,建库须遵循语料真实性、语料的平衡性、语料标注体现维吾尔语特点、学生背景信息完备性、便捷性等五项原则。

关键词:维吾尔语 中介语 语料库

「边疆时空」杨文革 | 建立维吾尔语中介语语料库基本设想


Selinker于1969年提出了中介语(interlanguage)概念,并于1972年在其题为“中介语”的论文中进行了详细论述。Selinker认为,中介语是一个单一的语言系统,这个系统是由不同的心理过程生成的规则构成的,并归纳了产生中介语的五大原因:语言迁移、目的语规则泛化、训练造成的迁移、学习策略与交际策略。从此中介许成为第二语言习得研究的重要课题。中介语理论的产生使20此纪70年代的应用语言学研究进入了一个新时代,它扩展、深化了语言的对比分析,为第二语言学习的偏误分析奠定了理论基础。

中介语理论于20世纪80年代初传入我国,对外语教学和外语测试以及对外汉语教学产生了巨大的推动作用。1984年鲁健骥先生发表了“中介语理论与外国人学习汉语的语音偏误分析”一文,首次引进“偏误”与“中介语”两个概念,文章在国内产生了较大的影响,使得偏误分析和中介语研究成为第二语言习得研究的中心课题。随后,孙德坤、王永德、盛永生、徐子亮、司联合、王建勤、韩照红等学者对中介语的概念、中介语的来源及产生的模式、中介语的性质和特点、研究方法、研究的意义和策略以及中介语与对比分析、偏误分析的关系进行研究,取得显著的成果。


一、国内外中介语语料库研究现状



语料是中介语研究的重要依据。早期对中介语的研究采用的语料基本是教师或者学者个人零星的统计和收集,无法实现对中介语的科学统计分析和定量分析研究。因此,中介语语料库的建设成为中介语研究的迫切需要。20世纪90年代,随着计算机技术迅速发展,中介语语料库得到了迅速发展,国内外一批针对第二语言学习者的中介语语料库相继建立。比如,国际上针对英语学习者的语料库有:比利时Louvain大学建立的“国际英语学习者语料库”和“国际英语口语过渡语语料库”、Longman出版集团建立的“朗曼学习者语料库”、剑桥大学出版社建立的“剑桥学习者语料库”、Jozsef Horvath建立的“匈牙利英语学习者语料库(JPU)”、波兰Lodz大学英语系和英国兰卡斯特大学语言学与英语系合作建立的“波兰英语学习者语料库”(PELCRA)、瑞典Uppsala大学建立“瑞典英语学习者语料库”(USE)、日本明海大学建立的“日本英语学习者语料库”(JEFLL)、美国蒙特克莱尔州立大学建立的“美国的英语学习者语料库”(MELD)等。针对我国英语学习者建立的语料库主要有:2001年约翰·弥尔顿建立的“香港高中生英语语料库”、1994年香港大学教育学院建立的“香港初中生教学语料库”、1996年何安平建立的“中国英语教育语料库”、1999年桂诗春、杨惠中建立的“中国学习者英语语料库”、2005年杨惠中、卫乃兴建立的“中国学习者英语口语语料库”、2005年文秋芳、王立非、梁茂成等建立的“中国英语学生口笔语语料库”等;针对外国留学生学习汉语建立的中介语语料库有:1995年储诚志、陈小荷等建立的“汉语中介语语料库系统”、2009年周文华、肖奚强等建立的“夕国学生汉语中介语偏误信息语料库”、2008年张舸建立的“留学生中介语语料库”、2005年王茂林建立的“留学生汉语中介语语料库”、2005年崔希亮、张宝林等建立的“HSK动态作文语料库(1.1版)”。这些语料库的建设为研究者提供了翔实、可靠的中介语语料,使中介语研究建立在科学统计分析和定量分析研究基础之上,更加客观、真实地反映了语言学习者的习得规律和过程,极大地促进了国内英语教学和对外汉语教学研究、教材建设、语言测试等工作。


二、维语中介语语料库建立的意义



与国内英语和对外汉语中介语语料库建设相比,目前,新疆在中介语语料库建设方面相对滞后,处于起步阶段。现建成的仅有2005年由海峰、崔新丹等建立的“维汉中介语语料库”,该语料库主要是针对新疆少数民族学生学习汉语而建立的中介语语料库,而针对维语学习者的中介语语料库还没有建立,是一项空白。

近年来,随着国家西部大开发战略的实施、援疆工作的全面开展以及新疆“双语”教学的不断推进,各行各业对精通维汉语的“双语”人才的需求逐年增加,维吾尔语学习得到了高度重视。2008年以来新疆自治区对维吾尔语专业实施了“少数民族语言人才特培计划”以及“双语翻译人才特培计划”等措施,从招生规模、培养经费、实践教学及推免研究生等方面给予了政策上的扶持,大力推进了维吾尔语专业人才的培养,提升了我区高校维吾尔语专业人才的培养质量。但是,由于种种原因,我区高校维吾尔语专业人才的培养质量还有许多方面不尽人意,比如,维语教学质量还需进一步提高;学生的维语表达能力还不能完全适应用人单位的工作需要;维吾尔语及维吾尔语教学研究得还不够深人,特别是对维吾尔语习得规律的研究还相对滞后。笔者在中文期刊网上查阅了近四十年有关维吾尔语中介语研究文献,统计后仅有9篇,其中1990年之前发表的1篇,1990年至1999年发表的1篇,2000年至2009年发表的4篇,2010年以后发表的3篇。研究内容主要涉及语法、语音偏误等方面的研究,具体为:关于维吾尔语学习“格”偏误分析的文章3篇;关于维吾尔语学习语音偏误的3篇,关于汉维中介语对比的1篇;维吾尔语学习偏误类型概括的2篇;有关维吾尔语中介语语语料库建设方面的文献未见一篇。可见,对维吾尔语中介语及维吾尔语中介语语料库的研究还没有得到足够的重视,这与对外汉语教学及少数民族汉语教学相比相对滞后,也和自治区大力扶持维吾尔语专业发展的思路是不相适应的。因此,进一步加强维吾尔语中介语及中介语语料库的研究对提高维吾尔语教学质量及维吾尔语研究等就显得至关重要。

维吾尔语中介语的研究离不开大量真实的中介语语料。而大量的真实的维吾尔语中介语语料的收集必须借助语料库语言学及中介语理论等知识,建立专门针对维吾尔语学习者的维语中介语语料库。考察国内外中介语语料库建设成果,我们认为维吾尔语中介语语料库的建设具有以下几点意义:

第一,维吾尔语中介语语料库建设可以对维吾尔语学习者的大量语言样本进行量化分析,为维吾尔语中介语研究、维吾尔语本体研究以及偏误分析提供真实、可靠的语言数据。目前,国内无论是对维吾尔语中介语的研究还是维吾尔语本体研究所采用的语料大部分是研究者或教师在教学过程中零星采集语料,往往代表是一个“点”上的语料,比如,或是某个学校维吾尔语专业学生学习维吾尔语过程中的语料,或是学习某一门课程所产生的语料,或是针对某个章节某个问题采集的语料等。因此,这些语料都缺乏一定的代表性。维吾尔语中介语语料库所采集的语料应该“点面结合”,尽可能穷尽性地搜集各个学校各年级所有学生学习维吾尔语过程中产生的维吾尔语中介语语料,保证所采集的语料富有代表性,为维吾尔语中介语研究、维语本体研究及偏误分析研究提供可靠的语言数据。

第二,维语中介语语料库的建设将为研究者提供比较全面的能够反映维语学习者的各种语言属性、个体特征等信息,为全方位地探索维语学习者语言特征提供重要参考依据。影响语言学习者习得效率的因素是多方面的,有智力方面的因素,也有诸如年龄、性别、学习环境、情感态度等非智力方面的因素。维吾尔语中介语语料库建设可以为研究者提供维语学习者相关的一些语言属性及个体特征,比如,性别、民族、年龄、学习阶段、所在学校、学习维语时间等信息。这为全方位地探寻维语学习者习得规律提供了重要的参考依据。

第三,维吾尔语中介语语料库的建设将为确定教学难点重点、语言项目的教学次序提供参考标准,能够对各种标准化维吾尔语测试和作文评分提供可靠依据。在第二语言教学过程中与目的语差别较大的地方通常是教学的重点和难点。吕叔湘曾指出,“第二语言教学要有的放矢”,“学生难以理解、经常出错或者避而不用的语法现象都是难点”。“有的放矢”就是指第二语言教学要有重点难点,不能“泛泛而教”,否则难易取得理想的教学效果。那么,如何把握维语教学的难点重点呢?“国内外长期教学的实践经验告诉我们,最重要的也是比较好操作的,是从教学偏误和语言对比中提取难点”,“偏误是由于母语的负迁移而产生的,因而由负迁移产生的偏误,往往是习得第二语言的难点”。如何掌握教学中的偏误呢?笔者认为,维吾尔语中介语语料库可以帮助教师便捷地实现对语料库中的偏误类型进行检索,对“学生经常出错、难易理解的或避而不用”偏误类型进行归纳,确定教学重点难点,做到“有的放矢”地教学。同时还可以对维吾尔语学习者的习得过程中产生的偏误类型进行定量统计分析,为语法项目的编排顺序以及维吾尔语语言能力测试提供重要的参考依据。

第四,维吾尔语中介语语料库的建设可以为维吾尔语教材编写提供可靠的参考。教材的设计和编写应服务于教学,适应于教学,应有助于学习者对教材及教材以外的语言事实的理解和掌握。因此,教材的编写要把握学习者习得规律,有助于学习者理解和掌握所学语言。维吾尔语中介语语料库可帮助教材编写者完成对维语学习者习得规律的把握。


三、维语中介语语料库建设思路、

构成及建库原则



维吾尔语语料库的建设将运用中介语理论、语料库语言学的理论和方法,搜集不同背景和不同学习阶段维吾尔语学习者的书面语语料60万词(指由词干与构词词尾或构形词尾构成的词符串)以上,并对语料属性、词汇、语法等单位进行计算机处理,形成熟语料,以实现对各种条件和要求下的语料数据进行便捷的机器检索和提取。语料收集对象主要针对新疆高校维吾尔语专业的本科生、非维吾尔语专业本科生、公务员维吾尔语培训班学员、干部维吾尔语培训班学员等,搜集上述学习者在学习维吾尔语过程中的成段成篇的语料,包括作文考卷、作文练习、作业、汉译维等,并对这些语料进行偏误类型标注。同时完整地记录每篇语料及写作语料学生的背景属性。这些背景属性包括姓名、性别、族别、身份、年级、班级、所在学校、学习维语的时间、写作语料的时间、语料来源、语料类别等内容。

根据对外汉语中介语语料库建设成功经验,维吾尔语中介语语料库主要由生语料库、熟语料库、统计信息库、相关信息库等四部分组成。生语料库存放未经任何标注的各高校维吾尔语学习者书面表达形式的语料,即写作语料,主要包括平时的作业、试卷中的所造的单句、语段、作文等。这些语料产出者的相关背景属性信息必须完备,便于按相关信息库提供的各种信息进行检索与输出并力争使这些语料的中部分语料有电子扫描版,可以直接呈现语料原貌,便于对维语学习者词语拼写偏误进行研究。熟语料库:存放经过标注加工过的维吾尔语中介语语料,即从词、维吾尔语语法范畴、语篇、标点符号等角度进行偏误标注的语料。统计信息库:存放各种统计数据,比如,词信息统计(词量及词频统计、词的各类偏误统计);各类语法范畴的统计(各类语法范畴的句量统计、涉及各类语法范畴类型的偏误句的统计);语篇信息统计(形式连接偏误统计、语义连接偏误统计);标点符号信息统计(各种标点符号的用量统计、各种标点符号的偏误统计)。相关信息库:存放学生相关背景信息和语料相关信息。学生背景信息包括:姓名(以代码形式显示)、性别、族别、身份、年级、班级、所在学校、学习维语的时间等内容。语料信息包括:标题、文体、字数、写作语料的时间、语料来源、语料类别等内容。

维吾尔语中介语语料库建设遵循以下几条建设原则:第一,语料真实性原则:所采集的语料必须是“原汁原味”的维吾尔语学习者习得维语过程中产生的原始语料。“语料录人采取实录原则,语料标注也要忠实原作,最大限度地保持语料原貌。录入时对语料不做任何修改订正,词、短语、句、篇、标点符号等方面的错误和书写格式均原样录入,以全面反映学生的实际语言表现”。第二,语料的平衡性原则:采集语料时从不同的学习阶段、不同的学校等方面考虑,保证语料的均衡,比如,一年级到四年级的语料、近四五年的语料以及各学校提供的语料量等都得保证一定的比例。第三,语料的标注体现维吾尔语特点的原则。维吾尔语属于黏着语,附加成分、虚词、词序、语调是维语常见的语法手段。维吾尔语的语法范畴有:数、格、人称、语态、能动一非能动、肯定一否定、式、体、时、级等语法范畴。构词词尾和构形词尾附着在词干上,形态变化非常丰富。因此,对语料标注时要充分考虑维语的这些语法特点,应从维语的这些语法范畴人手进行标注。第四,学生背景信息的完备性原则。搜集语料时注重学生信息的完备性,保证每一篇语料能和学生背景信息一一对应,“注重收集同一名学生/同一个学生群体在不同学习阶段/不同年级的语料。这部分语料能够反映学生的整个学习过程,在研究上有重要意义”。第五,便捷性原则:维吾尔语中介语语料库具备系统稳定、界面友好、方便快捷、检索功能等特点。


四、结语



维吾尔语是我国使用人口超过千万的少数民族语言之一,学习维吾尔语有利于新疆的民族团结、社会稳定、经济建设。维吾尔语中介语语料库是我国首次针对维吾尔语学习者拟建立的专用语料库,该语料库的建设将为维吾尔语中介语研究、维吾尔语教学研究、教材编写、维吾尔语水平测试、维吾尔语本体研究提供宝贵的语料资源,使维吾尔语偏误分析研究步人科学统计分析和定量分析的研究思路上,研究成果更具代表性和真实性。


【注】文章原载于《新疆大学学报》(哲学·人文社会科学版)2013年第3期。


声 明


分享到:


相關文章: