摘要 :
搭配作为语言能力的重要组成部分,其在语言习得过程中发挥着举足轻重的作用,学习者的搭配行为和搭配能力因此越来越受到国内外语言研究者的重视。Pawley&Syder(1983)指出,学习者若想获得接近本族语的选词能力和接近本族语的流利性就必须掌握大量的搭配结构。然而,对学习者搭配行为的研究却发现其在语言使用中普遍存在搭配知识缺乏的问题。而语料库(本族语语料库和学习者语料库)的出现使得对学习者搭配行为的大规模实证研究成为可能,基于语料库的搭配研究为人们重新审视语言使用中的搭配模式及其重要性提供了新的视角。
本研究基于“中国学生英语口笔语语料库”(SWECCL,Spoken and Written English Corpus of Chinese Learners),借助语料库检索工具WordSmith Tools5.0,采用对比中介语分析和计算机辅助错误分析的主要方法,研究中国英语学习者口语中的词汇搭配行为。其中对比中介语分析用于比较中国英语学习者和以英语为母语者的搭配使用(即搭配错误的判定和同/近义词的语义韵研究)以及不同水平英语学习者的搭配使用情况,计算机辅助错误分析则用于对搭配错误的描写和诊断分析。本研究从SWECCL的口语子库(SECCL)中抽取总计821,644词的口语语料,建成SECCL_TEM4和SECCL_TEM8两个语料库:SECCL_TEM4包含中国大学英语专业二年级学生口语语料,SECCL_TEM8包含英语专业四年级学生口语语料。于其中提取出六种搭配类型:动词-名词(C1),形容词-名词(C2),名词-动词(C3),名词-名词(包括名词+of+名词)(C4),副词-形容词(C5),动词-副词(C6),共计34,051项并对其中的搭配错误进行标注,以此为依据,从以下几方面对中国英语学习者口语中的词汇搭配使用进行深入探究:六种类型搭配及搭配错误在学习者口语语料库中的总体分布及频率,搭配错误的历时发展,不同水平英语学习者搭配行为的异同,不同类型搭配错误的特点及原因,学习者在口语和书面语中搭配使用的异同,以及学习者搭配行为中体现的语义韵特征等。在上述研究的基础上,总结归纳出中国英语学习者搭配使用和学习中存在的问题和难点,从而为改善大学英语教学,尤其是搭配教学提出实质性建议。
首先,对六种类型搭配及其错误的定量分析显示,在总计34,051项搭配中,判定为错误的搭配有4,476项,这其中动词-名词、形容词-名词和名词-名词这三种错误类型在所有搭配错误中所占比重最大,尤其在SECCL_TEM8中,这三类错误合计占搭配错误总量的90%以上,而所占比重最小的搭配错误是副词-形容词,其在SECCL_TEM4中占所有搭配错误的1.10%,在SECCL_TEM8中则仅占0.58%。与此同时,每种类型搭配的错误率也不尽相同,其中,名词-名词和动词-名词搭配的错误率最高,错误率最低的是动词-副词。由此可见,中国英语学习者对不同类型词汇搭配的掌握情况和使用能力不尽相同,出现频率最高的错误类型是动词-名词,形容词-名词和名词-名词错误,这其中对学习而言难度最大的是名词-名词和动词-名词搭配,而学习者对动词-副词搭配的掌握情况最好。更具体地说,根据语料库中每一类搭配的平均错误率对所有六种词汇搭配进行排序,难度从高到低依次是:名词-名词,动词-名词,形容词-名词,名词-动词,副词-形容词,和动词-副词。此外,对SECCL_TEM4中11年(1996-2006)的语料的历时分析结果表明六种搭配错误的数量11年来既有增加也有减少,但总体来说呈逐渐上升的趋势,而卡方测试结果(LL=172.166,p<0.001)显示搭配错误的数量在这期间显著性增加。由此可初步推断,我国英语专业二年级学生的搭配使用能力在过去一段时间并没有取得明显提高,搭配知识不足的问题依然存在,这也说明搭配教学仍是大学英语教学需要关注的重点之一。
第二,为考察不同水平英语学习者的搭配使用情况,即学习者的搭配能力是否伴随其整体语言水平的提高而提高,本研究对SECCL_TEM4和SECCL_TEM8中搭配错误的标准化频数进行比较。结果发现,SECCL_TEM8中每一类搭配错误的数量均显著性多于SECCL_TEM4,这就意味着英语水平相对较高的学习者,其正确使用搭配的能力似乎并没有优于英语水平相对较低的学习者,反而在实际的语言使用中出现了更多的搭配错误。造成上述学习者英语水平与搭配使用能力之间负相关的原因可以归结为以下两点:其一,TEM4和TEM8口语考试中试题的性质不同,前者为描述性试题,后者为论述类试题,难度较前者大,对学习者口语表达和逻辑思维能力的要求也更高;其二,英语水平相对较高的学习者(英语专业大四学生)在口语搭配中与英语水平相对较低的学习者(英语专业大二学生)相比更多地使用了频率相对更低、难度更大的词。用词汇分析软件RANGE分析比较不同水平学习者的词汇使用情况发现,英语水平相对较高的学习者使用词汇的多样化程度明显高于水平较低的学习者,故前者在口语表达中使用了更多样化的词汇,也创造了更多样化的搭配形式,这其中不乏低频的难词。同时,对SECCL_TEM4和SECCL_TEM8中搭配的数量进行比较的结果显示,SECCL_TEM8中的搭配数量显著性多于SECCL_TEM4。可见,高水平学习者在口语中使用的搭配数量也更多。然而,更多搭配错误的出现却说明,尽管在口语表达中使用了更多相对较难的词汇,创造了数量更大,更多样化的搭配形式,但对这些学习者来说,了解一个词的意思并不意味着可以准确找到与之相搭配的词,搭配知识的不足使得搭配错误不可避免。这说明,学习者搭配知识的增长速度要落后于其词汇量的增加速度,也就是说,学习者的搭配能力并没有伴随其整体语言水平的提高而提高,这也是造成相对高水平学习者在口语表达中出现更多搭配错误的直接原因。
第三,为深入探究中国英语学习者在口语搭配使用中存在的问题和难点,本研究在对语料库数据进行定量分析的基础上,进一步对不同类型搭配错误进行描写和诊断分析,以期揭示搭配错误的具体特征及造成错误的原因。描写分析采用James(1998)提出的对学习者错误的组合分类法,根据不同类型搭配错误的具体特征将每一类错误进一步细分为不同类型,并对每一类型进行定量和定性分析。结果显示,搭配错误的出现主要是由于学习者在使用某一词项的搭配时忽视或者没有充分掌握该词项的语义特征、搭配限制以及语义韵,而具体的错误不仅出现在构成搭配的某一词项上,也存在于搭配整体中。在动词-名词,形容词-名词,名词-动词,名词-名词,副词-形容词,和动词-副词搭配中,给学习者造成难度最大的成分分别是动词,形容词,动词,作修饰语的名词,形容词和副词。对六种类型搭配错误的诊断分析发现,搭配错误主要由语际迁移和语内迁移造成,据此可以将其分为语际错误和语内错误两种。前者主要由母语迁移(直译)造成,后者则可进一步归因于同/近义词误用,目标词选择错误/无视搭配限制,过度概括,自造词,以及对目标词用法的片面掌握。尽管造成错误的原因多种多样,但上述原因并不是独立发生作用的,而是相互联系、相互影响,换句话说,某一具体搭配错误的产生可能是几个不同原因共同作用的结果。此外,对六种类型搭配错误而言,其产生的原因各有异同,其中母语迁移和同/近义词误用是最普遍的原因(适用于全部六种搭配错误)。现将每种搭配错误的具体特征及原因概括如下:
描写分析将动词-名词搭配错误(CE1)分为动词误用、名词误用(包括名词数的误用)、动词所带介词误用、限定词误用、词不达意、冗余、难以界定类错误共7类,其中动词使用不当是CE1的主要特征,与动词有关的错误(包括动词误用和动词所带介词误用)在所有CE1中所占比重达到了56.14%。诊断分析发现,造成CE1的原因主要有母语迁移、同/近义词误用、目标词选择错误/无视搭配限制以及过度概括;形容词-名词搭配错误(CE2)分为形容词误用、表语形容词用作定语、名词误用(包括名词数的误用)、词不达意、冗余和难以界定类错误共6类,其中由形容词使用不当(包括形容词误用和表语形容词用作定语)造成的错误所占比重最大(55.57%),是CE2的主要特征。造成 CE2的原因则包括母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括和自造词;名词-动词搭配错误(CE3)分为名词误用、动词误用(包括动词语态误用)、主谓不一致、冗余和难以界定类错误共5类,其中由动词误用(包括动词语态误用)造成的错误占所有CE3的49.32%,是CE3的主要特征。诊断分析将CE3进一步归因于母语迁移、同/近义词误用、目标词选择错误/无视搭配限制及对目标词用法的片面掌握;名词-名词搭配错误(CE4)包含做修饰语的名词误用(包括名词数的误用)、做中心词的名词误用(包括名词数的误用)、名词+名词结构替代名词+of+名词、名词+of+名词结构误用、冗余、赘述、词不达意和难以界定类错误共8类,这其中做修饰语的名词误用造成的错误所占比重最大(34.69%),是CE4的主要特征。而CE4的出现主要由以下原因造成:母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括;副词-形容词搭配错误(CE5)分为副词误用、形容词误用(包括形容词比较级误用)、形容词和副词语序错误、冗余、词不达意和难以界定类错误等6类,其中形容词误用(包括形容词比较级误用)是CE5的主要特征。造成CE5的原因有母语迁移、同/近义词误用和过度概括等;动词-副词搭配错误(CE6)包含动词误用、副词误用、动词和副词语序错误、冗余和难以界定类错误共5类,而由副词误用引起的错误占所有CE6的57.62%,是其主要特征。造成CE6的原因有母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括和自造词。
第四,为比较学习者在口语和书面语中词汇搭配使用的异同,确定口语搭配区别于书面语的特征,本研究从SWECCL的口语(SECCL)和书面语(WECCL)子库中各抽取一个样本建成样本语料库SECCL_Sample和WECCL_Sample用于实证对比研究,同时将本研究关于口语搭配错误的特点与原因的发现与前人对书面语搭配错误研究的结论进行对比。结果发现,学习者在口语和书面语中均出现了一定数量、不同类型的搭配错误,而搭配使用的差异主要体现在搭配错误的数量上:口语中每一类搭配及其错误的数量均显著性少于书面语。同时口语中搭配的总体错误率(11.04%)也明显低于书面语(18.09%),这说明学习者在口语中对搭配的使用情况要优于书面语,对学习者而言,在写作中做出恰当搭配选择的难度似乎更高。造成这一差异的根本原因可以归结为口语和书面语自身性质的不同,即口语的不可规划性(unplanned/unplannable)和书面语的可规划性(planned/plannable)。在口语表达过程中,对说话者来说通常很难在保持口语输出流畅性的同时兼顾词汇使用的多样化,换句话说,为了能尽可能地将自己的想法连贯地表达出来,说话者常常不得不放弃使用更多样化或者说难度更高的词汇及其搭配。本族语者是如此,英语学习者更是如此。口语的自发性(spontaneity)大大限制了学习者在口语中能够使用的词汇及搭配的数量和多样性,他们在口语表达中更加依赖于那些习得较早、难度较低、使用起来更简单的词汇及其搭配。另一方面,在书面语写作过程中,学习者有较多时间用于安排写作的内容及其具体的表达方式,故而能使用更多样、更难的词汇用于创造更加多样化的搭配形式。然而,更多搭配错误的出现反而凸显了其搭配知识的不足。上述推测在对书面语和口语语料的定量分析中得到了证实:首先,比较SECCL_Sample和WECCL_Sample中的类符/形符比(Type/token ratio)发现,前者(6.03)明显低于后者(7.75),说明学习者在书面语中词汇使用的多样化程度高于口语,因此也创造了更多样化的搭配形式;其次,用词汇分析软件RANGE分析比较学习者在口语和书面语中的词汇使用特征,...
展开
搭配作为语言能力的重要组成部分,其在语言习得过程中发挥着举足轻重的作用,学习者的搭配行为和搭配能力因此越来越受到国内外语言研究者的重视。Pawley&Syder(1983)指出,学习者若想获得接近本族语的选词能力和接近本族语的流利性就必须掌握大量的搭配结构。然而,对学习者搭配行为的研究却发现其在语言使用中普遍存在搭配知识缺乏的问题。而语料库(本族语语料库和学习者语料库)的出现使得对学习者搭配行为的大规模实证研究成为可能,基于语料库的搭配研究为人们重新审视语言使用中的搭配模式及其重要性提供了新的视角。
本研究基于“中国学生英语口笔语语料库”(SWECCL,Spoken and Written English Corpus of Chinese Learners),借助语料库检索工具WordSmith Tools5.0,采用对比中介语分析和计算机辅助错误分析的主要方法,研究中国英语学习者口语中的词汇搭配行为。其中对比中介语分析用于比较中国英语学习者和以英语为母语者的搭配使用(即搭配错误的判定和同/近义词的语义韵研究)以及不同水平英语学习者的搭配使用情况,计算机辅助错误分析则用于对搭配错误的描写和诊断分析。本研究从SWECCL的口语子库(SECCL)中抽取总计821,644词的口语语料,建成SECCL_TEM4和SECCL_TEM8两个语料库:SECCL_TEM4包含中国大学英语专业二年级学生口语语料,SECCL_TEM8包含英语专业四年级学生口语语料。于其中提取出六种搭配类型:动词-名词(C1),形容词-名词(C2),名词-动词(C3),名词-名词(包括名词+of+名词)(C4),副词-形容词(C5),动词-副词(C6),共计34,051项并对其中的搭配错误进行标注,以此为依据,从以下几方面对中国英语学习者口语中的词汇搭配使用进行深入探究:六种类型搭配及搭配错误在学习者口语语料库中的总体分布及频率,搭配错误的历时发展,不同水平英语学习者搭配行为的异同,不同类型搭配错误的特点及原因,学习者在口语和书面语中搭配使用的异同,以及学习者搭配行为中体现的语义韵特征等。在上述研究的基础上,总结归纳出中国英语学习者搭配使用和学习中存在的问题和难点,从而为改善大学英语教学,尤其是搭配教学提出实质性建议。
首先,对六种类型搭配及其错误的定量分析显示,在总计34,051项搭配中,判定为错误的搭配有4,476项,这其中动词-名词、形容词-名词和名词-名词这三种错误类型在所有搭配错误中所占比重最大,尤其在SECCL_TEM8中,这三类错误合计占搭配错误总量的90%以上,而所占比重最小的搭配错误是副词-形容词,其在SECCL_TEM4中占所有搭配错误的1.10%,在SECCL_TEM8中则仅占0.58%。与此同时,每种类型搭配的错误率也不尽相同,其中,名词-名词和动词-名词搭配的错误率最高,错误率最低的是动词-副词。由此可见,中国英语学习者对不同类型词汇搭配的掌握情况和使用能力不尽相同,出现频率最高的错误类型是动词-名词,形容词-名词和名词-名词错误,这其中对学习而言难度最大的是名词-名词和动词-名词搭配,而学习者对动词-副词搭配的掌握情况最好。更具体地说,根据语料库中每一类搭配的平均错误率对所有六种词汇搭配进行排序,难度从高到低依次是:名词-名词,动词-名词,形容词-名词,名词-动词,副词-形容词,和动词-副词。此外,对SECCL_TEM4中11年(1996-2006)的语料的历时分析结果表明六种搭配错误的数量11年来既有增加也有减少,但总体来说呈逐渐上升的趋势,而卡方测试结果(LL=172.166,p<0.001)显示搭配错误的数量在这期间显著性增加。由此可初步推断,我国英语专业二年级学生的搭配使用能力在过去一段时间并没有取得明显提高,搭配知识不足的问题依然存在,这也说明搭配教学仍是大学英语教学需要关注的重点之一。
第二,为考察不同水平英语学习者的搭配使用情况,即学习者的搭配能力是否伴随其整体语言水平的提高而提高,本研究对SECCL_TEM4和SECCL_TEM8中搭配错误的标准化频数进行比较。结果发现,SECCL_TEM8中每一类搭配错误的数量均显著性多于SECCL_TEM4,这就意味着英语水平相对较高的学习者,其正确使用搭配的能力似乎并没有优于英语水平相对较低的学习者,反而在实际的语言使用中出现了更多的搭配错误。造成上述学习者英语水平与搭配使用能力之间负相关的原因可以归结为以下两点:其一,TEM4和TEM8口语考试中试题的性质不同,前者为描述性试题,后者为论述类试题,难度较前者大,对学习者口语表达和逻辑思维能力的要求也更高;其二,英语水平相对较高的学习者(英语专业大四学生)在口语搭配中与英语水平相对较低的学习者(英语专业大二学生)相比更多地使用了频率相对更低、难度更大的词。用词汇分析软件RANGE分析比较不同水平学习者的词汇使用情况发现,英语水平相对较高的学习者使用词汇的多样化程度明显高于水平较低的学习者,故前者在口语表达中使用了更多样化的词汇,也创造了更多样化的搭配形式,这其中不乏低频的难词。同时,对SECCL_TEM4和SECCL_TEM8中搭配的数量进行比较的结果显示,SECCL_TEM8中的搭配数量显著性多于SECCL_TEM4。可见,高水平学习者在口语中使用的搭配数量也更多。然而,更多搭配错误的出现却说明,尽管在口语表达中使用了更多相对较难的词汇,创造了数量更大,更多样化的搭配形式,但对这些学习者来说,了解一个词的意思并不意味着可以准确找到与之相搭配的词,搭配知识的不足使得搭配错误不可避免。这说明,学习者搭配知识的增长速度要落后于其词汇量的增加速度,也就是说,学习者的搭配能力并没有伴随其整体语言水平的提高而提高,这也是造成相对高水平学习者在口语表达中出现更多搭配错误的直接原因。
第三,为深入探究中国英语学习者在口语搭配使用中存在的问题和难点,本研究在对语料库数据进行定量分析的基础上,进一步对不同类型搭配错误进行描写和诊断分析,以期揭示搭配错误的具体特征及造成错误的原因。描写分析采用James(1998)提出的对学习者错误的组合分类法,根据不同类型搭配错误的具体特征将每一类错误进一步细分为不同类型,并对每一类型进行定量和定性分析。结果显示,搭配错误的出现主要是由于学习者在使用某一词项的搭配时忽视或者没有充分掌握该词项的语义特征、搭配限制以及语义韵,而具体的错误不仅出现在构成搭配的某一词项上,也存在于搭配整体中。在动词-名词,形容词-名词,名词-动词,名词-名词,副词-形容词,和动词-副词搭配中,给学习者造成难度最大的成分分别是动词,形容词,动词,作修饰语的名词,形容词和副词。对六种类型搭配错误的诊断分析发现,搭配错误主要由语际迁移和语内迁移造成,据此可以将其分为语际错误和语内错误两种。前者主要由母语迁移(直译)造成,后者则可进一步归因于同/近义词误用,目标词选择错误/无视搭配限制,过度概括,自造词,以及对目标词用法的片面掌握。尽管造成错误的原因多种多样,但上述原因并不是独立发生作用的,而是相互联系、相互影响,换句话说,某一具体搭配错误的产生可能是几个不同原因共同作用的结果。此外,对六种类型搭配错误而言,其产生的原因各有异同,其中母语迁移和同/近义词误用是最普遍的原因(适用于全部六种搭配错误)。现将每种搭配错误的具体特征及原因概括如下:
描写分析将动词-名词搭配错误(CE1)分为动词误用、名词误用(包括名词数的误用)、动词所带介词误用、限定词误用、词不达意、冗余、难以界定类错误共7类,其中动词使用不当是CE1的主要特征,与动词有关的错误(包括动词误用和动词所带介词误用)在所有CE1中所占比重达到了56.14%。诊断分析发现,造成CE1的原因主要有母语迁移、同/近义词误用、目标词选择错误/无视搭配限制以及过度概括;形容词-名词搭配错误(CE2)分为形容词误用、表语形容词用作定语、名词误用(包括名词数的误用)、词不达意、冗余和难以界定类错误共6类,其中由形容词使用不当(包括形容词误用和表语形容词用作定语)造成的错误所占比重最大(55.57%),是CE2的主要特征。造成 CE2的原因则包括母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括和自造词;名词-动词搭配错误(CE3)分为名词误用、动词误用(包括动词语态误用)、主谓不一致、冗余和难以界定类错误共5类,其中由动词误用(包括动词语态误用)造成的错误占所有CE3的49.32%,是CE3的主要特征。诊断分析将CE3进一步归因于母语迁移、同/近义词误用、目标词选择错误/无视搭配限制及对目标词用法的片面掌握;名词-名词搭配错误(CE4)包含做修饰语的名词误用(包括名词数的误用)、做中心词的名词误用(包括名词数的误用)、名词+名词结构替代名词+of+名词、名词+of+名词结构误用、冗余、赘述、词不达意和难以界定类错误共8类,这其中做修饰语的名词误用造成的错误所占比重最大(34.69%),是CE4的主要特征。而CE4的出现主要由以下原因造成:母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括;副词-形容词搭配错误(CE5)分为副词误用、形容词误用(包括形容词比较级误用)、形容词和副词语序错误、冗余、词不达意和难以界定类错误等6类,其中形容词误用(包括形容词比较级误用)是CE5的主要特征。造成CE5的原因有母语迁移、同/近义词误用和过度概括等;动词-副词搭配错误(CE6)包含动词误用、副词误用、动词和副词语序错误、冗余和难以界定类错误共5类,而由副词误用引起的错误占所有CE6的57.62%,是其主要特征。造成CE6的原因有母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括和自造词。
第四,为比较学习者在口语和书面语中词汇搭配使用的异同,确定口语搭配区别于书面语的特征,本研究从SWECCL的口语(SECCL)和书面语(WECCL)子库中各抽取一个样本建成样本语料库SECCL_Sample和WECCL_Sample用于实证对比研究,同时将本研究关于口语搭配错误的特点与原因的发现与前人对书面语搭配错误研究的结论进行对比。结果发现,学习者在口语和书面语中均出现了一定数量、不同类型的搭配错误,而搭配使用的差异主要体现在搭配错误的数量上:口语中每一类搭配及其错误的数量均显著性少于书面语。同时口语中搭配的总体错误率(11.04%)也明显低于书面语(18.09%),这说明学习者在口语中对搭配的使用情况要优于书面语,对学习者而言,在写作中做出恰当搭配选择的难度似乎更高。造成这一差异的根本原因可以归结为口语和书面语自身性质的不同,即口语的不可规划性(unplanned/unplannable)和书面语的可规划性(planned/plannable)。在口语表达过程中,对说话者来说通常很难在保持口语输出流畅性的同时兼顾词汇使用的多样化,换句话说,为了能尽可能地将自己的想法连贯地表达出来,说话者常常不得不放弃使用更多样化或者说难度更高的词汇及其搭配。本族语者是如此,英语学习者更是如此。口语的自发性(spontaneity)大大限制了学习者在口语中能够使用的词汇及搭配的数量和多样性,他们在口语表达中更加依赖于那些习得较早、难度较低、使用起来更简单的词汇及其搭配。另一方面,在书面语写作过程中,学习者有较多时间用于安排写作的内容及其具体的表达方式,故而能使用更多样、更难的词汇用于创造更加多样化的搭配形式。然而,更多搭配错误的出现反而凸显了其搭配知识的不足。上述推测在对书面语和口语语料的定量分析中得到了证实:首先,比较SECCL_Sample和WECCL_Sample中的类符/形符比(Type/token ratio)发现,前者(6.03)明显低于后者(7.75),说明学习者在书面语中词汇使用的多样化程度高于口语,因此也创造了更多样化的搭配形式;其次,用词汇分析软件RANGE分析比较学习者在口语和书面语中的词汇使用特征,
收起