第一章 汉语中介语语料库建设总论

本章从宏观角度讨论汉语中介语语料库1建设的总体性问题,包括下列三个方面的内容:

一、语料库的建设与发展。汉语中介语语料库建设发轫于20世纪90年代并非偶然,而是有其深刻的时代背景,是对外汉语教学形势深入发展、学术研究需求迫切、语料库语言学迅速发展等因素共同作用的结果。其从简单粗放的1.0时代到精细而丰富的2.0时代的发展过程体现了对外汉语教学/汉语国际教育的不断进步、需求变化与深入发展。认识其发展规律,对语料库建设乃至应用研究,都有其重要意义。

二、语料库建设现状与问题,包括口语语料库建设的现状与问题。任何事物在其不同发展时期,会呈现不同的面貌,面临不同的问题。而针对不同的形势与问题分析原因,对症下药,制定解决问题的策略与方法,进而在实际工作中解决问题,不断进步。这是事物发展的共同规律,语料库建设亦不例外,只能在这样的循环往复中不断得到进步与发展。

三、语料库建设的基本原则。语料库建设中的某些基本要求,例如语料的真实性、系统性、平衡性,语料标注的科学性、“偏误标注+基础标注”的标注模式、“人标机助+机标人助”的标注方法,语料库使用的开放性、便捷性等,皆为语料库建设的重要原则,在建库过程中必须遵守。本章先做整体性阐述,后面一些章节在谈论相关具体问题时还会论及。

讨论上述问题的目的,是便于读者对语料库有一个总体上的认识与把握,能够更好地了解、认识与使用语料库,并更加深入地理解与探究本书后面五章所讨论的语料库总体设计与功能、语料标注、建设标准、软件系统研究等四个方面的具体问题。