第三节 语料来源

本研究所采用的汉语语料主要来自北京大学中国语言学研究中心开发的汉语语料库和国家语委现代汉语语料库,并通过网络搜索得到部分语料。古代汉语语料来自北大语料库的古代汉语部分和瀚堂典藏数据库。由于条件所限,我们未能进行大规模的口语语料搜集。文中所用的口语语料一部分来自电视节目和网络视频,另一部分来自日常会话。

为了确保网络语料的合格性,我们尽量挑选语句完整、无歧义的语例;为了增强语料的说服力,我们在选取语料时兼顾不同作家、不同语体的作品,以尽量保持语料选择的平衡。部分语料没有标出处,为自拟例句。其他语种的自拟例句,其合格性都经过本族语使用者的认定。