尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 汉字字频是汉字除形、音、义三个要素外的第四要素。考察历代古籍字频,有助于深入了解汉字的发展演变,同时对研究古代汉语的用字面貌、研究历代社会思想及文化风貌的变迁有着重要意义。本文通过考察国内外有关汉字字频的研究现状后发现,前人的研究... 展开 汉字字频是汉字除形、音、义三个要素外的第四要素。考察历代古籍字频,有助于深入了解汉字的发展演变,同时对研究古代汉语的用字面貌、研究历代社会思想及文化风貌的变迁有着重要意义。本文通过考察国内外有关汉字字频的研究现状后发现,前人的研究成果较少,其中以专书字频研究为主,历时字频研究次之,而断代字频研究则凤毛麟角。本文即以断代字频研究为切入点,选取两汉魏晋南北朝时期的古籍文献作为研究对象和原始语料,分别从宏观、历时、共时三个角度,对两汉魏晋南北朝时期古籍字频进行全面系统地统计,得到一手数据,并基于这些数据进行字频分布情况研究。 本文首先依据汉语古籍语料库完整性、穷尽性、准确性等建库原则,分别构建了两汉魏晋南北朝古籍总汇语料库、两汉魏晋南北朝古籍历时语料库和两汉魏晋南北朝古籍共时语料库。接着对总汇语料库进行了字频统计和字频分级,进而分析发现,总汇语料库的字频大致符合Zipf分布,且核心字区、一用字区字频分布都很不均匀,其中古籍内容对一用字区的字频分布影响显著。同时,两汉魏晋南北朝的字频分布比先秦均匀一些,先秦古籍字频分布差异化特点更加突出。之后,本文对历时语料库下4个子库进行了字频统计,从历时角度比较分析了两汉、三国、两晋、南北朝4个历史阶段古籍用字的情况。通过计算各历史阶段古籍极高频字的莱文斯坦距离,本文发现彼此时代越接近,极高频字的字频分布也越接近;而在一用字字频分布上,两汉一用字的分布最不均匀,两晋一用字相较而言分布最均匀,差异化较小。最后,本文又对共时语料库下18个子库进行了字频统计,从共时角度比较分析了不同类别古籍用字的情况,发现在总字量、单字量、平均字频、离散系数、汉字一阶熵上,18个子库之间都存在较大差异,且前4个数据指标之间呈现出不同程度的线性相关性。此外,18个子库的极高频字大量分布于具有不同类别古籍特点的实词类字眼中。 至此,通过使用语料库语言学方法、计算机编程方法和统计学方法,同时以一种更为全面的视角,本文完成了对两汉魏晋南北朝时期古籍字频统计和分布的研究,在一定程度上弥补了两汉魏晋南北朝断代字频研究的空白。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。