尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 西夏文字数字化研究是保护西夏文字的重要内容之一。近年来,借助深度学习的发展中已有不少西夏文字识别系统被构建,可实现西夏文字的自动识别,解决了部分西夏文字识别困难的问题。但由于西夏文字结构很复杂,笔画很繁琐,相似性也很高,导致研究人... 展开 西夏文字数字化研究是保护西夏文字的重要内容之一。近年来,借助深度学习的发展中已有不少西夏文字识别系统被构建,可实现西夏文字的自动识别,解决了部分西夏文字识别困难的问题。但由于西夏文字结构很复杂,笔画很繁琐,相似性也很高,导致研究人员在对西夏文字数据集进行标注时难度较大,对相似文字的标注会耗费更多的时间和精力,且在监督学习中的识别中准确率也很低。同时由于西夏文献距今已久,保存并不完整,因此西夏文字的数据集中包含大量的残缺文字图片,导致西夏文字在残缺文字的识别准确率也不高。针对上述问题,本文开展了西夏文字的无监督识别算法研究。具体内容如下: (1)提出基于无监督双视图对比学习的西夏文字识别算法(Unsupervised Two View Comparative Model,UTVCM),解决了西夏文字数据集难标注、相似文字识别准确率低的问题。具体为:首先,提出西夏文字图片双视图的对比结构,通过改变图片本身色彩通道形成原始输入图片的正样本对,其余输入图片作为负样本对,利用了数据样本本身特征结构,省去了引入标签建立正负样本对的过程;其次,基于无监督双视图对比模型,在特征提取器中加入可变感知机,形成动态特征提取器,使提取到的文字局部结构特征更加贴合文字本身;然后,为使模型的正样本对表示在特征空间相距更近,而正负样本间的距离更远,改进了对比损失函数;最后,使用无监督双视图对比方法训练西夏文字识别模型,并对其识别性能进行了相关验证。实验结果表明:与其他监督学习和无监督学习相比,UTVCM实现了更高的识别准确率,而且由于网络中加入可变感知机使UTVCM算法在相似文字的识别上也达到了较高的识别准确率。 (2)提出一种基于无监督Transformer的西夏文字识别算法,解决了残缺西夏文字识别准确率的问题。首先,使用渐进式收缩型Transformer作为骨干网络并增加注意力机制,整合了文字的全局特征和局部特征,增强了模型的特征表达能力;其次,采用原始图像和掩码图像作为网络训练中的输入,提高残缺文字的识别准确率;然后,对不同的多层感知机设计方式进行实验比较;最后,使用无监督Transformer方法训练西夏文字识别模型并验证该模型的性能。实验结果表明,该模型在西夏文字数据集上的识别准确率超过了大多数无监督识别模型在该数据集上的识别准确率,同时也提高了残缺文字的识别准确率。 (3)基于上述两种算法,设计了西夏文字识别系统。实现了模型选择、结果展示,将所提出的模型及训练好的模型参数运用在识别系统,可以帮助研究人员快速识别文字,并提高了识别准确率,促进了西夏历史的研究。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。