尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 检务公开作为司法领域机关为民服务的重要举措之一,是提高检察机关监督体系、规范司法行为、促进司法管理的重要组成部分。2018年最高人民检察院印发《全国检察机关智慧检务行动指南(2018-2020年)》,将“智慧检务”列入司法领域智能化发展战略,在推进... 展开 检务公开作为司法领域机关为民服务的重要举措之一,是提高检察机关监督体系、规范司法行为、促进司法管理的重要组成部分。2018年最高人民检察院印发《全国检察机关智慧检务行动指南(2018-2020年)》,将“智慧检务”列入司法领域智能化发展战略,在推进检务智能化的基础上,提高司法领域信息公开和司法领域规范的强度。 本论文利用检务公开领域的核心起诉书,通过大数据、人工智能及自然语言处理技术,设计以起诉书为基础的检务公开领域知识图谱,挖掘孤立、离散的起诉书信息,并提取案件中有价值的信息,将检察院、被告、检察员等提供的重要信息进行关联;在处理海量的起诉书文本过程中,利用知识图谱提高查找的效率和精确度,为知识推送(类案推送、文书推送、法条推送等)和智能问答等应用提供底层数据和技术支持。本论文中针对检务公开领域知识图谱的设计,涵盖本体设计、知识抽取、知识存储、图谱可视化等知识图谱构建方面的研究。具体而言,本论文的主要工作和创新点概括如下: (1)检务公开领域本体设计。以检务公开中的起诉书为核心,首先分析检务公开领域的需求与知识,进而划分该领域中实体概念、实体属性和实体之间的相互关系,构建起诉书信息模型。分析构建本体的方法和检务领域的专业术语与起诉书的特点,选择实用性高的“七步法”进行相应修改,提出适合本文中本体的建模方法,并应用改进的方法构建检务公开领域本体。 (2)基于深度学习的知识抽取研究。由于检务公开领域的特殊性,起诉书的实体和属性标注的数据十分匮乏,通用知识抽取工具的抽取效果欠佳。本论文根据起诉书的特点,提取案件起诉书的关键词,并过滤无关信息,在此基础上提出基于BI-LSTM+CRF模型的命名实体识别模型。然而,检务公开涉及较强的专业性和较多术语,起诉书中存在大量的嵌套实体,且其具有特定的书写规范,导致了该模型在起诉书实体识别中不理想的应用效果。基于此,本论文提出了改进的BI-LSTM+CRF模型。实验表明,应用改进的模型能将P、R和F值分别提高4.14%、3.88%和4%,从而验证了改进模型的有效性。 (3)检务公开领域知识图谱系统设计。通过分析系统需求,设计了检务公开知识图谱系统架构;结合图数据存储技术与检务公开领域本体特点,设计了知识图谱存储方法;通过构建原型系统,展示了检务公开领域知识图谱系统与用户的交互,实现了知识管理、知识查询和知识推送等功能。 综上所述,本论文瞄准检务公开中的起诉书数据,主要解决了检务人员与群众如何迅速的从起诉书中获取需要的信息及相关联的信息。通过结合起诉书特点,研究起诉书的本体模型和实体识别方法,在传统的本体建模方法“七步法”上进行改进,并提出了融合起诉书特征的BI-LSTM+CRF识别模型,解决了现有的实体识别模型BI-LSTM+CRF对起诉书实体的识别不足与缺点;最终,实现对孤立非结构化数据的结构化存储,并通过知识图谱描述起诉书中各类实体的信息及之间的关系,提高了信息查询的准确率和高效性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。