摘要:
随着语义Web的快速发展,近几年来本体的数目越来越多,本体规模也不断增大,大规模本体的集成、重用、维持以及共享逐渐成为亟待解决的重要问题。本文就大规模本体分块与映射问题进行了研究。 首先,本文简单介绍了课题的研究背景,总结了当前常用的本...
展开
随着语义Web的快速发展,近几年来本体的数目越来越多,本体规模也不断增大,大规模本体的集成、重用、维持以及共享逐渐成为亟待解决的重要问题。本文就大规模本体分块与映射问题进行了研究。 首先,本文简单介绍了课题的研究背景,总结了当前常用的本体映射技术以及部分本体映射系统,并对大规模本体映射问题做了简单分析和介绍。 其次,针对当前现有的语义相似度计算方法没有充分利用本体的语义信息及其它方面的不足,提出了基于本体特征的语义相似度计算方法。该方法首先将概念的特征信息量化为一个集合形式,集合中的元素称为特征属性,然后通过计算两个集合间的相似度值得到概念的相似度,再引入深度和宽度影响因素,得出最终的相似度计算公式。理论和实验证明,该方法计算简便,结果准确。 再次,针对现有大规模本体映射方法所存在的自动化程度不高,分块大小不均匀等问题,提出了一种基于片段映射的大规模本体分块映射方法。该方法采用分治法的思想,将整个本体映射过程分为本体分块、片段映射以及片段内映射发现三个部分。首先,采用凝聚的层次聚类算法,将本体划分成大小合适的小规模本体片段集合;然后采用一种基于参考点的启发式方法,通过分析参考点的分布,对本体片段进行匹配,找到正确的片段映射。最后,采用多种策略相结合的方法,进一步发现源本体和目标本体中各个实体元素之间的映射。 最后,根据上述研究,本文设计并实现SLOM大规模本体映射系统。按照OAEI的评价方法,和已有大规模本体映射系统相比,具有更好的分块结果和片段映射质量,该系统不仅保证了查全率,同时也明显提高了查准率。
收起