尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: Web服务作为一种可重用、松耦合的分布式计算模型,近几年得到学术界和工业界的广泛关注。Web服务存在服务描述稀疏、语义表达模糊等问题,Web服务描述稀疏的现象导致用户不能准确高效的查询出满足个性化需求的Web服务,如何准确而高效地找到符合用户... 展开 Web服务作为一种可重用、松耦合的分布式计算模型,近几年得到学术界和工业界的广泛关注。Web服务存在服务描述稀疏、语义表达模糊等问题,Web服务描述稀疏的现象导致用户不能准确高效的查询出满足个性化需求的Web服务,如何准确而高效地找到符合用户需求的Web服务是制约Web服务应用发展的关键问题。目前针对于语义稀疏背景下的Web服务发现研究相对较少。为了解决Web服务中存在的语义稀疏问题,本文提出基于知识图谱与词嵌入的Web服务发现方法。 (1)一种是基于知识图谱同义词扩充的主题分布模型,首先对Web服务特征预处理,包括对服务名、服务标签、服务描述等进行分词、词性还原以及过滤停用词等操作;然后利用知识图谱wordNet将预处理后的Web服务文档进行同义词扩展,使服务描述语义更加丰富;最后通过LDA聚类算法对扩充的文本进行聚类,将服务组织到不同的潜在主题;根据检索词向量和主题词向量进行相似度比较,将同一主题的Web服务筛选出来推荐给用户,提高Web服务查询的查准率和查全率。为了验证模型的有效性,利用公共测试数据集OWLS-TC中真实注册的Web服务数据对两种模型设计了多组对比实验,实验结果表明,经过语义扩充后的Web服务语义更加丰富,描述更加具体,相比于传统关键字查询方法,查准率提高了10%左右,实验结果证明了提出算法的有效性。 (2)另一种是基于语义相似度的词嵌入主题模型,首先利用训练模型word2vec对服务描述的特征词汇进行词向量训练,得到连续词向量集合;再通过计算词向量之间的相似度筛选出相似度较高的词汇对文本进行语义扩充,扩充后的Web服务文档语义更加丰富;然后通过遍历用户查询的每一个特征词,将特征词映射为词嵌入,使用GaussianLDA聚类算法将同一主题的服务组织聚类到一起,Web服务查询效率更加高效。实验结果表明,基于语义相似度的词嵌入主题模型查准率和查全率都有一定程度的提高,相比于知识图谱同义词扩充,word2vec语义扩充效果更加理想,查询效率更高。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。