摘要 :
目的/意义:研究合著网络评价指标和文献计量学评价指标之间的具体相关性.方法/过程:以Web of Science收录的妇产科学、凝聚态物理学、有机化学、图书情报学4个领域的期刊论文作者为研究对象,分别计算4个领域的作者合著网络指标和文献计量学指标,研究其...
展开
目的/意义:研究合著网络评价指标和文献计量学评价指标之间的具体相关性.方法/过程:以Web of Science收录的妇产科学、凝聚态物理学、有机化学、图书情报学4个领域的期刊论文作者为研究对象,分别计算4个领域的作者合著网络指标和文献计量学指标,研究其相关性.结果/结论:点度中心度、最接近中间度和互信息与作者发文量最相关.到达中心度、接近中心度与被引频次和篇均被引频次的相关程度均较高.模块中心度与作者的发文量和被引频次呈负相关关系.局部聚类系数与发文量、被引频次和篇均被引频次相关性差或者不相关.
收起
摘要 :
目的:生物医学知识库—PubMed是研究生物医学的重要资源,针对某一具体问题时,如何从PubMed中抓取领域内高度相关的文献是非常具有挑战意义的.本文提出了一种基于主题词_概念网络模型衡量文献相关性的新方法.
方法:以2005年TREC(Text Retrieval C...
展开
目的:生物医学知识库—PubMed是研究生物医学的重要资源,针对某一具体问题时,如何从PubMed中抓取领域内高度相关的文献是非常具有挑战意义的.本文提出了一种基于主题词_概念网络模型衡量文献相关性的新方法.
方法:以2005年TREC(Text Retrieval Conference)基因组项目的4240篇文献为研究语料库.抽取文献主题词(Medical Subject Heading,MeSH)计算它们之间的语义相似性,并以主题词为节点构造主题词相似网络;向网络中添加标题摘要中经UMLS超级词典(Unified Medical Language System Metathesaurus)过滤的语义概念增强网络;接着通过RWR(Random Walk with Restart)算法生成语义特征向量从而确定文献相似性;最后与PubMed的PMRA(PubMed Related Article)算法进行比较.
结果:依据语料库金标准,RWR算法与PMRA算法的ROC曲线(Receiver Operating Characteristic Curve)下面积分别为0.93,0.67.且不同相似度阈值下RWR算法的准确率也高于PMRA算法.
结论:基于主题词_概念网络模型的RWR方法有助于揭示文献间的隐性关系和语义关联,能够提高检索效率和发现具有特定语义信息的文献集合.相关数据和代码可从www.获取.
收起