尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 近来,随着互联网的飞速发展,各种社交媒体大量涌现,在健康相关的医疗领域,出现了许多在线疾病问答网站。病人通过描述自己的遭遇、详细病情、用药和治疗情况等等来和医生进行交流并获取疾病相关的护理知识。在这样的疾病问答中,包含了许多个例的... 展开 近来,随着互联网的飞速发展,各种社交媒体大量涌现,在健康相关的医疗领域,出现了许多在线疾病问答网站。病人通过描述自己的遭遇、详细病情、用药和治疗情况等等来和医生进行交流并获取疾病相关的护理知识。在这样的疾病问答中,包含了许多个例的疾病信息,然而这些信息在文本中处于一种非结构化的状态。为了实现信息的充分利用,抽取和挖掘出其中有用的医疗知识,进行命名实体识别通常是第一步。 目前,在医疗领域,针对电子病历、各种医疗报告、医学文献等的实体识别工作已有不少,但针对医疗问答网站中的疾病问答信息尚未见到相关研究。本文即针对这样的问答信息首次进行了实体识别工作,关注了较为常见的五类疾病:胃炎,肺癌,哮喘,高血压和糖尿病。实验部分采用近年来较为先进的机器学习模型条件随机场进行训练和测试,抽取实体包含疾病、症状、药品、治疗方法和检查五类。在特征选取方面,除了使用一般的实体识别文本特征例如符号特征、词性特征、英文数字特征等等,还添加了医疗领域特有的一些特征,包括词的后缀特征、身体部位词语特征来辅助完成识别和抽取工作。实验结果显示,加入医疗领域特征后识别性能有了一定的提升。随后,本文采用了实验中最优的识别模型对网站上大量数据进行了医疗实体的识别抽取,并针对抽取结果进行了实体关系的挖掘。关系挖掘分别采用了两种方法:关联规则和相似度计算的方法。经实验证明,两种方法都取得了不错的挖掘效果。 通过对在线医疗问答进行实体识别和实体关系挖掘,本文验证了所提特征和方法的有效性,同时,该研究也为今后更好地认识疾病、了解疾病之间的关系提供了一个文本挖掘和探索的有效途径。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。