尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 复杂疾病如癌症等往往是由多基因异常引起的系统性疾病,基因突变、拷贝数变异以及基因表达失衡等均可能成为肿瘤发生的原因或表现。传统的“一药一靶”药物研发策略已经被证明存在一定的缺陷,比如容易产生耐药性和毒副作用等。此外生物系统的鲁棒性使... 展开 复杂疾病如癌症等往往是由多基因异常引起的系统性疾病,基因突变、拷贝数变异以及基因表达失衡等均可能成为肿瘤发生的原因或表现。传统的“一药一靶”药物研发策略已经被证明存在一定的缺陷,比如容易产生耐药性和毒副作用等。此外生物系统的鲁棒性使得单一药物很难完全抑制肿瘤细胞的生长。肿瘤的化学治疗要求药物可以作用于多个靶点和多条信号通路,并从多个靶点和通路上阻止疾病相关信号的发生、传导和作用。组合药物疗法是多靶点治疗中最常使用的一种疗法,其具有毒性低、效率高等优点。因此建立协同组合药物筛选的方法具有重要意义。筛选协同组合药物的传统方法是实验筛选法,然而实验筛选法往往成本很高且效率低下,只能发现少量具有协同作用的药物组合,而基于计算机模拟的方法对协同药物进行筛选具有通量大、效率高、成本低和污染少等优点。随着多组学数据的大量积累和生物信息学技术的不断发展,使用计算机模拟的方法有望代替实验筛选法进行协同药物筛选。因此对于肿瘤研究人员来说,建立一种有效的预测抗癌协同药物的计算模型将会具有重要意义。 近年来,基于计算模型预测协同药物的研究发展迅速。根据构建预测模型时使用机器学习算法的不同,可将这些模型分为无监督学习预测模型、半监督学习预测模型和监督学习预测模型。其中监督学习预测模型中较常使用的是随机森林算法(Random Forest)。基于随机森林算法的模型需要适量的有标记样本做训练集数据,然后进行特征设计,再对有标记样本进行特征值打分。这些预测模型的核心是所设计的特征。这些特征往往是基于药物表型数据设计的,如药物靶点、化学结构等。尽管这些特征也是药物的重要特征,但是这些特征并不能全面地反映药物的药理学特性。药物基因组学数据(药物处理细胞系后的表达谱数据)可以精确地反映药物对细胞系的扰动情况,能够从一定程度上反映药物的药理学特性。因此特征设计时,需要综合考虑药物表型特征和药物基因组学特征。 本研究以DREAM Challenge7 sub-challenge2中已知的协同药物组合、叠加药物组合和拮抗药物组合为基础,结合相应的药物表型数据和药物处理细胞系后的基因表达谱数据,设计和分析了21个组合药物的特征(包括药物表型特征和药物基因组学特征)。通过使用随机森林算法进行特征筛选、模型构建,得到了最优预测模型。然后我们筛选出Connectivity Map数据库中美国食品与药品监察管理局(U.S. FDA)已批准的抗癌药物。并将这些药物表型数据及其相应的基因表达谱数据作为测试集数据,应用到最优预测模型中预测协同组合药物并评估模型的预测效果。我们构建的最优预测模型在训练集数据上分类错误率(Out-of-bag estimate error rate)为0.15,曲线下面积(Area Under Curve)为0.89。Connectivity Map中符合要求的药物共组成187对抗癌药物组合。我们的最优预测模型(SyDRa)预测出这187对药物组合中有28对为潜在协同组合药物。通过公共数据库进行文献检索,我们发现其中有3对药物组合已经被报道为有效的药物组合,即:azacitidine和 thalidomide, imatinib和 paclitaxel, streptozocin和carmustine。可见SyDRa具有较好的预测能力。 综上所述,本研究分析和筛选了与协同组合药物预测有关的重要特征,其中包括药物表型数据特征和药物基因组学数据特征。同时构建了一个基于监督学习算法的协同组合药物预测模型,该模型可为大规模协同药物组合的初筛提供参考。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。