尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 乳腺癌(Breast Canner,BC)的发病率不断升高,且乳腺癌已不仅仅局限于中老年人群之间,患者正在趋于年轻化。早期和中期乳腺癌患者及时发现和治疗可以争取治愈,对于晚期乳腺癌患者可以延长寿命,改善其生活状态。但是,目前缺少能够有效协助医生对... 展开 乳腺癌(Breast Canner,BC)的发病率不断升高,且乳腺癌已不仅仅局限于中老年人群之间,患者正在趋于年轻化。早期和中期乳腺癌患者及时发现和治疗可以争取治愈,对于晚期乳腺癌患者可以延长寿命,改善其生活状态。但是,目前缺少能够有效协助医生对乳腺癌进行诊断的研究。在对乳腺癌进行数据诊断之前,对乳腺癌数据的处理也是至关重要的,需要在一定程度上补充原始数据集中的缺失值和选择适合的特征子集对乳腺癌进行辅助诊断建模。 对于解决数据缺失问题,本研究首先从纵横两个方面对原始数据集的缺失机制进行分析,然后从原始数据集中提取完整的数据子集,对完整的数据子集设置5%、10%、20%、30%以及40%的随机缺失比例。对不同缺失比例数据集中的每个特征使用K近邻(K-Nearest Neighbor,KNN)、随机森林(Random Forest,RF)、多重插补(Multiple Imputation,MI)和中心趋势值插补(Central Trend Value Imputation,CTVI)进行缺失值估计。最后融合不同缺失比例下不同方法每个特征的秩从而选出最适合的插补方法。 为了解决乳腺癌超声数据集的特征不相关以及特征冗余问题,首先使用方差法、信息增益法以及相关系数法对特征进行排序,对特征分配权重进行结果融合,得到最终排序结果。最终排序后的特征根据专家知识、重要性、皮尔逊相关系数删除不相关特征和冗余特征。把序列向前选择和朴素贝叶斯(Naive Bayes,NB)、决策树、RF结合得到不同方法对应不同特征子集的准确率。最后依据准确率选出最优特征子集。 超声检查是乳腺癌诊断在临床医学界公认的可靠标准,但是传统的人工检测可能误诊或漏诊。利用机器学习辅助诊断建模,由于单个模型无法确保其泛化性,不足以辅助临床诊断。因此,本文提出了一种基于堆叠的集成学习模型,该模型具有两层学习结构,通过所提出的堆叠方法确定两层结构的分类器组合。根据实验结果可知,本研究所提出的模型在一定程度上提高了乳腺癌的预测准确率,可以为医生诊断乳腺癌提供理论上帮助。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。