尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 近年来,乳腺癌引发的死亡已经持续成为女性死亡原因的前几名,而且,乳腺癌的患病人群也越来越年轻化。因此,乳腺癌的诊断与治疗已经成为医学研究的重中之重。乳腺癌诊断情况复杂、影响因素多样,如何提高乳腺癌的诊断效率已经成为急需解决的问题。... 展开 近年来,乳腺癌引发的死亡已经持续成为女性死亡原因的前几名,而且,乳腺癌的患病人群也越来越年轻化。因此,乳腺癌的诊断与治疗已经成为医学研究的重中之重。乳腺癌诊断情况复杂、影响因素多样,如何提高乳腺癌的诊断效率已经成为急需解决的问题。针对上述情况,论文以UCI机器学习数据库中569例乳腺癌数据集为研究对象,分别采用支持向量机算法、随机森林算法、XGBoost算法和CatBoost算法建立乳腺肿瘤诊断分类器,并对研究结果进行对比分析,找到最优分类器。经过对决策树进行集成优化的XGBoost算法和CatBoost算法都有着很好的分类效果,CatBoost算法的准确率更是达到了99%,进一步提高了分类器的分类性能,从而有助于帮助医生对病情进行更加精准的诊断。论文的主要内容如下: (1)充分理解乳腺癌的临床诊断指标,选取合适的属性作为本次数据挖掘的研究对象,建立乳腺癌数据集。比较分析不同的数据挖掘算法在乳腺肿瘤数据集上的不同效果,从中找出最有效的方法。 (2)参考大量文献资料,寻求适用于乳腺肿瘤数据的分类算法,并介绍了所选取的SVM算法、随机森林算法、XGBoost算法和CatBoost算法; (3)将SVM算法、随机森林算法、XGBoost算法和CatBoost算法用于Python软件对数据集进行模拟试验,分析对比算法的优劣性; (4)对所建立的诊断分类器进行评估分析对比,找出最优分类器; (5)检验CatBoost模型的可行性,使用心脏病数据集验证CatBoost的优势性。 实施的实验结果表明,经过对四种算法进行参数优化建立模型,得到的诊断分类器中Catboost分类器性能最优,其分类准确率为99.4%,支持向量机分类器、随机森林分类器和XGBoost分类器的分类准确率分别为94.7%、95.3%、96.5%。而使用Boosting算法进行集成优化后的XGBoost算法和CatBoost算法都优于单个的支持向量机算法和随机森林算法,集成算法的AUC值上升了1%~4%。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。