节点文献

基于不平衡分类的乳腺肿瘤预后预测方法的研究

免费订阅

【作者】 王哲杨日东周毅张学良王凯

【Author】 WANG Zhe;YANG Ridong;ZHOU Yi;ZHANG Xueliang;WANG Kai;School of Public Health, Xinjiang Medical University;Zhongshan School of Medicine,Sun Yat-Sen University;School of Medical Engineering and Technology, Xinjiang Medical University;

【通讯作者】 王凯;

【机构】 新疆医科大学公共卫生学院中山大学中山医学院新疆医科大学医学工程技术学院

【摘要】 目的探讨不平衡分类的乳腺癌数据集基于机器学习方法预测预后的生存状态。方法乳腺肿瘤预后的生存状态数据为不平衡数据,针对不平衡数据这一问题,本文使用SMOTE、Borderline-SMOTE、ADASYN、One-Sided Select处理乳腺肿瘤生存状态的不平衡数据。然后通过经典决策树、条件决策树、随机森林、支持向量机预测的准确率、敏感度、特异性、正例命中率、负例命中率来评价分类器的效果。结果 4种机器学习方法进行乳腺癌预后预测时,未经采样技术处理的原始数据集在预测准确率上均表现良好,其中支持向量机准确率最高,达90.42%。使用欠采样方法One-Sided Select技术,结合条件决策树预测,在不平衡的乳腺肿瘤数据集中预后预测效果最好,将敏感度由2%提高到58%,提高了56%。支持向量机在预测未经处理的数据集时特异性最高,为100%。采用One-Sided Select结合支持向量机算法的正例命中率最高,为40%。采用One-Sided Select结合条件决策树的负例命中率最高,为95%。结论对类不平衡数据预处理后可以较好的改善敏感度,通过对比发现采样技术中的One-Sided Select更适合于乳腺癌的预后模型。

【基金】 国家自然科学基金(61876194);国家重点研发计划(2018YFC0116902)
【所属期刊栏目】 公共卫生学与预防医学 (2019年04期)
  • 【分类号】R737.9;TP181
  • 【下载频次】141
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: