节点文献

一种基于模糊C均值聚类的稀疏数据缺失值填充方法

免费订阅

【作者】 张楷卉李鹏

【Author】 ZHANG Kaihui;LI Peng;College of Entrepreneurship Education, Heilongjiang University;School of Software and Microelectronics, Harbin University of Science and Technology;

【机构】 黑龙江大学创业教育学院哈尔滨理工大学软件与微电子学院

【摘要】 缺失数据处理通常基于统计学的方法,在数据预处理阶段对缺失值进行填补,其效率和准确性并不高。因此,提出了一种基于模糊C均值(FCM)聚类的嵌入式填充方法(FCMSI)。此算法通过平均比率法(ARM)对稀疏数据进行初始化填充;采用局部距离策略对FCM进行改进,并对数据进行聚类;将缺失数据作为变量,在每次聚类迭代后的簇内采用协同过滤(CF)的思想对变量值进行替换,直到结果收敛。利用UCI标准数据集进行对比实验,并采用三种不同评价指标衡量,验证了FCMSI方法比传统填充方法性能显著提高。

【基金】 国家自然科学基金资助项目(61103149);黑龙江省普通高校基本科研业务费专项资金资助(LGYC2018JQ003)
  • 【DOI】10.13482/j.issn1001-7011.2019.06.012
  • 【分类号】TP311.13
  • 【下载频次】46
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: