标题:不同类别非完整大数据中缺失数据填充算法
作者:王玮;苏琦;周伟;刘荫;张宾;
作者机构:[王玮;苏琦;周伟;刘荫;张宾]国网山东省电力公司信息通信公司;[王玮;苏琦;周伟;刘荫;张宾]山东大学计算机学院
来源:科学技术与工程
出版年:2018
期:08
页码:91-96
关键词:不同类别;;非完整;;大数据;;缺失数据;;填充
摘要:针对目前缺失数据填充算法精度低、运行效率低、内存占用率大的特点,提出一种新的不同类别非完整大数据中缺失数据填充算法。通过2个定理阐述了缺失数据填充算法的原理,给出信息熵的计算过程。输入根据数据集构建的决策表和不同类别非完整大数据中缺失数据的最大值、最小值、填充步长。求出其他类指标和某类指标的相关性,得到数据集,求出权重系数;计算初始数据库的信息熵,通过相关理论或经验对缺失数据区间下限进行设定;用一个很小的区间数据取代缺失数据,根据给出的步长不断扩大区间范围,绘制出每一步信息熵状况,将其与初始数据库信息熵相比,实现缺失数据填充。实验结果表明,所提算法精度高、运行效率高、内存占用率低。
资源类型:期刊论文
原文链接:http://kns.cnki.net/kns/detail/detail.aspx?FileName=KXJS201808015&DbName=CJFQTEMP
TOP