数据缺失如何处理?
我想对一组数据进行线性回归分析,可是在导入的时候才发现,其中有很多数据缺失,请问这时候我该怎么解决?插值还是........?如果是插值应该如何弄?谢谢我上传一下数据,看各位能不能帮我一下
[ 本帖最后由 ChaChing 于 2009-7-1 22:29 编辑 ]
回复 楼主 的帖子
找本数值算法的书看看,里面有插值[ 本帖最后由 ChaChing 于 2009-7-1 22:31 编辑 ] 看完LZ的数据, 才知道LZ所谓的数据缺失有两类! 一类是整行全无数据(可处理), 另一类是列中一整段数据缺失(个人认为已不可处理见附图)!
一时还真不知如何读入LZ的数据! 待高人路过, 看有无好方法! 我是将其复制至excel, 存成xx.xls档再处理!
clc; clear
aa= xlsread('b1.xls', 'A2:I1478'); plot(aa); %原始资料
row=all(isnan(aa),2); %找寻整行全无数据
aa(find(row),:)=[]; figure; plot(aa)
col=any(isnan(aa));%找寻列中有数据缺失
figure; plot(aa(:, find(col))) 用Matlab中的misdata()方法试试,虽然参数化方法并不是一种好方法,不过有时挺有效果的
页:
[1]