目录
引进
概念
运用原理
在引入数据分析时,首先需要消除异常值。 那个方法有叫做依达拉奉定律的东西。
概念
假设一组检测数据只包含随机误差,对其进行计算处理得到标准差,按一定概率确定一个区间,认为超出此区间的误差为粗大误差,而不是随机误差,包含该误差的数据应该剔除。
注:这种判别处理的原理和方法仅限于正规或接近正规分布的样本数据处理,并假定样本数据量足够大。
对于数据量较少的数据集,此方法不可靠,因此必须选择其他方法来消除偏离点。
运用原理
在正态分布中,表示标准偏差,表示平均值。 x=是图像的对称轴。
3原则:
分布在(-、 )上的概率为0.6826
数值分布为(-2、 2)概率为0.9544
数值分布为(-3、 3)概率为0.9974
y的可取值大部分集中在(-3, 3)区间,超出该范围的可能性只有不到0.3 ),可以认为是异常值而排除。
%matlab相关函数mean(x; %返回x的平均值STD(x ),%返回x的标准偏差