首页 > 编程知识 正文

python编写计算方差的函数,numpy计算协方差

时间:2023-05-04 18:54:58 阅读:50268 作者:267

一、原理介绍中常用的数据标准化方法有最大最小规范化、均方差标准化、小数定标法、定量特征二值化等。 其中,均值方差标准化是将数据转换为标准正态分布的标准化方法。 在回归模型中,遵循正态分布的自变量和因变量往往对应于较高的回归预测效果。 平均值归一化的计算公式为x '=xx '=frac { x- mu } {sigma } x '=x

在该表达式中,x表示各个数据的可取值, mu 表示相应列的平均值, sigma 表示相应列的标准偏差

二、代码实现# 筛选加载模块froms klearn.preprocessingimportstandardscalerimportwarningswarnings.filter warnings (ignore ) )警告的含义from ppore P#读取数据data=PD.read _ CSV (f :/data/data.CSV ), encoding='gbk ' ) #bgk是中文代码# 表示阅览数据前5行的data.head ()1)资产负债率;2 )除去保证金的资产负债率;3 )长期资本负债率;4 )长期资产适合率;5 )权益乘数00.6557990.6067080.6138650.4990 . 93299020.9573910.9415430 60.5306370.95808640.8052350.7960710.8614800.5412990.957462 #已标准化,返回值为标准化数据SSS

-2.18550266e-01、-4.97556164e-01]、

[5.83511306e-02、1.83702105e-01、6.61977686e-01、

7.51432528 e00,3.06672601 e-01 ],

[ 1.90602996 e00,1.69014811 e00,-2.10373034e 00,

- 2.41440984 e-01,6.23989972 e-01 ],

…,

[-1.14289225e-01、-1.81738238e-01、-4.01819153e-01、

- 1.78750448 e-04,2.31292440 e-01 ],

[-7.54465400e-01,- 7.37349652 e-01,3.84582589 e-01,

-2.41868662e-01、-3.87772198e-01]、

[ 1.2886801 e00,1.12495300 e00,-2.10373034e 00,

- 2.48967045 e-01,5.66083685 e-01 ] )

#由于标准化数据为array格式,因此将其转换为数据框standard _ data=PD.data frame (standard _ data ),使数据成为csv文件,然后进行后续建模

#标准化数据中不包括列名standard _ data.columns=data.columns standard _ data.head (() )资产负债率) )存款的资产负债率;3 )长期资本负债率) - 0.218550-0.49755610.0583510.1837020.6619787.5143250.30667321.9060301.6619787 1.1320780.3277240.44979790 绘制概率密度图,展示数据分布PLT.rcparams [ ' font.sans-serif ' ]=[ ' simhei ' ] #图为中文PLT.rcparams [ ' axes.unicode _ MINUS

从概率密度图可以看出,归一化数据对称分布在0的两侧,接近正态分布。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。