首先,我将介绍两个软件包: numpy和pandas,它们是使用python处理数据的常用软件包。
numpy
最重要的特征是n维数组对象ndarray是一个快速灵活的大型数据集容器。 这是一个通用的同构数据多容器。 这意味着所有元素都必须是相同的类型,每个数组都有一个shape (表示维大小的元组)和一个dtype (表示维大小的元组)。
1 .创建数组常用的函数是数组、数组
例如:
array函数:
范围函数:
注意: python中左闭右开原则
2 .数据类型
numpy的数据类型有int/float/complex/bool/object/string
在数据类型转换中使用函数: astype
另一种转换方法是在数组中键入逗号,然后键入dtpye=np.float64。 如下所示。
3 .切片
一维数组切片,操作注意事项3 :大括号、左闭右开、冒号
二维阵列切片:
只有冒号意味着选择整个轴
4 .矢量化
无需编写程序即可对数据执行批量运算。 相同大小数组之间的任何算术运算(加减乘除幂)都可以在元素级别应用运算
例如:
5 .随机数生成
numpy.random补充了python内置函数random,添加了有效生成多个概率分布采样值的函数。
常用的有
normal生成正态分布的样本值
rand生成均匀分布的样本值
randint在指定的上下限范围内随机选择整数
randn生成标准正态分布的样本值
permutation返回序列的随机数组
seed确定随机数发生器的种子
帮助:
numpy.random.normal(loc=0,scale=1e-2,size=shape ) )的含义如下:
参数loc(float ) :正态分布的平均值对应于该分布的中心。 loc=0表示以该y轴为对称轴正态分布,
参数scale(float ) :正态分布的标准差对应分布的幅度,scale越大正态分布的曲线越矮胖,scale越小曲线越瘦。
参数size(int或整数元组) :将输出值指定给shape,默认值为None
6 .排列变换和轴对换
reshape、t属性、transpose
以上是numpy的详细介绍,详细叙述了pandas。 请注意明天更新的文章哦~
关于详细的分析和数据获取,请参照以下内容。
3358 cloud.yisurvey.com :9081/html/1 d3e 52e7- f130-4b 08-8f 2c 54d 7a e 676 d.html? ly=csdn
本文转载于网络,仅以学习交流为目的。 内容的版权归原作者所有。 例如,关于相关作品、著作权、其他问题,请联系删除处理。
特殊说明:本文旨在技术交流,因此请勿将相关技术用于非法用途。 不这样做,一切后果都会变得自负。 如果你觉得我们侵犯了你的合法权益,请联系我们处理。