由于python是基于numpy创建pandas作为进行数据分析的常用第三方库,因此使用numpy的程序也可以更好地使用pandas。
##1 pandas数据结构
###1.1 Series注:由于pandas与numpy关系密切,代码中经常将两者一起部署使用。
在上图中,首先使用numpy创建一维数组,然后使用pandas内置方法将其转换为pandas数组类型Series。 如您所见,pandas会自动将原始数据转换为列,并为行添加索引。
# # # 1.2数据帧pandas的第二个典型数据结构是数据帧。
当然,DataFrame是矩阵类型的数据,但pandas会在矩阵中添加矩阵索引,并使用元素进行搜索。
# 2创建数据帧系列可以视为数据帧的一种简单情况,因此稍后将主要介绍数据帧。 关于Series的状况可以和过去一样考虑。 正如上一节所述,pandas数据是通过用内置方法转换用numpy创建的数据获得的,但也可以直接在pandas库中创建数据框架。
创建数据框架时,可以手动将矩阵名称添加到数据中。 否则,pandas会自动添加形状类似于“0、1、2、3”的矩阵名称。 因为pandas是基于numpy创建的,所以numpy的一些常用方法可以直接移植。
pandas也有shape方法,用于显示矩阵的大小。
查找数据框架的元素
由于pandas矩阵可以自定义矩阵名称,因此放置其中的元素有以下几种方法:使用矩阵名称、使用矩阵位置和混合名称位置。
###3.1矩阵名称定位
###3.2矩阵定位
###3.3名称位置混合定位
一般常用的是前两种定位手段,混合定位理解即可。
总结:作为pandas系列的开头,本文就介绍到此,沿袭numpy系列的模式,后面的博文将介绍pandas关于数据帧的一般方法。