python具有丰富的第三方库,python爬虫需要的第三方库

由于python是基于numpy创建pandas作为进行数据分析的常用第三方库，因此使用numpy的程序也可以更好地使用pandas。

##1 pandas数据结构

###1.1 Series注：由于pandas与numpy关系密切，代码中经常将两者一起部署使用。

在上图中，首先使用numpy创建一维数组，然后使用pandas内置方法将其转换为pandas数组类型Series。如您所见，pandas会自动将原始数据转换为列，并为行添加索引。

# # # 1.2数据帧pandas的第二个典型数据结构是数据帧。

当然，DataFrame是矩阵类型的数据，但pandas会在矩阵中添加矩阵索引，并使用元素进行搜索。

# 2创建数据帧系列可以视为数据帧的一种简单情况，因此稍后将主要介绍数据帧。关于Series的状况可以和过去一样考虑。正如上一节所述，pandas数据是通过用内置方法转换用numpy创建的数据获得的，但也可以直接在pandas库中创建数据框架。

创建数据框架时，可以手动将矩阵名称添加到数据中。否则，pandas会自动添加形状类似于“0、1、2、3”的矩阵名称。因为pandas是基于numpy创建的，所以numpy的一些常用方法可以直接移植。

pandas也有shape方法，用于显示矩阵的大小。

查找数据框架的元素

由于pandas矩阵可以自定义矩阵名称，因此放置其中的元素有以下几种方法：使用矩阵名称、使用矩阵位置和混合名称位置。

###3.1矩阵名称定位

###3.2矩阵定位

###3.3名称位置混合定位

一般常用的是前两种定位手段，混合定位理解即可。

总结：作为pandas系列的开头，本文就介绍到此，沿袭numpy系列的模式，后面的博文将介绍pandas关于数据帧的一般方法。