首页 > 编程知识 正文

python具有丰富的第三方库,python爬虫需要的第三方库

时间:2023-05-04 22:28:12 阅读:129183 作者:2356

由于python是基于numpy创建pandas作为进行数据分析的常用第三方库,因此使用numpy的程序也可以更好地使用pandas。

##1 pandas数据结构

###1.1 Series注:由于pandas与numpy关系密切,代码中经常将两者一起部署使用。

在上图中,首先使用numpy创建一维数组,然后使用pandas内置方法将其转换为pandas数组类型Series。 如您所见,pandas会自动将原始数据转换为列,并为行添加索引。

# # # 1.2数据帧pandas的第二个典型数据结构是数据帧。

当然,DataFrame是矩阵类型的数据,但pandas会在矩阵中添加矩阵索引,并使用元素进行搜索。

# 2创建数据帧系列可以视为数据帧的一种简单情况,因此稍后将主要介绍数据帧。 关于Series的状况可以和过去一样考虑。 正如上一节所述,pandas数据是通过用内置方法转换用numpy创建的数据获得的,但也可以直接在pandas库中创建数据框架。

创建数据框架时,可以手动将矩阵名称添加到数据中。 否则,pandas会自动添加形状类似于“0、1、2、3”的矩阵名称。 因为pandas是基于numpy创建的,所以numpy的一些常用方法可以直接移植。

pandas也有shape方法,用于显示矩阵的大小。

查找数据框架的元素

由于pandas矩阵可以自定义矩阵名称,因此放置其中的元素有以下几种方法:使用矩阵名称、使用矩阵位置和混合名称位置。

###3.1矩阵名称定位

###3.2矩阵定位

###3.3名称位置混合定位

一般常用的是前两种定位手段,混合定位理解即可。

总结:作为pandas系列的开头,本文就介绍到此,沿袭numpy系列的模式,后面的博文将介绍pandas关于数据帧的一般方法。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。