首页 > 编程知识 正文

wps表格怎么做直方图,怎么根据数据做直方图

时间:2023-05-06 15:03:57 阅读:155900 作者:423

phython制作直方图和表的方法我们将首先加载用于绘图的matplotlib和seaborn模块。

importmatplotlib.pylabaspltimportseaborn % matplotlibinlineplt.hist (games (' fthg ',range(8) ) ) PLT.hist ) gamest

1 .计算并绘制x的直方图。 如果输入包含多个数据,则返回值为元组(n,kwdhxc,patches )或([n0,n1, ],kwdhxc,[patches0,patches1, ] )。 要为装箱数据创建直方图,请参阅权重参数文档。

2 .可以用x提供多个数据。 可以用作不同长度的数据集列表[x0,x1,…],也可以用作每列为数据集的二维数据数组。 请注意,ndarray表单相对于列表表单是倒置的。

3 .不支持掩码数组。

4 .容器、范围、权重和密度参数的行为与numpy.histogram相同。

matplotlib.pyplot.hist基本包括范围:x, kwdhxcs=None, range=None, density=False, weights=None, cumulative=False, bottom=None, histtype=‘bar’, align=‘mid’, orientation=‘vertical’, rwidth=None, log=False, color=None, label=None, stacked=False, , data=None, kwargs)

具体的解释

输入值时,可以使用单个数组,也可以使用不需要相同长度的数组序列。

x:(n,)数组或(n,)数组序列

如果箱子是整数,则定义范围内的等宽箱子数。

如果箱子是序列,则定义包含第一个箱子左边缘和最后一个箱子右边缘的箱子边缘。 在这种情况下,垃圾桶的间隔可能不相等。 除了最后一个(最右边的)箱子外,所有的箱子都半开着

换句话说,垃圾桶是[ 1,2,3,4 ]

第一个箱子是[ 1,2 ] (包括1,但不包括2 ),第二个箱子是[ 2,3 ],最后一个箱子是[ 3,4 ],其中包含4。

如果kwdhxcs是字符串,则这是numpy.histogram_kwdhxc_edges支持的装箱策略之一。 分别是“自动”、“软盘”、“完成”、“停止”、“停止”和“擦除”

kwdhxcint或sequence或str,默认值:rcParams[“hist.kwdhxcs”](默认值:10)

存储单元的下限和上限范围。 忽略下限和上限的异常值。 如果未提供,则范围为(x.min )、x.max ) )。 如果存储单元是序列,则范围无效。

如果框指定了序列或范围,则自动缩放将基于指定的框范围,而不是x范围。

rangetuple或None,默认值:None

如果为True,则绘制并返回概率密度。 每个框将显示框的原始计数除以计数总数和框宽度,以便直方图下的区域积分为1(NP.sum (密度np.diff )框) )。

如果叠加也为真,则直方图之和被归一化为1。

densitybool,默认值:False

与x相同形状的权重数组。 x的每个值只将相关权重贡献给仓库的数量,而不是1。 如果密度为真,则将对权重进行标准化,以使密度在此范围内的积分保持为1。

您可以使用此参数创建装箱数据的直方图。 例如,使用numpy.histogram。 通过将每个箱子视为单个点,权重等于其数量

权重(n,)类似数组或无,默认值:无

如果为真,则计算直方图。 每个框给出该框的计数加上小值的所有框。

最后一个箱子显示数据点的总数。

如果“密度”也为真,则对直方图进行归一化,使最后一个箱子为1。

如果累计值小于0,则累计方向相反,例如-1。 在这种情况下,如果密度也为真,则直方图被标准化为第一个仓库为1。

cumulativebool或-1,默认值:False

描绘每个箱子底部的位置,即从箱子底部到底部的历史(x,箱子)。 标量时,每个箱子底部的移动量相同。 对于数组,每个箱子独立移动,底部的长度必须与箱子的数量一致。 如果没有,则默认值为0。

组类型{‘bar’、‘bar stacked’、‘step’、‘step filled’},默认值:“bar”

bottomarray-like、标量或无,默认值:无

“条形图”是一种传统的条形图。如果给定多个数据,则条形图将并排排列。
“barstacked”是一种条形柱状图,其中多个数据相互叠加。
“步骤”生成默认情况下未填充的线形图。
“stepfilled”生成默认情况下已填充的线形图。
对齐{‘left’,‘mid’,‘right’},默认值为’mid’
直方图条的水平对齐。
“左”:条形图位于左侧料仓边缘的中心。
“中间”:条形在料仓边缘之间居中。
“右”:条形图位于右侧箱子边缘的中心。

更有趣的是,我们可以使用二维直方图来比较成对值的频率

[h, x, y, i] = plt.hist2d(games["FTHG"], games["FTAG"], range(8))seaborn.heatmap(h.astype("int"), annot=True, fmt="d", cmap="coolwarm")

上图显示1-1是最常见的分数。对角线上缺少符号说明了主队的优势,即185场比赛是1-0,而只有143场比赛是0-1,以此类推。
在下面的图中,我们看一下主客场犯规的分布情况。如果我们仔细观察,我们会发现主队犯规比客队多。

[h, x, y, i] = plt.hist2d(games["HF"], games["AF"], range(20))seaborn.heatmap(h.astype("int"), annot=True, fmt="d", cmap="coolwarm")

*seaborn.heatmap基本包括范围:(data, , vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt=’.2g’, annot_kws=None, linewidths=0, linecolor=‘white’, cbar=True, cbar_kws=None, cbar_ax=None, square=False, xticklabels=‘auto’, yticklabels=‘auto’, mask=None, ax=None, kwargs)

seaborn.heatmap是一个轴级函数,如果ax参数未提供任何热图,则会将热图绘制到当前活动的轴中。除非cbar为False或向cbar_ax提供单独的轴,否则该轴空间的一部分将用于绘制彩色地图。

数据矩形数据集
可以强制转换为数据数组的二维数据集。如果提供了数据帧,索引/列信息将用于标记列和行。

vmin,vmaxfloat可选值来锚定colormap,否则将从数据和其他关键字参数推断这些值。
cmapmatplotlib颜色映射名称或对象,或颜色列表,可选从数据值到颜色空间的映射。
如果未提供,默认值将取决于是否设置了中心。
中心浮动,可选打印divergant数据时要使颜色贴图居中的值。如果未指定任何cmap,则使用此参数将更改默认cmap。
robustbool,可选
如果不存在True和vmin或vmax,则使用稳健分位数而不是极值来计算颜色贴图范围。
annotbool或矩形数据集,可选
如果为True,则在每个单元格中写入数据值。如果一个数组与数据具有相同的形状,则使用它来注释热图,而不是数据。请注意,数据帧将匹配位置,而不是索引。
fmtstr,可选
添加批注时要使用的字符串格式代码。
注释键,值映射,可选
annot为True时matplotlib.axes.axes.text()的关键字参数。
线宽浮动,可选将分割每个单元格的行的宽度。
linecolorcolor,可选将分割每个单元格的线条的颜色。
cbarbool,可选是否绘制颜色条。
cbar_kwsdict键,值映射,可选matplotlib.figure.figure.colorbar()的关键字参数。
cbar_axmatplotlib轴,可选
要在其中绘制颜色条的轴,否则会占用主轴的空间。
squarebool,可选
如果为True,请将轴纵横比设置为“相等”,以便每个单元都是方形。
xticklabels、yticklabels“auto”、bool、list-like或int,可选
如果为True,则绘制数据帧的列名。如果为False,则不要打印列名。如果类似于列表,请将这些备用标签打印为XTICKLabel。如果是整数,请使用列名,但仅打印每n个标签。如果为“自动”,请尝试密集打印非重叠标签。
maskbool数组或数据帧,可选
如果传递,数据将不会显示在掩码为True的单元格中。缺少值的单元格将自动屏蔽。
axmatplotlib轴,可选
要在其中绘制绘图的轴,否则使用当前活动的轴。
kwargsother关键字参数
所有其他关键字参数都传递给matplotlib.axes.axes.pcolormesh()。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。