首页 > 编程知识 正文

盒须主要用途,盒须可以用在哪里

时间:2023-05-03 06:42:21 阅读:275043 作者:2120

2019独角兽企业重金招聘Python工程师标准>>>

盒须图(Boxplot)主要用于对数据分布的显示。对于详细数据的显示通常采用下面几种方法。

最简单的方法是把所有的数据显示在一个散点图上。读者可以直接观察数据点的分布。

但如果数据量很大,数据点就会大量的重叠。虽然可以采用一些方法来减少重叠的影响,比如抖动,半透明显示等措施,但当数据量达到一定规模之后,唯一可行的方式就是显示数据汇总之后的结果。

比如在上面的例子,我们显示了一组销售价格和年度的数据。如果我们想看看总体价格是在上升或者下降,最常用的方法就是显示每个年度的均价。

根据年度均价的显示,销售价格应该是一个下降的趋势。但是真实情况确实如此吗?在使用平均值的时候,有很多情况会引起对数据的曲解。比如房价,如果高价位的房降了10%,而中低价位的房涨了15%,得出的均价很可能显示一个下降的趋势。而大家的感觉却是房价在上涨。

盒须图在很大程度避免了这种问题。盒须图对每组数据显示了五个部分:

以从上到下的顺序:

最大值(或减掉outlier之后的最大值)

位于75%百分位的值

中间值

位于25%百分位的值

最小值

如果我们不上面例子里的同样数据用Boxplot画出来,就可以看到一个完全不同的结果。

我们可以看到和2009年相比,2010年的最低价位到中高价位都有一个上升。但因为最高值有一个较大的下降,导致平均值有一个降低。但总体价位是一个上升的趋势。

文章出自:http://www.inetsoft.com.cn/services/KnowledgeBase/

 

转载于:https://my.oschina.net/tianzhen/blog/11180

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。