概率论中经常出现PDF、PMF、CDF,这三者的区别和联系是什么?
1 .概念解释PDF :概率密度函数(probability density function )在数学中是连续型随机变量的概率密度函数(如果不容易的话可以简称为密度函数)
PMF :概率质量函数(probability mass function )是在概率论中,概率质量函数为离散随机变量每个特定可能值的概率。
CDF :累积分布函数(cumulative distribution function )也称为分布函数,可以是概率密度函数的积分,完全描述实随机变量x的概率分布。
2 .数学表示2.1 PDF是连续随机变量的情况,概率密度函数被定义为FX(x )FX(x ) ),表示随机变量通过在PDF的一个区间中的积分来获得在该区间中的概率,即
对于2.2 PMF离散型随机变量,将概率质量函数定义为FX(x ) FX ) x。 PMF实际上是高中学习的离散型随机变量的分布规律,即
例如,在投掷均匀硬币的情况下,如果将表面设为X=1X=1,将背面设为X=0X=0,则该PMF
2.3 CDF可以定义其累积分布函数,而无论任意类型的随机变量(连续的/离散的/其他),并且可以简称为分布函数。
对于连续型随机变量,显然存在以下情况:
fx(x )=pr(xx )=xfx ) t ) dtf (x ) ) x )=pr(x(leqx )=(int_{-(infty}^{x}f_x(t ) dtft )
CDF是PDF的积分,PDF是CDF的导数。
在离散随机变量的情况下,该CDF是段函数,并且例如在举例来说投币随机变量的情况下,该CDF为:
fx(x )=pr ) xx
) { 0 i f x < 0 1 2 i f 0 ≤ x < 1 1 i f x ≥ 1 F_X(x)=Pr(Xleq x)left{ begin{array}{rcl} 0 & & {if x <0 }\ frac{1}{2} & & {if 0leq x<1}\ 1 & & {if xgeq 1}\ end{array} right. FX(x)=Pr(X≤x)⎩⎨⎧0211if x<0if 0≤x<1if x≥1 3.概念分析根据上述,我们能得到以下结论:
PDF是连续变量特有的,PMF是离散随机变量特有的;PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;PMF的取值本身代表该值的概率。 4.分布函数的意义我们从两点来分析分布函数的意义:
4.1 为什么需要分布函数?对于离散型随机变量,可以直接用分布律来描述其统计规律性;而对于连续型随机变量(非离散型的随机变量),我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像离散随机变量那样用分布律进行描述。于是引入PDF,用积分来求随机变量落入某个区间的概率。
分布律(PMF)不能描述连续型随机变量,密度函数(PDF)不能描述离散随机变量,因此需要找到一个统一方式描述随机变量统计规律,这就有了分布函数。
另外,在现实生活中,有时候人们感兴趣的是随机变量落入某个范围内的概率是多少,如掷骰子的数小于3点的获胜,那么考虑随机变量落入某个区间的概率就变得有现实意义了,因此引入分布函数很有必要。
4.2 分布函数的意义分布函数 F ( x ) F(x) F(x)在点 x x x处的函数值表示 X X X落在区间 ( − ∞ , x ] (−infty,x] (−∞,x]内的概率,所以分布函数就是定义域为 R R R的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题,增大了概率的研究范围。
5.参考文献概率中的PDF,PMF,CDF
http://www.dataguru.cn/thread-150756-1-1.html
https://www.zhihu.com/question/23022012
https://www.zhihu.com/question/36853661
https://www.zhihu.com/question/21911186
http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html