如何理解置信区间的置信水平,置信度对置信区间的影响

关于信赖区间和信赖度的理解，在网上找了相关的2个观点，感觉很会说话，恍然大悟。简单地概括。只有一个参数是固定的，不变。我们局部地估计整体。参数95%的可靠度在区间a，也就是说是正确的。对95%置信度的置信区间进行100次采样计算，计算95次的区间中包含真值。错误：采样100次，95次真值落入置信区间。真实的值不会改变，而是信任区间。

以下是两个引用。 http://BBS.pinggu.org/thread-3037010-1-1.html

33559 www.zhi Hu.com/question/2018

说到可靠性，首先老师肯定已经介绍过点估计，引入这个概念的目的当然是结合被称为区间估计的置信区间来估计置信区间。通常，在通过点推定(点推定是指用概率论导出的推定值)计算出的数据上加上变动幅度，形成区间。这个变动幅度与可靠性这个参数有关。首先为什么要使用区间估计？让我们看一个例子。打10次枪，就能得到平均值。比如说8。那么，整体的期待是8呢？这么说，也太轻率了。再做10次的话可能会变成7，所以整体的期待会变成7吗？当然，整体的期待是客观存在这一点没有改变。实际上平均值等于期待的概率是0呢。因此，用点估算是不准确的。但是，既然样品是从总体中提取的，那么样品的平均水平和总体的期待就不远了。你的射击平均值是8，总体期望不是总是1吗？所以，换句话说你打枪的平均环数是[ 6，8 ]，相信的人就多了。可见，虽然整体平均值的取值范围有所扩大，但可信度明显提高。当然，不能轻易无限扩大区间范围。果然统计也必须重视一定的精度。所以，我们很可靠。也就是说，你测量的平均值和整体的实际情况之差小于这个给定值的概率。虽然说你测量的平均值是整体的期望是轻率的，但是我想我测量的平均值，如果有95%的把握是非常接近整体期望的，是可以相信的。平时常说的95%的可靠性是什么意思呢？要理解可靠性，就必须理解置信区间。要理解置信区间，需要从统计学最基本、最核心的思想开始思考。那就是用样本推测总体。统计学上容易模糊概念，容易将95%的置信区间理解为该区间包含真实值的概率为95%。但是，这里有两个容易混淆

淆的地方
1.真值指得是样本参数还是总体参数？这个问题的答案是总体参数，我们取的数据是样本数据，点估计是样本参数的真实值，我们要估计总体参数。
2.95%的概率，变动的是谁？这里95%的概率，变动的是置信区间。

错误理解：假如有100个考生，100个学生中有95个考分落在（70,80）这个区间内。这就是95%置信度。
这是非常错误的理解，样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值，这个值只有一个，且不会变动。
那正确的应该怎么理解呢？
样本数目不变的情况下，做一百次试验，有95个置信区间包含了总体真值。置信度为95%。换言之，若扩大样本容量，考100次试，这100名学生的成绩组成改的区间有95次包含了总体真正的均值，那这才是95%置信度。说白了，我们有95%的把握说总体的真值在这个区间内。

那么还有一个问题，是不是置信度越高越好？

这个问题就要看你需要统计的是什么？经济效益是什么？通常情况下，95%被作为常用的置信度，原理就在于3西格玛控制（在一些严格的领域甚至会用到6西格玛），此时已经有很高的置信度了，那在往上去，随着置信度的上升，置信区间的跨度也就越大，对参数估计的精度必定降低。点估计就一个值，精度高，但置信度则低，精度与置信度相互的取舍则要全由分析者自行选择了。

楼主tips:置信度这个问题，其实核心问题就是要理解我们的核心思想是用样本估计总体，保证的是总体参数的精确度，这个区间是为总体设计的即可。

--------------------------------------------============================================================================================ ====================================================================================================================
要理解置信度，就要理解好置信区间。
要理解置信区间，就要从统计学最基本最核心的思想去思考，那就是
用样本估计总体。
在统计学中，非常容易把概念模糊化，很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。
但是这里有两个容易混淆的地方
1.真值只得是样本参数还是总体参数？
这个问题的答案是总体参数，我们取的数据是样本数据，点估计是样本参数的真实值，我们要估计总体参数。
2.95%的概率，变动的是谁？
在以后不常温习的情况下，这个问题容易造成困扰。这里95%的概率，变动的是置信区间。非常难以理解，用图来阐述一下：
&amp;lt;img data-rawheight="3508" data-rawwidth="2480" src="https://pic3.zhimg.com/50/ad6b8118232d8e702c28ed52b68f0776_hd.jpg" class="origin_image zh-lightbox-thumb" width="2480" data-original="https://pic3.zhimg.com/ad6b8118232d8e702c28ed52b68f0776_r.jpg"&amp;gt;

错误理解：上图浅色的虚的竖直线代表样本参数真值，横的两端有端点的代表95%置信度的置信区间，100条竖直线里有95条左右落入这个区间内。
这是非常错误的理解，样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值，这个值只有一个，且不会变动。

下图为正确理解：
&amp;lt;img data-rawheight="3508" data-rawwidth="2480" src="https://pic1.zhimg.com/50/eab7e81a9a00080c6658d0ff2ac2e7ac_hd.jpg" class="origin_image zh-lightbox-thumb" width="2480" data-original="https://pic1.zhimg.com/eab7e81a9a00080c6658d0ff2ac2e7ac_r.jpg"&amp;gt;

样本数目不变的情况下，做一百次试验，有95个置信区间包含了总体真值。置信度为95%
其中大虚线表示总体参数真值，是我们所不知道的想要估计的值。正因为在100个置信区间里有95个置信区间包括了真实值，所以当我们只做了一次置信区间时，我们也认为这个区间是可信的，是包含了总体参数真实值的。

这样应该就能很好地理解了，遇到统计上的困惑时，多思考 用样本估计总体这个核心思想，很多就能迎刃而解。