第一次用CSDN写博客,其实主要目的是用来自己做统计学笔记归纳。
我现在是在外国就读统计与数据分析本科。其实本人以前在国内是个数学白痴,只是出国了突然就成了数学好..而且也是听朋友说读统计数据分析以后找工作不愁,所以就误打误撞近了这个系。是有点觉得被坑了,因为进去容易想毕业真的挺有难度。课程除了统计和数学那些,还有大量机器学习,那才是最要命,需要投入很多时间进去学习。 好了废话不多说了,开始整理自己的基础统计学笔记。
学校用的书是"Statistics for Business and Economics",从第三章"Elements of Chance: Probbabliltyy Methods"开始整理笔记。我觉得这一章对我这个菜鸟来说最难部分就是排列组合了。懂是看懂了,只是题目一有转变什么的,我的大脑就转不过来,感觉超痛苦的...不知道有没有人和我一样有这个烦恼?
3.1 集合论 (Random Experiment, Outcomes, and Events)
样本空间(SAMPLE SPACE)
每一个随机实验都有一个样本空间简写为S,样本空间的子集就是随机事件
Ex. 随机实验事件E抛出一颗6面的正常骰子,所以事件E的样本空间就是:
S={1, 2, 3, 4, 5, 6}
1. 假设事件A抛出骰子是奇数,则对应事件A的集合是 {1, 3, 5},
complement of event A 是事件A的补集
以事件B表示 complement of event A,则对应事件B的集合是{2, 4, 6}
2. 如果两个事件的交集是空集,则称mutually exclusive event
*一个事件的出现表示在同一时间内不会出现其他事件
例如上面的事件A和事件B
A∩B=∅
3. intersection of event就是两个事件的交集
例如事件A={1,3,5} 事件B={2,3,5},那么事件A和事件B的交集就是A∩B={3,5}
如果一个集合里面没有任何元素,那么我们称这个为空集,简写∅={ }
4. union of events是两事件的并集
例如事件A和事件B的并集{1,2,3,4,5,6}就是整体样本空间
A∪B
5. 如果各个对应事件并集且等于样本空间,则称之为collectively echaustive events
*当进行一次试验时出现的结果一定是这些事件的其他之一
3.2 排列组合(Combination)
1. 置换(Permutaions)
例如从1到6的数字排列有720种
(从n个相异元素中取x个元素,得出x个元素排列数量)
2. 组合(Combinations)
例如从一个班中抽出四位同学组成四人小组的组合数为 (不放回):
又例如一个箱子里有6个不一样颜色的球,从里面抽取四个,每抽取一次后放回再抽第二次,
那么可以有多少组合(放回)
(从n个元素中抽取x个,x可重复)
3.3 概率理论(Probability and its postulates)
概率必须介于在0和1之间
样本空间所有概率的总和必须等于1
1. 古典概率(Classical Probability)
计算事件A的概率:
3.4 机率法则Probability rule
1. Complement rule
*Complement rule
2.
3. 一般加法原理The Addition Rule of Probability
4. 条件机率Conditional Probability
5. 联合机率Joint Probability
*如果一个事件的发生不会影响里一个事件的发生的机率就代表两个事件为独立事件.
所以乘法原理只可以用在事件a和b两者相互独立的时候
6. 统计独立性(Statistical independenc)
*这部分是转发一个台湾网站http://web.ydu.edu.tw/~alan9956/docu3/0991stat/Statistics_05.pdf
獨立性(independence)。 在機率論裡, 獨立是一很重要的概念。 不過這
種獨立的概念, 是所謂統計的獨立(statistically independent), 或稱隨機的獨立(stochastically
independent), 與日常生活裡的主權獨立, 經濟獨立中的"獨立"意義並不相同。
若一事件之發生, 對事件之發生的機率並沒有影響。即
, --------------------------------(1)
則我們說與相互獨立(mutually independent, 簡稱獨立)。此處需要求。
再由先前介紹的條件機率知
,--------------------------(2)
因此, 由(1)式與(2)式可得
。---------------------------(3)
(3)式對或為0時仍然成立(因此時(3)式左、右均為0)。所以我們就常以(3)式當
做與獨立的條件。採用(3)式的好處是將二事件與對稱地對待, 且較易推廣到超過
兩個事件獨立的情況。
若要計算二獨立事件交集的機率, 我們只需將二事件個別的機率相乘即可。若要決定
與是否為獨立, 只要驗證是否成立, 若成立, 則與獨立,
否則與相依(dependent)。
當事件與 獨立時, 由 之發生, 對事件得不到任何推論(inference) 。因此直觀上
與 獨立, 會導致與獨立。這是正確的, 其推導如下:
事實上不難看出, 與、與也都獨立。
最後, 我們來看三個事件的獨立要如何定義?
設 , , 為樣本空間中的三事件, 若滿足
(1) , , 兩兩獨立, 即
,
,
,
(2) ,
則我們稱, , 三事件相互獨立(仍簡稱獨立)。
7. 贝叶斯定理Bayes' Theorem
我在知乎上找到一个很容易理解的贝叶斯定理
https://zhuanlan.zhihu.com/p/22467549