首页 > 编程知识 正文

统计学变量数据抽样原则,统计学系统抽样

时间:2023-05-06 00:50:31 阅读:190693 作者:3633

变量值是变量的取值变量的类型
1.1 分类变量
1.2 顺序变量
1.3 数值型变量
另,根据其取值不同又可分为:离散型变量、连续型变量数据处理:将数据用图表等形式展现出来;
数据分析:选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论,具体方法有描述统计和推断统计。推断统计:
如何利用样本数据来推断总体特征的统计方法。 截面数据时间序列数据统计量,根据样本数据计算得出,是样本的函数。分类数据和顺序数据,一般是由文字来表述,又被称为定性数据和品质数据。变量分类:
分类变量、顺序变量、数值型变量。

数据的来源:

间接来源—二手数据
二手数据优点:搜集容易,采集成本低,并且能很快得到。
局限性:相关性不够、口径可能不一致、数据也许不准确、也许过时。直接来源:
调查数据、实验数据 二、调查数据 概率抽样:每一个单位都有一定机会(已知的,可计算的非零概率)被抽到,可以以相等(等概率抽样)也可以不相等(不等概率抽样)。
特点:随机原则抽取样本;
概率抽样可以依据调查结果,计算估计量误差,从而得到对总体目标量进行估计的可靠程度。也可以按照要求的精确度,计算出必要的样本数目。概率抽样的方式:
2.1. 简单随机抽样:
从抽样框(抽样框包含所有总体单位的信息,作用:提供备选单位以供抽选,计算相应的概率)中进行;
从总体中的N个单位一个一个地抽取,每个单位都是相等的,是一种等概率抽样;
是一种最基本的抽样方式,是抽样方式的基础;
特点:简单直观,在抽样框完整的时候,可以直接抽取样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算估计量误差都比较方便
局限性:当N很大时,抽样框不宜选取;抽出的单位很分散;没有利用辅助信息提高估计的效率。
2.2 分层抽样
先划分不同层,然后从各层中抽取。
保证了样本与总体结构相近。
2.3 整群抽样
分组(把这样的组称为群),然后直接抽群,对群中的所有的单位实施调查。
优点:简化了编制抽样框的工作量,较为简便。
缺点:估计精度比较差。
2.4 系统抽样
对总体中的所有单位进行排序,选取初始单位,按照一定的规则确定其他样本。
2.5 多阶段抽样
类似整群抽样,区别是从抽出的群里进行再次抽样,依次推广,即为多阶段抽样。
优点:样本相对集中,节约调查费用。
在较大规模的抽样调查中,多阶段抽样经常使用非概率抽样:
特点:抽取样本不遵循随机原则,而是根据研究目的对数据的要求,采用某种方法进行抽样。有如下几种:
3.1 方便抽样
依据方便的原则,自行确定入选单位。
容易实施,但不能将结果推广到总体当中。
3.2 判断抽样
根据以往经验,有目的的地选取样本,主观的。又可分为:重点抽样、典型抽样、代表抽样。
3.3 自愿抽样
3.4 滚雪球抽样
先对稀少群体调查,之后再请他们提供另外的调查对象,持续下去。
特点:适合对特定顶群体进行研究、搜取资料。
3.5 配额抽样
类似于概率抽样的分层抽样,先分层、再在各层中进行方便抽样、判断抽样等选取单位。
搜集数据:
自填式、电话式、面访式、观察式。
实验数据:
随机原则分配给实验组和对照组。
匹配,情况相同的每队单位分别分配给实验组和对照组。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。