首页 > 编程知识 正文

sas 字符型转化为数值型失败原因,sas自动筛选变量方法

时间:2023-05-05 06:28:56 阅读:262255 作者:891

在SAS系统中,除了可以使用MEANS过程执行描述性统计分析外,也可用UNIVARIATE过程进行描述性统计分析。UNIVARIATE过程的基本功能如下:

描述性统计分析,涉及偏度、峰度、分位数的计算,频率表的绘制和变量极端值分析等。

常用统计图形的绘制,包括直方图、概率分布累积图和Q-Q图等。

数据的正态性检验。

在SAS系统中,UNIVARIATE单变量过程的基本格式为:

PROC UNIVARIATE [选项] ;

BY变量列表;

CDFPLOT变量列表 [选项];

CLASS 变量列表;

FREQ 变量;

HISTOGRAM 变量列表 [选项];

ID 变量;

OUTPUT [out=输出数据集名] [统计量关键字=变量名];

QQPLOT 变量列表 [选项];

VAR 变量列表;

WEIGHT 变量;

其中:

PROC语句用于指定使用UNIVARIATE过程进行描述性统计分析,同时,在该语句后常用的选项介绍如下:

DATA=数据集名:指定需要分析的数据集。

PLOT或PLOTS:绘制茎叶图、盒式图和正态概率图。

FREQ:生成频数分布表。

NORMAL:对输入变量进行正态性检验。

BY语句用于指定分组的变量,在组内对数据进行描述性分析。

CDFPLOT语句用于控制概率分布累积图的绘制。

CLASS语句的用法基本同BY语句,用于指定分组的变量。

FREQ语句用于指定代表观测频数的变量。

HISTOGRAM语句用于控制直方图的绘制。

ID语句用于指定数据集中识别观测的变量。

OUTPUT语句用于建立一个新的数据表,存放分析的结果。

QQPLOT语句用于控制Q-Q图的绘制。

VAR语句用于指定UNIVARIATE过程分析的变量。

WEIGHT语句用于指定代表观测权重的变量。

下面利用UNIVARIATE过程对本章例4.1中表4.2的各型号汽油污染程度的指标数据,进行描述性统计分析,注意体会SAS系统中这两种过程在描述性统计分析上的差异。

【例4.2】 UNIVARIATE过程的SAS实现。

下面的程序利用UNIVARIATE过程实现描述性统计分析。

proc univariatedata=ww.test4_1;

by type;

var sulfur arene benzene pb;

run;

执行上述程序,UNIVARIATE过程会将所有的描述性统计分析的结果输出到结果窗口。本例中按照汽油型号分组,对每种型号的汽油的各变量都进行了描述性统计分析,结果包括矩、位置和变异性的基本测度、位置检验、分位数和极端观测,其结果的目录如图4.3所示。

同时,以A汽油的含硫量的结果为例展示UNIVARIATE过程的基本的描述性统计分析结果,如图4.4所示。

图4.3 UNIVARIATE过程结果目录树

图4.4 UNIVARIATE过程的描述性统计分析结果

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。