


单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,sas,程序步分为两种:,数据步(,data step,),data,:数据步的开始、命名要创立的数据集Input,:,确定输入的数据所对应的变量cards,:输入数据过程步(,proc step,),proc,:过程步的开始Output,:输出过程步运行结果,Set,语句:,1,、引用数据集,2,、纵向合并数据集(合并时不会根据,id,进行匹配),merge,语句:横向合并数据集(合并时会根据,id,变量匹配),常用统计描述过程,proc freq,:,调用,freq,过程,列频数分布表proc means,:调用,means,语句对变量进行简单的统计描述proc univariate,:调用,univariate,过程对变量进行详细统计描述table,:指出列表变量,并生成包含频数表数据的数据集var,:指出分析变量histogram,:指明对绘制直方图所用的数据变量并绘图proc gchart,:调用,ghart,过程绘图pie,:绘制圆饼图,gplot,:绘制散点图,plot,:指出绘图的纵坐标和横坐标,二项分布,Poisson,分布,正态分布,PDF,函数:求概率密度,二项分布,P,(,X,),=PDF(“Binomial”,,,X,,,Prob,,,N,),Poisson,分布,P,(,X,),=PDF(“Poisson”,,,X,,,Lamda,),计算累计概率密度的常用函数,二项分布,Poisson,分布,如求,X,服从二项分布,则,P(X,k),probbnml,(,p,,,n,,,k,),-probbnml,(,p,,,n,,,k-1)=PDF(“Binomial”,,,k,,,p,,,n),如,X,服从泊松分布,则,P(X=k)=Poisson,(,p,,,k,),-Poisson,(,p,,,k-1,),=PDF(“poisson”,k,,,p),。
求概率密度函数的两种方法,CDF,函数:求正态分布累积概率密度的函数,cdf(NORMAL,k,mean,std,),:,用于计算均数为,mean,,标准差为,std,的正态分布的随机变量,xk,的累积概率probnorm,函数:标准正态分布函数,probnorm(u),:求出从,-,到,u,位置的面积大小,P,robit函数:求标准正态分布的,Z,值的函数,probit,(,prob,),:求出从,-,到,Z,的位置面积为,prob,时的,Z,值,SAS,中常用的正态分布相关函数,CDF,函数:求正态分布累积概率密度的函数,cdf(NORMAL,k,mean,std,),:,用于计算均数为,mean,,标准差为,std,的正态分布的随机变量,xk,的累积概率probnorm,函数:标准正态分布函数,probnorm(u),:求出从,-,到,u,位置的面积大小,P,robit函数:求标准正态分布的,Z,值的函数,probit,(,prob,),:求出从,-,到,Z,的位置面积为,prob,时的,Z,值,常用的正态分布相关函数,置信区间,总体均数的可信区间,t,分布法,SAS,函数:,TINV,t=TINV(p,df),可求,t,分位数的函数,,p,是从,-,到当前,t,分位数位置的面积。
df=n-1,(自由度),T,检验,(均数、标准差、标准误、,t,检验),proc,means,mean,std,stderr,t,prt;,var,x;,run,;,proc,univariate,normal,;,var,x;,run,;,proc,ttest,H0,=,40.4,;,var,a,;,run,;,方法,1,方法,2,方法,3,Proc univariate,normal,*进行正态性检验,proc ttest,:调用,ttest,过程进行,t,检验,paired,:指出,t,检验重要比较的变量对,class,:指出分类变量,方差分析,PROC ANOVA,的过程格式,PROC ANOVA,;,CLASS,变量表;,MODEL,因变量表效应;,MEANS,效应,/,选择项,;,PROC GLM,的过程格式,PROC GLM,;,CLASS,变量表;,MODEL,因变量表效应;,MEANS,效应,/,选择项,;,五、方差分析所用的过程,ANOVA,过程,(,An,alysis,O,f,Va,riance),GLM,过程,(,G,eneral,L,inear,M,odel),Hovtest,使用,levene,检验,选项,bartlett,:,使用,bartlett,方法,选项,snk,:使用,snk,方法,选项,bon,:使用,bonferroni,方法,选项,dunnett,:使用,dunnett,方法(要注明对照组),Treat,:处理组,block,:区组,卡方检验,proc,freq,;,tables,r*c/,chisq,expected exact,;,weight,f;,run,;,注:,1.,tables,语句中的,chisq,选项指定进行卡方检验,,expecte,d,选项指定,输出理论频数,2.exact,输出确切概率,/,四格表资料不加此选项也可以输出确切概率,3.,weight,语句,指定权重变量为,f,注,:,agree,选项,进行,mcnemar,检验与一致性检验;,exact mcnem,语句,进行,mcnemar,检验同时输出确切概率,适用于,b+c40,的情况。
proc,freq,;,tables,r*c/,agree,;,exact mcnem,;,weight,f;,run,;,非参数检验,PROC NPAR1WAY,过程格式,PROC NPAR,1,WAY,Wilcoxon,;,CLASS,变量;,VAR,变量表;,Freq,频数变量;,RUN,;,*调用,npar1way,进行非参数检验(秩和检验),相关分析,线性相关,proc corr,秩相关,proc corr spearman,分类变量的关联性分析,(,属两种属性独立性的,2,检验,定性变量之间的联系:查看,Chi-Square,和,Contingency Coefficient,),线性回归,proc,reg,;,model,y=x/,clm cli clb,;,plot,y*x/,conf,pred,;,run,;,注:,model,语句,建立自变量对因变量的回归,方程,等号的左边表示因变量,y,,等号的右边,表示自变量,x,;选项,clm,指定输出预测值,95%,的置信区间;选项,cli,指定输出,95%,的预测个体,所在的范围;选项,clb,指定输出回归系数的,95%,置信区间。
plot,语句,指定输出以,y,变量为纵坐标,x,变量,为横坐标的散点图,并拟合回归线,选项,conf,和,pred,指定输出,95%,的置信区间和,95%,的预测个体,所在的范围的曲线线性相关:,proc,corr,;,var,x,y,;,run;,秩相关:,proc,corr spearman,;,var,x,y,;,run;,列联相关:,proc,freq,;,weight,f;,table,r*c/chisq nocol norow nopct;run;,回归分析,:,proc,reg;,model,y=x/,clm cli,;,plot y*x/conf pred;run;,完。