统计学(sas复习总结)

文档格式：PPT| 30 页|大小 304.14KB|2024-12-11 发布|举报 | 版权申诉

下载文档

下载文档到电脑，查找使用更方便还剩页未读，继续阅读>>

侵权申诉举报

1 / 30

此文档下载收益归作者所有下载文档

版权提示

文本预览

常见问题

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,sas,程序步分为两种：,数据步（,data step,）,data,：数据步的开始、命名要创立的数据集Input,：,确定输入的数据所对应的变量cards,：输入数据过程步（,proc step,）,proc,：过程步的开始Output,：输出过程步运行结果,Set,语句：,1,、引用数据集,2,、纵向合并数据集（合并时不会根据,id,进行匹配）,merge,语句：横向合并数据集（合并时会根据,id,变量匹配）,常用统计描述过程,proc freq,：,调用,freq,过程,列频数分布表proc means,：调用,means,语句对变量进行简单的统计描述proc univariate,：调用,univariate,过程对变量进行详细统计描述table,：指出列表变量，并生成包含频数表数据的数据集var,：指出分析变量histogram,：指明对绘制直方图所用的数据变量并绘图proc gchart,：调用,ghart,过程绘图pie,：绘制圆饼图,gplot,：绘制散点图,plot,：指出绘图的纵坐标和横坐标,二项分布,Poisson,分布,正态分布,PDF,函数：求概率密度,二项分布,P,(,X,),=PDF(“Binomial”,，,X,，,Prob,，,N,),Poisson,分布,P,(,X,),=PDF(“Poisson”,，,X,，,Lamda,),计算累计概率密度的常用函数,二项分布,Poisson,分布,如求,X,服从二项分布，则,P(X,k),probbnml,（,p,，,n,，,k,）,-probbnml,（,p,，,n,，,k-1)=PDF(“Binomial”,，,k,，,p,，,n),如,X,服从泊松分布，则,P(X=k)=Poisson,（,p,，,k,）,-Poisson,（,p,，,k-1,）,=PDF(“poisson”,k,，,p),。

求概率密度函数的两种方法,CDF,函数：求正态分布累积概率密度的函数,cdf(NORMAL,k,mean,std,）,:,用于计算均数为,mean,，标准差为,std,的正态分布的随机变量,xk,的累积概率probnorm,函数：标准正态分布函数,probnorm(u),：求出从,-,到,u,位置的面积大小,P,robit函数：求标准正态分布的,Z,值的函数,probit,（,prob,）,：求出从,-,到,Z,的位置面积为,prob,时的,Z,值,SAS,中常用的正态分布相关函数,CDF,函数：求正态分布累积概率密度的函数,cdf(NORMAL,k,mean,std,）,:,用于计算均数为,mean,，标准差为,std,的正态分布的随机变量,xk,的累积概率probnorm,函数：标准正态分布函数,probnorm(u),：求出从,-,到,u,位置的面积大小,P,robit函数：求标准正态分布的,Z,值的函数,probit,（,prob,）,：求出从,-,到,Z,的位置面积为,prob,时的,Z,值,常用的正态分布相关函数,置信区间,总体均数的可信区间,t,分布法,SAS,函数：,TINV,t=TINV(p,df),可求,t,分位数的函数，,p,是从,-,到当前,t,分位数位置的面积。

df=n-1,（自由度）,T,检验,（均数、标准差、标准误、,t,检验）,proc,means,mean,std,stderr,t,prt;,var,x;,run,;,proc,univariate,normal,;,var,x;,run,;,proc,ttest,H0,=,40.4,;,var,a,;,run,;,方法,1,方法,2,方法,3,Proc univariate,normal,*进行正态性检验,proc ttest,：调用,ttest,过程进行,t,检验,paired,：指出,t,检验重要比较的变量对,class,：指出分类变量,方差分析,PROC ANOVA,的过程格式,PROC ANOVA,；,CLASS,变量表；,MODEL,因变量表效应；,MEANS,效应,/,选择项,；,PROC GLM,的过程格式,PROC GLM,；,CLASS,变量表；,MODEL,因变量表效应；,MEANS,效应,/,选择项,；,五、方差分析所用的过程,ANOVA,过程,(,An,alysis,O,f,Va,riance),GLM,过程,(,G,eneral,L,inear,M,odel),Hovtest,使用,levene,检验,选项,bartlett,：,使用,bartlett,方法,选项,snk,：使用,snk,方法,选项,bon,：使用,bonferroni,方法,选项,dunnett,：使用,dunnett,方法（要注明对照组）,Treat,：处理组,block,：区组,卡方检验,proc,freq,;,tables,r*c/,chisq,expected exact,;,weight,f;,run,;,注：,1.,tables,语句中的,chisq,选项指定进行卡方检验，,expecte,d,选项指定,输出理论频数,2.exact,输出确切概率,/,四格表资料不加此选项也可以输出确切概率,3.,weight,语句,指定权重变量为,f,注,:,agree,选项,进行,mcnemar,检验与一致性检验；,exact mcnem,语句,进行,mcnemar,检验同时输出确切概率，适用于,b+c40,的情况。

proc,freq,;,tables,r*c/,agree,;,exact mcnem,;,weight,f;,run,;,非参数检验,PROC NPAR1WAY,过程格式,PROC NPAR,1,WAY,Wilcoxon,；,CLASS,变量；,VAR,变量表；,Freq,频数变量；,RUN,；,*调用,npar1way,进行非参数检验（秩和检验）,相关分析,线性相关,proc corr,秩相关,proc corr spearman,分类变量的关联性分析,（,属两种属性独立性的,2,检验,定性变量之间的联系：查看,Chi-Square,和,Contingency Coefficient,）,线性回归,proc,reg,;,model,y=x/,clm cli clb,;,plot,y*x/,conf,pred,;,run,;,注：,model,语句，建立自变量对因变量的回归,方程，等号的左边表示因变量,y,，等号的右边,表示自变量,x,；选项,clm,指定输出预测值,95%,的置信区间；选项,cli,指定输出,95%,的预测个体,所在的范围；选项,clb,指定输出回归系数的,95%,置信区间。

plot,语句，指定输出以,y,变量为纵坐标,x,变量,为横坐标的散点图，并拟合回归线，选项,conf,和,pred,指定输出,95%,的置信区间和,95%,的预测个体,所在的范围的曲线线性相关：,proc,corr,;,var,x,y,;,run;,秩相关：,proc,corr spearman,;,var,x,y,;,run;,列联相关：,proc,freq,；,weight,f；,table,r*c/chisq nocol norow nopct;run;,回归分析,:,proc,reg;,model,y=x/,clm cli,;,plot y*x/conf pred;run;,完。

点击阅读更多内容