


单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,卫生统计学,王秀琴,如何判断药物的疗效?,(,假设检验,),体育彩票能否中奖?,(,概率论,),子女为什么象父母,其强度有多大?,(,相关与回归,),工作生活中常见的统计学问题,第一章 绪论,主要内容,学习卫生统计,学的意义,统计学的,若干概,念,卫生统计工作,的基本步骤,一、学习卫生统计学的意义,卫生统计学:,是数理统计学的基本原理和方法在,医学领域,中的应用,是关于,医学研究,中,资料,的收集、整理、分析、解释和表述的一门科学统计学:,是关于,数据,的收集、整理、分析、解释和表述的科学概念,数理统计学,应用统计学,例1.1,资料分析表明在全球范围内人类的乳腺癌、男性生殖系统癌症有明显上升的趋势,同时,男性的精子数量和浓度有明显减少的倾向一、学习卫生统计学的意义,有学者提出了“,环境激素,”学说,即,人类越来越多的暴露于环境中有人体激素样作用、对人体内分泌起干扰作用的化学污染物质例1.1,北京大学一个课题组欲研究人们经常食用的一种食品是否含有雌激素,是否对小鼠有雌激素作用。
一、学习卫生统计学的意义,统计学设计:,1.需要多少大鼠?2.如何分组?,3.如何设立对照?4.是否使用盲法?,5.选用何种指标表示雌激素作用?,6.选用何种统计方法?,德国(1960年代初),,药物酞胺哌啶酮(又称反应停)事件(,曾引起一次胎儿畸形(四肢体短缺)的暴发,经过研究发现危险因素是,反应停)一、学习卫生统计学的意义,例,1.2,:,例1.3:,某地1986年120名8岁男孩身高均数为=123.02cm,标准差为=4.79cm,试估计,该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比?,一、学习卫生统计学的意义,例1.4,某医师研究用,兰芩口服液,与,银黄口服液,治疗,慢性咽炎,疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗问题:这两种药物的疗效是否相同?,药物,疗效,合计,有效,无效,兰芩口服液,41,4,45,银黄口服液,24,11,35,合计,65,15,80,一、学习卫生统计学的意义,例1.5,某研究者欲评价新药,按摩乐口服液,治疗,高甘油三脂血症,的疗效,将高甘油三脂血症患者189例随机分为两组,分别用按摩乐口服液和,山楂精降脂片,治疗,数据见表10-4,问两种药物治疗高甘油三脂血症的疗效有无不同?,表 两种药物治疗高甘油三脂血症的疗效,一、学习卫生统计学的意义,二、统计学的若干概念,总体与样本,同质与变异,变量的类型,观察单位与变量,误差,概率与频率,观察单位:,某地2000年每个7岁正常儿童,被观察或测量对象的最基本单位,也称,个体,,可以是一个人、一个动物或一个采样点等。
观察单位与变量,二、统计学的若干概念,例,:欲观察某地2000年7岁正常儿童的身高变量:,身高,对每个观察单位的,某项特征,进行测量或观察,该项特征就称为,变量,被观察单位的该项特征值为,变量值,分类变量:,通过确定每个观察单位的某项特征的,性质或类别,得到的数据,,例如,,,职业、性别等,包括:,无序分类变量:,多分类变量,(,血型,),二分类变量,(,性别,),有序分类变量:,疗效,(好、中、差),数值变量:,通过,测定,每个观察单位的某项特征的大小得到的数据有,度量衡单位,连续型变量,:,如,血压、身高、体重等离散型变量,:,如,一月中的手术病人数,一年里的新生儿数等变量的类型,分类变量,数值变量,二、统计学的若干概念,离散型变量,常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析连续型,有序,分类,二分类,变量的类型,变量转化:变量只能由高级向低级转化:,二、统计学的若干概念,例:一组20,40岁成年人的血压(舒张压),以12kPa(90mmHg)为界分为正常与异常两组,统计每组例数8 低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,计量资料,等级资料,计数资料,变量的类型,二、统计学的若干概念,变量的类型,二、统计学的若干概念,数值变量,分类变量,无序分类变量,有序分类变量,计量资料,计数资料,等级资料,资料类型,统计资料类型:,资料类型,变量类型,示例,统计指标,统计分析方法,计量资料,数值变量,人体身高,170cm,168cm,171cm,平均数,标准差,t,Z,F,直线相关与回归,计数资料,无序分类变量,性别,男,女,率,比,构成比,卡方检验,Z检验,等级资料,有序分类变量,治疗效果,痊愈,好转,无效,构成比,秩和检验,二、统计学的若干概念,同质与变异,同质性:,研究对象具有,相同,的状况或属性等共性。
变异:,同一总体内的同质的各观察单位其某变量值之间的,差异,例如:研究某新药治疗胃溃疡的效果?,二、统计学的若干概念,例,:研究某地2005年活产婴儿的出生体重二、统计学的若干概念,总体与样本,如:欲研究2009年厦门市成年人高血压患病率情况总体,:根据研究目的确定的同质观察单位的全体根据总体中观察单位数是否已知,分为:,有限总体,:有确定的时间、空间和有限个观察单位无限总体:,没有确定的时间、空间限制,观察单位数为无限总体,样本,抽取部分观察单位,?,统计推断,总体与样本,为了保证样本的可靠性和代表性,需要采用,随机,的抽样方法(,在总体中每个个体具有相同的机会被抽到,)二、统计学的若干概念,样本:,是指总体中的一部分观察单位的某项变量值的集合,必须对总体具有代表性如:欲调查某地2005年活产婴儿的出生体重,欲研究某药治疗胃溃疡的效果,泛指测量值与真值之差.,误差,二、统计学的若干概念,系统误差,随机测量误差,抽样误差,包括:,指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为,系统误差误差,二、统计学的若干概念,系统误差:,特点:,可避免,不可估计其大小。
误差,二、统计学的若干概念,随机测量误差:,在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫,随机测量误差,特点:,不可避免,不可估计其大小误差,二、统计学的若干概念,抽样误差:,由于,抽样,原因造成的,样本指标与总体指标,之间的差别,可以通过增大样本使其减小特点:,不可避免,但可用统计学方法估计其大小总体,样本,抽取部分观察单位,系统误差,随机测量误差,抽样误差,二、统计学的若干概念,指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性由于抽样原因造成的样本指标与总体指标之间的差别特点:,可避免,不可估计其大小特点:,不可避免,不可估计其大小特点:,不可避免,但可用统计学方法估计其大小频率与概率,二、统计学的若干概念,频率和概率均,表示随机事件发生可能性的大小,记作P,p如:,某药治疗200个病人,其治愈率为80%统计分析中的很多结论都是带有概率性的习惯上将 P0.05,或,P,0.01,,称为小概率事件,,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。
频率与概率,Certain,Impossible,0.5,0,1,必然事件,P,=1,随机事件,0,P,1,不可能事件,P,=0,二、统计学的若干概念,参数:,是统计模型的特征指标,是对总体而言,,其大小是客观存在的,然而往往是未知的,,,如总体均数和总体方差;,统计量:,由观察资料计算出来的量,,如计算观察样本中的个体得到的样本均数,样本方差参数与统计量,二、统计学的若干概念,总体,样本,抽样研究,描述和统计推断,参数与统计量,参数,统计量,二、统计学的若干概念,三、统计工作的步骤,第1步,第2步,第3步,第4步,设 计,收集资料,整理资料,分析资料,制定计划,对整个过程进行安排是整个工作的关键如何进行设计?举例背景-目的-方法-内容-经费预算,根据计划取得可靠、完整的资料收集资料的方法有三种:统计报表、日常性工作、专题调查注重资料的真实性原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析可借助于计算机(常用软件:EPI、SPSS、SAS)统计学的关键所在运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律包括,统计描述和统计推断练习,1.统计学中所说的有代表性的样本指的是(),随意抽取的总体中任意个体,有意识地选择总体中有典型个体,依照研究者要求选取总体中有意义的个体,最方便获取的部分个体,依照随机原则抽取总体中的个体,E,练习:,2.下列变量的观测结果属于等级资料的是(),白细胞计数,住院天数,门诊就诊人数,患者病情分级,各临床科室的患者数,D,练习:,3.抽样的目的是(),研究样本统计量,由样本统计量推断总体参数,研究典型案例,研究总体统计量,研究特殊个体特征,B,练习:,4.关于随机抽样,下列哪一项说法是正确的(),抽样时应使得总体中的每一个个体都有同等的机会被抽取,研究者在抽样时应精心挑选个体,以使样本更能代表总体,随机抽样即随意抽取个体,为确保样本具有很好的代表性,样本量应越大越好,选择符合研究者意愿的样本,A,练习:,5、对某地200名16岁中学生口腔检查,发现龋齿的人数54人,该资料属于(),计量资料,计数资料,等级资料,经变量转换也可以作为计量资料,B,练习:,6、下面的变量中,属于分类变量的是(),A.脉搏,B.血型,C.肺活量,D.红细胞计数,E.血压,B,练习:,7、某人记录了50名病人体重的测定结果:小于50Kg的13人,介于50Kg和70 Kg间的20人,大于70 Kg的17人,此种资料属于(),A.计量资料,B.计数资料,C.等级资料,D.无序分类的计数资料,E.名义变量资料,C,练习:,8、下面的变量中,属于数值变量的是(),A.性别,B.体重,C.血型,D.职业,E.民族,B,练习:,9、调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于(),计量资料,计数资料,总体,个体,A,练习:,1.在研究工作中,误差是不可避免的,,误差是可以而且应该避免的,统计方法能处理的是,误差。
2.统计工作的四个步骤是:,,,,,,,随机测量,系统,抽样,设计,收集资料,整理资料,分析资料,练习:,某年级甲班、乙班各有50人从两个班各抽取10人测量身高,并求其平均身高,如果甲班的平均身高高于乙班,,能否推论甲班所有同学的平均身高高于乙班?,为什么?,练习:,谢 谢,。