


单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,卫生统计学 绪论,1,统计学Statistics的定义,研究内容:,搜集,整理,分析,推断,目的:处理数据中的变异性,求得可靠的结果,工作内容:,参与随机现象研究的设计观察和资料的搜集,处理研究阶段与统计相关的问题并提出建议,根据统计学原理对资料进行统计分析和推断,2,医学中的统计学科,医学统计学Medical Statistics:统计学原理在医学中的运用,生物统计学Biostatistics,:,生命科学研究、临床医学研究、预防医学研究-国际,生命科学实验研究-我国,卫生统计学Health Statistics:预防医学研究-我国,3,医学中的随机现象,统计学思维和方法渗透到医学研究和卫生决策之中,4,医学中的统计思维-百年发展,1834 统计学的目标-数据搜集,1894 Pearson 现代统计教育,Pearson和Galton的努力将其变为高级的应用,数学学科,并用于解决医学、生物学问题,1903 Lister预防医学研究所创建第一个统计系,统计在医学中的作用开始得到强调和认可,强调医学艺术 统计艺术,强调个人经验 科学证据,5,医学领域的应用,实验室研究-实验数据分析,临床研究-个体,临床试验-临床治疗的有效性和安全性,临床用某种药物治疗缺铁性贫血的疗效,甲:治疗10人,8人有效,乙:治疗10人,4人有效,临床科研,外科医生观察了50例肿瘤病人的术后生存情况(月):,3,10,20,12,28,7,9、,反应停事件:“医学专业判断”?,6,医学领域的应用,公共卫生-群体,流行病研究-吸烟与肺癌(Doll和Hill),卫生服务-卫生资源需求和利用、医保改革,健康统计-医学人口、生长发育、疾病统计等,药学,药物筛选,药代动力学等,7,个体:根据研究目的确定的最基本的研究对象单位,也称观察单位,同质的(homogeneous)和异质的(heterogeneous):具有相同性质的观察单位称为同质的;否则为异质的,调查某地1995年正常成年女子的糖化血红蛋白-同质的要素?,调查某地1995年正常成年女子的雌激素水平-同质?,基本概念-个体individual,8,基本概念-变量和资料variable and data,变量-所研究的观察对象的一个或几个特征,观察指标,资料-变量的观测值组成,随机变量random varialbe:观察结果是随机的。
随机变量分为:连续型资料和离散型资料,9,变量类型,连续型变量-取值范围是一个区间,连续取值,离散型变量-取值范围是有限个值或一个数列构成表示分类情况的离散型变量又称为分类变量:,无序变量:两分类和多分类如血型,也可用数字进行编码,但没有大小关系有序变量/等级变量:取值为互不相容的类别,而且在研究背景下有等级顺序,如疗效(无效、有效、显效),变量的转化,连续型-有序-分类,信息损失,基本概念-变量和资料variable and data,10,基本概念-变量和资料variable and data,例:调查某地某年1岁儿童的生长发育情况,总体:某地某年1岁的儿童(同质和变异?),变量:性别、身高、体重、出牙、营养状况,变量类型:?,11,基本概念-总体与样本population and sample,例:假定某该地在1998年的7岁男孩有10万人,现研究1998年该地7岁男孩的身高情况现在随机抽样调查了解200名7岁男孩的身高情况,测量他们的身高,通过分析这200个儿童的身高推断该地10万个7岁男孩身高情况12,基本概念-总体与样本population and sample,上述例子中涉及到下列概念:,研究目的:1998年某地7岁男孩的身高情况。
研究对象:该地在1998年的10万个7岁男孩观察单位(个体):每个7岁男孩观察指标:身高(观察指标又称为变量),观察值:身高测量值(亦称变量的取值),总体:该地1998年的10万个7岁男孩身高观察值的全体(即:10万个身高观察值构成的一个集合)样本:随机抽样的200个7岁男孩身高观察值,13,基本概念-总体与样本population and sample,总体:,根据研究目的确定的同质的所有个体某项观察值(测量值)的集合实际研究中往往观察/测量多个指标,构成个体的一组观察指标,因此简单的称总体是根据研究目的确定的同质个体的全体如:某时某地区10岁正常发育男孩的身高分布情况,有限总体和无限总体:,研究总体和目标总体:,目标总体:用某药治疗的全部贫血患者(无时间地点限制),研究总体:符合研究条件的贫血患者,14,基本概念-总体与样本population and sample,抽样:在较大范围的研究对象(总体/总体的一部分)中随机抽取一部分个体,样本sample:这些个体的测量值构成样本样本量sample size:样本中的个体总数,透过样本数据研究总体规律,通过对样本的分析了解总体的基本情况或推断总体的特征,15,基本概念-概率和频率probabililty and frequency,随机事件:随机现象的某个可能观察结果。
如治疗的结果:治愈和未愈,频率:在n次观察中,随机事件A发生了m次,则A发生的比例为f=m/n频率呈现随机性和波动性:治愈率不同,随着观察次数n的增大,f随机波动幅度减小,并趋于常数即概率概率:描述随机事件发生的可能性大小,0-1小概率事件:随机事件发生的概率小于等于0.05,小概率事件原理:小概率事件在依次随即抽样中不会发生-统计推断的原理,未知的总体参数,16,同质总体的大同小异,个体变异individual variation:同质个体的某指标之间的差异,具有普遍性、随机性,例:调查某地1999年20-40岁全部成年男子的血红蛋白水平,同一总体的同质性,不同总体的异质性,例:研究同性别、同年龄中日小学生的身高是否相同-大同小异?总体不同?,基本概念-个体变异和资料分布,17,同类个体变异在概率意义下是有规律的,表现为观察值出现在不同范围中的概率大小,资料分布:称随机变异的规律性为该指标取值的概率分布,简称为资料的分布,同一,总体,的个体之间的差异具有一定的规律性,以变量值的分布来反映,如正态分布,称为某变量服从正态分布任何随机现象或随机变异都有其固有的分布规律,即概率分布,在大量重复观察的条件下就会呈现其规律性,基本概念-个体变异和资料分布,18,基本概念-参数和统计量parameter and statistic,参数:刻画总体特征的指标称为总体参数。
用来确定某一分布的特征;如总体均数,总体阳性率,往往是未知的,统计量:刻画样本特征的指标称为统计量由观察资料计算出来的量;可以用来近似的反映总体参数,统计的任务:由样本估计总体,由样本统计量估计总体参数,19,基本概念-抽样误差和测量误差,抽样误差sampling error:由随机抽样造成的样本统计量和总体参数之间的差异,抽样分布:抽样误差在一次抽样中是随机的,在概率意义下(量重复抽样中)是有规律的,这种规律称为抽样分布,由于个体变异存在,抽样误差不可避,免,但可通过增加样本含量减小,测量误差:指实际观察值呈现规律性的偏离观察真实值可以通过改进措施消除或减少,是可控的:如同一时间观察,20,统计工作的步骤,设计:正确、周密的设计是研究成败的关键,收集:准确可靠来源:统计报表、工作记录、专题调查或实验,整理:原始资料的清理、录入、检查,分析:,统计描述和统计推断,由样本估计总体,由样本统计量估计总体参数;,阐明事物的内在联系和规律,合理呈现,21,目标与方法,目标:了解统计的重要性,学会统计的思维,用统计的方法为自己的工作服务,方法:理论联系实际,掌握基本知识、基本技能、概念的方法,多联系实际,讨论和操作,22,。