当前位置首页 > 高等教育 > 统计学
搜柄,搜必应! 快速导航 | 使用教程

统计学第6章抽样和抽样分布不讲概率

文档格式:PPT| 127 页|大小 1.34MB|2024-12-10 发布|举报 | 版权申诉
第1页
第2页
第3页
下载文档到电脑,查找使用更方便 还剩页未读,继续阅读>>
1 / 127
此文档下载收益归作者所有 下载文档
  • 版权提示
  • 文本预览
  • 常见问题
  • 单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,第6章 抽样与抽样分布,,,第 6 章 抽样与抽样分布,6.1,抽样的基本概念,,6.2 抽样分布基本理论,,6.3 样本,抽样分布,,6.4 抽样误差的计算,,,学习目标,了解抽样中的概率抽样方法,,理解抽样分布的意义,,了解抽样分布的形成过程,,理解中心极限定理和大数定理,,理解抽样分布的性质,,6.1,抽样的基本概念,6.1.1,抽样推断,,,6.1.2,抽样的方法,,,6.1.3,样本容量和样本个数,,,6.1.4,参数和样本统计量,,,6.15,抽样框,,,6.1.6,抽样的组织形式,,,6.1.7,抽样误差,,,,,从研究现象总体的所有单位中,按照,随机原则,抽取部分单位作为样本,然后以样本的观测结果对总体的数量特征作出具有,一定可靠程度和精度,的估计或推断的一种统计调查方法抽样推断的含义,总体,,,,,,,,随机样本,,,,1.在调查单位的抽取上遵循随机原则,抽样推断方法的,特点,2.以样本的数量特征去推断总体的数量特征,3.存在抽样误差,可计算并加以控制,,一、了解不能或难以采用全面调查的总体的数量特征,,二、与全面调查相结合,修正和补充全面调查,,三、在生产过程中进行质量控制,,四、可以对总体的某种假设进行检验,,,抽样推断的,作用,,(一)参数估计,,(二)假设检验,抽样推断的,内容,,6.1,抽样的基本概念,6.1.1 抽样推断,,6.1.2,抽样的方法,,,6.1.3,样本容量和样本个数,,,6.1.4,参数和样本统计量,,,6.15,抽样框,,,6.1.6,抽样的组织形式,,,6.1.7,抽样误差,,,,6.1.2 抽样的方法,抽样的方法,重复抽样,不重复抽样,,,重复抽样:也叫回置抽样。

    特点:每个单位在每次抽中机会一样不重复抽样:也叫不回置抽样特点:每个单位在每次抽中机会不一样;每个单位最多只能被抽中一次不重复抽样的抽样平均误差小于重复抽样的抽样平均误差6.1.1 抽样推断,,,6.1.2,抽样的方法,,,样本容量和样本个数,,,6.1.4,参数和样本统计量,,,6.15,抽样框,,,6.1.6,抽样的组织形式,,,6.1.7,抽样误差,,,,6.1.3 样本容量和样本个数,样本容量:样本中的单位数,通常用字母,n,表示通常,,n≥30,的样本称为大样本,,n,<,30,的样本称为小样本样本个数:从总体中可能抽得的样本的数目,,,样本的可能数目,从总体N中随机抽取n个样本单位共有多少种可能的抽选结果与抽样方法和是否考虑顺序有关有以下四种组合:,⒈ 重复抽样考虑顺序,⒉ 不重复抽样考虑顺序,3. 不重复抽样不考虑顺序,4 重复抽样不考虑顺序(不常用),,⒈ 重复抽样考虑顺序的可能样本数目:,⒉ 不重复抽样考虑顺序的可能样本数目:,共n个,3 不重复抽样不考虑顺序的可能样本数目:,,6.1,抽样的基本概念,6.1.1 抽样推断,,6.1.2 抽样的方法,,6.1.3 本容量和样本个数,,6.1.4,参数和样本统计量,,,6.15,抽样框,,,6.1.6,抽样的组织形式,,,6.1.7,抽样误差,,6.1.4 参数和统计量,参数(parameter),,来描述总体数量特征的指标,又称总体指标。

    即对总体特征的数量描述参数已知,总体的分布特征就已知所关心的参数主要有总体均值(,,),、标准差(,,)、总体比例(P/,),等,,用  表示,,参数的特点:参数的数值是客观存在的,总体一定,参数就唯一确定,但却是未知的统计量(statistic),,又称样本指标或估计量,是根据样本数据计算出来的一些量,用以推断总体参数(总体指标)的综合指标特点:是随样本不同而不同的,随机变量,不含未知参数所关心的样本统计量有:样本均值(,,x,)、样本标准差(,s,)、样本比例(,p,)等,,用,,表示,,,,,平均数,,标准差,,比例,参数,,,,,,统计量,,,x,,s,,p,,,,,,,,,总体,,,,样本,,6.1,抽样的基本概念,6.1.1 抽样推断,,6.1.2 抽样的方法,,6.1.3 本容量和样本个数,,6.1.4,参数和样本统计量,,,6.15,抽样框,,,6.1.6,抽样的组织形式,,,6.1.7,抽样误差,,6.15抽样框,,抽样框:全部抽样单位的名单框架抽样框的好坏通常会直接影响到抽样调查的随机性和调查效果有如下几种抽样框形式:,,名单抽样框:列出全部总体单位的名录一览表。

    如职工名单,企业名单区域抽样框:按地理位置将总体范围划分为若干小区,以小区为单位进行抽样如市住房调查划分为街道、区片时间抽样框:将总体全部单位按时间顺序排列,每隔一定时间抽样如流水线抽样进行产品质检6.1,抽样的基本概念,6.1.1 抽样推断,,6.1.2 抽样的方法,,6.1.3 本容量和样本个数,,6.1.4 参数和样本统计量,,6.15 抽样框,,6.1.6,抽样的组织形式,,,6.1.6,抽样误差,,6.1.6,抽样的组织形式,一、简单随机抽样,,二、分层抽样,,三、系统抽样,,四、整群抽样,,五、多阶段抽样,,,——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本,应用,仅适用于规模不大、内部各单位标志值差异较小的总体,是最简单、最基本、最符合随机原则,,,但同时也是抽样误差最大的抽样组织形式,简单随机抽样,(,simple random sampling,),抽签、随机数字表法,,59079 46755 72348 69595 53408 92708 67110 68260 79820 91123,,48391 76486 60421 69414 37271 89276 07577 43880 08133 09898,,67072 33693 81976 68018 89363 39340 93294 82290 95922 96329,,86050 07331 89994 36265 62934 47361 25352 61467 51683 43833,,84426 40439 57595 37715 16639 06343 00144 98294 64512 19201,,注意:,,必须先对总体中的每一个单位进行编码或编号,确定抽样框。

    简单随机抽样适合于调查标志在各单位分布较均匀的总体,一般情况下,简单随机抽样的效果相对差些——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本总体,,N,样本,,n,等额抽取,等比例抽取,最优抽取,···,···,能使样本结构更接近于总体结构,提高样本的,,代表性;能同时推断总体指标和各子总体的指标,分层抽样,(stratified sampling),,注意:,,1、随机性,,2、分层抽样要求事先对总体有较多的了解3、分层抽样对层而言是全面调查,对层内单位而言是非全面调查4、能避免明显的偏高或偏低情况5、适合于调查标志在各单位间的分布差异大的总体等距抽样/机械抽样,——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位······,随机起点,半距起点,对称起点,(总体单位按某一标志排序),按无关标志排队,其抽样效果相当于,简单随机抽样,;按有关标志排队,其抽样效果相当于,类型抽样,系统抽样,(systematic sampling),,,—— 将总体全部单位分为若干,“群”,,然后随机抽取一部分,“群”,,被抽中群体的所有单位构成样本,例:总体群数R=16 样本群数r=4,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,L,H,P,D,样本容量,简单、方便,能节省人力、物力、财,,力和时间,但其样本代表性可能较差,整群抽样,(cluster sampling),,,—— 指分两个或两个以上的阶段来完成抽取样本单位的过程,例:在某省100多万农户抽取1000户调查农户生产性投资情况。

    第一阶段:从该省所有县中抽取5个县,第二阶段:从被抽中的5个县中各抽4个乡,第三阶段:从被抽中的20个乡中各抽5个村,第四阶段:从被抽中的100个村中各抽10户,样本n=100×10=1000(户),多阶段抽样,,调查对象的性质特点,,对调查对象的了解程度,,抽样误差的大小,,人力、财力和物力等条件的限制,在实际工作中,选择适当的抽样组织方式主要应考虑:,抽样组织方式的选择,,6.1,抽样的基本概念,6.1.1 抽样推断,,6.1.2 抽样的方法,,6.1.3 本容量和样本个数,,6.1.4 参数和样本统计量,,6.1.5 抽样的组织形式,,6.1.6,抽样误差,,抽样中的误差,登记性误差,也叫调查误差,代表性误差,系统性误差,偶然性误差,偏差,抽样误差,抽样中的误差,(抽样误差的计算在后边讲),,6.2 抽样分布基本理论,6.2.1,中心极限定理,,,6.2.2,正态分布的再生定理,,,6.2.3,大数定律,,,6.2.4,三种不同性质的分布,,,6.2.5,常见的几种抽样分布,,,,,,,中心极限定理:,设从均值为,,,方差为,,2,的一个任意总体中采取重复抽样抽取容量为,n,的样本,当,n,充分大时,样本均值的抽样分布近似服从均值为,μ,、方差为,σ,2,/,n,的正态分布,不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当样本量,n,充分大,就趋于正态分布,,该定理为均值的抽样推断奠定了理论基础。

    中心极限定理,,中心极限定理,当样本容量足够大时(,n,,,30) ,样本均值的抽样分布逐渐趋于正态分布,一个任意分布的总体,x,,中心极限定理,,x,的分布趋于正态分布的过程,,正态分布的再生定理,,= 50,,,=10,X,总体分布,n,= 4,抽样分布,x,n,=16,当总体服从正态分布,N,(,μ,,,σ,2,),时,来自该总体的所有容量为,n,的样本的均值,,x,也服从正态分布,,,x,的数学期望为,μ,,方差为,σ,2,/,n,即,,x~N,(,μ,,,σ,2,/,n,),,例题分析,,[例]某酒店电梯中质量标志注明最大载重为18人,1350kg假定已知该酒店旅客及其携带行李的平均重量为70kg,标准差为6kg试问随机进入电梯18人,总重量超重的概率是多少?,,,,例题分析,,[例] 一个汽车电池的制造商声称其最好的电池寿命的分布均值为54个月,标准差为6个月假设某一消费组织决定购买50个这种电池作为样本来检验电池的寿命,以核实这一声明1)假设这个制造商所言真实,试描述这50个电池样本的平均寿命的抽样分布,,(2)假设这个制造商所言真实,则消费组织的样本寿命均值小于或等于52个月的概率是多少?,,,,,6.2.3 大数定律,1. 独立同分布大数定律,,2. 贝努里大数定律,,大数定律是阐述大量同类随机现象的平均结果,,的稳定性的一系列定理的总称。

    独立同分布大数定律,——,设,X,1,,,X,2,, …,是独立同分布的随机变量序列,且存在有限的数学期望,E,(,X,i,),=,μ,和方差,D,(,X,i,,),=,σ,2,(,i,=1,2,…,),则对任意小的正数,ε,,,有:,,,大数定律(续),该大数定律表明:当,n,充分大时,相互独立且服从同一分布的一系列随机变量取值的算术平均数,与其数学期望,μ,的偏差小于任意小的正数概率接近于1该定理给出了,平均值具有稳定性的科学描述,从而为使用样本均值去估计总体均值,(数学期望)提供了理论依据贝努里大数定律,设,m,是,n,次独立重复试验中事件,A,发生的次数,,p,是每次试验中事件,A,发生的概率,则对任意的,ε,> 0,有:,它表明,当重复试验次数,n,充分大时,事件,A,发生的频率,m,/,n,依概率收敛于事件,A,发生的概率,,阐明了,频率具有稳定性,提供了用频率估计概率的理论依据,总体分布,,总体中各元素的观察值所形成的分布,,分布通常是未知的,,可以假定它服从某种分布,6.2.4 三种不同性质的分布,总体,,一个样本中各观察值的分布,,也称经验分布,,当样本容量,n,逐渐增大时,样本分布逐渐接近总体的分布,样本分布,样本,,抽样分布是来自,容量相同,的,所有,可能样本的概率分布,,是一种理论分布,,抽取容量为,n,,的样本时,由该统计量的所有可能取值形成的概率分布,,,样本统计量(如,样本均值,,,样本比例,样本方差等,),是随机变量 ,样本不同,样本统计量的计算值是不同的。

    3.,抽样分布反映样本统计量的分布特征,是进行推断的理论基础,揭示样本统计量和总体参数之间的关系,估计抽样误差,是抽样推断科学性的重要依据,,抽样分布,,抽样分布的形成过程,总体,计算样本统计量,,如:样本均值、比例、方差,样本,,6.2.5 常见的几种抽样分布,X~N,(,μ,,,σ,2,),,正态分布(略),,,,2,—分布,,t—分布,,F—分布,,正态分布,(normal distribution),由,C.F.,高斯,(,Carl Friedrich Gauss,,,1777,—,1855,),作为描述误差相对频数分布的模型而提出,,描述连续型随机变量的最重要的分布,,许多现象都可以由正态分布来描述,,可用于近似离散型随机变量的计算,,例如: 二项分布,,经典统计推断的基础,x,f,(,x,),,概率密度函数,f,(,x,) = 随机变量,X,的频数 (概率密度函数),,,= 正态随机变量,X,的均值,,,,= 正态随机变量,X,的方差,,,,= 3.1415926,; e =,2.71828,,x,= 随机变量的取值 (-,,<,x,<,+,,),,X服从参数为,,,,的正态分布,记为X~N(,,,,),,正态分布函数的性质,图形是关于,x,=,,对称钟形曲线,且峰值在,x,=,,处,,均值,,和标准差,,一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”,,均值,,可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的,“陡峭”或“扁平”程度,。

    ,越大,正态曲线扁平;,,越小,正态曲线越高陡峭,,当,X,的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交,,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于,1,,,,,和,,对,正态曲线的影响,,x,f,(,x,),C,A,B,,=1/2,,1,,2,,=1,,正态分布的概率,概率是曲线下的,面积,!,a,b,x,f,(,x,),,,标准正态分布,标准正态分布,的概率密度函数,随机变量具有均值为,0,,标准差为,1,的正态分布,,表示为,X~N(0,1),标准正态分布,的分布函数,,标准正态分布,,标准正态分布,X,m,s,一般正态分布,,=1,Z,标准正态分布,, ,,标准化证明,,通过 的线性变化,,,将随机变量,X~N(,,,,),,转化成,,X~N(,0,1,,),的标准正态分布,,标准正态分布表的使用,对,于标准正态分布,即,Z,~,N,(0,1),,,有,,P,(,a,,Z,,b,),,,b, ,,,a,,,P,(|,Z,| ,a,),2,,,a, ,1,,对于负,的,z,,,,可由,,(-,z,),,,z,,得到,,对,于一般正态分布,即,X,~,N,(,,,,,),,,有,,,标准化的例子,,P,(5,,X,,,6.2),,X,,,=5,,=10,一般正态分布,6.2,,,=1,Z,标准正态分布,,0,0.12,.0478,,标准化的例子,P,(2.9,,,X,,,7.1),,5,s,= 10,2.9,7.1,X,一般正态分布,标准正态分布,0,,s,= 1,-.21,Z,.21,.1664,.0832,.0832,,正态分布,(例题分析),【例】假,定某公司职员每周的加班津贴服从均值为,50,元、标准差为,10,元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过,70,元,又有多少比例的职员每周的加班津贴在,40,元到,60,元之间呢?,解:,设,,=5,0,,,,,=10,,X,~N,(50,10,2,),,用正态分布近似二项分布,在试验次数,n,很大时,二项分布,X~N(n,p,),,则可以用均值,,=,np,,,,,2,=,n(1-p),的正态分布,,要求:,np,和,,n (1-p),都大于5,才能用正态分布来近似,,,,例题分析,[例]假设有一批种子的发芽率为0.7,现在这种种子1000颗,试求其中有720颗以上发芽的概率,,解:,,,,例:,一种电子元件的使用寿命X(小时)服从正态分布N(100,15,2,),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率.,解,:设Y为,使用的最初90小时内损坏的元件数,,故,则Y~B(3,p),其中,正态分布表,,,2,—分布,,4.,2,—分布的,密度函数f(y)曲线,a.分布可加性,若,X,,~ 2(n,1,),Y~ 2(n,2,),,,X, Y,独立,则,,X + Y ~ ,2,(n,1,+n,2,),,b.期望与方差,,若,X~ ,2,(n),,则,,E(X)= n,D(X)=2n,5.,2,—分布的性质,,C.,,2,(n)分布的变量值总是为正;,,D. 2(n)分布的形状取决于自由度n的大小,通常为不对称的右偏分布,随着自由度n的增大逐渐趋近于对称分布,,6. 分位点,设,X,,~ ,2,(n),,若对于,:0<<1,,,存在,满足,则称,为,分布的上,分位点。

    ~,若总体,U,则,~,~,t,分布,,,,t,分布性质,,,t,分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散一个特定的,t,分布依赖于称之为自由度的参数随着自由度的增大,分布也逐渐趋于标准正态分布,x,t,,分布与标准正态分布的比较,t,分布,标准正态分布,t,不同自由度的,t,分布,标准正态分布,t,(,df,= 13),t,(,df,= 5),z,,t,分布,的概率密度函数为,f(t),的极限为,N(0,1),的密度函数,即,,t,分布,分位点,,设,T~t(n),,若对,,:0<<1,,存在,t,,(n)>0,, 满足,P{Tt,,(n)}=,,,则称,t,,(n),为,,t(n),的上侧分位点,,注:,,由统计学家费舍,(,),,提出的,以其姓氏的第一个字母来命名则,,设若,U,为服从自由度为,n,1,的,,2,分布,即,U,~,,2,(n,1,),,,V,为服从自由度为,n,2,的,,2,分布,即,V,~,,2,(,n,2,),,且,U,和,V,相互独立,则,,,为服从自由度,n,1,和,n,2,的,F,分布,,随机变量,F,简称为,F,变量。

    记为,F,分布,,3.其概率密度为,F,(1,20),(5,20),(10,20),F分布是偏右分布,随着两个自由度增大逐渐接近对称分布,,4. F—,分布的分位点,,对于,:0<<1,,,若存在F,,(n,1,,,n,2,)>0,,,满足,,P{FF,,(n,1,,,n,2,)}=, 则称F,,(n,1,,,n,2,)为,,F(n,1,,,n,2,),的,,上侧,,分位点;,,,6.3 样本抽样分布,6.3.1 样本均值的抽样分布,,6.3.2 样本比率的抽样分布,,6.3.3 抽样平均误差的计算,,6.3.4 样本方差的抽样分布,,6.3.5 两个样本统计量的抽样分布,,,,,在选取容量为,n,的样本时,由样本均值的所有可能取值形成的概率分布,,推断总体均值,,的理论基础,,6.3.1 样本均值的抽样分布,,(例题分析),【例】,设一个总体,,含有4个元素(个体),,即总体单位数,N,=,44,个个体分别为,x,1,=1,,x,2,=2,,x,3,=3,,x,4,=4,总体的均值、方差及分布如下,总体分布,1,4,2,3,0,.1,.2,.3,均值和方差,,(例题分析),,,现从总体中抽取,n,=2的简单随机样本,在重复抽样条件下,共有4,2,=16个样本。

    所有样本的结果为,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二个观察值,第一个,,观察值,所有可能的,n,= 2 的样本(共16个),,样本均值的抽样分布,(数学期望与方差),比较及结论:,1. 样本均值的均值(数学期望) 等于总体均值,,2. 样本均值的方差等于总体方差的1/,n,,x,样本均值的抽样分布,1.0,0,0.1,0.2,0.3,P,,(,x,),1.5,3.0,4.0,3.5,2.0,2.5,,(例题分析),,计算出各样本的均值,如下表并给出样本均值的抽样分布,3.5,3.0,2.5,2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个,,观察值,16个样本的均值(,x,),,样本均值的分布与总体分布的比较,,= 2.5,,σ,2,=1.25,总体分布,1,4,2,3,0,.1,.2,.3,抽样分布,P,(,x,),1.0,0,.1,.2,.3,1.5,3.0,4.0,3.5,2.0,2.5,x,,样本抽样分布特征的证明,,,,样本均值的数学期望,,,样本均值的方差,,重复抽样,,,不重复抽样,样本均值的抽样分布特征,,(数学期望与方差),,抽样分布与总体分布的关系,总体分布,正态分布,非正态分布,大样本,小样本,正态分布,正态分布,非正态分布,,1.总体服从正态分布,N,(,μ,, )时,2. 总体分布未知,当,n,充分大时,重复抽样时,不重复抽样时,重复抽样时,不重复抽样时,近似,近似,,比率:,总体,(,或样本,),中具有某种属性的单位与全部单位总数之比,,不同性别的人与全部人数之比,,合格品,(,或不合格品,),与全部产品总数之比,,总体比率可表示为,,,样本比率可表示为,,,6.3.2 样本比率的抽样分布,,棣莫佛-拉普拉斯中心极限定理,设随机变量,X,服从二项分布,B,(,n,,P,)的,那么当n→ ∞时,,X,服从均值为,n,P,,、方差为,n,P,(1-,P,),的正态分布,即:,或:,上述定理表明:,,n,很大,,np,≥5,,n,(1-,p,) ≥5时,二项分布可以用正态分布去近似。

    在重复选取容量为,n,的样本时,由样本比率的所有可能取值形成的相对频数分布,,当样本容量很大时,样本比率的抽样分布可用正态分布近似,,,推断总体比例的理论基础,,样本比率的抽样分布,中心极限定理,,样本比率的数学期望,,,样本比率的方差,,重复抽样,,,不重复抽样,样本比率的抽样分布,(数学期望与方差),,6.3.3 样本方差的抽样分布,对总体为正态总体:,,,~,,用样本方差推断总体方差,必须知道总体方差的抽样分布样本方差的抽样分布在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布6.3.5 两个样本统计量的抽样分布,两个样本均值之差的抽样分布,,两个样本比率之差的抽样分布,,两个样本方差比的抽样分布,,两个总体都为正态分布,即 ,,,,两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差,,,方差为各自的方差之和,一、两个样本均值之差的抽样分布,,,,从两个服从二项分布的总体中,分别独立抽取两个样本,由两个样本比率之差的所有可能取值形成的相对频数分布分别从两个服从二项分布总体中抽取容量为,n,1,和,n,2,的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布近似服从正态分布。

    分布的数学期望为,,,方差为各自的方差之和,二、两个样本比率之差的抽样分布,,,,三、两个样本方差比的抽样分布,1.两个样本方差比的抽样分布:若两,个总体都为正态分布,即,X,1,~,N,(,μ,1,,,σ,1,2,) ,,X,2,~,N,(,μ,2,,,σ,2,2,),,从两,个总体中分别抽取容量为,n,1,和,n,2,的独立样本,由两个样本方差比的所有可能取值形成的相对频数分布2.两,个样本方差比的抽样分布,服从分子自由度为(,n,1,-1),分母自由度为(,n,2,-1) 的,F,分布,即,,6.4抽样误差的计算,,,抽样误差,实际抽样误差,抽样平均误差,抽样极限误差,,实际抽样误差,指样本统计量与总体参数之间的绝对离差实际抽样误差,│,│,,│,│,,│,│,,,,抽样误差,实际抽样误差,抽样平均误差,抽样极限误差,,抽样平均误差是样本统计量与总体参数的平均离差,也即样本统计量的标准差1.抽样平均误差的概念,,以均值的抽样平均误差为例,,测度所有样本均值对其中心值的离散程度,所有可能的样本均值的标准差,,所有样本均值分布在总体均值的周围,抽样平均误差反映了样本估计值与相应总体参数的平均差异程度,,抽样平均误差越小,样本估计值的分布越集中在总体参数的附近,样本估计值对总体的代表性越高,,,,,(1) 理论公式,,2. 抽样平均误差的计算,,抽样平均误差计算式推导,,〖例3〗现有A、B、C、D四名工人构成的总体,他们的日产量分别为22、24、26、28件。

    从四名工人中任取两名构成一个样本,请利用重复抽样和不重复抽样的方法计算抽样平均误差分析】,先计算出三类数值:,根据抽样平均误差的计算公式,我们必须,本题要求我们计算抽样平均误差,可能样本个数总体平均日产量、,样本平均日产量,、,,解:,,但由于本题计算抽样平均误差要分别采用重复抽样和不重复抽样两种方法,因此,除总体平均日产量计算结果相同外,样本平均日产量、可能样本总数均不完全相同为了准确计算有关数据,我们将所有可能的样本及其平均数列举出来,然后,根据列举结果就可以计算出抽样平均误差列举过程见表4-2,1.采用重复抽样,,,22,24,26,28,22,(22,22),,(22),(22,24),,(23),(22,26),,(24),(22,28),,(25),24,(24,22),,(23),(24,24),,(24),(24,26),,(25),(24,28),,(26),26,(26,22),,(24),(26,24),,(25),(26,26),,(26),(26,28),,(27),28,(28,22),,(25),(28,24),,(26),(28,26),,(27),(28,28),,(28),,,22,24,26,28,22,,(22,24),,(23),(22,26),,(24),(22,28),,(25),24,(24,22),,(23),,(24,26),,(25),(24,28),,(26),26,(26,22),,(24),(26,24),,(25),,(26,28),,(27),28,(28,22),,(25),(28,24),,(26),(28,26),,(27),,,应当指出的是,上面计算抽样平均误差的这个理论公式,在实际应用上会存在两个困难:,列举过程见表4-3,2.采用不重复抽样,⑴运用这个公式要求把,所有的样本都抽选出来,然后计算它们的指标数值,。

    这在实际应用过程中几乎是不可能的⑵运用上面公式要求,总体平均数的数值是已知,的但实际上,总体平均数的数值是未知的,它正是抽样调查要推断的因此,根据上面这个理论公式计算样本平均数的抽样平均误差是行不通的必须选用其他计算公式数理统计已经证明,在随机抽样方式下,,样本平均数(成数)的抽样平均误差可以按下述公式来计算⑴在重复抽样条件下:,,样本平均数的抽样平均误差,样本成数的抽样平均误差,,⑵在不重复抽样条件下:,,①样本平均数的抽样平均误差,在总体单位数很大的情况下,样本平均数的抽样误差,,②样本比率(成数)的抽样平均误差,在,总体单位数很大,的情况下,样本成数的抽样误差,,,样本标准差s的选取标准:,注意,2.在小样本情况下,选用无偏的;,1.在大样本情况下,选用有偏的;,,〖例〗现有A、B、C、D四名工人构成的总体,他们的日产量的标准差为2.236从四名工人中任取两名构成一个样本,请利用重复抽样和不重复抽样的方法计算抽样平均误差由题意知,总体标准差σ,解:,=4,,样本单位数 n,总体单位数N,=2.236,,=2,⑴在重复抽样条件下:,,样本平均数的抽样平均误差,,⑵在不重复抽样条件下:,,样本平均数的抽样平均误差,,[例]某班组有5个工人,他们的单位工时分别是4,6,8,10,12元,现用重复抽样方式从5个工人中随机抽出2人,计算样本的平均工时工资及其抽样平均误差。

    〖例5〗,某厂从1000名工人中采用不重复抽样随机抽取100名工人登记每人日产量,对获得资料进行整理,见表,(1)利用表中数据计算样本平均数的抽样平均误差2)如果工人日产量在118件及以上者为完成生产定额,试计算完成生产定额日产量成数的抽样平均误差由题意知,,解:,=1000,,样本单位数 n,总体单位数 N,=,6.4374,=100,在不重复抽样条件下,,样本平均数的抽样平均误差,利用表中数据,计算得样本标准差s,在不重复抽样条件下,,样本成数的抽样平均误差,,一、总体内部的差异程度(用标准差衡量),,二、样本容量,,三、抽样方法 (重复与不重复),,四、抽样组织形式 (分层抽样和系统抽样要小,简单随机抽样和整群抽样相对要大),,,3.影响抽样平均误差的因素,,,抽样误差,实际抽样误差,抽样平均误差,抽样极限误差,,抽样极限误差,对于某一项调查来说,根据客观要求,一般应有一个允许的误差限度,也就是说若抽样误差在这个限度之内,就认为是可允许的,这一允许的误差限度就称为极限误差本章小结 抽样与抽样分布,6.1,抽样的 基本概念,,,,,,6.2,抽样分布,,,4.1.1 抽样推断,,4.1.2 抽样的方法,,4.1.3 本容量和样本个数,,4.1.4 参数和样本统计量,,4.1.5 抽样的组织形式,,4.1.6 抽样误差,,,4.2.1 三种不同性质的分布,,4.2.2 样本均值的抽样分布,,4.2.3 样本比例的抽样分布,,4.2.4 样本方差的抽样分布,,4.2.5 两个样本统计量的抽样分布,,4.2.6 抽样平均误差的计算,,,,。

    点击阅读更多内容
    卖家[上传人]:niuqichong
    资质:实名认证
    相关文档
    正为您匹配相似的精品文档