


单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,心理测量,,学习内容,心理测量概述,,测验的常模和结果的解释,,信 度,,效 度,,项目分析,,心理测验编制的一般程序,,心理测验的使用,,,,第一节 心理测量概述,心理测量的历史,,心理测量,,心理测验的分类,,纠正错误的心理测验观,,,,第一单元 心理测量的历史,一、中国古代的心理测验,,《黄帝内经》,,孔子,,孟子,,西周采用“试射”的办法选拔文官,,科举取士,,刘勰的著作提到了类似现代“分心测验”,,,,第一单元 心理测量的历史,二、心理测验在西方的早期探索,,冯特,,高尔顿(Gollton)首次提出了“心理测量”的概念,,卡特尔(Cattell)第一次使用了”心理测验” 概念,,医学和精神病学家工作的重要影响:克雷匹林(Kraepelin,E)、艾宾浩斯等,,,,,第一单元 心理测量的历史,三、心理测验在西方的产生,,法国心理学家比奈(Binet)是第一个智力测验的创立者,,,,四、心理测验在西方的发展,1.智力测验的发展,,斯坦福一比奈智力量表首次使用了智商(Intelligence Quotient,即IQ)的概念。
用于教育和临床领域,是最有影响的智力测验之一在1937、1960、1972、1986 年被四次修订比奈量表介绍,,,四、心理测验在西方的发展,2)韦克斯勒-贝尔韦量表:韦克斯勒改进了智商的概念,提出了离差智商,这是一个巨大的进步,,1974年发表WISC修订本WISC-R,,1981年发表WAIS修订本WAIS-R,,1991年WISC第三版,(WISC-III),出版,,,韦克斯勒量表介绍,,,,言语测验,,1,知识,常识,2,领悟,社会价值观,道德,判断力,3,背数,注意力,记忆力,4,相似性,抽象概括,逻辑思维,5,算术,注意记忆力,6,词汇,理解力,言语发展力,韦克斯勒量表,,操作量表,,1,数字符号,手眼协调,注意力,操作速度,2,填图测验,视觉辨别力,概括力,3,积木图案,空间知觉,视觉分析力,4,图片排列测验,思维灵活性,逻辑联想,5,拼图测验,想象力,手眼协调力,,,韦克斯勒量表介绍,,,韦克斯勒量表介绍,,,韦克斯勒量表介绍,,,四、心理测验在西方的发展,3)1938年,英国心理学家瑞文(Raven, J. C)出版瑞文标准推理测验,,,瑞文标准推理测验,,,四、心理测验在西方的发展,3.能力倾向测验的产生与发展音乐能力测验、教学能力测验等。
4.人格测验的产生与发展,,艾森克的EPQ问卷,,卡特尔的16PF问卷,,明尼苏达多项人格量表(MMPl),,加里福尼亚心理调查表(CPl),,,艾森克的EPQ问卷,1.你是否有许多不同的业余爱好?,,2.你的心境是否常有起伏?,,3.你是否健谈?,,4.你曾无缘无故觉得"真是难受"吗?,,5.你是否比较活跃?,,6.你是否常常为自己不该作而作了的事,不该说而说了的话,,而紧张吗?,,7.你喜欢跳降落伞吗?,,8.通常你能在热闹联欢会中尽情地玩吗?,,9.你容易激动吗?,,10.你是一个容易伤感情的人吗?,,11.在社交场合你是否总不愿露头角?,,......,,,,,艾森克的EPQ问卷,,,1,疑病量表,对健康的不正常的关心,2,抑郁量表,情绪低落,焦虑,3,癔病量表,对心身的关注,自我中心,4,偏执量表,社会行为偏离特点,5,男子气女子气量表,男子女性化,女子男性化特点倾向,6,妄想量表,病理性思维,7,精神衰弱量表,精神衰弱,强迫,恐怖,8,精神分裂症量表,思维异常和古怪行为,9,躁狂量表,情绪紧张,过度兴奋,10,社会内向量表,社会化倾向,明尼苏达多项人格量表,,,五、心理测验在中国的发展,1979年,林传鼎、张厚粲等以国外资料为参考,编制了,少年儿童学习能力测验,,1980年初,北师大心理系开设了心理测量课,,林传鼎、张厚粲修订,韦氏儿童智力量表WISC-R,,吴天敏在1979和1981年间主持修订的,比奈一西蒙智力量表,,龚耀先主持修订:,韦氏成人(儿童、学前和幼儿)智力量表、韦氏成人记忆量表、EPQ问卷、罗夏测验,,宋维真与香港张妙青合作修订,MMPl人格问卷,,辽宁教育科学研究所的李绍农修订,16PF,,,第二单元 心理测量,,,一、心理测量,(一)测量,,测量:依据一定的法则用数字对事物加以确定。
三个要素:事物、数字、法则,,,一、心理测量,1.事物:即事物的属性或特征,一个事物有很多属性,,2.数字:区分性、序列性、等距性和可加性的性质,,3.法则:测量所依据的规则和方法,,,二、测量的量表,1.测量要素,,参照点,,单位,,,三、测量量表,命名量表(类别量表),顺序量表(等级量表),等距量表,,等比量表(比率量表),,,三、测量量表,1.命名量表(类别量表)命名量表属于四种测量中最低水平的测量,,1表示男人,用2表示女人,,,有区分性,,没有序列性、等距性和可加性,,,,三、测量量表,2.顺序量表(等级量表):根据事物某一属性在量的方面的差别而指派相应的数字,,数字代表了事物属性的大小和等级关系,,数字具有区分性、序列性,,不具有等距性和可加性,,,,,三、测量量表,3.等距量表:有相等的单位,具备了等距性和可加性,,不能进行乘除运算,,,,三、测量量表,4.等比量表(比率量表):是最高水平的测量,,有相等的单位,还有绝对的零点,,能进行乘除运算,,,心理测量属于哪一个测量水平呢?,没有绝对零点,,测量的单位是不相等,,心理测量属于等级测量,等距测量,,,第二单元 心理测验的基本概念,一、定义,,依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行动活动中的心理特征作出推论和数量化分析的一种科学手段。
一、定义,心理测验:是对行为样本的客观和标准化的测量美国 Anastasi, A),,心理测验的三个要素:,,1.行为样本(Sample Of Behavior),,2.标准化(Standardization),,3.客观测量(objective measurement),,,二、心理测验的性质,间接性,,相对性,,客观性,,,第三单元 心理测验的分类,1.按测量功能分 智力测验、特殊能力测验和人格测验,,2.按测验材料分,,文字测验 、非文字测验(操作测验),,3.按测验材料的严谨程度分,,客观测验、投射测验,,4.按被试的人数分,,个别测验 、团体测验,,5.按测验的要求分,,最高作为测验、典型作业测验,,,罗夏投射测验,,,二、测验的功用,1.分类(Classification),,选拔(Selection),,证明(Certification),,安置(Placement),,初选(Screening),,2.诊断(Diagnosis),,3.评价(Evaluation),,4.研究(Research),,,第四单元 纠正错误的心理测验观,一、错误的测验观,,测验万能论,,测验无用论,,心理测验就是智力测验,二、正确的测验观,,1.测验是重要的心理学研究方法之一,是决策的辅助工具,,2.心理测验作为研究方法和测量工具尚不完善,,3.科学的看待测验,防止乱编滥用心理测量,,,,第二节 测验的常模和结果的解释,第一单元 常模团体,,第二单元 常模的类型,,第三单元 常模的表示方法,,,,第一单元 常模团体,一、常模团体:有某种共同特征的人组成的一个群体。
是可供比较的量数常模团体必须能够代表该总体二、常模团体的条件,群体的构成必须明确界定,,常模团体必须是所测群体的代表性样本,,样本的大小要适当,,一般最低不小于,30,或,100,个全国性常模,一般应有,2000,~,3000,人为宜,,标准化样组是一定时空的产物,,,三、取样的方法,简单随机抽样,,按照随机表顺序选择被试构成样本,或者给每个样本编号,,,系统抽样,,如果发现排列有某种内部循环规律存在,就不能如此进行了,,分组抽样,,分层抽样,,,三、取样的方法,最常用的是,分层抽样,方法,,它是先将目标总体按某种变量(如年龄、文化程度)分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模样本四、常模分数与常模,(一)常模分数,,原是分:被试的反应与标准答案相比较而获得的测验分数导出分数:原始分数的意义需有参照意义标准才能体现出来,在心理测验中,这种标准是由原始分数构成的分布转换而来的分数,就叫导出分数导出分数具有一定的参照点和单位四、常模分数与常模,,(二)常模:它是解释心理测验分数的基础第二单元 常模的类型,一、发展常模,,二、百分位常模,,三、标准分常模,,,,,第二单元 常模的类型,一、发展常模,,1.顺序量表:为检查婴幼儿心理发展是否正常而设计的,是以婴幼儿代表性行为出现的时间为衡量标准。
2.智力年龄:,,3.年级量表:应用于成就测验中的一种年龄量表每一个学生的原始分都对应着一个年级当量(Grade Equivalence),,,第二单元 常模的类型,二、百分位常模,,1.百分等级量表应用最广泛的方法,,2.百分点(百分位数)计算处于某一百分比例的人对应的测验分数是多少,,3 .四分位数和十分位数,,,第二单元 常模的类型,三、标准分常模:将原始分数与平均数的距离以标准差为单位表示出来的量表线性标准分数量表,,Z=(X-X)/S,,Z=A+Bz,,非线性标准分数量表,,zˊ,,,第二单元 常模的类型,四、智商及其意义,,智力年龄是一个人智力发展的绝对量数,,缺点:,,不能将一个人聪明和愚笨的程度数量化由于不同年龄阶段智力发展的速度不同,使得不同年龄组儿童的智力不能相互比较四、智商及其意义,1912年斯腾最早提出了智商(Intelligence Quotient,IQ)的概念斯坦福一比奈量表中使用的智商是比率智商(Ratio IQ)其计算方法为:,,,四、智商及其意义,难以克服的缺点:①智力增长的终止年龄难以确定,,②智力发展是不等速的,心理年龄与实际年龄并非同步增长③各年龄组智商的标准差不同,不同年龄阶段计算出的智商,不能进行比较,,,3.离差智商,为克服比率智商的缺点,韦克斯勒提出之,,公式:,,X 表示被试的量表分数,表示被试在所在年龄水平的平均量表分数,SD表示这一年龄水平被试的量表分数的标准差,,,第三单元 常模的表示方法,1.转化表(Conversion Table),,2.剖析图(Profiles),,,第三单元 常模的表示方法,,,第三节 信 度,误差的来源:,,随机误差(Random Error) :在不同情境下测量结果是不稳定的,与测量情境和测量条件有关的误差 ,也称测量误差(Measurement Error),,系统误差(System Error):由测量工具本身造成的误差,,,第一单元 信度的概念,一、定义,,信度(Reliability)也称可靠性,是指测验结果的一致性和稳定性程度。
即测验分数不随时间、地点等因素的变化而变化信度是衡量测验整体质量的重要指标指同一被试者在不同时间内用同一测验重复测量,所得结果的一致程度信度受随机误差的影响,不受系统误差的干扰一、定义,真分数与测量误差,,X=T+E,,式中X表示某被试在一个测验实得分数,,T表示真分数,,E表示测验误差,即在测验某一具体形式上产生的随机误差,,,一、定义,在测量理论中,信度被定义为:,,一组测量分数的真分数方差与总方差的比率公式:,,,二、信度的指标,信度系数与信度指数,2. 测量标准误:标准误越小,信度越高,真分数标准差与实得分数标准差的比值,信度系数:,信度指数:,真分数方差与实得分数方差的比值,,,第二单元 信度评估的方法,重测信度,,复本信度,,内部一致性系数法,,评分者信度,,,一、重测信度,稳定性系数(Coefficient of Stability):用同一量表在不同时间内对同一组被试先后施测两次,计算两次测验得分的相关系数,,表示的是测验结果的稳定性,,复本A-------,最短时间,-----复本B,,重测时间间隔可以是几分钟,也可以是几年,但一般不超过6个月一、重测信度,计算重测信度时应注意两方面的问题:,,所欲测量的心理特质是否稳定,,重测结果要尽量减少练习或遗忘因素的影响,,,,二、副本信度,复本是编制测验时形成的两个平行测验。
两个复本施测于同一被试样本所得测验分数的积差相关系数,即为等值性系数(Coefficient Of Equivalence),或称复本信度(Alternate Form Reliability)复本法的模式是: 复本A-------,适当时间,-----复本B,,,三、内部一致性信度,反应的是测验题目之间的关系,,1.分半信度:,,斯皮尔曼—布朗公式:,,卢龙(Kulon)公式为:,,2.同质性信度:2个计算同质性信度的公式,,库德—理查森公式法,,克龙巴赫的a系数:适用于多级记分的测验,,,四、评分者信度,一般要求成对的受过训练的评分者平均一致性达0.9以上,才认为评分是客观的如果是多个评分者或一个人两次以上的评分,可采用肯德尔和谐系数各种信度系数的比较,信度系数类型,误差方差来源,重测信度,时间抽样,复本,内容抽样,分半信度,内容抽样,库德-理查森系数克龙巴赫a系数,内容抽样和内容一致性,评分者,评分者之间差异,,,第三单元 信度的作用与影响因素,一、信度的意义与作用,,,第三单元 信度的作用与影响因素,,1.解释真实分与实得分的相关评价测验:当r=0.90时,说明实得分数中真实分数占90%,10%是由误差造成的。
信度系数,应用情况,高于0.85,诊断、鉴别、解释、团体比较,0.70~0.85,只能进行团体比较,<0.70,不能评价个人,也不能进行团体比较,第三单元 信度的作用与影响因素,2.确定信度可以接受的水平:,,,第三单元 信度的作用与影响因素,3.解释个人分数:,,,若某智力测验信度为0.95,标准差为15,某儿童得分为120分,我们就可以估计其真分数的范围则他的真实智力分数的95%的置信区间为(113.4≤IQ≤126.6),,,第三单元 信度的作用与影响因素,4 .比较不同测验分数的差异,,,第四单元 影响信度的因素,1.所测样本团体同质性程度,,2.测验的长度,,3.测验题目的难度:难度接近0.5时,测验分数就呈现正态分布,分布范围广,信度就高,,4.时间间隔:对重复信度和重测副本信度有影响,,,第四节 效 度,第一单元 效度概述,,第二单元 效度评估方法,,第三单元 效度的功能,,第四单元 效度的影响因素,,,第一单元 效度概述,一、效度(Validity),,指的是测验的有效性,即所测量的与所要测量的心理特点之间的符合程度任何测验对所要测量的心理特质的测量都不是绝对客观和准确的。
第一单元 效度概述,总,,方,,差,真实方差,误差方差,有关的方差,无关稳定的方差,表示公式:X=V+I+E,效度公式,,,第二单元 效度评估方法,效度分为三大类:,,内容效度,,构想效度,,效标效度,,,一、内容效度(content-related validity),(一)定义,,是指测验题目对所要测量的内容范围的代表性程度它体现的是与内容有关的效度证据测验题目应是所界定的内容范围的代表性取样二)内容效度的评估方法,1.专家判断法,,2.统计分析法,,3.经验推测法,,,(三)内容效度的特性,内容效度与所有效度的性质一样,不是普遍适用的,而是根据具体情况分析得来内容效度与表面效度,指一个测验看起来好象是测验所要的东西的程度即当那些未经过训练的被试或测验应用者认为某测验是有效时的测验时,该测验就有表面效度它不是一种效度,只是外行人的一种评价二、构想效度(构想效度),(一)什么是构想效度,,是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何二、构想效度(构想效度),智力代表了一个人获得、保持知识的能力,推理能力及适应环境的能力。
根据智力的定义我们可以推演出以下几点假设:,,,二、构想效度(构想效度),智力不同于后天获得的知识,因此与遗传因素有关,且更为稳定;,,智力会随着人的生理变化而发展变化;,,智力会影响人的学习成绩和事业成功计算同卵双生子、异卵双生子、其他同胞、非同胞间智商的相关,看相关系数是否依次降低;,,看智商与学业成绩间是否有高相关;,,智力是否随着年龄的增长而逐渐提高,在某一个阶段又是相对稳定的二)构想效度的估计方法,1.对测验本身的分析,,这类方法是通过研究测验内部结构来界定理论构想常用的方法:分析测验的内容效度和测验的内部一致性分析,,,,(二)构想效度的估计方法,2.测验间的相互比较,,最简单的是计算两种测验之间得分的相关,其中一个测验是有研究效度的,,另一个是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,,,(二)构想效度的估计方法,区分效度(discriminate validity)是构思效度的又一个证据因素分析法(factor analysis)也是建立构思效度的常用方法,,,(二)构想效度的估计方法,3.效标效度的研究证明另一种证实构思效度的方法是心理特质的发展变化4.实验法和观察法证实,,,三、效标效度,(一)什么是效标效度,,又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。
被预测的行为是检验效度的标准,简称效标三、效标效度,根据效标资料是否与测验分数同时获得,同时,,效度,,预测,,效度,即测验所得的分数可与效标同时验证,,,通常与心理特征的评估及诊断有关某人具有这种能力吗?”,“某人的心理正常吗?”,需要一段时间才可搜集到,通常用于选拔、分组某人会有这种能力吗?”,“某人会出心理问题吗?”,,,三、效标效度,一个好的效标必须具备以下条件:,,效标必须能最有效地反映测验的目标,即效标测量本身必须有效;,,效标必须具有较高的信度,稳定可靠,不随时间等因素而变化;,,效标可以客观地加以测量,可用数据或等级来表示;,,效标测量的方法简单,省时省力,经济实用二、效标效度的评估方法,相关法: ①积差相关②点二列相关③二列相关,,区分法:区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法命中率法:,,,,,效 标,,,,成功,失败,测验分数,成功,正确接受(A),错误接受(B),,失败,错误拒绝(C),正确接受(D),,,第三单元 效度的功能,一、预测误差,,二、预测效标分数,,三、预测效率指数,,,第四单元 效度的影响因素,一、测验本身的因素:,测验的长度、试题类型、难度编排方式,,二、实施中的干扰因素:,主试、 指导语、场地、布置、场所噪音;被试的兴趣、动机、情绪、态度、心身状况,,三、样本团体的性质,,样本团体的异质性:同信度一样干涉变量,,样本团体的性质:年龄、性别、教育程度、智力等,,四、效标的性质:是否呈线性关系,,,第五节 项目分析,第一单元 项目难度分析,,,第一单元 项目难度分析,一、难度的概念及计算公式,,二、选择题难度的校正,,,,第一单元 项目难度分析,一、难度的概念及计算公式,,公式,:,用于二分法记分的项目,P为题目难度,R为通过或得分的人数,N为总人数,,,第一单元 项目难度分析,100人参加的一测验,第2题和第3题通过的人数分别为30人和70人.计算得第2题难度为0.30,第3题难度为0.70。
第2题难度值小,但实际难度大,第3题难度值大,但实际难度小,,,难度的高低与难度值的大小正好相反但由于这种计算方法已约定俗成第一单元 项目难度分析,对多级记分的题目,难度的计算公式为:,,,,,,第二单元 项目区分度分析,又称项目的鉴别力,,指项目得分对被试实际能力或心理特质水平的区分能力或鉴别能力也即项目得分的高低与被试实际能力或特质水平高低的一致性程度第二单元 项目区分度分析,项目区分度的计算方法有,,相关分析法,,极端组法,,因素分析法,,四分相关和中相关,,,第二单元 项目区分度分析,若是采用相关系数计算区分度,则相关系数要>0.05或0.01水平上的相关系数临界值,若使用区分度指数表示区分度,则要≥0.30区分度与测验的信度和效度,区分度可以用项目总分的相关来计算,因此区分度体现了测验的同质性区分度高时,测验的同质性就高,测验的信度就高事实上信度会随着区分度的提高而迅速地提高区分度是项目对被试能力高低的鉴别能力的指标,项目区分能力的总和就是测验的效度,因此区分度与效度有更加直接的关系二、依据项目统计量挑选项目,1.根据难度挑选项目项目: 难度为0.50左右时测验的信度和区分能力都能达到最高水平编制测验时一般要求题目的难度值要位于0.20~0.80之间,而所有题目的平均难度则要在0.50左右。
2.根据区分度挑选项目:鉴别度在0.30以上就比较理想了但有些区分度在0.20~0.30之间的项目如果能很好地体现测验目的,也应酌情予以保留第六节 心理测验编制的一般程序,标准化测验的编制包括以下几个步骤:,,①确定测验目的并依据测验目的选取测验材料,,②将测验材料编成测验题,形成最初的试卷,,③预测并分析测验质量,,④选择并编排测题,并形成最终试卷,,⑤测验标准化,,⑥鉴定测验基本特征,,,一、明确测验目的,(一)明确测验目的,,(二)分析测验目标,,(三)选取测验材料,,(四)设计测验蓝图,,,三、试测及测题质量分析,(一)试测,,(二)测题质量分析,,,三、试测及测题质量分析—试测,被试样本要有代表性,,样本容量要适当,,测验的情境等与正式测验完全相同,,试测的测验时间要尽量放宽,,试测过程中发生的情况要随时加以记录,,,,,质的分析,,难度分析,,区分度分析,三、试测及测题质量分析—质量分析,筛选和进一,,步改进测题,,,,四、测题的编排与测验标准化,(一)复本的制作,,复本测验也是检验测验信度和效度的一种重要手段一个测验要有2~3个复本四、测题的编排与测验标准化,如果要编制两个复本,应按如下顺序分配测题:,,复本A:1 4 5 8 9 12 …,,复本B:2 3 6 7 10 11…,,,四、测题的编排与测验标准化,如果要编制三个复本,则按如下顺序分配测题:,,,复本A:1 6 7 12 13 18 …,,复本B:2 5 8 11 14 17 …,,复本C:3 4 9 10 15 16 …,,,测验的编排测题编排时要注意:,①同一类型的测题应编排在一起。
这样有利于对答题的要求作出统一说明,也有利于被试掌握答题规则按要求作答,不致出现不必要的失误,同时也有利于测题的评分②测题排列的顺序应是先易后难,容易的题目放在前面,易于调动被试的积极性,使其产生较高的兴趣和动机难的测题放在前面,就不利于完成后面的测题测验的标准化,1.测验内容的标准化,,2.测验实施过程的标准化,,主试:年龄、性别、态度等因素都可能对被试产生一定的影响,,指导语:主试的,被试的,,测验实施的外部环境:,,测验的时限:,,,测验的标准化,3.评分标准化:论文式试题——尽量做到客观,,4.解释的标准化:指对测验分数高低优劣的判断要以一定的标准为依据,,,五、鉴定测验的基本特征和编写测验使用说明书,(一)测验基本特征的鉴定,,测验的信度,,测验的效度,,,,五、鉴定测验的基本特征和编写测验使用说明书,(二)编写测验使用说明书,,测验目的和测验用途,,测验的材料是根据什么原则,,如何实施测验的说明:指导语、测验的时限及对测验情境、主试的要求等,,测验的标准答案及计分方法,,常模表及如何使用常模资料解释测验,,测验的信度和效度资料,,关于如何使用测验结果的说明,,,第二单元 测题编写技术,一、测题类型的选择,,(一)测题的类型:,,提供型测题:要求被试自己提供答案,包括填充题、简答题、论文题、应用题、联想题、操作题等,,选择型:,,,,一、测题类型的选择,(二)不同类型测题的优缺点,,客观性试题因答题简单明确,故答题速度快、效率高,被试可能凭猜测答题,故意选择社会接受性高的、主试期望的或他认为是正确的答案,降低了测验结果反映测验目的的有效性,,,主观性试题能够测量出被试深层次的心理特质。
缺乏评分客观性主观性试题对成就测验所欲测量的全部知识范围的覆盖面窄,不如客观试题灵活、全面,内容效度低二、命题的一般原则,(一)内容方面,,要求题目的内容符合测验的目的,避免贪多而乱出题目,,内容取样要有代表性,符合测验计划的内容,比例适当;,,题目间内容相互独立,互不牵连,切忌一个题目的答案影响对另一个题目的回答,,,二、,命题的一般原则,(二)文字方面,,使用准确的当代语言,避免使用生僻的字句或词汇;,,语句要简明扼要,既排除与答案无关的因素,又不要遗漏答题所依据的必要条件,,一句话说明一个概念,意义必须明确,不得暖昧或含糊,尽量少使用双重否定句,,,,二、 命题的一般原则,(三)理解方面,,题目应有确切的答案,除创造力测验和人格测验外不应具有引起争议的可能;,,题目的内容不要超出受测团体的知识水平和理解能力;,,题目的格式要不被人误解二、命题的一般原则,(四)社会敏感性方面,,在编制测题时,应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用三、测题的编制要领,(一)选择题有几点必须注意:,,1. 题干所提的问题必须明确,尽量使用简单而且明晰的词语做到题干意义完整,即使被试不看选项亦能完全理解。
不要在题干中夹有选项,或者掺有不切题的内容三、测题的编制要领,(一)选择题有几点必须注意:,,2. 选项切忌冗长,要简明扼要选项中共同用到的词语删掉,放到题干中去,可使题意更明确,同时减少被试看题时间三、测题的编制要领,(一)选择题有几点必须注意:,,3. 每题只给一个正确答案,其他属诱答若是找最合适的答案,则应用这样的问句:“下列答案中哪个最合适?”以免引起困惑三、测题的编制要领,(一)选择题有几点必须注意:,,4. 各选项长度应相等,尽量不要有长有短同时,选项与题干的联系要非常密切诱答也必须一致,以免被试很容易就排除了诱答项目三、测题的编制要领,(一)选择题有几点必须注意:,,5. 避免题干用词与选项用词一致,否则成了选择答案的线索正确答案有修饰用语或用正规的词语,而诱答选项均没有,也会给被试提供线索,应避免决不”、“从来”、“所有”、“惟一”、“绝对”等词,不适用于选项中三、测题的编制要领,(一)选择题有几点必须注意:,,6. 选项最好用同一形式如同是人名,同是日期,同是物理现象等等,长度最好相等选项的排列最好随机,除非本身有逻辑顺序三、测题的编制要领,(二)是非题例:,,(1)你常常会主动地去做一些有意义的习题吗? 是口 否口,,(2)你常常主动给朋友写信或打电话吗? 是口 否口,,,三、测题的编制要领,编制是非题应注意:,,,1.内容应以有意义的概念、事实或基本原则为基础,不要在叙述中出现琐碎的细节或无关的话语,不要照抄原文。
三、测题的编制要领,编制是非题应注意:,,2.每道题只能包含一个概念,避免两个或两个以上的概念出现在同一个题目中,造成“半对半错”或“似是而非”的情况三、测题的编制要领,编制是非题应注意:,,3.尽量避免否定的叙述,尤其是要避免用双重否定的叙述因为否定的叙述常会被人误认为是肯定的叙述,将“不”字忽略,双重否定尤其容易使人困惑,不如直接采用肯定的叙述为佳三、测题的编制要领,编制是非题应注意:,,4.若是表达意见的题目,最好说明意见的来源和根据,以便测出被试是否了解某个人或某些人的意见、信念或价值观念等三、测题的编制要领,编制是非题应注意:,,5.“是”、“非”题的数目应有适应比例,基本相等,且要随机排列是”、“非”题目的编写在长度和复杂性上应尽量保持一致三)简答题,例:,,世界上第一个智力测验是由,,与,,编制的填充题),,夏天为什么要穿浅颜色的衣服,不穿深颜色的衣服?(简答题),,,编制简答题有三条原则:,1.宜用问句形式如果使用未完成的句子,则空格尽量放在最后2.如果是填充形式,空格不宜太多,过多空格会使题意不明确,并且所空出的应该是关键词句3.每题应只有一个正确答案,而且答案要简短而具体。
对不完整的答案,应事先规定评分标准四)操作题编制,操作测验有四条原则:,,1.明确所要测量的目标,,2.尽量选择真实性程度较高的项目,,3.指导语要简明扼要的说明题,,4.制定评分标准,确定计分方法第七节 心理测验的使用,,,第一单元 主试资格,一、知识结构,,二、专业理论知识和专业技能,,专业理论知识,,专业技能,,三、职业道德,,测验的保密和控制使用,,测验中个人隐私的保护,,,第二单元 测验的选择,一、所选测验必须适合测量的目的,,二、所选测验必须符合心理测量学的要求,,,第三单元 测验前的准备及注意事项,一、测验前的准备,,预告测验,,准备测验材料,,熟悉测验指导语,,热悉测验的具体程序,,二、测验中主试的职责,,三、建立协调关系,,,,第四单元 测验实施的程序及要素,一、指导语,,对被试的指导语,,对主试的指导语,,二、时限:时限也是测验标准化的一项内容三、测验的环境条件,,,第五单元 被试误差及控制方法,一、应试技巧与练习误差,,(一)应试技巧,,,,练习效应其具体表现,1.教育背景较差、经验较少或智力较高者,受其影响较大;,,2.着重速度的测验较为明显;,,3.重复实施相同的测验,影响的程度要大于复本的测验;,,4.两次测验之间的时距越大,练习效应越小,相距三个月以上练习效应可忽略不计;5.一般的平均练习效应,仅限于第一次及第二次重测,第三次以后练习效应增加不明显。
二、动机与焦虑因素,(一)应试动机,,,(二)测验焦虑的影响因素,1.能力高的人,测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高;,,2.抱负水平过高,求胜心切的人,测验焦虑较高;,,3.具有某种人格特点;,,4.测验成绩与被试的关系重大,容易使其产生测验焦虑;,,5.经常接受测验的人焦虑较低,而对测验程序不熟悉,尤其是测验中采取了新的题目形式或实施程序会增加测验焦虑三、反应定势(反应风格),求“快”与求“精确”的反应定势,,喜好正面叙述的反应定势,,喜好特殊位置的反应定势,,喜好较长选项的反应定势,,猜测的反应定势,,,第六单元 测验的评分,一、原始分,,二、原始分数的转换,,,第七单元 测验结果的报告,,,,一、测验,分数的综合分析,,应根据心理测验的特点进行分析不能把分数绝对化,更不能仅仅根据一次测验的结果轻易下结论为了对测验分数做出确切的解释,只有常模资料是不够的,还必须有测验的信度和效度资料对于来自不同测验的分数不能直接加以比较二、报告分数的具体建议,不应把测验分数直接告诉被试,应解释和建议避免使用专业术语要保证当事人知道这个测验测量或预测什么要使当事人知道如何运用他的分数。
要考虑测验分数将给当事人带来什么心理影响要让当事人积极参与测验分数的解释。