中考方差分析总结(合集3篇)

山崖发表网工作总结2024-01-03 11:28:4433

中考方差分析总结 第1篇

[关键词] 助理全科医师;试卷分析;信度;难度系数;区别度

Brief introduction to commonly used indicators of assistant general practitioner's examination paper

ZHANG Donghai1 ZHAO Liuzhuang2 GANG Jun3 XU Deying4 LIU Shuang3 MA Xiuhua2

of Gastroenterology, Daxing Hospital, Capital Medical University, Beijing 102600, China; of Hospital, Daxing Hospital, Capital Medical University, Beijing 102600, China; of Science and Education, Daxing Hospital, Capital Medical University, Beijing 102600, China; Practice and Continuing Education of Capital Medical Unicersity School, Beijing 100069, China

[Abstract] Eight indicators are used in evaluating examination quality, including reliability, validity, difficulty, discrimination testing and average marks, standard deviation, score distribution, grade. Commonly used methods for the above indexes which are suitable for general graduation examination paper analysis would be introduced briefly.

[Key words] Assistant general practitioners; Examination paper analysis; Reliability; Difficulty coefficient; Difference degree

试卷分析是针对大量的成绩数据进行统计、计算、分析,进而得出科学结论的过程。试卷分析属于“教育测量学”的范畴。通过试卷分析可能提炼出诸多对考试质量进行评价的数据,此时试卷就不是单纯地“考试”,而是变(升华)为“试卷分析”。通过试卷分析所得到的比较科学的分析结果,可以进一步展开对教学活动评价,了解教学质量以及学生的学习质量(如对知识的掌握程度)等[1-7]。评价考试质量常用8个指标,包括涉及试卷的信度以及效度、难度、区分度,还包括平均分数以及标准差、分数分布状态、成绩[8-10]。对于上述指标进行分析的方法学较多、有的较为繁杂。我们曾做过相应试卷分析工作[11,12],现结合工作体会将适合结业试卷分析的一般常用方法做一简介。

1 主要涉及试卷质量指标(信度、效度、难度、区分度)的一般分析方法[8,13-14]

试卷试题难度分析的常用具体方法

难度系数(P)通常是指试卷以及试题的难易程度,可以反映或评价大部分学生对该试题或试卷知识点的掌握程度。难度系数分析应该包括试题难度系数与试卷难度系数两部分,仅进行试卷难度系数分析不易找出具体问题(即总成绩可能掩盖具体得分点)。

试卷总体难度分析的常用方法 试卷整体难度一般以~为宜。方法1:难度系数(P)=试卷的平均得分÷该试卷的满分值。如:试卷平均分为75分,该试卷满分为100分,则P=。该方法较为粗糙,故较少采用。方法2:试卷难度系数(P)=(考试成绩前27%学生的得分之和+考试成绩后27%学生的得分之和)/两组总人数满分之和(考试成绩前27%学生指考试成绩排名在前27%的学生,将这些学生的成绩相加即为得分之和;考试成绩排名在后27%的学员以此类推)。

试题难度系数(P)常用计算公式 方法1:难度系数=试题的平均得分÷该题的满分值。方法2:难度系数=该题的总得分÷该题的满分值。满分值是指:参加考试人数×该题卷面的分值。如果所有试题均采用1分制(即:满分100分,试题100道,每道1分;不采用扣分制),则该题得满分值就是参考人数。所得结果也是该题的答题正确率。此时用方法2就较为方便。

区别度分析的具体方法学

区别度(D)是指能够区分考试(测验)成绩好的学生和考试(测验)成绩差的学生的指标,一般通过计算高分数段和低分数段学生的难度系数而得出。要同时分析试题区别度数与试卷区别度,单独分析试卷区别度易于掩盖试题的区别指数,误导选用试题。区别度越高,区分能力越强。但是,在结业考试中允许D=0的试题出现。一般以

试卷信度分析的具体方法学

试卷信度(α)评价该试卷检测结果的可靠程度、可重复性的指标,即为评价被测者在测试中的实际测量值与真实能力是否一致性的指标。最好的试卷信度应该在以上,若低于以下则不甚可靠。计算方法如下。

克朗巴赫公式[Cronbach系数(α)] (α)= 试题数/试题数-1×[(所有被测者第i题的方差-所有被测者总分的方差)/所有被测者第i题的方差]。该方法适用于非选择题以及多值计分题(即:试卷试题的类型较多、各题分值不同,如包括多选题、是非题、问答题等)。计算过程较为复杂,需要每道试题计算后得出结果,该方法应用较多。

库德-理查逊信度(简化)公式 适合用于每题1分的选择题(即试题计分为1分或0分的试题)。信度系数=[n(s-1)2-X(n-X)]/[(n-1)s2](计算较为简单)。(n为卷面满分成绩,X为平均总分,s为标准差)[11]。该方法最大的好处是不需要逐题计算通过率。

库德-理查逊信度(简化)公式的进一步简化 计算较为简单。此公式适用于所有试题为每题1分选择题的试卷。信度系数=[K/(K-1)]{1-[X(K-X)/Ks2]}。K为测题的数目,X为平均总分,s为标准差)[5]。

相关系数(R)计算[10] 该方法计算较为复杂。具体公式可以参考相关文献。

试卷效度分析

效度用于评判测量的正确性、有效性(反映测量到的与所要测量的二者之间的符合程度)[5,6,8,14-15]。如果将测验总分看作是内部效标,则该测题的区分度也就是该测题的效度(即内部效标的效度)[5,6,8,14]。所以,如果仅分析试卷本身只要有区别度即可。因此,在多数的研究中没有计算“效度”[1,3,7,11]。其他获得效度的方法如下。

相关系数(R)计算 基本方法是通过计算两门性质相近学科、或同一学科前后两次考试成绩的相关系数(R)来评价此次考试成绩的有效性。

百分一致法 按考试成绩将学生分为高、中、低3组,用各个试题中高、低分组之差除以相应的满分,即可得出此题的效度值。这实际上雷同于“区分度计算”方式,仅适应于本试卷的检测[16]。

试题难度系数(P)与区别度(D)之间的关系

P值越大则说明试题难度越小(内容为多数学生掌握),P值越小说明试题难度越大(多数学生未掌握),此两种情况试卷或试题的区别度均较差;要有较好的区别度,试题难度应适中。

较易试题的难度系数≥;

2 主要体现学生成绩的分析指标(成绩、平均分数、标准差、分布状态)[5,6,10,13,14]

成绩

即考生试卷的总得分。这是基本原始数据,是所有数据分析的基础数据,必须仔细输入。

平均分数

是最直观的集中量数。一般认为平均分数的最佳数值为75(百分制)。

标准差(s)

例如,甲班与乙班的考试平均分数相近但分数分布差异明显,则不能说两个班级的成绩相近。此时不仅要考虑到平均分数,还要计算分数的离散程度(简单可以理解为“分数分布情况”,学术名称――差异量数)。常用的差异量数有多种,经常采用的差异量数是标准差。计算公式可以在统计学教材查找到。计算标准差,理论上讲学生人数越多越好。一般认为:标准差≤10即能符合要求。标准差过大说明全班分数差异过大,需要教师予以注意;但过小则信度下降,区别度下降,标准差也可用于信度计算。

分布状态

简单理解就是看整个班级(年级)学生的成绩分布情况。一般要求是正态分布,结业考试可以允许一定的正偏态分布,但绝不能完全一边倒。一般习惯是利用成绩分布曲线分析学生的考试成绩(纵坐标为学生人数,横坐标为分数),可以直观的下结论(定性分析);如果要进行定量分析,则需进一步计算偏态量数及峰态量数[10]。

试卷分析的方法学较多,本文仅介绍较为简单、易于掌握的部分。利用试卷分析结果,可以评价教学效果,但其评价的基础是要有高质量的“试卷”(难易程度适当、知识点掌握的较好),这同样涉及教与学两方面的努力。试卷分析仅仅是手段而已,也可称为是教育测量的工具。在进行试卷分析的准备过程中,首先要编制适合测试对象的“试卷”:编制试卷则要根据测验目的进行,最基本的是要依据测验功能决定是进行能力倾向测验(学生的潜在能力如何?)是学业成绩测验(考察学生经过教育教学过程后学业成绩的掌握情况,也称“考试”)。进一步,则要根据培养目标进行分数解释,如果是“目标参照性测验”则其及格就是最基本的教学要求水平参照点,分数愈高说明达标的完满程度愈高;如果是“常模参照性测验”,即测验目的是鉴别性测验(优选,如高考),则测验的难度就要适当增加以利于选拔。结业测验一般是“目标参照性测验”,本文介绍的简便方法学适用于“目标参照性测验”。

研究结业考核标准与模式是不断探讨的课题[17],结业试卷分析不仅可以评价本次考核内容的学生掌握情况、教师教学效果,同时也可以评价不同教学单位在教授同一课程时其间教学效果的差异性[18]。“3+2”助理全科医师培训[19-21]是一项新的工作,我们在其中的《临床综合课程》教学实践、教学管理中,纳入试卷分析体系作为评价整体教学水平、发现不同教学单位教学差异点的手段之一[8,9],取得了较好的效果,不仅了解了教学效果,同时也为提出新的教学思路提供启发点,为集体备课提供了具体依据。因此,掌握试卷分析方法学,既是教师的基本功(特别是高校教师),也是教学管理部门应该熟悉的管理内容与管理技术。

[参考文献]

[1] 张正祥,刘国庆,王廷慧,等. 延安大学医学院药理学试卷分析[J]. 中华医学教育杂志,2008,28(4):120-122.

[2] 孙敏,王锦帆,祖勤,等. 医学生学习中期评估测试实效分析[J]. 中华医学教育杂志,2013,33(4):617-620.

[3] 卢燕,王培玉,刘宝花. 北京大学医学部八年制疾病预防医学期末考试试卷分析[J]. 中华医学教育杂志,2013, 33(5):791-793.

[4] 和永祥,王渊,徐俊丽,等. 内科学考试试卷分析与评价[J].西北医学教育,2006,14(3):304-305.

[5] 王孝玲,教育测量(高等师范院校教材)(第2版)[M]. 上海:华东师范大学出版社,2005:1-188.

[6] 黄颖,林端宜. 试卷分析研究现状综述[J]. 西北医学教育,2005,13(1):39-40.

[7] 宋青,蔡景一. 试卷考核质量评价[J]. 中国高等医学教育,2006,(11):30-31.

[8] 高卫红,任俊峰. 利用教育统计学原理进行考试质量分析方法初探[J]. 武警医学院学报,2004,13(3):214-218.

[9] 田考聪,彭斌. 试卷质量定量分析系统中的几个参数及其应用[J]. 医学教育探索,2004,3(4):52-54.

[10] 张玲玲,梅忠义. 对学生成绩评价指标体系中一些问题的思考,合肥工业大学学报(社会科学版),2006,20(2):19-21.

[11] 马秀华,张东海,黄东明,等. “3+2”助理全科医师培训《临床综合课程》结业试卷评价及相关因素分析[J]. 中国医学教育技术,2015,29(2):213-217.

[12] 马秀华,张东海,徐德颖,等. “3+2”助理全科医师培训中《临床综合课程》结业试卷分析评价[J]. 中华医学教育探索杂志,2016,15(5):445-450.

[13] 彭斌. 试卷质量定量分析系统中的几个参数及其应用[J].中华医学教育探索,2004,3(4):52-54.

[14] 刘新平,刘存侠. 教育统计与测评导论(第1版)[M]. 北京:科学出版社,2003:133-156.

[15] 史宏灿,龚卫娟,郑英,等. 以国家执业医师资格考试为参照的临床医学教学改革思考[J]. 中华医学教育探索杂志,2016,15(5):459-464.

[16] 陈欣,戴社教,赵暹,等. 不同类型试题对医学影像学考试评价的效能分析[J]. 中华医学教育探索杂志,2016, 15(5):455-458.

[17] 赵丽莉,李崭,黄艳. “3+2”培训项目结业考核标准与模式的研究[J]. 继续医学教育,2015,29(11):4-5.

[18] 张东海,马秀华,赵留庄,等. 通过临床综合课程结业试卷分析不同教学单位教学效果的差异[J]. 卫生职业教育,2016,34(12):101-103.

[19] 黄艳,线福华,赵丽莉,等. “3+2”助理全科医师培养模式的探索与实践[J]. 中华医学教育杂志,2014,34(2):31-33.

[20] 张东海,马秀华,黄东明,等. “3+2”助理全科医师培训首轮课程施后的思考[J]. 中华医学教育探索杂志,2015,14(8):837-840.

中考方差分析总结 第2篇

一、试卷的结构分析

主要包括:

1.内容结构分析:基本概念和化学原理、元素化合物知识、有机化学知识、化学计算、化学实验等方面的内容比例乃至每一方面的二级结构分析。

2.目标水平结构分析:按照考试大纲所列水平(通常分为知道、理解、应用、综合运用等)种类,分析它们的组成比例并且作内容—水平双向交叉分析。

3.题型结构分析:各类题型的比例分析。

4.分数结构分析:内容—分数和水平—分数的双向交叉分析。

5.难度和时限结构分析:对难度测验作难度分布描述,对速度测验作时限分布描述。

6.试卷特点及横向、纵向比较:就试卷是否符合考试(教学)大纲规定、是否反映化学学科特点和内在联系、符合学生实际水平、合理性、适宜性以及其他特点作出描述和判断。横向比较可以在学校—学校或地区—地区间进行,纵向比较可以在不同学年间进行。

进行结构分析时,分析者要对测验各项目逐一分析和作出判断,因而结构分析带有较强的主观色彩。分析者对项目的判断跟编制、设计者不一致的情况经常会发生,对于比较复杂的综合题尤其是这样。为此可以把试卷结构分析结果跟编制试卷的结构设计进行比较。

除了难度结构分析跟答卷情况有关,只有在考试实施之后才能进行外,其他各项分析跟答卷情况无关,在考试实施之前就可以进行,属于试卷的“静态”分析。

二、答卷情况描述

主要包括:

1.成绩分布情况描述:列出频数分布表或频数分布图。

2.统计量描述:列出平均分、标准差、优分率和低分率以及某些因素间的相关系数等数据,还可以进一步作各内容跟其平均得分率、标准差、优分率和低分率的双向交叉分析,各水平层次跟其平均得分率、标准差、优分率和低分率的双向交叉分析,以便从中发现问题。

3.分布形态判断:判断总体分布是正态还是偏态或其它形态。

4.由样本统计量推测总体参数(总体平均成绩、总体标准差等)。

三、试题及解答情况分析

1.题目的内容、水平分析:逐一分析各题的内容、水平和考核意图。

2.题目的难度、区分度、灵敏度、识别度和题目反应分布:具体方法参见文后所附题目分析部分。

四、试卷质量分析

1.试卷的信度分析和效度分析。参见文后所附“试卷的信度分析和效度分析。”

2.整卷难度分析。

3.试卷质量评价:就考试目的和试卷内容、结构、形式的合理性、适宜性、有效性和可行性等对试卷作出全面评价。

五、教学分析和教学建议

从得分、失分情况以及某些部分之间的比较、分析,发现教师、学生以及命题等方面的成功与不足之处,并针对存在问题提出改进意见。

为了使试卷分析全面、可靠和有效地发挥应有作用,试卷分析工作应实行教师分析和学生自我分析结合、“动态”分析和“静态”分析结合、定性分析和定量分析结合,在认真分析的基础上,简明、扼要、有重点地写出试卷分析报告。

附:题目和试卷的统计分析方法

一、常模参照性测验的题目分析

常模参照性测验题目的分析工作,主要是对测验结果进行统计分析,估计题目的难度、区分度,分析答案是否适宜等。

1.难度分析

所谓题目难度是指某一题目的难易程度,通常用答对率P来表示。

一般说来,题目的P值以~为宜。也有人用不通过率Q来表示难度。它们的计算方法如下表所示:

*X高为高分组的该题得分总和,X低为低分组的该题得分总和,H、L分别为该题的最高、最低得分。

P值无等距性,无法对试题之间的难度差异作精确的比较,也不能用于计算平均难度。为了对各题难度作比较,通常要把P转换成标准难度,使之等距化。

值越大,题目难度越大;=13时,题目难度为中等。

运用下表可以方便地由P值直接查得对应的值:

2.区分度分析

题目区分度是指某一题目对被测水平的区分能力。若某题目能使水平较高的被测得较高分、使水平较低的被测得较低分,该题就有较高的区分度。

区分度分析可以采用极端分组法,或者采用相关法。相关法比较复杂,这里从略,不作介绍。在极端分组法中,从总体中分出高分组和低分组(比例均为25%~33%且数值相同),然后计算区分指数D作为区分度的指标,如下表所示:

除了计算方法以外,还可以采用弗拉南根查表法:根据占总人数27%的高分组的答对率和占总体人数27%的低分组的答对率,从专门的表(附表5)中查得题目的区分度。

一般说来,当D<时,题目的区分度太低,必须淘汰或者加以修改;当D≥时,题目的区分度非常好;通常题目的区分度指数D在~之间。题目难度跟题目区分度之间有着一定的联系。难度太大或者太小,都可能使区分度变小;只有难度适中时,才可能有较高的区分度。

3.题目反应分布分析

对于多重选择题等可能有多种答题情况(题目反应)的题型来说,仅仅作难度分析和区分度分析是不够的,还需要分析题目反应分布情况,检查它是否跟预期的反应分布模式符合,从而发现需要修改之处。题目的难度和区分度也可以从反应分布中得到反映。进行题目反应分布分析,先要制作题目反应分布表。下面是该表的示例,表中还列出了有关的分析和判断:

*为答对人数

二、目标参照性测验的题目分析

目标参照性测验题目试测后的分析工作主要是作灵敏度分析和识别度分析,有时也要作题目反应分布分析。

1.灵敏度分析所谓灵敏度是指题目能灵敏地反映教学作用的能力,通常用目标教学前后被测总体的通过率之差来估计。

设目标教学前、后通过试题的被测人数分别为R1、R2,被测总体人数为N,则试题对教学的灵敏度指数S可按下式计算:

当S>0时,试题有效,S越大,试题对教学作用的感受越灵敏;当S≤0时,需要研究是否由教学不当而引起,如非教学不当引起,则可认为试题质量不佳。

2.识别度分析

题目识别度是指某试题能有效地识别达标者的能力,通常用合格者通过本题的百分比跟不合格者通过本题的百分比之差来估计。

设P1和P2分别为合格者和不合格者的本题通过率,则

识别度指标D=P1-P2

识别度指标的最大值为,当D≤0时,该题无预期的识别能力。

题目识别度还可以用被测是否合格跟是否通过本题的φ相关系数来表示。设题目在总人数为N的被测总体中的试测结果如下表所示:

所得φ相关系数需进行检验,方法是:按下式算出φx2

x2=Nφ2

的,其犯错误可能性为。

3.题目反应分布分析

目标参照性测验的题目反应分布分析方法跟常模参照性测验的分析方法相似。通过分析不但可以发现题目中存在的问题,还可以了解被测的错误类型及其分布,具有学习诊断作用。

三、试卷的信度分析

信度表示测量的一致性、稳定性和测量结果的可靠性。测量时的随机误差越小,测量结果就越接近真实值,其信度就越高;样本统计量越是接近总体参数,其信度也越高。

信度常用信度系数rxx表示,其值在0~1之间。若rxx=0,表明实得分数完全由偶然误差决定;若rxx=1,表明实得分数完全不受偶然误差的影响。一般说来,化学学业成绩测验的信度应在以上,甚至达到。

由于Sr和SR难于直接测得,所以rxx通常借助于某些特别方法进行计算。

(一)常模参照测验信度的计算

常模参照测验的信度系数可以用再测法、等价测验法和两半法等方法求得,所得信度系数意义略有不同,分别表示测量的再测稳定性、等价测量稳定性和内在一致性,故又分别称为稳定性系数、等价性系数和内部一致性系数。在化学教学测量中,常用下列方法计算内部一致性系数。

1.两半法,即在一次施测后,把试题分为对等、可比的两半,其内容、预测难度、总分和题数都大致相同;计分时把各被测的两半实得总分分开统计,计算两半间的积差相关系数;

式中,x、y分别为某被测实得的两半总分,N为被测总数。

再将rhh代入下式校正,即可得整卷的信度系数rxx。

采用这一校正公式时,两半的平均数、标准差、项目的组间相关、分布的形态和内容都应相近。否则,整个测验的信度估计rxx将有误差。此时可改用下式计算rxx:

式中,Sa、Sb分别为两半分数的标准差,St为整个测验总分方差,Sd为两半分数之差的标准差。

2.克龙巴赫法

方差。

影响测验信度的因素主要有:

(1)测验长度:测验越长,题量越大,信度越高。

(2)试题难度:当各题难度和平均难度为中等(P=~)时,有利于提高测验的信度。

(3)样本(或总体)大小:样本(或总体)越大,分数分布越广,信度越高。

(4)测验内容的复杂性:测验内容同质性高,信度也高;反之,内容越庞杂,信度就越低。

(5)施测条件的标准化,有利于减小随机误差的影响。

(6)评分的客观性。

(二)目标参照测验信度的计算

复本法:以等价的两份测验对同一被测群体施测,设测验结果的分布情况如下表所示:

四、试卷的效度分析

效度表示测量跟测量目的符合的程度,是测量准确性和有效性的指标。跟测验目的无关的因素影响越小,测验的有效性即效度就越高。

(一)常模参照测验的效标关联效度

在确定常模参照测验的效度时,通常以另一比较符合测量目的的测量结果作为检测效度的参照标准(即效标)。设被测总数为N,x和y分别为被测i的本次测得成绩和效标成绩,则

若已将成绩转换成Z标准分,则

rxy>0时,说明两者相关(正相关),rxy值越大相关程度也越大;rxy=1时表示测量完全反映测量的目的;rxy=0时,表明两组分数完全不相关(零相关)测量结果跟测量目的无关;rxy<0时为负相关,表明一测量得分高者另一测量得分低,测量结果跟测量目的完全相反。一般情况下,化学学业成绩测验的效度应在~之间

系统误差和随机误差跟实得分数方差比值的大小影响着效度的高低,要提高效度,就必须:

(1)提高测验的信度,减小随机误差的影响。

(2)施测标准化、评分标准化、采用适宜的分数合成方法,减少与测验的目的无关的因素,尽量降低系统误差的影响。题文难于理解、数学计算过于复杂等,均会降低测验的效度。

(3)提高命题质量。试题太少、偏、怪,覆盖面小、编排不当、过难过易等,都会影响效度。

(4)增大样本容量、使之具有较好的代表性。

(5)选择可靠(信度高)、符合测量目的的测验作效标。

效度系数也可以视具体情况改用二列相关系数或者点二列相关系数、φ相关系数等来表示。

(二)目标参照测验的效度

目标参照测验要求测量结果的变异最好为零,故不能用变异量来表示其效度。此时,可以通过内容适宜性来确定其效度。

五、试卷难度分析

试卷难度跟试题难度相似,可以用得分率表示:

中考方差分析总结 第3篇

语文:错在选择题好文言文阅读,选择题是最不应该错的,是我的马虎和审题的不认真导致语文成绩下降。

数学:数学的主要问题在大题和计算题,计算题不应该做错,这也表现了我的粗心大意,而大题完全答不上,第一是我的分析能力差,不能说没做过的类型就不会,将来中考题我不可能见过,所以我的学习能力还是太差。

英语:总体来讲问题集中在阅读和词汇上,主要是我对提的理解不够,不该加s的地方加了,该加s的地方不加s。

显示全文

注:本文部分文字与图片资源来自于网络,转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即后台留言通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意

点击下载文档

文档为doc格式

发表评论

评论列表(7人评论 , 39人围观)

点击下载
本文文档