全方位教学诊断数据监测指标应用说明

作者:admin 来源:本站 发布时间:2022-09-20 14:41:19 点击数:28538


初中19级数学组  仉倩

目前我们对于测验数据的分析一直延续应用的是平均分、及格率、优秀率等常见指标,由于学科、题目的难度系数、总分等不同,单一考虑某一参数并不能够准确、直观地反映年级、学科、学生的真实情况,就此我们引入了几个新的数据统计指标。以下我将从考试质量指标、教学诊断成绩分析指标、教学问题个性化指标和全方位多层次分析指标四方面说明。

一、考试质量指标

数据的真实性、准确性是建立在试卷试题质量有效性基础上的,对此我们引入了难度和区分度两个统计指标。

难度是指测验题目或整份试卷的难易程度。对于一道试题,如果大部分应试者都能答对,则该题的难度就小,反之,该题的难度就大。难度取值介于0 — 1之间。如:满分100分的试题,考生平均得分76分,难度为0.76。

 

 

 

难度评价标准:作为学校阶段考试试卷,难度控制在0.7至0.8之间较好,有利于测量学生的真实水平,对不及格率也有较好的控制。难度小于0.4的试题过难,学生失分严重,应分析其原因。难度指标衡量了一份试卷命题的难易程度对于应试者是否合适,也从侧面反映出应试者的素质。(同一试题,在不同对象、不同环境中使用,所得的难度值不一定相同。应试者的群体相对较大,不同程度学生均匀分布,得到的结果准确性越高。)

区分度指测验对考生实际水平的区分程度。区分度高的试题,能较好地鉴别考生的实际水平,使得实际水平高的学生得高分,实际水平低的考生得低分。简单地说,区分度是衡量试卷是否能够正确区分成绩好的学生跟成绩差的学生,从而达到针对性教学目的的一项指标,是评价试题质量、筛选试题的主要依据。区分度取值介于 -1.00 — +1.00之间,值越大,区分效果越好,如果是负数,说明实际水平高的得了低分,实际水平低的得了高分。

区分度的计算:

PH:高分数组(以总分高分段27%考生为代表在该题上的得分率)

PL:低分数组(以总分低分段27%考生为代表在该题上的得分率)

区分度评价标准:区分度越高越好,不同要求的测验,区分度的评价标准可做适当调整,一般地:0.4以上为优秀;0.3至0.39 为良好,如能改进更好;0.2至0.29尚可,需作改进;0.19以下为差,必须淘汰或改进。

作为命题者,对试题的难度控制是提供一份优质试卷的关键,这依赖于命题者对教学大纲的理解程度,对教学内容的熟悉程度,对应试者水平的了解程度。

结合难度、区分度两个指标,对于试卷试题质量的精确测算和把握,为学校和年级及老师准确了解学生的知识掌握情况和整体水平提供了更为精准的数据参考依据,也为今后的教学实践改革落实提供了更为具体的方向。

二、教学诊断、成绩分析指标

达标平均分是指根据测验或考试总分数的实现目标(如上本科最低录取控制分数线等目标分数值),按各科试题难度系数的比例分配计算出的各科目标分数值。

达标平均分规避了学科分数、难度的不同导致的平均分差异,更加准确地体现了学生的实际水平,用此来计算达标上线率,对标中考可以用于评价各学科分数是否达到预期目标值,可作为学生(或教师、班级、学校)各学科是否达标的参考,更加有针对性地开展教学实践。

达标贡献值是指某次考试中,针对某个实现目标,某个评价对象(学生、教师、班级、学校)的各学科成绩所发挥作用的大小,则为该对象该学科的达标贡献值。

达标贡献值成功地把某群体在此次考试中各学科所作贡献大小量化了,同时也成功地把每个考生各科目贡献大小量化了,它具有可比性,因而具有评价作用。不单单以分数论来评判学生、学科的真实掌握程度,方便学生、教师和年级更有针对性找准提分上线的抓手,开展教学实践。

标准差是反映一个群体的考生分数之间离散程度的指标。

例如,A、B两组各有6位学生参加同一次数学测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差为17.08分,B组的标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。

此指标反映了一个群体的参差情况,差生跟好生的两极分化大小,通过数值可以一目了然,测试者可以从中发现问题,对两极分化大的班级进行针对性教学。

Z分数是以一批分数的平均数作为参照点,以标准差作为单位表示距离的。Z分数准确地体现了一个分数在一批分数中的相对位置。

如下:

                      

如果只知道某一学生考试得了87分,那么我们几乎得不到什么信息。因为考试的题目的难度、学生的现有知识水平以及评分标准都会影响到学生的得分。87分可以说很高,也可以说很低;如果我们知道了学生的Z分数,我们就可以说学生这次考试是低于平均分还是高于平均分,以及在全班(或者总体)的一个什么位置。

此指标不但可以说明某个学生在整体中的相对位置,还能看出排在某个位置的学生对于本次考试的知识掌握情况到底如何。

百分等级是一种相对地位量数,计算方法是把考生各科的原始分在全体考生中从高到低排序。算出每一个原始分以下的考生占全体考生总数的百分比。这个百分数就称为百分等级。例如将某次数学考试结果转化为百分等级后,得知甲生的百分等级为95,表示甲生的数学考试分数胜过本校百分之九十五的同学。用百分等级表示分数结果,不仅可以知道胜过人数的百分比,而且可以知道其所不如的人数之多少百分比。此指标能够体现某个学生到底在整个团体中排在什么位置。

百分等级能让师生准确认识学生在团体中的相对位置,Z分数又避免了学生因为分数两极分化或相对集中转化为百分等级时被夸大或缩小的情况(例如:某次测验学生的成绩分布集中分布在80分上下,80分和85分的百分等级差距相差较大,但对于知识的把握程度其实相差不大,或者某次成绩分布两级分化,低分人群较多,70分百分等级较高,但知识的掌握情况相对并不高。),两者结合使用,教师和学生能够正确认识我们的教学现状和知识掌握情况,不仅仅得意或失落于分数高低,从而更加客观地认识和转变教与学的方式内容和态度。

三、教学问题个性化指标

在以上数据的支持下,怎样针对班级任课教师和学生,针对性调整教学内容还需要结合我们实际的考试内容做参考,我们现有的班级错题集、试题查阅、知识点分析、小题分等数据能够为学科教学提供强大的数据支撑,但对于部分学生的差异化、细化管理和异常失分还有部分缺失,我们由此引入了:

闪光点:考生得分率大于一定比例的试题(得分率比例可设定)。说明在被测团体当中的大多数人都能够答对的题目,属于被测团体的得分强项。

薄弱点:考生得分率小于一定比例的试题(得分率比例可设定)。说明在被测团体中的大多数人都不能够答对此题,属于被测团体的得分弱项,测试者可针对此题目进行加强教学。

例如:学生得分率大于75%的题目为闪光点,小于25%的题目为薄弱点,则系统将自动进行统计,若整份试卷的一、三、五题为闪光点,说明一个群体75%以上的人都能答对此题目,若二、四为薄弱点,则说明只有不到25%才能答对此题目,属于丢分严重的题目,需要加强教学。闪光点和薄弱点的使用与我们错题集的百分率功能有异曲同工之处,但可以按照我们的教学目标自行设定统计标准。

注意系数是指针对学生或试题得分情况分析其异常状态的指标。判断学生是否存在异常现象,即是否存在较多在具备作答能力的试题上犯错误的现象。

对于单名学生的异常失分,属于非共性问题,由于试卷数量较多和人数不同,教师很难针对到每个同学。注意系数的使用克服了时间的距离,有效提高了我们的教学针对性和解决学生个人的知识盲区或细节失误问题,对教学实践的开展起到了积极作用。

四、全方位、多层次分析指标

在对试卷和试题质量的精准把握的基础上,我们收集的数据统计指标繁杂多样,根据分析对象的不同,从学校、年级、学科组、班级、以及教师和学生个人多层面,我们可以参考不同数据,更加切实有效地分析成绩数据并做出相应教学调整。

从学校/年级层面上看:

1. 整体情况: 总分、科目分、分数段、名次段、达标分、达标上线率

2. 学科情况:成绩段、标准差、达标平均分、百分等级、Z分数、达标上线率

3. 教学管理:达标贡献值、双达标上线率

4. 教学问题:关注历次成绩跟踪对比(名次、达标贡献值)

从班级/班主任层面看:

1. 整体情况:总分、科目分、分数段、名次段、达标上线率

2. 学科情况:成绩段、标准差、Z分数、百分等级、达标平均分、达标上线率

3. 教学管理:达标贡献值、双达标上线率

4. 教学问题:关注历次成绩跟踪对比(名次、达标贡献值)、注意系数

从学科组层面看:

1. 整体情况:平均分、优秀率、良好率、及格率、满分率、零分率、分数段、名次段、达标上线率

2. 学科情况:成绩段、标准差、Z分数、百分等级、达标上线率、双达标上线率

3. 教学问题:小题分、闪光点和薄弱点、注意系数

从任课教师层面来看:

1. 整体情况:科目分、平均分、优秀率、良好率、及格率、满分率、零分率、分数段、标准差、百分等级、Z分数、达标贡献值、双达标上线率

2. 教学问题:小题分、闪光点和薄弱点、注意系数

从学生层面来看:

关注总分、科目分、达标贡献值、小题分、闪光点和薄弱点、注意系数

精准化数据的使用形象直观地反映了我们的教育教学实践情况,很大程度上减轻了一线教师的统计压力,也有效避免了想当然、我以为的猜想论和我觉得的经验主义论,用数据说话为我们的教学方式和内容的调整提供了可靠的技术支撑和方向。