透过PISA能否解读中国教育
PISA2012报告由6卷组成。第一卷《学生知道什么与能够做什么》分析了数学、阅读、科学的成绩状况;第二卷《追求公平基础上的卓越》从公平角度分析了影响学生测试成绩的社会经济因素;第三卷《学习的准备》分析了学生的学习动机以及自信;第四卷《什么使学校走向成功》分析了教育资源与教育政策的影响;第五卷《生活的技能》分析了学生解决问题的表现;第六卷《学生与理财》分析了学生的理财素养。
报告完全是欧盟视角,以经合组织成员为准,对参与测试的65个国家和地区的51万学生进行分析。我国上海、香港、澳门、台北参与测试,结果展示了同一种文化多种社会制度下教肓的表现。
上海社会是否早熟?
根据数学成绩分析,上海属于第一水平,显著高于第二水平的新加坡;香港、台北与韩国同属第三水平;澳门与日本、列支敦士登、荷兰、芬兰等地区同属第四水平。在经合组织中,韩国学生的数学成绩第一,日本和瑞士第二,荷兰第三,芬兰第四。
从数学成绩与社会经济背景的关系看,澳门、香港学生的数学成绩受其家庭经济社会地位影响比较小,优于经合组织成员。而台湾学生的数学成绩受其家庭经济社会地位影响比较大,劣于经合组织成员。
从高分的10%与低分的10%的学生分数相差值看,台北学生数学成绩分化最严重,其次是新加坡、以色列、比利时;上海的分化程度居第5位、香港的居第15位、澳门的居第25位。这组相关分析系数昭示天下,上海的教肓公平程度优于台湾,但明显逊色于澳门和香港。这是值得深刻反思的。
报告认为上海、台北都属于数学成绩高于经合组织平均值而结果公平程度低于平均值的一组,与德国、越南、波兰、新西兰等为伍。澳门、香港都属于数学成缋高于平均值而结果公平程度优于平均值的一组,与加拿大、新加坡、韩国、芬兰等为伍。
上海学生数学成绩与其家庭经济社会地位的相关程度与经合组织成员无显著差异,即处于同一水平。显然上海社会发展水平和经济水平难与经合组织成员相提并论,这是否暗示上海社会早熟呢?
教育投入具有独立性吗?
报告明确结论是,学生数学成绩与经济发展水平似乎不成简单的线性关系。GDP对学业成绩的解释力在经合组织成员之间只有12%,其他参试成员之间为21%。加拿大和波兰的成绩都是518分,前者人均GDP是后者的一倍。
从人力资源投入角度看,上海是最多的,台北是最少的,澳门和香港居中,其具体生师比,上海的好学校和差学校分别为10.5和14.7,台北为18,香港为15.1和14.5,澳门为15.2和16.4。
从教师工资看,香港最高,其次是澳门,上海第三,台北数据缺乏。全部参试地区教师工资与学生数学成绩成正比,即总体而言学生数学成绩随教师工资水平提升而提高。
教师工资占了经合组织成员和其他参试地区财政支出的大部分。从财政支出角度看,学生数学成绩随着生均教肓经费的提高而提高。
因此,师资和生均经费等方面教肓资源分布不均,值得高度关注。
在这方面上海、香港、澳门、台北都比经合组织总体状况遭糕。问题最严重的是上海,其次是台北,第三是澳门,香港教育资源分布均匀状况最好。
回归分析结果表明,GDP的发展水平对于学生数学成绩的贡献率是21%,而教育财政投入的贡献率是30%。由此可见,经济发展水平与教育投入水平是两码事,即经济发展水平高,不一定教育投入高;但是经济发展水平低,必然是教育投入低,因此教育投入具有独立于经济发展水平之上的作用或功效。
家庭条件左右学生学业的力度有多大?
与香港相比,上海学生的家庭藏书太少了!
在参试的65个国家和地区当中,爱尔兰家庭藏书量对学生数学成绩的贡献率最高,其次是英国、瑞典、爱沙尼亚,都在8%以上。香港家庭藏书量对学生数学成绩贡献率3.8%,上海2.6%,台北2.4%,澳门1.2%。澳门家庭藏书对学生数学成绩的贡献小得可怜,但值得深思的是,澳门居然比日本还高。
从学生数学成绩与家长最高职位的关系看,澳门、上海、香港和台北都处于十分弱相关的状态,与韩国处于同一水平,逊色于毫无关联的日本、土耳其、哈萨克斯坦。可见,在教肓公平服务于社会各阶层上,这些地区的经验非常值得我们学习。
当然,从这种关系看,上海、香港、澳门、台北的教育公平水平优于新加坡、法国、美国等五十多个国家。但是以学生数学成绩与父母最高学历水平的关系看,上海的问题最严重,台北其次,澳门最弱。
从家庭总的文化资本与数学成绩的关系看,台北最不公平,上海其次,香港和澳门最好,都处于国际先进水平。
课外补习是世界性的吗?
在参加测试的国家和地区中,上海学生做家庭作业
对于学生学习时间,报告还提供了另外一组数据,即放学后参加数学补习班的学生比例。在这方面,越南第一,80%多学生参加校外数学补习班,更有90%多家庭经济条件好的学生参加校外数学补习。
紧随其后是突尼斯、日本,然后是韩国、马来西亚和上海。上海学生参加校外数学补习班的比例最高,最低的澳门只有40%的学生参加课外补习班,香港、台北分别有超过55%的学生参加课外数学补习班。
从参试地区的情况看,学生参加校外数学补习班是普遍现象,不同之处只是程度而已。就是比例最低的新西兰、爱尔兰、澳大利亚、荷兰、奥地利等13个地区,都有超过20%的学生参加校外数学补习班。
在校数学学习时间,上海居第九位,智利、加拿大、阿拉伯联合酋长国、葡萄牙、新加坡、秘鲁、突尼斯、澳门都多于上海。在校学习数学时间最少的是保加利亚,只是智利的三分之一多一点。
从2003年到2012年有数据可比较的38个参试地区学生每周家庭作业时间看,减少是总趋势,如俄罗斯、希腊都减少了3小时,匈牙利减少了3.7小时。
中国学生数学成绩得分高,也许一个重要原因是我国数学教材的难度比较高的自然结果。PISA将试题分为三个难度,最低难度由水平一和二组成,中等难度由水平三和四组成,高难度由水平五和六组成。上海学生在高难度题目上的得分比例最高,两个水平的得分比例分别达到了24.6%和30.8%;而台湾、香港、澳门的比例分别是19.2%、18%、21.4%、12.3%、16.8%和7.6%。(本报记者陈中原)
【答疑】
哪些学生参加了测试?
PISA的测评对象简称15岁学生。PISA2012技术标准和抽样手册规定,所有在参与国家(地区)辖区内的学校都在抽样框内,即使这些学校不属于当地教育行政部门管辖。因此“上海市的学校”包括其他国家和其他省市在上海办的学校,“在上海市的学校就读的学生”包括在上海就读的外来务工人员子女和外籍学生。
PISA抽样分为两个阶段。第一阶段为学校抽样,由PISA国际专业协作组织——美国维斯达特公司(Westat)和澳大利亚教育研究院(ACER)负责,采用概率与抽样元素的规模大小成比例的抽样法(简称PPS抽样)。上海PISA研究中心确定的外显分层变量有三个,一是学段(初中、高中、完中),二是学校类型(普通、职业),三是学生入学成绩等级或学校质量(实验性示范性、一般),用这三个变量把学校分为5类:初中及九年一贯制学校的初中部、完中及十二年一贯制学校中学部、示范性普通高中、一般普通高中、中等职业学校。此外还确定了三个内隐分层变量,一是公办与民办,二是城市与农村,三是中专、职校和技校。分层变量确定后,上海PISA研究中心要上报上海每一所有15岁学生就读的学校信息,Westat和ACER对这些信息检查无误后才开始抽取学校。第二阶段为学生抽样,运用KeyQuest软件从每所样本学校中随机抽取43名学生,不足43名的则全部抽取。
上海被第一批抽到的155所样本学校全部参加了测试,学校参与率为100%,远远超过PISA技术标准规定的标准(85%)。符合PISA参加资格的样本学生为6467名,实际参加测试的学生共6374名,学生参与率为98.56%,每一所学校都超过了PISA技术标准规定最低参与率要求(80%)。所以各类学校参加测试的学生比例均符合全市15岁在校生总体分布,上海的样本质量远高于技术标准的要求。
测了哪些方面?
PISA2012的核心测评领域为四个:数学、科学、阅读、问题解决,其中问题解决采用计算机辅助测试。此外还有两个国际选项:财经素养(纸笔测试)、计算机辅助阅读和数学测试。上海学生参加了上述所有领域的测试。
与PISA2009相比,PISA2012的数学测评框架有了较大的变化:一是把问题解决过程划分为三个阶段:(1)用数学语言表述问题情境,(2)运用数学概念、事实、步骤和推理,(3)阐释、应用和评价数学结果;二是对学习者特征进行了更全面深入的阐述,包括数学学习的动机和信念等。
PISA2012问题解决测试采用计算机辅助测试,它有四个特点,一是仿真性,例如,模拟科技设备的功能,包括手机、遥控器和自动售票机等。二是交互性,问题解决者无需了解设备的内部工作原理,只需通过设备面板按钮的操作,通过人机交互来探究和理解设备的使用方法和功能。三是过程性,有利于中间和最终结果的获取与评分。只要编写出合适的试题,计算机就能够有目的地获取一系列数据,比如学生在解决问题时所采取的行动的种类、频率、持续时间以及顺序,从而能够收集和分析问题处理以及解决策略的相关数据。四是可控性,测试时可以监控并限制学生在某一特定试题上所花的时间,比如,限制学生在钻研某复杂问题情境时所浪费的时间,因此,学生一旦登录测试环境,时间就完全交给计算机控制。
举个实例:电子表。学生将看到一块有四个按钮控制的电子表,但并没有向学生透露它们各自的功能。学生需要完成以下任务:探究“时间”模式中每个按钮的功能;完成一张说明电子表各模式之间如何转换的展示图;根据以上了解,操控手表,设置时间。
除了认知领域的测试外,PISA还通过问卷调查收集学生个人、家庭和学校背景信息,分析影响教育质量的因素,为学校教育系统的改进提供政策建议。学生问卷内容涉及他们的家庭社会经济背景、问题解决策略、数学学习动机和学习机会等。校长问卷主要关于教师状况、学校资源状况、学校风气和学校政策等,时间为30分钟。
PISA问卷一般要求学生对一系列具体事实或行为做出描述或评价,而不是笼统地提问。例如对学生家庭经济社会文化地位的调查,包括父母的学历、父母的职业、家庭拥有物三个方面的问题。关于父母的职业,学生不是在几个有限的大类中做选择,而是具体描述父母的工作内容,比如“你父(母)亲主要从事什么工作?(如,学校老师,帮厨,销售经理)”“你父(母)亲从事的主要工作是怎样的?(如,教高中学生,在餐厅帮厨师备菜,管理一支销售队伍)”。然后由经过专门培训的编码员将父母的职业按照国际职业标准分类进行编码。又如,家庭拥有物包括家庭财富、文化资源和教育资源(问学生家中有哪些物品,在20多种物品中做选择)以及家庭藏书量。将学生对上述问题的回答综合为家庭经济社会文化地位(ESCS)指数,通过计算该指数与成绩的相关、对成绩差异的解释率和对成绩差异的作用大小,可以估计家庭背景对成绩的影响,如果相关系数、解释率或回归线的斜率有统计上的显著性,那么说明教育结果是与家庭背景相联系的,是不公平的,反之则较公平。
是如何评卷打分的?
PISA测试中的开放题大约占45%,需要专家对开放题进行评分,但实际并不是给出分数,而是给予一个评分代码。PISA2012正式测试评卷工作分纸笔和机考两方面。
纸笔测试评卷聘用32名评卷专家,其中12名评数学,8名评阅读,8名评科学,另外还有4名数学、财经、阅读、科学领域的评卷负责人,他们都参加过国际评卷培训,负责开展上海本地评卷培训以及检查评卷员每天的工作,并且在个别评卷员请假的时候担任替补。计算机辅助测试聘用12名评卷专家,4名评计算机辅助问题解决,4名(兼)评计算机辅助阅读素养,4名(兼)评计算机辅助数学素养,其中计算机辅助阅读和数学素养的评卷专家都是参加过纸笔测试评卷的。所有评卷专家都签署了保密协议。
评卷的培训工作非常严格,培训时间占了总时间的30%左右,培训和评分交替进行,每次1个单元组。所有评卷专家都要先做一遍即将进行评卷的单元组试题,对照评卷指南给自己做的试卷打分,然后采用全组公开讨论的方式来分析这些评分,再利用本地学生回答的样例开展评分实习。评分实习时评卷专家不能提问,不能咨询其他的评卷专家。完成实习后,培训者要对他们的评分进行审阅,并深入讨论以确保评卷专家明白正确评分的理由。只有当所有的评卷专家的评分质量和可靠性都达到要求了,才可以开始正式评分。
评卷过程分为单次评分和多次评分两个阶段,每个试题本都要抽出100本,由4位专家独立评分,用于检查专家之间的一致性。在所有数据提交后,国际组织还会要求抽样扫描200本试题本,由国际组织另外聘请一组国际专家来评分,以此检查各国(地区)对评分标准掌握的宽严程度,检查结果会在测试的技术报告中列出。
除了试题本需要专家编码外,学生问卷中的父母职业需要根据ISCO-08标准进行职业分类编码,这是一个相当繁重的工作,SHPISA中心聘请了7位编码人员,前后历时1个月才完成。
试题本评卷和问卷职业分类编码完成后便开始数据输入,共聘请15位数据输入员,用了11天时间完成。(PISA2012中国上海项目组秘书长 陆璟)
《中国教育报》