干货丨揭秘多数IB学校使用的ISA评估测试

文丨新学说

准确有效的教育评测方法能够为各个学校乃至各个国家提供清晰明确的参照物,使得学校明晰自身的教学水准,发现自己的擅长和不足的领域,从而促进学校不断完善,最终达到提高学校办学品质的目的。

新学说2018《中国国际学校发展报告》对目前国内国际学校使用的主流国际评测手段进行了比较详细地梳理与介绍,希望帮助广大国际化学校甄别筛选出符合自身教学需要的评测手段。其中,对国际学校评估测试ISA进行了详尽的介绍与分析。

ISA概述

ISA(International Schools’ Assessment),即国际学校评估测试,是面向世界范围内的国际学校的3-10年级学生的评估测试,基于OCED(经济合作与发展组织,Organization for economic cooperation and development)下PISA(国际学生评估项目,Program for International Student Assessment)测试项目的概念和框架,主要评估学生在学术、阅读、写作和科学上的能力。这一项目由ACER——澳大利亚教育研究委员会研究并推广。

干货丨揭秘多数IB学校使用的ISA评估测试

ISA的发展历史

PISA测试是对国际学生能力的评估,参与PISA测试的ACER(澳大利亚教育研究委员会,Australian Council for Educational Research )也将目光放到了学生评估和ISA组织的发展上。经过和东亚地区国际学校的讨论,ACER了解了学校对于评估体系的需求,评估体系提供保质保量的回馈报告,通过反馈能够帮助学校提高教学,同样也可以将自身的学生水平和同类型学校进行对比。尽管很多学校在监督和评估学生水平上使用了一些外部评估机制,但是由于这些评估体系缺乏特殊性,无法表现出多语言和多文化背景下的学生的真实水平。

通过参与PISA项目的实施,ACER在评估测试上已经积累很多经验,尤其在针对多语言文化背景的学生方面。评估学生的能力也成为ISA理想中的角色定位,2002年ISA测评正式成立。

ISA的测试形式

ISA测试包含数学、阅读、写作和科学四个方面的能力评估,其中除科学只针对7-10年级学生开放,其余三项3-10年级学生均可参加。3-10年级学生在数学、阅读和写作以书面形式或线上形式进行;7-10年纪学生在科学能力上以线上形式进行。测试时间为每年9月、2月和5月,学校可自行选择安排时间。例如:北京乐成国际学校每年2月进行ISA测试评估。

学校分别可以在在2月进行书面和线上的评估,在5月进行线上的评估,而9月进行书面评估。

ISA与IBO的合作

2009年,IBO官方委托ACER对“PYP和MYP项目中学生的表现”进行研究调查,主要以IB项目中学生在认知能力、学习态度和幸福感上的表现为主要目标。

随后,IBO官方与ACER签订合作协议,IBO对自身的IB课程项目改进和学生能力评估会以ISA测试为重要依据。综合来看,针对学生学习能力的ISA测试和强调培养学生全方位能力的IB课程在一定程度上的契合使得ISA和IB有了更多合作。根据报告的信息,2009-2011年,IB委托ACER继续来评估学生的表现,同样通过问题调查研究IB学生在认知能力、学习态度和幸福感上表现。这些都会纳入报告内容。这一合作也解释了开展ISA评估测试的学校多为IB课程的国际学校。

ISA的对比性及评估人员专业性

ISA报告剖析

ISA测试以学生为最小单位,综合所有学生的测试结果,以此为基础,作为评价学校整体学习能力的核心依据。因此,ISA报告包含三方面内容:

1. 每个学生的个体评估报告,即每个学生在测试中的全部表现;

2. 班级评估报告:每一项中个体学生评估的总和;

3. 学校评估报告:各年级和小群体中学生评估结果的总和。

ISA效果对比

ISA评估测试除了反应学生、群体和学校的水平,还能显示其和类似目标对比的结果,如:参加测试的国际学校和相似学校相比,学生的能力处于什么水平。

为了实现“对比性”这一目标,需要成员学校的配合和支持,主要体现在以下方面:

1. 根据ISA官方提供测试引导介绍,不同学校的学生能够在相同条件和背景下进行评估测试,这样的数据比较性较强;

2. ISA评估测试的安全性,确保测试资料不会外泄。每年会定期将测试资料寄回官方,以便ISA官方可以随时将学生的成绩进行更新;

3. 测试评估的准确性。成员学校中只有真心不想参加测试的学生可以被允许不参加,由于参与学生多是愿意主动加入的,所以ISA评估报告对于学生整体的评估比较准确。

ISA官方和成员学校沟通

定期的邮件和面对面的沟通确保学校对ISA的评估体系的使用和学校是否达到了所需要遵守的条例的要求。但是,ISA并不强迫学校,而是取决于成员学校对规则的遵守,这样才能保证ISA比较数据对学校的用处最大化。

评估人员的专业性

评估过程中的打分员必须具有相对应的学术、专业背景,比如,10年级的数学测试打分员必须具有中学数学教师或相同程度的水平。ISA官方针对每一个科目的打分都有相应的指导。比如,一个既定的分数标准下,学生的回答示例,同时官方会给打分人员进行相应的培训,实践中也会由负责打分评估的小组领导进行审核和确认。

ISA的分数及内容构成

ISA评估测试的分数以量尺分数(scale score)呈现,不同于原始分数(raw score)和加权分数(weighted score),采用这种量尺分数的好处在于,可以正确的反应学生的学习能力。

如:满分制下,考生数学成绩80分、英文成绩70分,从分数来看,学生的数学成绩高于英文成绩,但是如果大多数考生数学成绩都在80分左右,英文在60分左右,则显然学生的英文学习能力在同龄人中高于数学上的学习能力。

ISA测试评估中的量尺分数

每一个项目都有相应的数值标准(基于年度PISA测评中的相关内容)和原始分数。学生成绩是由学生“正确题目”的总和呈现,将每一项的得分转换成量尺分数。使用量尺分数的好处在于,可以不局限于科目对学生进行评估和比较。

比如:在阅读测试上使用量尺分数,可以直接对比任意一年中3-10年级学生的不同表现。和学生完成了哪一个阅读测试无关;都可以和其他完成ISA测试的学生分数进行对比。ISA量尺分数的更新能够关于学生学习能力的最新变化,同样也作为课程、教育改革对学生影响的证据。

这一分数涉及两个内容:

1. 学生在单科中答对的题数;

2. 所有学生在这单科上的表现——多少考生答对多少题,整体统计进行换算;托福考试中也使用这种方法。

ISA测试中不同项目的定义

ISA测试中包含四个项目:数学、阅读、写作和科学,和各项代表的具体科目和知识不同,ISA测试更注重这四方面学生的能力和素养。

1. 数学素养:指学生的数学表达、使用和解释能力。包含了数学推理、数学概念、推导过程、描述方法等方面。可以更好地帮助学生理解数学在生活中的意义和基本数学推理基础。

2. 阅读素养:定义为“文章的理解、使用和思考,以达到既定的阅读目标,增加个人的知识并在社会中进行分享。”

3. 写作能力:ISA写作评估中包含了两个延伸的写作任务——描述性写作、议论性写作。

4. 科学素养:指学生理解科学问题的能力,基础知识和科学使用能力是考评的两个方面,如理解科学目标的基本概念和产生过程、解释科学现象、分析数据和证据、科学推导等方面。

内容、语言、拼写是主要的考评方面。描述性写作要求学生写一个故事或者思考,通常根据一副图片来引导。议论性写作要求学生根据一个命题表达自己的观点。在写作开始前学生会有时间进行讨论和交流。内容、英语语法和写作结构是主要考评方面。科学素养理解科学相关问题,科学能力和基础知识是考评的两个方面。

评估测试的难度

ISA测试中,测试资料的难度由评估发展员根据目前各年级所需要的难度来确定。因为评估发展员都是教师出身,测试本身具有一定可靠性,在之后的试验阶段,这一测试也会被不断完善,最终根据学生的反馈,对测试材料的难度进行准确的调整。

ISA测评下的项目反应理论(IRT,Item Response Theory)能够为目标群体选择能力相匹配的学生。在现代学习测量理论中,影响最大就是IRT。学习测量的主要任务在于探索人类某种学习行为下面的起制约作用的潜在特质结构(包含有哪些成分以及这些成分的数量、性质),进而将其量表化,再通过此量表判定被试在这些潜在特质量表上的准确位置,以最终能够较为准确地预测该学习者的学习行为或能力表现,因此,也被称为潜在特质理论(Latent Trait Theory)。

1952年,美国测量专家洛德(在他的博士论文中间首次提出了基于项目反应的“双参数正态卵形模型”,并提出了该模型相应参数的估测办法,从而使得这一理论模型能够实际运用于二值计分的学习测试项目。

ISA在世界及中国国际学校的使用情况

截至2015-2016学年,来自355所世界各地学校的76,000名学生参与到了ISA评估项目。 中国大陆有33所国际化学校采用ISA作为学生评估的手段。另外,在这34所中国学校中,16所为外人员子女学校,16所民办学校,1所公办学校,公办学校对于类似ISA的国际评测机构的认知程度相对较低。


分享到:


相關文章: