国外教育考试公平性标准及其启示

投稿狂奔
更新时间2015-08-30
阅读量325次
评分4
赞78
踩0

　　【内容提要】教育考试公平事关教育公平乃至社会公平。本文对国外教育考试公平标准的理论和制度进行了梳理，从起点公平、过程公平和结果公平三个角度论述了国外教育考试公平性的实施及其意义，并从考试的内容、过程、形式和评价等方面提出了相关建议。

　　【关键词】教育考试/教育公平/考试公平性

　　【作者简介】王蕾　张安梅　北京师范大学　北京　100875

　　【中图分类号】G405　【文献标识码】B　【文章编号】1005-8427(2010)09-0049-6

　　教育考试（这里指统一考试）是20世纪以来日益突出的一种社会现象，是当代社会政府和公众普遍关注的一种社会现实。教育考试是社会评价人才（量人）的重要机制，作为教育考试结果的教育考试成绩已成为社会分配教育机会或资源的主要依据甚至唯一依据（如我国现行的高考），有时还是应试者获得职业等其他机会和资源的重要依据。广义考试公平指各类考试本身固有的属性，狭义考试公平指应试者在具体考试类型、考试科目、考试场景中享受到的公平待遇。考试公平不仅指考试定义公平，考试制度制定实施公平导向，还指具体考试实施中处于不同地域、经济条件和不同地位、权力、金钱条件下的应试者，考试中享有同等公平待遇。简单而言，就是考试内容和实施过程对所有考生一视同仁、不偏不倚。

　　教育考试公平事关教育公平乃至社会公平。在教育机会有限、教育资源（特别是优质的教育资源）紧缺的情况下，要使社会教育机会和资源分配公平合理，必须使作为其重要依据之一的教育考试做到公平。随着我国教育事业的日益发达，教育考试的重要性也逐渐凸显，教育考试事关千家万户的切身利益，教育考试的公平性牵动着千万家长和考生的心，从某种角度来说，教育考试的公平性决定了它的正当性。无论从理论上看还是从实际上看，教育考试的公平性问题已经成为一个不能不引起社会高度重视和认真研究的重大理论和现实问题，而如何保证教育考试公平性呢？国外很多机构为此制定了公平性标准，希望通过标准系统来保证教育考试的公平性。本文试图通过对国外教育考试公平性及其标准的理论和制度做一梳理，能对我国的教育考试公平性及其标准的制定有所借鉴。

　　1　理论研究

　　从教育公平的角度说，瑞典著名教育社会学家托尔斯顿·胡森(Torsten Husen)在一份权威性的研究报告中对教育公平作了一个动态的、较为全面的界说，教育公平依次在效率优先的起点均等论、公平优先的过程均等论和突出个性发展的结果均等论三种平等观指导下演进，这三个平等观分别代表着各不相同的价值取向。因此对接受教育的个体主体而言，“公平”意味着三层内涵：起点、中介性阶段、最后目标，或者三个方面的综合。但考试公平则往往无法实践这种公平价值的层层推进，而只能在教育资源准入门槛上起到所谓公平、公开、客观、有序的竞争机制的作用，即只是体现一种社会本位的机会公平、程序公平。

　　美国教育社会学家詹姆斯·科尔曼(James colemarl)曾界定了不同的教育机会公平定义，并将它们区分为教育投入资源和教育产出效果两类机会公平。在科尔曼看来，教育机会公平观念理应意味着机会的效益均等。相对于教育考试的机会公平来说，绝不能简单地在能不能报考，有没有机会参考的表面公平上着眼，而应该认真审视影响到考试状况的所有对学习起作用的基本因素。比如说，国家宏观的教育投资政策等。

　　功能主义者特纳在对英国和美国教育系统的比较中曾提出了“赞助性流动”和“竞争性流动”的概念，在竞争性流动中，个人的选拔可以不断地推迟，但流动的希望一直存在，一直都在激励着个人最后目标的实现；而在赞助性流动中新的和未来的精英是由现在的精英所指定的，他们利用高水平的学校对人们进行分类。“赞助性流动”的选拔机制允许人们坦诚接受考试中的失败或成功，只要你有信心并付诸努力都有机会指向自我发展的结果公平；而“竞争性流动”的机制则类似于“一考定终身”的某些考试制度，因为考试结果的不同将会导致完全不同的发展机会，并成为教育成层的一个重要原因。这一理论与胡森关于结果公平的论述如出一辙，胡森在其理论中指出，结果公平是指承认个体差异，强调应该按照不同的教育起点经过不相等的教育过程，社会政策的最终指向是追求每个人的天赋得以充分发展的机会。

　　在教育考试的内容形式方面，根据新右派的观点，社会文化本身就是多元的，在这种多元的基础上，按照同一个文化标准去实现考试公平，这本身就是不公平的。考试过程组织的统一性（包括时间、地点、形式、内容、答案、选拔标准的统一性）意味着一种一元文化或所谓有“同质化”社会和文化的前提，换句话说，这种考试程序的公平是按照同一个文化标准去说明和追求并实现的机会公平。

　　美国著名学者Popham指出，许多标准化的考试内容，不仅是在测试教师及学生在课堂上的所教所学，还在测试学生在课堂外、学校外之所知所获，这使得来自社会不同阶层的学生面临着不平等的竞争状态。那些来自中上流社会背景的学生，生活、成长于一个物质条件及精神资源相对丰富的环境中。他们从校外生活中所获得的知识和信息量，是那些生活在物质条件及精神资源都相对匮乏的环境中的贫民学生所无法匹敌的。标准化考试的范围与教师上课所讲授之内容的不匹配，便存在着这样一种可能：考试成绩不是在说明学校教学情况，而是在说明学生在校外的社会生活地位与经济地位的差异。换句话说，在统一课程及标准化考试中，成绩的差异更多的是社会结构不平等的产物。

　　2　制度方面

　　由于各国的政治制度及文化传统存在很大的差异，因此，各国的考试制度改革也具有不同的特点。按照地域和考试制度，国外的考试制度可以分为三类：(1)美国型（包括加拿大）。(2)欧洲型（英、法、德等国）。(3)亚洲型（日本、韩国等国）。

　　2.1　美国型

　　1883年，以平等竞争为原则的文官考试法案获得美国国会通过，该法案规定政府事务官的录用，必须经过公开考试，择优录用。英、法、美等国都在引入文官考试制度之时，探讨了其公平性问题，并且到近现代对于考试的公平性的争论更为深入和细致。

　　20世纪60年代，不同社会经济地位、性别、种族在测验结果上的差异问题引起了美国教育界的广泛兴趣，统一考试能否克服现存的由社会经济地位、种族、性别等形成的不平等成为美国教育界争论和研究的焦点。在考试内容的公平方面，围绕“统一课程及标准化考试”，课程及考试内容究竟是体现了真正的教育平等还是损害了教育平等，也成为争论的焦点之一。不少美国教育者认为，标准化考试的许多内容具有一定歧视性。

　　1974年，美国教育研究联合会(AERA)制定了《教育与心理测量标准》，用于指导、规范和评价各类测验的设计和使用。1985年修订的第二版中，首次专门设立了一个章节讨论测验公平性问题。1999年由美国教育研究协会(AERA)、美国心理学协会(APA)和全美教育测量学会(NCME)三家机构共同对1985年版本进行修订后颁布。这是今天教育与心理测验领域中一份最具权威性的文献，它体现了考试领域中的行业标准，是所有考试工作者的必读书。其中在第二部分测试中的公平性中对测试和测验应用中的公平性、多元语言背景考生及残疾考生的测试方面给予了较详细的指导意见。1986年开始，美国教育测验服务中心(ETS)规定其编制的所有测验都要进行题目偏差的检验。ETS宗旨是通过提供公平和有效的评测、研究以及相关服务，从而提高教育质量和公平性。其编制的《ETS质量和公平性标准》几经修订，成为规范和评估其众多考试项目的指导手册。其他如《公平测验实践规范》、《教育测量中专业责任规范》等文件，成为测验行业大家公认、确保考试科学而公平使用的标准。

　　美国教育测验服务中心(Educational Testing Service)是世界上最大的私立民间考试机构，于1947年在普林斯顿大学成立。在ETS成立之前，美国的各种考试机构之间不协调（美国各州都有自己独立的公立学校考试评估系统，但各州的考试评估标准不同，考试成绩不被广泛承认），ETS成立之后，SAT和GRE等就统统归于ETS，它所举办的考试，被大多数院校认可。作为世界先进的教育考试机构，ETS的网站上有这么一段关于测评中的公平和公正的承诺：“ETS承诺确保我们的测评和其他产品都是最高质的，并且是尽可能免予偏见的。我们所有的产品和服务——包括个人的测评问题、评价、指导材料和出版物——在开发过程中就已被评估为确保它们不是冒犯性的和引起争论的，不会强化任何集团的陈规老套的，是免予人种、种族、性别、社会经济和其他形式偏见的，是免予被相信是对任何集团不恰当或毁损名誉的内容的。”ETS早在1981年就研制出了一套标准系统，并称之为“质量与公平标准(Quality and Fair-Standards)”。ETS的总裁兼首席执行官科特·M·朗德格拉夫(Kurt M.Landgraf)宣称：“我们教育考试服务中心的使命就是要通过提供公平而有效的评估、研究和相关的服务推进教育的质量和平等。”其核心就是《ETS质量与公平标准》，该标准1981年被ETS理事会作为公司政策采用，并仍继续作为衡量所有ETS产品和服务是否优秀的基准发挥作用。这套标准系统是ETS所有考试和服务的基准尺度，ETS要求通过这种基准尺度使考试项目满足公平、合理、有效和实用的标准。

　　2.2　欧洲型

　　英国实行校外教育证书考试制度，高校招生基本不采用入学考试，而是根据校外教育证书考试的成绩来录取。证书考试在英国享有极高的声誉。例如，英国的中学毕业考试，即普通教育证书考试(GCE)分为普通水平考试（俗称“16岁考试”）和高级水平考试（俗称“18岁考试”）。各大学依据GCE考试结果，独立选拔学生。1988年，英国把GCE普通水平考试和职业性的中等教育证书考试合为单一的普通中等教育证书考试(GCSE)，仍保留GCE高级水平考试。1989年又增设了高级补充水平考试，且两科高级补充水平考试相当于一科高级水平考试。为了使高水平考生充分发挥自己的能力，GCE考试机构又在部分高级水平考试内，新设特殊试卷考试。

　　这些考试均由独立于中学和高校，经国家教育与科学部认可的校外考试机构主持并颁发证书。英国的两级教育证书考试制度颇具特色，既考核学生学习的广度和深度，又兼顾学生不同时期的学习表现，最大限度地避免了“一考定终身”的弊端。

　　2.3　亚洲型

　　第二次世界大战后，日本政府进行了继明治维新之后的第二次教育改革。1947年3月颁布的《教育基本法》和《学校教育法》进一步确立了“教育机会均等”的原则，入学观念开始由国家转向个人，学生不再受国家意志的支配，而是从个人需要和兴趣出发选择学习内容。观念的转变推动了日本考试制度的改革。第二次世界大战后，日本曾实行过4种大学入学考试制度。

　　1947～1954年，日本大学入学考试主要是引进美国的SAT(Scholastic Aptitude Test)，即“学术能力测验”。试题由文部省直属的国立教育研究所命制，力求全面考查学生的智能和学习能力，克服偏重知识考查的倾向，并根据测验的考分录取学生。

　　1955年取消“学术能力测验”后，由各大学自主举行的考试又回到了以知识考试为主的老路上，实行按标准分决定录取的方法，实质是强调分数第一。

　　自1979年起，日本的大学入学考试分为由大学入学考试中心举行的“全国共同学力第一次考试”和由各大学自行主持进行的“第二次考试”两个阶段。根据这两次考试的成绩，并参考高中校长提供的“学生鉴定书”、“体检表”等资料，择优录取。

　　从1990年起，日本用“大学入学考试中心考试”（又称“国家中心测验”）代替了“共同第一次考试”。日本中心考试以及单独考试相结合的现行高考制度，使得考生在一年内向多个学校多次挑战成为可能，即实现“考试机会的复数化”，不再是“一考定终身”，减小考生的压力，让他们轻松应战，以取得更好的成绩。

　　由于各国的具体情况不同，研究实现考试公平性的侧重点也就不同，但总的说来是围绕起点公平、过程公平和结果公平来做文章。从起点公平来看，国外不断扩大教育考试应考机会，原则上将其给予所有愿意应考的人员。美、英、法、德等国通过各有千秋的改革，现已使教育考试机会可以惠及全体中学生，甚至全体公民。从过程公平来看，不少国家在考试中引入“复试”机制，使考生在同一考期有多次类似“补考”“重试”的机会，还有，赋予考生更多更大的自主选择权利，使考生在一定的规范下能按自己的兴趣、能力或需要选择应考科目、场次、方式，或选做不同层次的试卷，发挥自身优势。从结果公平来看，各国在根据各自的考试评分规则评定考生最终成绩之后，都努力遵守“凭分取人”的“游戏规则”。当然，有些国家出于更广泛的社会公平性考虑，在教育考试评分中会给某些社会处境不利群体，如少数族裔或偏远贫穷地区的考生某些“加分”优待。

　　3　对我国的启示

　　3.1　考试内容能力化

　　以美国大学入学考试为例，其内容旨在评价学生在校内外学习中发展起来的认知和分析能力，只进行综合能力考查。考试虽然分语言和数学等测验，但每部分内容都涉及自然科学和社会科学。学生单靠死记硬背和临阵磨枪是无法取得好成绩的，需要平时日积月累的知识储备和能力养成。

　　而目前我国各类入学考试的内容还是偏向于背诵型知识的考查，鉴于此，当前的考试内容改革应将能力考查作为重点和核心，突出体现学生对知识理解运用、问题分析、思维创新能力，将其重点放在学生对问题的分析、理解和凭借能力及创新能力的展现上。注重学生动脑和动手能力的综合考查，强调理论联系实践。此外，考试内容要注重学科之间的渗透和综合，体现现实生活的客观要求，重在考查学生的综合素质和能力。

　　3.2　考试过程科学化

　　国外社会考试服务机构从试题编制到考试实施都非常注重科学性。在人员配备上，考试服务机构汇集了众多心理学、教育学、统计学和心理测量与教育测量等学科领域的专家。每编制一个测验，都要做出测验计划，还要进行试题预测、调查性测验，分析试题的信度、效度、难度和区分度等。

　　对于现阶段我国的考试现状来说，应该注意提高考试的科学性和专业性。在编制试题中，集中各个领域专家和一线教师，广泛采纳意见，科学编制试卷；在实测过程中，加强对考场、考务人员的管理。通过合理使用选择题的形式提高阅卷过程的科学性，加强对考生个人考试心理技能的教育与训练，尽量减少考生主观因素带来的考试误差，提高考试的客观性、科学性和公平性。

　　3.3　考试形式多样化

　　从考试举办主体来说，应该由专业的考试机构和各个高校等多个主体参与。以日本为例，中心考试是由日本大学入学中心组织负责的，而一般入学考试由大学负责并部分采用大学入学中心命题的中心考试成绩，推荐入学和AO考试则完全由大学的相关机构自行负责组织实施。这种由多个主体共同参与的形式不仅符合各大学的个性发展，同时也从一个侧面保障了考生的选择权。鉴于此，对我国现阶段的大学来说，由于其专业设置、培养要求的不同，建议从自身的实际情况出发出题，重点考查学生的专业适应性和自身能力。同时，多个机构组织考试有利于各考试机构良性竞争，避免单一考试所带来的弊端。

　　从考试时间来说，应该避免一考定终身，为考生提供更多机会。以我国高考为例，春季高考不面向普通的高中应届毕业生，且招生学校多是民办院校，无名牌大学，使得家长和学生都涌向每年6月的高考。为此政府也投入大量的人力、物力和财力。为了使每年一次的高风险考试“赌博”转化成为科学、合理、公正的学业能力测评，考试机构应该每年提供多次考试。以降低高考的风险性和考生的压力，促使考试回归到测评服务的本质上来。

　　3.4　考试评价合理化

　　现阶段我国的大多数考试仍然处在“一考定终身”的局面中，这一点在高考中尤为明显，高考成绩是学生能否被大学录取的唯一条件。而国外大学入学考试并不看重一次考试的结果性评价，而是更强调学生在整个学习阶段表现的过程性评价，这就保证了不同特长和才能的学生接受教育的机会，减轻了考试的决定作用，避免学生被过度同质化。因此，从考试的评价功能上来说，应从结果性评价转变为过程性评价。除了考试成绩外，应将学生学习阶段的学习成绩、特长和能力表现等情况一并作为参考条件，努力给学生提供更加多元的评价标准。

　　【参考文献】

　　[1]李云芳.战后发达国家高等教育机会平等进程分析[D].2004(5).

　　[2]宋维红.中美学者对统一考试公平性认识之比较[J].教育评论，2007(4).

　　[3]齐森.美国教育考试与评价现状[J].中国考试，2004(1).

　　[4]王玉衡.美国标准化测验的问题与质疑[J].比较教育研究，2002(7).

　　[5]陈兴德，赵静.科举制：中国对世界文明的一大贡献[J].湖北招生考试，2005(4).

　　[6]方彤.国外教育考试改革追求选择性下的公平性[J].湖北招生考试，2005(12).

　　[7]赵静.英、美、日三国大学入学考试制度研究及对我国的启示[J].世界教育信息，2007(2).

　　[8]赵春娟.战后日本大学入学考试制度的变革及其启示[J].天中学刊，2005(12).

　　[9]陈阳.国外高考模式比较研究[J].理论观察，2006(2).

　　[10]苏尚锋.考试的起点、过程和结果公平[J].湖北招生考试，2006(10).

　　[11]冯先杰.美国大学入学考试制度及对我国高考改革的启示[J].理工高教研究，2005(4).