第三节 课程学习评价的发展趋势

21世纪初,哈佛学院前院长李维斯就指出,“在目前这种竞争和消费主义盛行的大学文化指引下,评价学生学习与发展的考试制度和与考分直接挂钩的奖励制度不仅脱离了真正的学识,而且抹杀了学生努力的意义以及追求公正的信心,进而演变成为一场勾心斗角的厮杀,从而培养出‘暴民’。大学已经失去了灵魂,忘记了本科教育的基本任务是帮助十几岁的孩子了解自我、探索生活的远大目标,帮助他们到毕业时成长为一个二十几岁的更加成熟的人。”(Lewis,2006)事实上,考试作为课程学习评价的一种主要策略(strategy),是以牺牲效度来达到信度的目的,以牺牲学生的学习兴趣来达到出题者的目的。所有的考试都意味着一种妥协:为了评分的精确性,考试内容就必须简单化和去情境化,学生利用资源的路径就要受到限制。学生既不能让考题适合于自己的风格,也不能就考题去质问老师。在这样一种考试文化(test culture)中培养出来的学生就只是一群拥有证书的庸人(mediocrity)。所以,我们不应该将“评价”只看作是“考试”,评价是用系列更为全面的、多维度的方式,去观察和判断在行动(action)中的个体学习者是如何思考的(Wiggins,1993)。而且“设计合理和实施得当的学习评价不仅能够激发学生的学习动机、提高学习效率,在评价的过程和反馈中学习,同时评价还可以为教师帮助改善学生的学习提供充分的信息”(Vu,et al.,2007)。的确,无论中外,当今的本科生都前所未有地将自己的学习努力置于学习评价的基础之上。他们分配学习时间和学习重点都是基于对评价的理解,即评价的内容可能是什么,学习什么内容可以拿到高分。评价影响学生的学习方法、学习活动并引导学生学习行为的方方面面;在许多课程中,评价环节之于学习的影响要远远大于教学内容之于学习的影响(Gibbs,2006)。

尽管以GPA主导的考试越来越科学,但也越来越机械(mechanical)(Wiggins,1993)。考试的认识论基础是智力(intelligence)(Wolf,et al.,1991),即智力是特定的、一元的、固定不变的,没有类型(kinds)只有等级(ranks)。特曼曾明确指出可以根据智力水平以固定的方式对个体进行分等(Terman,et al.,1922)。而在此基础上形成的“正态分布”的考试文化就强调通过分等的形式组织教育活动,为学生未来“命中注定”的生活做准备。其“课程设计”呈阶梯状,即知识的获得从入门的了解到最后的掌握呈线性顺序,而且纯粹的思维要比实际的动手更有价值,解决实际问题位于知识获得的最底层,理论性的思考是知识获得的最高层。“学习观”的突出表征就是认知的单元性和渐进性以及为了表明个体差异对学生的分类和分等,“评价”也就不可能包括合作、资源和工具使用等方式,而必须使用一种最能体现个人主义的(individualistic)方式——考试。因为表现个体差异的智力,就像身高等特质一样,是已经确定了的,没有其他任何辅助的东西可以改变(Wolf,et al.,1991)。

因此,基于这样一种“智力正态分布”的认识论基础,大学考试文化的本质就是以一种易于量化的方式来展示个体学生掌握知识信息数量上的差异程度,而非其思维表现的多样程度(郭芳芳,2012)。这种考试文化有如下三个突出的特点:第一,客体性——以GPA为主导的“分数与排名”就是基于固定的和外在的标准对学生的行为表现进行分等和比较,而不是描述学生的学习水平和思维方式。考试的主要工具就是正态分布曲线,曲线两端是少数的不合格者和优秀者,中间部分是大多数学生群体。所以,考试要么是迫使学生想尽各种方法将排名靠前,要么就是让学生安于现状,做一个平庸者(mediocrity),而不是刺激学生去追求更高的成就(accomplishment)。将学生看作一个个客体,认为在这样的体系中有些人注定要“失败(failure)或者表现不好”是自然的(natural)考试文化,使得“让所有的学生都学会学习”和“针对学生当前的成就水平提供指导”的责任变得不是那么重要和必需了(Wolf,et al.,1991)。第二,去情境性——考试是一种在有限时间内的即时反应(first-draft responses),强调速度和效率而非思考和准确。在考试中表现较好的学生,即GPA较高的学生在实际中未必一定表现很好(Schoenfeld,1988)。另外,考试将学习看作是个体单独的事,GPA排名则是一种零和游戏,但是在实际的工作中,大多数的工作是需要合作和借助于其他资源和工具的。第三,终结性——考试作为一种科学测量方式,就像温度计、测深仪一样,学生只是被测试的客体,学生和教师关注的只是结果,而不去思考为什么会产生这样的结果——失败或者成功,这样也就不会有更进一步的针对考试结果的讨论和学习。GPA说明的只是数量的多少而不是质量的好坏,通过GPA并不能了解学生在“追求、研究、想象和观点”等方面的思维特性(郭芳芳,2012)。

如果说以“GPA和排名”为主导的考试文化将学生看作是被动的客体、采用单一的终结性方式测评一种个体孤立的学习观,适用于高等教育精英阶段,那么在高等教育大众化和普及化阶段,这种考试文化的局限和不足就越来越明显。用更为全面的评价方式代替考试的讨论、研究和实践始于20世纪70年代末欧美高等教育大众化领域。因为GPA膨胀(inflation)问题以及由此引发的对大学本科教育的全方位思考,特别是对高等教育质量保障的深刻反思,使得包括研究者和实践者在内的各界人士都逐渐将注意力从考试投向评价,并引发了一场风靡全球的“评价运动(assessment movement)”(Ewell,2002)。这种词语上的改变不只是形式上的,更是对高等教育的理念和实践认识更为深入和科学的体现。从考试文化转向评价文化就是基于教育的本质是促进人的发展,而不是给人分等;学生的发展是多元的;学生学习受益于评价等多方面的认识(郭芳芳,2012)。

评价文化的认识论基础是心智(mind),即思考的能力是不断发展变化的,学生学习本质上就是一种思维活动,需要多种心智和工具的合作(Wolf,et al.,1991)。而“心智”这一人的基本素质存在于不同人的不同发展阶段,所有的人都可以构建而不仅是吸收知识。发展和认知心理学,比如加德纳的多元智能理论(Gardner,1985),罗格夫的日常认知(Rogoff,1990)和学徒思维(Rogoff,et al.,1984)已经充分证明了这一点;学习并非一点一滴的线性累积,而是一种不均衡的飞跃式转变;新手与专家的区别不是知识掌握的多少和智力的高低,而是其在组织和识别信息方面的能力差异。这种能力差异主要源自经验的多寡(Messick,1984)。因为只拥有心智的结构(furniture of the mind)——智力是不够的,还需要有心智的规训(discipline of the mind)——用一种有成效的方式去重组和使用智力的能力(Krug,1992)。思考像其他行为一样具有社会属性,只有在见证其他不同心智如何工作,以及其他心智介入挑战自己心智的情况下,理解才可能变得更深刻和复杂。同时,只有在与其他资源和工具等结合的时候思考才能发生。所以,学习不仅是个体的事,更是一种群体的、合作的事(郭芳芳,2012)。

在“心智”的认识论基础上,评价文化强调的是一种探究和合作,侧重于衡量个体学生如何探究复杂的知识技能以及如何与别人合作,并强调学生为主体的成就与发展。其实,早在1899年,美国实用主义的倡导者,有着美国第一位本土哲学家、心理学家和教育学家美誉的詹姆斯就明确指出,没有任何一种在实验室使用的方法可以用来测量某门学科对学生的影响,在我们的一生中会有各种各样的考试,但只有心智的成长才能让生活更加美好(James,1983)。詹姆斯担心评价会变成一次性的测量,他指出,如果我们想证明学生的进步与否,就必须首先描述进步指的是什么,然后在此基础上思考如何使用一种发展的、历时的数据从长远的角度来衡量学生的进步与成长。相比单一的考试测量,评价是价值关涉的,是基于现实的一种心理构建(Guba,et al.,1989)。这种评价文化亦有如下三个特点。

第一,从排名到证明,强调的是学生的主体性。评价是去“证明成就(document accomplishment)”而不是基于智力的概念使用特曼的“正态分布曲线”去排名。评价要全面了解学生的学习情况,了解学生真实的知识技能的掌握情况,以及学生的发展情况而非和他者的比较情况。这不仅需要将学生作为主体而非客体,同时学生自己也要彰显自己的主体性。考试排名关注的是学习成绩的合格与否,评价则是提供证据来描述学生学习成就的现状并指明改进的方向。评价结果可以说明学生在其受教育历程中的位置,而不是在其不断变动的同学数量中的相对位置(Cannell,1989)。在“证明的主体性”框架下,成功于学生就不再是虚无缥缈,于院校也不再是各种排行榜的位置,而是学生在不同阶段心智的成熟和理解的深入。第二,从智商到心智发展的评价,强调情境性。即结合学生个体特征及其所处环境对其进行真实情境下的评价(Wolf,et al.,1991)。第三,从他评到自评,强调反思性。所有的学习者都可以通过自己的体验和教育对自我的学习与发展进行自评,但是这种自我评价的能力是在别人不断评价而不是测量的基础上形成的(Wiggins,1993)。因此,如果说考试表明了个体智力的差异,评价则能描绘个体整体心智的品质并渗透到个体日常中去改进这种品质。因此,后者才能真正地诠释教育的要义(郭芳芳,2012)。

另外,考试文化只适合那种“学生适应课程”的精英教育阶段。在这种情形下,师生在基于对“效率(efficiency)——正确地做事”的标准和证据讨论的前提下,得出一种以“分数与排名”为本质的高风险决策(high-stakes decisions)(Wolf,et al.,1991)。而评价文化则适合“课程适应学生”的大众教育阶段。在这种情形下,优先被考虑的是“效能(effectiveness)——做正确的事”,所以重点就不是“分数与排名”,而是“成就与素质”。在效率与效能无法兼得的情况下,我们首先应着眼于效能,然后再设法提高效率。

考试作为一种测量学生学习的方式沿用至今虽然也证明了其合理性,但是如果在大众化高等教育情境中,在建构主义思潮逐渐渗透到高等教育系统内外的各个领域之际,还将考试作为大学中唯一的或者说是主要方式来衡量学生的学习与发展的话,那就不妥当了。前述论及的以“主体性、情境性和反思性为主要特征的评价文化”给“强调客体、去情境性和终结性为主导的考试文化”提供了新的选择,并已经有坚实的认识论基础和大量的实证研究验证其合理性和必要性。这种新的评价文化所体现出来的理念和价值观就是,评价可以激发学生学习兴趣,培养学生更为广泛的能力来适应未来的学习和工作,同时也为教和学提供有用的信息。因此,大学有必要在认识到考试不足的基础上,充分构建和使用新的能够展现学生学习与发展的评价,从考试文化转向评价文化。但是这种评价文化的营造和落实需要一种整合的力量去计划(to plan)、实施(to implement)和改进(to improve),即营造新的院校文化——共享的价值和使命——强调和重视学生的学习,审视影响学生学习的因素,通过评价促进和提高学生的学习与发展;教师、行政人员和学生共同承担学生学习的责任;整合资源优化结构支持学生学习;采用合适有效的方法评价学生的学习(North Central Association of Colleges and Schools,2005)。

总之,通过分析高等教育中学生学习理念的变迁、学生学习质量观的诉求以及课程学习评价的发展趋势,可以认识到课程学习评价在当今高等教育中的作用和地位。课程学习评价可以通过证明的方式来影响和指引学生的学习,让每个学生都能学有所成;课程学习评价不仅局限在课程教学实践中对学生学习的指引和影响,还可以作为衡量院校教育质量的重要手段。