考虑到高等教育中“加工”材料的差异性,目前高等学校普遍采用了按照教师的岗位来进行评价的方法,一般将教师岗位划分为教学岗、教学科研岗和科研岗三类,并按照岗位分类进行教师评价。这种按照岗位不同设定不同评价指标的方式并没有解决教师考核评价中的问题。教学科研岗的评价是以科研为主,对达到规定课时数量的教师,几乎放弃了对其教学的评价;对教学岗的评价是按照外显指标进行,例如,教学岗教师普遍要求获得省级以上的教学成果奖或者撰写规划教材等等,这种指标对于普通教师是难以达到的,因此,这种评价也不是真正的对教育教学的评价。教育教学成效是教师评价的关键目标,同样,从图1可以看出,对于教育教学的评价,最为关键是评价学生通过学习有什么成长,学生对教师的教学评价和通过学生的增值来对教师进行评价是教师评价的两个重要手段。
(一)学生对教师的教学评价
学生是教师教育教学的直接受益人,因此,学生自然成为教师评价的最直接的人选。学生评教于20世纪中叶由美国学生发起,并于70年代被美国大学所广泛采用,德国和哥伦比亚的大学则是从本世纪初开始实施。学生教学评估(student evaluation of teaching,简称set)在北美和英国被广泛用作记录和提高教学质量的手段。对于学生给教师的评价一直有两种声音交织在一起,一种是肯定的声音,另外一种就是否定的声音。已发表的有关学校评教的研究一般认为这些评价是可靠(p79-326)。一些学生评价教师的量表已经创造了0.70到0.90之间的可靠性。使用学生教学评级是大学中评价教师教学质量或者能力最常见的过程,在20世纪70年代,学生评教主要用于形成目的,即改善和塑造教学质量,自20世纪70年代以来,它们也成为总结性评价的主要指标,即“总结”教师的业绩,以决定晋升和任期。学生评价已经发展成为占主导地位的,在许多情况下,是评价教师教学能力的唯一指标。否定的声音认为学生评教结果并不具备充分可信度。在校学生正处在认识、理解与判断等多种能力的改善中,这些能力是评教必需,在学生阶段的学生们还不具备评价教师教学的能力。让不具备评教能力的学生评教,不是将教育教学质量往上推,而是往下拉。
学生的评教行为也会影响到教师的教学行为。一项在荷兰一所大学进行的问卷调查发现,很多教师认为他们给学生打分数的等级与学生评教的结果之间是存在一定关系的。有65%的教师认为对学生的评分越严,学生对教师的评价越低;福特(foote)等研究者认为,很多教师在学生评教中得分高,不是因为他们使用了更好的教学方法,而是他们与学生相处得好。在一个研究中,70%的学生暗示说他们会依照老师给他们打的分数来评价教师。
除了学生对教师的评价以外,我们还会经常使用教学督导来检查和评价教师的教学工作,教学督导成员多数都是经验丰富的老教师,由他们来检查教师的教学工作、评价教师教学水平,具有很高的信度和效度,但是教学督导需要大量的教师,有研究表明,教学督导一次至少要连续听2个学时的课程,才能够获得较为可信的评价,如果按照这个要求,教学督导需要的人力和时间成本巨大,难以作为主要的教学评价手段。
(二)通过学生的增值来评价教师
“增值”一词是从经济学中借来的,用于指成品价格与生产该产品所需原材料成本之间的差额。教育系统中的“增值”概念指的是学生在知识、技能、能力和其他属性方面的成长,这些都是学生在一段时间的教育系统中积累的经验。增值也是学生经过一段时间学习后其知识和技能与他们学习前知识和技能之间的差异。学生的知识与技能的成长与教师的教学密切相关,因此,越来越多的评价将教师评价与学生的成果关联起来,也就是通过学生的增值来评价教师的工作。
评价学生增值程度的模型称为增值模型(value-added model,简称vam模型),增值模型旨在客观地衡量教师“增加”(或减少)学生从一个学年到下一学年的学习和成就的“价值”。更具体地说,vam模型是统计工具,旨在衡量教师的教学以及该教学如何促进学生学习和随着时间的推移取得的成就。增值模型可以定义为一类统计模型,利用学生在一段时间内的成绩数据来衡量学生的学习收获。正如doran和lockwood所指出的,增值模型回答了如下研究问题:在观察到的学生成绩变化中,有多少比例可以归因于学校或老师?
增值测量提供了一个更“准确”的评价手段,借用这种评价方法,我们可以评价教育机构对学生学术进步的贡献,增值评价测量可以通过将学生的成就与家庭特征和社会经济背景等其他影响因素在一学年或另一段时间内分离出来,来估计教育机构对学生学业进步的贡献。
教师教学质量是以学生学习效果为标志的。利用增值评价对教师的教学水平进行评价,需要很严格的控制条件,即能够有标准化的测试来反映有价值的学习和学生个体的实际成就;在对教师评价时间段内,单个教师是学生学习的唯一贡献者。除了以上这些控制条件以外,评价还要考虑学校的因素、以前的教师和学校的情况、同伴的文化和家庭的情况。
增值评价虽然能够直接评价教师的教学情况,但是由于增值评价的干扰因素太多,而且这些干扰的模式又非常复杂,因此,使用vam模型同时带来了一些难以回避的问题,学校更加担心vam模型是否能够成为一个积极的力量?是否能够支持建立一个更有效和公平的教育体系,而不是阻碍教师为高需求学生服务和工作互相合作?
使用增值评价对教师教学成效的考核评价目前多数还是应用在基础教育阶段,这个阶段的学科数量有限,可以对学生进行标准化的考试,通过数据分析工具和模型的逐渐完善,能够在较高可靠性的基础上评价教师的教学效果。
高等教育阶段的增值评价主要是针对学校层次的评价,例如,由美国州立大学协会和公立大学与赠地学院协会联合推出的自愿计量系统(voluntary system of accountability,简称vsa系统),vsa系统致力于使用标准的测试来衡量高等教育的教学成就,标准测试主要测量写作交流能力和批判性思维能力,这两种能力被认为是在21世纪全球化市场中最为重要的能力。
高等教育领域中通过学生增值对教师进行评价面临很大的挑战。高等教育的专业众多,课程繁杂,不同学科、专业和课程之间难以直接的比较,需要进行标准化的测试,要明确高等教育阶段学生应该获得什么样的知识?在技能和能力方面有什么提升?在对学生的测试中还要控制学校有关变量、学科专业有关变量和个人因素的变量,依靠学生增值对教师进行评价,还需要有进一步的创新和方法上的突破。