史蒂夫Glazerman最近批评一个报告经济政策研究所(EPI)说,EPI报告滥用在实践他称为“misnaepery NAEP数据。“伊莱恩·维斯EPI发送我们的反应。

史蒂夫Glazerman是正确的,为特定目的,纵向数据将是一个理想的工具来评估学生的增长以应对政策变化。这将是真实的,然而,只有在数据存在进行研究,他们构建良好,控制了在学校里的政策选择导致偏见,并雇了一个规模适当反映水平的学生增长从一年到下一个。绝大多数的学者,他们依赖于横截面数据,将证明,这些数据集是极其罕见的。

此外,学者使用纵向数据想要确保他们的有效性——他们确实是测量他们所声称的措施。在这种情况下,直流综合评估系统(DC-CAS)是严重不足,主要因为附加的高风险通过影响教师评价体系。

作为约翰麦罗最近提醒我们诺伊斯小学,被授予蓝丝带状态,考试分数从44%上升精通阅读精通2009年到2007年惊人的84%。传入的校长的担心,她的学生非常可怜的读者,不可能取得这样的进步,使她学会2010个测试严格的安全措施。阅读能力远远低于2007年的水平,熟练的32%。确定又政策和教师是如何影响学生的学习将是非常困难的考虑到这些问题。

关于报告更广泛、更大胆的教育方法Glazerman批评,但是,没有纵向数据可以回答的重要问题,我们试图探索。我们的报告评估多少市场化改革中受益,如建立在华盛顿特区、纽约和芝加哥,提供给学生和学校,而在类似地区不同的政策。

改革领导人推进这些政策使用状态测试成绩数据来证明学生获得了多少。唯一可能的方法来评估这些主张的有效性,然后,是比较他们报道的成功从国家教育进展评估的可靠数据,NAEP。的确,这就是受人尊敬的学者,从政府到私营部门一直做学术机构;NAEP数据被认为是远远优于国家测试成绩数据,有几个原因。

首先,NAEP倾向于评估更复杂的比大多数国家测试技能和深入的知识。这意味着很难“教到测试;“分数NAEP更有可能代表实际学生知识和能力对完整的4th或8th年级的课程,而不是考试的能力。(事实上,应试策略被广泛使用的教师作为一个关键的手段提高直流CAS分数。)

第二,NAEP是一致的。虽然每年都不同,具体的问题,材料的学生必须掌握的水平达到一个给定的分数不。这就是为什么学者依靠NAEP来评估学生的进步,无论在国家、州或市区水平,或子组的学生之一。

国家考试分数承诺没有这样的一致性。事实上,国家常常简化内容和/或转变“熟练”的标准建议当没有取得进展。为芝加哥学派研究协会的一项研究使明确这一点。比较NAEP分数的变化与伊利诺斯州标准成就测验,发现改进测试的结果报告准备和内容的变化,而不是真正的学习:

这份报告中的许多发现矛盾的趋势出现在公开报告数据(公共大型数学和阅读的报告收益与小得多的)。…公开报道的差异是由于无数问题数据包括测试内容和变化的那记让与去年同期相比几乎不可能没有复杂的统计分析,如进行报告。这导致的另一个关键信息报告:公开报道的统计数据用于学校和学区负责学术进展是不准确的措施的进展。

最后,也许最重要的是,NAEP分数少得多的“游戏”,正越来越多地用于操纵国家考试成绩。因为他们被连接到高风险同时在各个老师和学校水平,激励操纵国家考试成绩——通过缩小课程,教学测试,显然,战略悬浮液和测试成绩都普遍存在。

这样,我们可以推出小,越来越少,理解这些分数,尤其是纵向上下文——即。的风险增加了,我们可以预期,提高考试分数的方式增加了。NAEP分数取样,一个不同的,匿名组学生每两年需要测试意味着没有利害关系,也没有激励游戏。

考试成绩反映儿童生活的方方面面——家庭和社区远远超过学校——但告诉我们只有一小部分他或她知道或有能力。他们并没有告诉我们任何关于学生的身体和心理健康,对学校环境或领导。

这就是为什么我们远远超出NAEP分数在我们的报告。我们在教师招聘评估市场化改革的影响,营业额和看增加的系统性影响特许学校访问和关闭学校。可能的程度,我们报告的变化老师,学生和家长的士气,和其他方面的日常现实影响学生幸福和成就。

目前尚不清楚Glazerman先生会有我们做什么。没有我们可以使用纵向数据。大概,他宁愿让虚假索赔由改革者站,让家长,学生,和老师被误导,比使用NAEP它的目的之一。