教育测量与统计复习资料
一.教育测量的含义、功能、类型 含义:教育测量是根据教育目标的要求,按照一定的规则对教育活动的效果加以数量化测定的过程,它主要用于对学生精神特定的测定。 类型:
(一) 按照测验目标分:学业成就;智力测验;能力倾向测验;人格测验 (二) 按照测验时机分:准备性测验;进展性测验;总结性测验 (三) 按照测验结果的评价标准分:常模参照测验;目标参照测验 (四) 根据测验材料分:文字测验;分文字测验 (五) 根据测验来源分:标准化测验;自编测验 (六) 根据测验对象分:个别测验;团体测验 功能:
(一) 教学方面:反馈功能;激励功能 (二) 行政管理方面:评价功能;选择功能 (三) 教育科学研究:导向功能;研究功能
良好教育测验的特征:信度、效度、难度、区分度、公平性 二.怎么分析信度
信度是指可靠性或可信程度。测验的信度是指测验结果的可靠性,即测量能否稳定反应被试的实际水平,前后两次测验结果之间的一致性程度。 方法:
再测信度:是一种表示稳定性的方法:用同一测验在前后两次对同一类对象测验说得的分数之间的相关系数。公式:
复本信度:是一种表示测验等值性的方法:用不同的两套不同的等值量表对相同被试先后实施两次测验所得分数之间的先关系数。 公式:
内部一致性系数:是同一测验个体奇偶分半或者前后分半测验所得分数之间的相关系数。公式: 评分者信度:评分者评分的一致性系数。公式:斯皮尔曼等级相关公式:
目标参照信度:与一个既定目标相比较,看被试是否达到这一水平:公式:一致性百分比=两次测验合格人数+两次测验不合格人数/测验总人数 ×100% 三.效度分析的方法
效度是一种能够正确地测量出他所要测量的特征或功能的程度。
内容效度:测验内容与预定要车内容之间的一致性程度,也可说是测验内容与要测的全部内容的取样代表性程度。(内容范围明确;取样具有代表性) 适用于学科测验 内容效度的估计方法:逻辑分析法(布鲁姆的认知学习理论);统计分析法(克隆法、评分一致性考察法、前后比较法)
构想效度:测验成绩能够解释心理学理论上的某种结构或特质的程度。适用于心理测量 步骤:建立理论结构—提出成绩构想—用逻辑或实证方法证明构想
效标关联效度:测验分数与作为效标的另一测验结果之间的一致性程度。
分为同时效度和预测效度:同时效度指一种测验的结果与另一种大约同时获得的测验结果(效标)之间的一致性程度。预测效度指测验分数与将来的效标之间的相关程度。 相关计算(P98-P101) 四.难度
难度:测验项目的难易程度。在教育测量中,一般指能够正确回答问题的数与参加测验人数之比。它对新信度和效度产生直接影响。
客观性试题难度的计算:P=R/N 。校正公式:CP=(KP-1)/(K-1) 极端分组计算:P=(Ph+Pl)/2 主观性试题难度的计算:平均分数法:P=平均分/满分 极端分组:P=(Xh+Xl-2NL)/2N(H-L) 五.区分度
区分度:是测验对考生实际水平的区分程度,是测验项目的重要内容,是评价项目质量、筛选项目的指标与依据。
计算方法:1.极端分组法:客观性试题:D=Ph-Pl 主观性试题:D=(Xh-Xl)/N(H-L) 2.相关法:极差相关;点二列相关;二列相关;相关(P114-118) 六、教育测验的原理和程序
原理:目的性、典型性、灵活性、科学性
程序:确定测验目的→分析教育目标测验取材并编拟题目(取材要具有目的性、代表性、普遍性、鉴别性)→测验与分析→编制测验(试题的检查、编排、答题说明书) 七、教育测验个案分析方法
智力测验、学业成就测验、人格测验、品德测验 八、教育评价的含义、功能、类型
教育评价的含义:对教育现象中的人、事或物进行价值判断。 功能:导向、鉴定、激励、改进 类型:
按目的分:诊断性、形成性、终结性评价
按参照标准分:相对性、绝对性、个体差异性评价 按范围分:宏观、中观、围观评价 按评价主体分:自我评价、他人评价 按评价方法分:定量评价、定性评价
九、教育评价指标体系的意义、设计、方法
意义:由教育评价指标、指标权重、评价标准按一定要求组合起来形成的系统化的有机整体。它是教育评价得以开展的先决条件,是教育评价工作的基础,对教育评价的水平和教育评价工作的成败具有直接的影响。
设计、方法:1.拟定评价指标。(1)初拟指标(头脑风暴法,因素分解法)(2)筛选指标(经验法,调查统计法)2.分配权重指标:(1)专家会依法(2)特尔斐法(3)层次分析法(4)两两比较法 (3)制定评价标准。(1)分解末及指标,形成评价要点(2)确定等级质量(3)确定符号和标志 十、教师评价和学生评价
教师评价是对教师工作现实的或潜在的价值做出判断活动。
教师评价内容:1.教师素质(职业道德、知识结构、能力结构、健康的身心品质)2.教学工作(备课、上课、作业布置和批改、课外辅导、学业考评、教学效果评价)3.其他工作(班主任工作、继续教育培训、教育科研工作)
教育评价的实施:1.确定评价主体(教师自评、专家评价、领导评价、同行评价、学生评价) 教师评价方法:行为观察法、成果分析法、问卷调查法
学生评价:在一定的教育价值观的指导下,更具一定的标准。运用一系列方法,对学生的学习进展和行为变化进行系统分析和价值判断的过程。
学生评价观:目的是促进学生发展和改进教学;内容应体现全面发展的思想;方法应体现定量和定性相结合;评价主体应多元化。
评价内容:1.学生素质(道德品质、公民素养、交流与合作、审美与表现、运动与健康)2.学习过程(参与状态、交往状态、思维状态、生存状态)3.学业成绩(学习效果评价)
评价实施:1.确定评价主体(自我评价、同学互评、教师评定、家长评说、社区评定) 评价方法:等级法、评语法、档案袋法
十一、教育评价模式的基本内容
教育评价模式是教育研究工作者依据某种教育理念、教育思想或特定的教育评价目的,选取一种或者几种评价途径所建立起来的相对完整的评价体系。
(一)目标评价模式(泰勒模式,19世纪30年代) 基本问题:确定目标-选择经验-组织经验-评价结果 目标评价模式的优缺点:
优:1.克服了以往测验的片面性。2.注重目标和目标分类,简洁明了。3通过学生的行为考察更好地接近教育目标。4.操作性强,容易见效,经济。
缺:1.以目标为中心,忽略目标本身的合理性的判断。2.容易造成评价内容不全面。3.用行为目标来表述具有简单化之嫌。4.忽略了过程评价。5.统一评价,忽略个性化特征。 (二)CIPP评价模式(斯塔弗尔比母,1966提出) 含义:背景评价、输入评价、过程评价、结果评价 CIPP模式的优缺点:
优:1.考虑了评价目标的合理性,克服了目标评价的不足。2.评价贯穿教育活动始终。3.评价内容广泛。
缺:1.了参与者的创造性发挥。2,要求信息资源的配合、充分的经费和专业的分析方法,难实现。
(三)目标游离模式(克里文,1967提出,非预期效益)
含义:从“方案想干什么”转移到“方案干了什么”,不受目标的干扰,从教育内在价值出发对方案的效果进行评价。
目标游离模式的优缺点:
优:1.突破目标的,考虑实际需要。2.非预期效益
缺:1.评价在评价时缺少评价的准则。2.没有完整的定义、组织结构、程序,操作起来有难度。 (四) 应答模式(斯塔克,1973,价值观和方法多元)
含义:给评价者提供他们关心的信息,通过“对话”的方式,对教育方案和决策进行修改,满足各种人的需求,重视活动的效果而不是活动方案的意图。 应答模式的优缺点:
优:1.强调价值观的多元和发散性。2.促进了定性和定量分析得结合。3.评价更为灵活。4评价者得到了充分的尊重和信任。
缺:在实际中耗费大量的人力、物力、财力。 十二.教育评价方法
教育评价方法:为了判断教育活动的价值而采取的途径步骤和手段。 主要方法:
(一) 观察法:观察者凭借自身的感官或科学仪器,有计划、有目的地在自然状态或控制状态下
对被观察着的行为表现进行观察,从而获取第一手资料的方法。
类型有:参与型和非参与型;自然观察和实验室观察,结构型观察和非结构型观察
(二) 问卷调查法:评价者利用设计好的问卷对被试者进行调查,并通过回答而获得评价信息的
方法。
步骤:编制问卷-正式实施
(三) 访谈法:访谈者通过与受访者进行交谈来搜集评价信息的方法。
类型:个别访谈和集体访谈;直接访谈和间接访谈;结构式访谈;无结构式访谈,半结构式访谈 (四) 文献法:通过查阅与评价对象有关的文章,获取评价信息的方法。
(五) 表现性测验法:测量学习者利用已学知识来解决新问题或者完成特殊的任务。 (六) 档案袋评价法:利用学生不同的时期的档案记录或者作品来评价学生的方法。
教育处理信息的常用方法:
1. 累计求和:S=∑Xi(i=1,2,3,4,······n) 2. 加权求和::S=∑WiXi(i=1,2,3,4,······n)
3.百分等级分数:Pr=100-(100R-50)/N (R为名次,N为受测人数) 4.Z分数:zxx s10(xx)50
s5.T分数:T十三.教育评价的基本过程 (一) 准备阶段
组织准备—方案准备—准备 (二) 实施阶段
收集信息—整理信息—分析处理信息 (三) 总结阶段
诊断问题—反馈评价结果—撰写评价报告—元评价