頁籤選單縮合
題 名 | 作業取樣對數學實作評量分數類推之影響=Task Sampling on the Generalizability of a Mathematics Performance Assessment |
---|---|
作 者 | 張麗麗; | 書刊名 | 教育研究資訊 |
卷 期 | 11:6 2003.12[民92.12] |
頁 次 | 頁65-100 |
專 輯 | 多元評量 |
分類號 | 521.36 |
關鍵詞 | 數學實作評量; 類推性理論; 信度; Mathematics performance assessment; Generalizability theory; Reliability; |
語 文 | 中文(Chinese) |
中文摘要 | 本研究主要的目的在探討不同作業分層及類推設計對數學實作評量分數之變異及類推的影響。受試者為132位國小五年級學童,評分者為兩位具實作評量計分經驗的國小教師。實作評量包括五題建構反應型式的紙筆測驗,計分規準採分析式計分規準,包括數學理解、程序與策略、溝通三個向度。正式計分前,兩位評分者均接受嚴謹的評分者訓練。為探討不同作業分層對分數變異及類推的影響,研究者根據作業的難度、所測認知能力、內容與歷程、內部結構等將作業分為同質性不等的五個層次,分別進行「p × t × r」及「p × r × (t:s)」兩種不同的類推設計。 類推分析的結果顯示,提高作業同質性雖能適度提高分數的類推程度,但因「受試者 × 作業」交互作用之變異所佔的比例仍然相當高(約六成),以至於各種作業分層之類推結果差異不大。控制作業層次的「p × r × (t:s)」分隔設計,雖然能降低作業層次間的變異,但卻因為多了一項誤差面向,使得其整體的類推程度要低於「p × t × r」設計之類推結果。造成p × t變異無法透過作業分層及類推設計有效控制的可能原因,雖然包括分層變項選取不佳、作業所測內容差異大、所測構念屬複雜認知構念等因素,但因作業間的共變情形與傳統測驗相近,故結果強烈暗示作業題數少是造成p × t變異的關鍵性因素。本文對造成p × t變異的可能原因及解決方法均有提出討論。 |
本系統中英文摘要資訊取自各篇刊載內容。