WikiTeamWork
Advertisement

前言-AEL092222林青蓉[]

實作評量(performance assessment)從1980年代,由專業領域轉至教室評量領域開始,至今已成為教育評量的另類主流。影響實作評量發展的因素大致來自對標準化測驗的批判、對學習與思考的認知研究、對專家與生手的研究以及認知科學與電腦科技的發展等。科技整合的趨勢使評量可以更多元化、更深入化,就不需侷限於容易施測與評分的評量方式。

實作評量的性質-AEL092222林青蓉[]

實作評量是介於評量認知能力和在真實情境中應用能力兩者之間,在模擬各種不同真實程度的測驗情境之下,提供教師一種有系統的評量學生實作表現的方法。例如,自然課程比較重視學生在實驗室的操作技能、數學課程比較重視學生的演算及實際問題解決技能、語言課程比較重視學生的口語表達技能等,這些實作表現技能都是典型的客觀式和論文式測驗所無法測量出的,在這種情境下,唯有實作評量才可以提供直接測量上述學習成果的有用訊息。所以在專門評量知識與理解的客觀式紙筆測驗之外,實作評量提供另一種有用的輔助評量方式,這種在真實的教育情境下進行的評量,其最大的好處是,除了可以改變教學和評量,進而促進改善教育外,更可以各種方法增進學生、教師及家庭所應扮演的角色。表1所示,即為各種評量方式的比較。(余民寧,2002,457-460)

表1 各種評量方式的比較
客觀測驗 論文測驗 口試 實作評量
目標 知識樣本,具有最大的有效性和信度值 評量思考技能或知識結構的精熟度 評量教學中的知識 評量將知識和理解轉換成行動的能力
學生的反應 閱讀、評鑑、選擇 組織、寫作 口頭回答 計畫、建構和傳送原始的反應
優點 有效-能同一時間內進行多個測驗試題的施測 可以評量較複雜的認知成果 可以連結評量與教學 提供實作技能充分的證據
對學習的影響 過度強調記憶;如果妥善編製,亦可測量到思考技能 激勵思考和寫作技能的發展 刺激學生參與教學,提供教師有關教學成效的立即回饋 強調在相關的問題背景情境下,使用現成技能和知識

資料來源:余民寧,2002,458;Stiggins,1987,35

一般以為實作評量必定是要學生實際操作,事實上,實際操作只是學生學習的表現形式之ㄧ,也並非動手操作就是實作評量的形式。實作強調個人「表現」(performance)的意義,實作的精熟通常可表現在完成一篇散文、一項設計工作或社會大眾有興趣的方案上。實際操作以及各種形式的表現方式,如學生筆記、電腦虛擬形式、自由申論題與新形式的選擇題,若能測得學生應用知識來表現精熟的能力,不論是評量知識的組織、解題時的策略或監控表現的能力,都可以稱之為實作評量或表現本位評量。

綜合上述,所謂「實作評量」,就是在自然或已建構好的情境中,具有評量專業的教師,要求學生執行或處理一項指定的工作(task),讓學生表現所知、所能的學習結果,並由教師觀察與評鑑學生的建構性反應過程與結果,看他們是否適當、精確和完美地達成教學目標。簡單地說,實作評量就是一種直接判斷表現的評量。由此可知,實作評量不是在測量基本的、機械的心理動作能力,例如體育科的基本體能測驗,而是在測量結合知識與複雜動作協調的技能領域。「實作」可以用口語表達方式進行,例如演講、戲劇、角色扮演等;或者以紙筆完成建構式作業,例如編擬計畫、建造模型、繪製圖表等;也可以是操作工具或設備(電腦、樂器、打字機)等。

實作評量的類型-AEL092222林青蓉[]

紙筆表現[]

紙筆表現有別於傳統所使用的紙筆測驗,它更強調在模擬情境中應用知識與技能。這種紙筆評量方式的應用可能是最後學習成果的展現,例如在測驗編制的課程裡實際設計一份雙向細目表,並據以編一份試卷;也作為動手操作前的初步評量,例如要求學生寫出檢查和啟動機器的安全步驟。

在紙筆表現測驗中,時常使用類似「設計」、「編製」、「擬定」、「創造」、「撰寫」等行為動詞,例如設計一份海報、擬定活動流程等。紙筆表現測驗的施測方式是團體的、紙上的,所以具有經濟與安全的價值。

辨認測驗[]

是指以實物作為刺激,但所要求的反應仍是語文反應(紙筆或口頭),而不要求學生實際去操作。例如在某種情境下,可能只要求學生辨認一套工具或一組器具,並指名它們的功用而已;或比較複雜的,教師操作一輛故障的汽車給學生看和聽,要求他們指出最可能故障的部分,並說出應採取的檢查步驟及所需用到的工具。

雖然,辨認測驗在工業教育中較被廣泛使用,但它的用途並不限於該領域而已。例如,化學系的學生需要去辨認各種化學物質和儀器設備、外語系學生需要去辨認正確的發音等。因此辨認測驗在認知層次上,不只是可以測量知識的層次,也可以測量到分析、評鑑的層次。

結構化表現測驗[]

此評量係要求學生在標準且控制下的情境完成實作作業,測驗情境的結構性甚高,它要求每位學生都能表現出相同的反應動作。這種測驗和摽準化測驗一樣,特別強調施測和計分過程的一致性和公平性,所以在儀器設備、材料、時間、要求的實作上都有一致的規定,而在計分上,通常根據多個標準來評定,例如成品精確性、實作步驟的適當性、工作速度、符合規定的程度。

當使用結構化表現測驗時,也許需要設定可被接收的最低表現水準是什麼,它可能是有關測量的精確性(如:測量氣溫,精確到小數點以下第二位)、適當的步驟和順序(如:依據適當的步驟順序,調整一部顯微鏡到理想的位置)或表現的速度(如:在三分鐘內找出一部電器發生故障的部位)等。但不論採用何種標準作為判斷表現良窳的依據,都必須使用操作行定義,以可被觀察到的、測量到的及可被量化的數字形式,來加以描述和界定可被接受的最低表現水準,如此的評量結果才會具有客觀性和公正性。

模擬表現[]

模擬表現即為配合或替代真實情境中的表現,局部或全部模擬真實情境而設立的一種評量方式。例如,在體育課程中,針對一個假想的球練習揮棒與一位假想選手模擬拳擊對打;在社會科學課程中,學生角色扮演法庭審判、市政會議的進行等都是一種模擬表現。

模擬表現在學校的應用很廣,例如,輔導教師以角色扮演方式幫助畢業學生演練就業晤談的能力;也適合用來檢驗各種災變因應計畫的效能,並同時訓練相關人員應變的能力,例如舉行消防演習、防震演習等。

工作範本[]

在實作評量的各種類型中,工作樣本算是真實性程度最高的一種評量方式,它需要學生在實際作業上,表現出所要測量的全部真實技能。工作樣本通常取自真正工作中較重要的部分,而把較不重要的或有危險性的部分去除掉了。例如,在模擬道路的標準場地裡進行駕駛執照的路考。

在商業及工業教育中的實作評量,也都常使用工作樣本的評量方式,例如,要求學生速記一段口述資料、打一封商業書信或操作電腦分析一份商業資料等。工商企業界在僱用新進人員時常採用「試用制度」,分派新人做一些簡單的工作,實際上就是以工作樣本法來進行評量;另外,在甄選某類(如製圖、美工、攝影)新進人員時,要求應徵者提出個人作品專輯,以展示個人能力與成就,也是一種以工作樣本為評量的方法。

實作評量的設計原則-AEL092213曾毓敏&AEL092240林彥如[]

確立實作評量的目的(曾毓敏)[]

確認實作評量的標準(曾毓敏)[]

提供適當的表現情境(曾毓敏)[]

選擇計分和評分方法[]

系統觀察與軼事記錄(曾毓敏)[]

檢核表(林彥如)[]

檢核表為分析式評定法其中的一種。係把要觀察的行為或作品先分解成幾個要素,列成一清單,然後逐一作判斷,最後再合計總分。而檢核表即是一組列出表現或成果的測量向度,並且提供簡單記錄「是」或「否」判斷的資料表。適用於當作品或動作可以細分為一系列明確且具體的要素,而這些要素又可以作二分法判斷(是或否、有或無、合格或不合格)。

例如,如果要使用檢核表來評量一組過程時,只要依序列出這些評核向度,然後,由觀察者逐一核對每個被觀察的表現項目是否發生或出現即可。若該表現行為已出現或發生時,則觀察者只要在檢核表前的適當空格中打個「ˇ」號,以作個評核紀錄即可。若該表現行為未曾出現或發生時,則觀察者便不需要留下任何記號,直接跳至下一個觀察項目,繼續評核下去即可。 另外,進行觀察判斷時,評分者常會加上一些說明來支持他的判斷,或寫一些他觀察到的重要事件,所以在每一個項目之後留有空白,或在表格右邊留有較大的空間,將很有幫助。

一份用來評量成果的檢核表,一般都包括兩個部分:(1)條列出描述該優良表現成果的重要向度(如:大小、顏色、形狀等),(2)根據評量特性的結果,提供打「ˇ」或作任何記號(如:劃記「×」)的空白處。因此,檢核表只是引導評量的注意力到所要觀察的向度上,並且提供一種方便作判斷記錄的工具。

檢核表通常可以提供教師有關學生行為的診斷訊息,讓教師明瞭學生有哪些行為或學習是需要改進的地方,累積一段時日的檢核表資料,可以看出學生學習進步的情形,以及提供跨班、跨校、及跨年度進行比較的參考資料。但是,檢核表亦有其使用上的兩大限制。

1、檢核表只提供教師兩種選擇:「是」或「否」兩者。而實際上,學生有許多知識或行為的學習,是介於這兩個極端之間的,並非「全有或全無」兩種絕然的狀態。因此,當教師使用檢核表強迫二分法的選擇時,所收集到的資料可能會喪失對某部分行為描述的精確訊息。
2、評量結果很難以一個總分來表示。也就是說,檢核表評量的結果是一種質化的資料,而非量化的資料。若要進行量化,且以一個客觀的總分來代表時,則教師必須先計算檢核表中打勾的記號數目,再將其除以全部的檢核表評量結果的量化指標。

另一作法,則是由教師事先設定評定學生表現行為的標準。例如:【見附錄】

《卓越》:如果評定結果達到10至12項表現標準。
《優良》:如果評定結果達到7至9項表現標準。
《普通》:如果評定結果達到4至6項表現標準。
《低劣》:如果評定結果達到1至3項表現標準。

如此教師便可以將評定學生後的資料,轉化成上述的等第或等級指標,並以相對地位量數的觀點,來解釋和描述學生表現行為的好壞。這是另一種以量化分數來評定學生表現的作法。

要設計一份作為實做評量用的檢核表,通常包括下列步驟:

  1. 條列出所要進行評量的每一項過程或成果特質。
  2. 增列一些常見的錯誤到該檢核表裡,它對較差表現的診斷很有幫助。
  3. 以某種邏輯順序排列這些列舉項目(例如:步驟的排列順序)。
  4. 提供評分指導語和勾選每個檢查項目的地方。
  5. 如果需要的話,可以在檢核表底部留些空白處,供作書面文字評論之用。

評定量表(林彥如)[]

評定量表類似檢核表,都是用來作為判斷過程和成果的一種評量工具。其間的主要差異是,評定量表不像檢核表一樣,僅提供「是」或「否」等簡單的二分髮判斷而已,它反而是提供評定某種表現出現程度多寡的機會,它所評量的表現行為特質通常都是隸屬於等距量尺(interval scale)以上的連續性變項資料,但可被人為方式分成少數幾個等分或等級者。例如,有名的李克特氏五點評定量表,即是將評定量表所使用的評定等級分成五個固定的數字評定選項,然後要求評量者依據所評定特質的隸屬程度,在適當的數字評定選像上勾選作答。當然,評定量表不一定限制只能使用個固定的評定選項而已,使用其他數目的評定選項也可以,通常,使用最多的評定選項數目約在三至七個之間。就如同檢核表一樣,評定量表也只是引導評量的注意力到所要觀察的向度上,並且提供一種方便作判斷記錄的工具而已。 評定量表依據所使用的目的和量尺類型的不同,可以分成三類:

1、數字型評定量表(numerical rating scale)

即依據學生在某種行為上出現頻率次數(如:總是、偶爾、從未等),圈選足以代表該表現程度的適當數字(如:5、3、1等)的一種評量工具。

2、圖表型評定量表(graphic rating scale)

即依據學生在某種表現上的一般品質(如:傑出、優秀、普通、滴下、劣等),在一條用來表示該種特質或品質的連續線上(但可分成幾個小線段)

3、描述型評定量表(descriptive rating scale)

又稱作評分規準,即使用簡短的描述語句(如:快速完成作品、緩慢完成作品、沒有幫助無法完成作品等),來評定學生在實際表現中可被接受的最低表現水準的一種評量工具。在每個試題或每組試題後面,也可以預留一些空間供作書面文字評論之用,以補充說明評定的意義獲描述如何改善表現的建議。 另外,若使用描述型評定量表的評量結果,而要進行量劃分數的報告時,也可以仿同檢核表量化成等級分數一樣,先由教師事先設定評定結果的表現標準,例如:

「卓越」:面對聽眾,穩穩地站著,並且保持目光接觸。
「優良」:偶爾面對聽眾,直直地站著,時而保持目光接觸。
「普通」:目光游移不定,稍微目光接觸,表情與聲調不一致。
「低劣」:不安地走動,沒有目光接觸,聲音單調,面無表情。

然後將評定學生後的資料加總起來,轉化成等地或等級分數,並對照上述的描述用詞,來加以解釋學生表現行為的好壞。這亦是一種將直化資料轉化成量化資料的解釋方法。 要設計一份作為實作評量用的評定量表,通常包括下列步驟: 1.條列出所要進行評量的每一道過程或成果特質。 2.選擇所要使用的量表類型及評定點數,並且以描述語句或片語來界定它們。 3.在評定量表上依序排列試題,以方便使用。 4.提供清楚、簡短的評分說明,以告知如何在量尺上評定每道試題。 5.如果為了診斷或教學的緣故,尚須提供可供作書面文字評論的空白處。

作品量表(林彥如)[]

作品量表的格式與評定量表相類似,內容包括一系列足以反映出各種不同品質程度的範本作品,例如,在判斷書法字跡的美醜與工整性時,我們也許會挑選五份書法字跡品質在「卓越-低劣」的連續量尺上大約等距的作品範本,然後依序在每份作品範本上標記數字(如:5、4、3、2、1),數字越大即代表書法字跡的品質越美、越工整,數字越小即代表書法字跡的品質越醜、越潦草,這種量尺表示法即為作品量表。接著,將每位學生的書法作品字跡依序與這五種範本作對照,看看每位學生的字跡符合哪一種範本,即得該範本代號的分數,該分數即用來表示書法字跡的美醜與工整程度的數值。例如,某生的書法作品字跡接近3號範本,他的得分就為3分。同樣的,作品量表也可以應用到諸如:繪畫、模型、木工、烹飪等領域。當某種作品的品質很難以一組特徵來下定義,但使用整體的判斷法還算可行時(如:藝術品的鑑賞),使用這種作品量表的評定方法特別有用。 要發展一套作為實做評量用的作品量表,通常必須遵守下列步驟:

1.挑選三至七種不同品質程度的作品範本。
2.依序(即依據某種評量標準)排列這些範本,並給予標上號碼,號碼越大,及代表該作品的品質越高。
3.將學生的作品依序與該作品量表相對照,找出與範本相似或相同者,並給予該範本所標記的號碼分數,以作為該學生作品的品質得分。

檔案評量(林彥如)[]

通常使用系統觀察及檢核表、評定量表、及作品量表等方法,所蒐集的實作評量資料,多半是一次僅針對一件表現行為事件來進行的。如果教師想要蒐集到更多足以代表學生典型行為的表現樣本的話,也許可以借用檔案的蒐集工作,來當作一種實作評量方式使用。例如,學生的寫作檔案可以用來評量他們的寫作技能,繪畫方面的檔案可以用來評量他們的美術技能,便是一例。


在某些情況下,所有教室內表現成果的檔案,都可以被當程式一個整體來加以組織和運用。因此所謂的檔案,即是泛指用以顯示學生在一個或數個領域內,有關學習成就或持續進步訊息的一連串表現、作品、評量結果、和其他有關學習成長紀錄等資料的匯集,不光只是收集學生作品的檔案夾而已,而是更具意義地收集學生邁向重要課程目標之成長與發展方面的相關作品樣本,整個檔案從內容的放入、標準的選擇、和評分標準的決定,都有學生參與其中,並且還包括更重要的學生自我反省的證據。近年來,由於這種檔案評量方式具有諸多使用優點,因此它在教室情境下的應用已有逐漸受到學校教師們重視的趨勢;甚至,連我國正在推動的九年一貫課程評量方式,亦具檔案評量的精神與功能。


實作評量具有提供教學目標,可測量較複雜的學習成果,又同時可對過程和結果進行評量,若妥善加以運用,以評量者的角度來看,對學習者的學習狀況可以作更有效的掌控,又因為實作評量的多元化,可培養學生其它如蒐集、整理資料、歸納、獨立思考等能力,的確是一個值得推廣並應用的評量方式。

實作評量的應用實例-AEL092211徐凱婷[]

一、系統觀察與軼事記錄[]

  • 附件一(軼事記錄表)
國小自然課之軼事記錄表

http://140.116.223.225/plan/5-1/22-L.htm


  • 附件二(軼事記錄表)

http://cris.fhl.net/article/study.htm


二、檢核表[]

  • 附件三(檢核表)
自殺風險評估檢核表

台北醫學大學.巿立萬芳醫院精神科 謝文傑心理師


被評估者:         年齡:     性別:   教育程度:
評估日期:     檔案編號:
評估原因:
可能性風險:
評估者簽章:
指導語:下列各題為一個人企圖自殺時的可能性反應。俏若你身旁的個案疑似為自殺的高危險群時,
        請依照題目的指示,在□中以「ˇ」號標示符合的狀況。

□感到強烈的無望/絕望 
□自尊非常低
□感到哀愁與憂鬱,並且對於喜愛的活動興趣缺缺 
□酒類或藥物的使用量較以往多 
□近期有經歷失落事件或是與重要他人分離 
□飲食、飲酒與睡眠型態,出現戲劇化的轉變 
□變得非常喜怒無常 
□突然變得沈靜 
□言談過程中,透露出自殺的想法 
□對於死亡有預期性想法 
□在課業或工作上的功能表現不如以往 
□從朋友群聚中退縮下來 
□從過去的經常性活動中退縮下來
□不重視自身外表 
□精神集中感到困難 
□出現身體症狀,如:頭痛或倦怠感 
□強烈的出現罪惡感或羞恥感 
□出現暴力、敵對或反叛的行為(尤其是年輕人最常有此反應) 
□近期是否曾因接受精神科住院治療後出院
附記:當您所勾選的「□」愈多時,您就愈有理由考慮被評估者正受到自殺的威脅,請予以妥善的專業處置。

  • 附件四(檢核表)
國小自然科第二冊第二單元「豆子發芽」評量檢核表:

http://content.edu.tw/primary/nature/ks_gc/txt/txt/a2-2.txt

三、評定量表[]

  • 附件五(評定量表)

行為態度量表:

  • 附件六(數字評定量表)
                 敘述文評定量表
               1      2    3      4     5
1.標點適當 〔   〕〔   〕〔   〕〔   〕〔   〕
2.用字正確 〔   〕〔   〕〔   〕〔   〕〔   〕
3.修詞精確 〔   〕〔   〕〔   〕〔   〕〔   〕
4.文法通順 〔   〕〔   〕〔   〕〔   〕〔   〕
5.句型豐富 〔   〕〔   〕〔   〕〔   〕〔   〕
6.取材適切 〔   〕〔   〕〔   〕〔   〕〔   〕
7.主題鮮明 〔   〕〔   〕〔   〕〔   〕〔   〕
8.背景清晰 〔   〕〔   〕〔   〕〔   〕〔   〕
9.情節流暢 〔   〕〔   〕〔   〕〔   〕〔   〕
                                         總分:


  • 附件七(學習檔案評定量表)

http://www.tmps.tp.edu.tw/shitong/records/Student/Srp.htm

四、作品量表[]

五、檔案評量[]

  • 嘉義市博愛國小網頁:

http://www.paes.cy.edu.tw/t/tea/diary02-6.htm

參考資料[]

書目[]

  • 余民寧(2002)。教育測驗與評量-成就測驗與教學評量。臺北市:心理。
  • 歐滄和(2002)。教育測驗與評量。臺北市:心理。

網路[]

討論問題[]

在國民小學階段,哪種領域課程適合以實作評量方式進行評量?如何進行?

Advertisement