Fandom

WikiTeamWork

MTT:第十一章

870個維基
頁面
增加新頁面
討論0 分享

測驗常見之爭議與其對策

對不同語言背景的受測者施測編輯

對於所有受測者而言,測驗有一部分是在測量他們的語言能力。對於其母語不是測驗所用語言的受測者來說,這是一個特別需要注意的問題,若測驗是在受測者的語言能力沒有達到一定程度的情況下施測,對於使用測驗結果作任何用途都可能會在測驗過程中引入與構念無關因素。因為此時的測驗結果可能不能準確地反映受測者的真正特徵和能力。另外,語言差異幾乎總是和隨之相連的文化差異相關聯。當受測者的母語不是測驗所用語言時,在使用測驗的結果時需將這一點考慮進去。那麼,一種語言的某種方言是否可以被認定為是另一種語言呢?對這個問題,儘管本章有所涉及,但也沒有下最後的結論。不管以上哪種情形,在製作、施測、評分和解釋分數時,在根據考試分數作決定時,可能需要對語言和文化上的問題給予特別關注。當然,針對語言能力的測驗則明顯是個例外,因為這些測驗的目的就是要測驗受測者對於該語言的精熟程度。

即使是熟悉兩種以上語言的受測者,在每一種語言上的聽、說、寫、讀能力也會顯著地不同。這些能力還會受到溝通時的社交或功能情境的影響。有些人能用社交和文化上都能接受的方式說話,將兩種或者多種語言同時結合在一起使用;有些人能將熟悉的兩種語言同時結合在一起使用;還有一些人雖然也熟悉兩種語言,但在用一種他們相對不太熟悉的語言去解決問題時可能會做得慢一些,效率低一些,有時準確性也可能會差一些。語言優勢不見得是測驗時語言能力的指標,即使在用一種比較熟悉的語言測驗時,有時還須有調整措施。因此,在編製、挑選、施測、和解釋測驗表現時考慮受測者的語言背景是很重要的。舉例來說,不應將基於英語是母語的受測者成績建立的常模用於英語不是其母語的受測者,或是這些受測者的成績只能被理解為部分地反映了他們目前的英語熟練程度,而非他們全部的能力、潛力、智力或人格特徵。當受測者因為在某種語言方面的能力有限,而使得一個偏重語言的測驗不適用時,非語文測驗可能是較合適的替換方案。

當有效的工作表現需要使用測驗所用的語言來溝通時,沒有充分語言能力的人可能在工作上,或測驗上,或兩方面都成績欠佳。在這種情形下,只要測驗所需的語言水平不超過工作需要的水平,用作預測將來工作表現的測驗應該用工作所使用的語言較合適。測驗使用者須懂得受測者不理想的測驗成績,不理想的工作表現可能是因為他們語言熟悉程度不理想,而不是其他方面不足。

本章論及的許多問題,也和測驗那些因殘障(如盲、聾)原因而有獨特語言特徵的受測者有關。例如,將傳統試卷翻譯和改編成適用於美國手語的問題。但需注意的是美國手語不僅只是一種語言,還是另一種溝通方式。另外,殘障人士可能和非母語受測者一樣,會要求調整施測程序.第十章將對殘障人士有更具體的討論。前面數章(特別是第一章至第五章)已經討論的一些問題,比如分數推論的效度,測驗信度和測驗的製作及施測等.都和本章有密切的關係。本章將更進一步地對這些問題展開討論,強調語言能力和技巧對測驗成績可能造成的影響的重要性;陳述在對不同語言背景的受測者施測時涉及的法律方面的要求。本章的標準就是應用於和這些要求一致的情形。

測驗的翻譯、改編和修改編輯

要想在受測者成績基礎上得出有效的推論,有必要考慮以受測者的第一語言施測。於是,語引修改常常變為有必要。將測驗翻譯成受測者的第一語言代表修改的一種,但是在翻譯中要注意避免以下幾個問題:首先,不應簡單假設翻譯版和原版測驗在內容、難度、信度和效度方面完全等同。其次,不能假設受測者對兩種文化認同方面的經歷可以在兩個版本之問相互比較。

最後,許多字在不同的語言裡使用頻率和難度也不同。因此,在兩種語言裡看起來意思相近的字可能在用法上截然不同,以至於影響到翻譯版測驗的原定用途。另外,翻譯版的測驗內容可能和原版的並非等同。例如,甲語言的閱讀能力測驗翻譯成乙語言的閱讀能力測驗後,可能含有和原版意義不完全相同的內容,或是對只能讀乙語言的人有不合適的內容。

翻譯和改編測驗的目的是為了解決測驗語言為非母語受測者的問題。我們不建議將回譯作為一個單獨程序,這樣做可能會人為地造成與原文版看似相近但並非是最佳的版本。在多數情形下,本標準建議用類似於測驗編製和效度驗證過程的方式循序漸進,以保証兩種版本都測驗相似的構念。當試卷以兩種或多種語言同時製作時,一般最好是能用每種語言各出部分試題。至於是用標準原始語言測驗還是用改編版是一個複雜的問題。下一節將討論由這個決定所影響到的一些問題。

以下的方法可能在測驗語言不是受測者母語時使用比較合適。這些方法包括對測驗的某些方面稍作調整或是修改施測步驟,如試題的表現形式、答題形式、測驗時間、考場安排(如個別測驗代替集體測驗)和只用適合受測者語言水平的那部分測驗。如果是在表現形式和答題形式上作修改,有時可能得將修改過的測驗先在一個恰當的樣本內實際試驗一下,然後再用到原定的受測者群體中去。

等同的問題編輯

「等同」(equivalence)這個詞在這裡指測驗分數能夠用來對不同的受測者進行可比較的推論的程度。當測驗是設計給語言背景相同的群體時,分數等同的問題比較簡單(詳見第一章和第四章)如果某個受測者是屬於測驗設計目標群體的話,那麼施測和解釋的標準程序就應該會在分數的基礎上對受測者做出有信度和有效度的推論。當測驗的設計是針對不同語言背景的受測者時,就比較難建立等同的推論。

一般而言,目標受測者群體的語言和文化特性應在作測驗設計、效度驗證和建立常模等過程樣本中整個地反映出來。在這些測驗編製的每個階段和標準化過程中,不同的語言群體應受到同樣程度的對待。在綜合標準化和效度驗證樣本中包含不同語言的次群體可能不足以確保他們之間的等同。

與構念等同有關的問題可能是最根本的。可能有人會質疑某個受測者的分數是否能代表他在目標群體所測量的同樣構念裡的真正能力。例如在一個主要測量學業成績的測驗時,如果考試語言不是受測者的母語,考試有可能全部或部分地變成測量受測者語言熟練程度的測驗。有幾種計量心理學上的技術可以幫助確定次群體間的等同狀況,比如証實性的因素分析(confirmatory factor analysis)、多種方法一多項品質矩陣(multi-methods multi-trait matrices)裡的數據資料分析和實証性的次群體解題規律的等同等。這些方法可以根據受測者未源地的群體語言對測驗結果作邏輯分析來補充。

在測驗不同語言背景的受測者時,還有一些其他類型的等同因素需要考慮。功能性等同是談一個測驗測量的相似活動或行為是否對不同的文化次群體或者語言次群體具有同樣意義的問題。翻譯等同要求翻譯或改編的測驗應在內容上和原來的測驗一樣,這一點在測驗的翻譯和改編中己談到。

計量上的等同著眼的是用不同語言舉行的測驗成績是否具有可比較的計量心理方面的特性。例如,當計量上的等同時,用甲語言作的測驗丙的50分是和用乙語言作的測驗丁的50分在解釋上是相同的。一般而言,計量上的等同限於特定的場合、受測者群體和解釋類型。

語言精熟度測驗編輯

在教育計畫和一些個人化測驗的專業應用上對有關同一語言內部的差別的考慮在決定合適的測驗解釋和決策過程中極其重要。例如,測驗語言為非母語的受測者在測驗語言的熟練程度上可能千差萬別,有人可能對該語言沒有任何概念,有人可能非常流利地使用測驗語言並對其文化知之甚多。進一步而言,人口統計上的劃分(如墨西哥裔或德裔)可能不足以決定施測的語言,因為同一文化群體的成員可能在文化適應、對測驗語言的熟練程度、對自己母語中的詞語和句法的熟悉程度、測驗背景、對測驗和測驗技巧熟悉程度,以及其他可能嚴重影響從分數中得出的椎論在信度和效度的因素差別輻度會很大。因此,在測驗語言背景有差別的受測者時,考慮到受測者之間的差異可能會影響到受測者的成績這一點至關重要。有必要考慮語言優勢和語言熟練程度問題。

在一給定語言裡評量多個內容領域的標準化測驗可以有助於決定語言的優勢和熟練程度。操作測驗的人首先應收集受測者主要掌握的語言(即:受測者喜歡用的或主要使用的語言)的資料。在決定了優勢語言後,應收集受測者在優勢語言的熟練程度的資料,如果多種語言的優勢程度差不多的話,應建立兩種或所有語言的熟練程度的比較。然後,如有現成試卷的話,測驗應以受測者己掌握的最熟練的語言進行(除非測驗的目的是決定受測者對測驗語言的熟練程度)。

然而,僅僅用受測者的優勢語言進行測驗的方法並非靈丹妙藥。因為,如上所言,雙語受測者的兩種語言能力可能突出的領域不一樣(如:第一語言在家裡、家教活動和本民族文化中使用,第二語言主要用於學校、工作、電視和主流文化中)。因此就語言本身而言使用其中任何一種語言的測驗可能會測量一些領域而漏掉另外一些領域。在這種情形下,以兩種語言測驗(即優勢語言和受測者最熟練的語言)可能是必要的,但前提是已有這樣合適的測驗存在。如果真用兩種語言測驗,要仔細考慮這樣做可能對其他效應產生影響的可能性。

因為期望學生擁有學校使用語言的熟練程度適合他們的年齡和教育程度,需要有合適的測驗來評量他們在那種語言方面的進步的程度。例如,有些測驗(特別是紙筆測驗)是為英語作為第二語言的受測者準各的。如果對重要的聽力和表達能力的評量沒有足夠的重視的話,這些測驗可能就不會特別有用。對所有有關英語能力的測量(如:溝通能力、識字能力、語法、發育和理解能力)多半在學校裡最有用。

觀察學生在自然條件下的講話可對他們在某一個語言上的熟練程度提供更多的訊息。然而,自然條件下的觀察結果可能不足以判斷學生在正式場合和學習場合裡使用該語言的能力(如教室裡)。例如,將一個孩子能否受益於多少班級教學的能力的判斷單單放在對他(她)在操場上語言流利的程度的觀察上是不恰當的。如果正式語言和工作無關的話,以一個人的正式語言評量成績來判斷他(她)的工作能力也是不恰當的。

一般而言,對沒有恰當的機會學習測驗使用語言的人用這種測驗會有特別的困難。當一個測驗為一個影響面很廣的決策過程提供訊息時,測驗使用者要審核測驗本身並考慮其他可能的收集訊息的替代工具(如:另外的測驗、觀察資料的來源、入選測驗的改編試卷)這點非常重要,因為這樣坐的目的是為了保証將要得到的訊息是針對原定的目的的。這類審核會顯示出是否有必要正式改編測驗或是製作一個新的測驗(為了適應受測者的具體語言特徵)

測驗使用雙語的受測者編輯

雙語受測者的測驗使用也有特殊挑戰。一個懂得兩種語言的受測者可能用哪門語言都考不好。舉例而言,由雙親是講西班牙語的家庭出來的孩子可能懂西班牙語,但表達最好的還是英語。還有,有些雙語人士在多數社交場合裡用母語,但在學業上和工作上則主要用英語。再舉一例,口語英語和書面英語常常不一樣,英語為非母語的人在口語交談中可能給人以流利的印象,但在需要用書面英語的測驗中表達能力可能就不行。因此,了解一個人的雙語類型和程度對合理使用測驗很重要。

施測和施測人員方面的變量編輯

當不能假設某個受測者隸屬於某個文化或語言群體,而測驗的標準化又建立在該群體之上時,採用標準化的施測程序可能並不能夠為這個受測者提供一個可以比較的施測程序。在這種情形下,正確做法的根本原則是,無論來自何種背景,應向受測者提供合適的機會完成測驗,表現他們在測驗所測量的特質方面的能力。

然而,也可能在施測人員、受測者和實際情況變量間有複雜的交叉影響,需要主持測驗的執行人員密切注意。影響受測者臨場表現的因素包括以下幾方面:受測者和施測人員的文化和語言背景,主考的性別和測驗風格,主考和受測者的文化認同程度,測驗是用原始語言(即受測者的第一語言)進行還是兩種語言都用(如果是這樣,語言的秩序如何排的)測驗的時間限制,是否動用了雙語翻譯。

在測驗中使用翻譯人員 編輯

當沒有得當的測驗翻譯版或合適的非口語測驗時,理想的作法是,應當由一個經過專業訓練的雙語施測人員來評量在測驗語言上能力有限的人。雙語施測人員對受測者語言的熟練程度應相當於一個對該語言訓練有素的專家的水平。當沒有雙語施測人員時,一個解決辦法是在測驗過程中用翻譯,以受測者的母語進行測驗。雖然這是一個常見作法,但由此也帶來一些困難。例如,在原版測驗和譯版測驗之間可能缺少語言上的或是文化上等同的地方,口譯或筆譯人員可能沒有受過很好的在測驗環境下作翻譯的訓練,可能沒有具有代表性的常模來恰當地用作計分和解釋結果。這些難題對基於測驗結果的推論的效度可能是嚴重的威脅。

當在一個具體測驗情形下需要一個翻譯時,找一個完全夠資格的翻譯來協助施測人員是很重要的。測驗中提供翻譯服務最重要的一點是翻譯對測驗所要求的能力和準備工作。翻譯顯然需要對測驗所用語言和受測者的母語都很流利,並熟悉一般的翻譯程序。為增加效率起見,翻譯應略微懂得教育心理衡鑑方面的過程,包括遵循標準化程序施測、向施測人員準確傳達受測者的實際答案的重要性、以及翻譯在測驗中的角色和責任。另外,翻譯不應當和受測者在此之前有不恰當的私人關係,那樣會影響到施測的客觀性。

然而,在很小的語言和文化社區裡,能講不同語言的人常互相認識。因此在這種情形下,測驗使用者或是施測人員有責任使翻譯知道有關客觀施測的原則,並評量事先存在的偏差,這樣測驗的解釋就能將這些因素考慮進去。如果偏差的蹟象很明顯,但又無法矯正的話,施測人員要想法安排另外翻譯來做這項工作。

只要是語言的熟練程度對工作表現有舉足輕重的影響時,在不降低保護社會大眾的健康、安全和福利標準的情況下,可以允許使用翻譯幫助候選人參加執照証書或公務員測驗。當允許使用翻譯時,譯者不能在測驗內容的理解上或任何其他足以影響執照和証書決定的方面給予候選人任何幫助,這點至關重要。製作錄音磁帶使候選人能夠聆聽每個測驗問題以測驗語言播出可能在需要這類調整措施時更合宜一些。

在教育和心理測驗中,翻譯可能得在測驗前熟悉測驗內容和施測過程的全部細節。同時在必要時應給譯者時間去翻譯測驗指示和試題。在心理測驗中,施測人員最好能向翻譯示範,某些試題是怎麼考的並解釋在測驗中期望什麼結果。另例,在測驗前施測人員和翻譯應互相熟悉對方的說話方式和速度,這點非常重要。

在評量即將開始前,應向受測者清楚解釋翻譯的角色。翻譯應盡最大努力,提供準確的譯文,這一點至關重要。翻譯必須在整個測驗過程中反映其專業態度並保持客觀性(如;不加主觀意見,不給受測者提示等)一旦測驗結束,施測人員有責任在翻譯的協助下審核測驗的回答。翻譯有困難的答題(如;詞匯),可能有特別意義的非測驗行為(如:身體語言),還有語言因素(如;兩種語言混合使用)以及可能對測驗結果產生效果的文化因素都須詳盡討論。這方面資料將會被施測人員用來仔細評鑒測驗結果並由此做出推論。

文化差異和個別測驗的施測編輯

在一種文化裡看起來怪異或不適宜的語言行為在另一種文化裡可能被認為很正常和恰當的,這點應在測驗過程中考慮進去。例如,有些文化裡兒童和成人可能對成人或比其地位高的人用闡述的語言方式講話,旁人可能鼓勵他們對這些人只作具體問題回答或用平板的語調講話。

因此,在測驗時,這類受測者可能對施測人員希求詳細回答的問題勉強只是用一個短語或是聳聳肩來應付了事。如果這種傾向沒有在解釋測驗結果中恰當考慮進去的話,其解釋結果就可能被証明可能不合適。同時,施測人員不應假定這些受測者所表現出來的寡言少語是文化特徵,可能需要其他的訊息(如:測驗前的觀察或對家庭成員的諮商)來討論語言表達方面可能的文化影響。

與語言表達的程度和本質相聯的價值取向也可能有文化間的差異。一個文化群體可能認為能言善道或說話速度快是很粗魯的,而另一個文化群體可能視之為高智商或友好的表現。從一種文化裡出來的人在另一種文化的人的眼裡可能是寡言內向或低能。由此做出的測驗解釋和治療措施可能是沒有效度的,並可能給受測者帶來傷害。


對殘障人士施測編輯

隨著科學知識、醫學技術和社會政策的進步,將有越來越多的殘障人士更深入參與教育、就業和社會活動中,這個不斷增加的參與,使得對於殘障人士的各種測驗與評量的需求大為增加。殘障人士就是指因身體、心理或發展上的傷害,而明顯限制了他們一種或多種主要日常活動的人。儘管本章的<標準>主要是針對測驗殘障人士的技術和專業問題,但是,測驗編製者和測驗使用者還是有必要熟悉聯邦、州和地方的法律,以及那些用來規範測驗和評量殘障人士的司法和行政上的規定。

對於殘障人士的測驗,往往是針對不同目的、在不同施測條件下進行的。例如;測驗可以用於診斷受測者的殘障是否存在,以及殘障的程度如何。測驗還可以服務於某些特定的目的,以確定治療計劃等。另外,還可以從教育和就業的角度出發,對殘障性質種類己確定的受測者進行施測,以便做出安置、挑選等類似的決策;或是作為貫徹教育責任制的工具,追蹤學生的成就等等。對殘障人士進行測驗往往是為學校、臨床診斷、諮商、司法訴訟、聘僱甄選、和資格認証等需要而做的服務。

施測殘障人士時有關調整的論題編輯

測驗殘障人士過程中,主要涉及的一個問題是,如何對測驗進行合理地調整、修改、和改編。所謂評量,是對某一構念的評量。因此,對測驗做調整或修改的主要目的,是要將與構念無關的受測者個人特質對於測驗過程的影響降到最低限度。「調整和修改」(accommodation and modification)這個術語的含義很多。

在這裡,「調整」一詞通藉是指針對受測者的殘障情況,決定採取偏離現行的施測例行程序的行為。根據具體情形,這種有針對性的調整可能包括對測驗施測過程或測驗內容進行修改,但並不意味著改變測驗所要測量的構念。

針對一般受測者所設計的標準化測驗,如果在施測中需要用到受測者的感官、運動神經、語言或其他心理技能,而這些技能又與測驗本身所要測量的核心構念無關時,假若某些受測者的殘障,明顯影響到這些技能的發揮的話,那麼這種標準化測驗就不適合這些特定的殘障人士。比如說,有些盲人受測者只能閱讀布萊葉盲文(Braille format)試卷;半身不遂(hemiplegia)的受測者連筆都拿不住,要他們完成標準化的書面測驗就非常困難。

另外,許多殘障人士還兼有殘障併發症狀(如:有身體殘障的受測者在測驗中易疲勞等)他們在標準化施測條件下作測驗要比普通受測者面對更大的困難。在這種情況下,為了獲得準確的評量結果,只要是閱讀、鉛筆使用、疲勞等不屬於測驗本身所要測量的構念,就有必要對某些測驗內容和施測程序進行調整和修改。

應該注意的是,在很多情況下,沒有必要,也不適宜對測驗進行調整。

首先,當有些殘障類型正好與測驗所要測的構念相關時,那對測驗進行調整和修改就不合適。比如說,如果測驗本身所要測量的是受測者的視覺空間能力,那麼要針對完全失明的受測者將測驗做任何調整和修改就不合適。同樣地,在就業甄聘測驗中,如果測驗要測量的是受測者從事某項工作所應具備的基本技能,那麼,這裡的修改,就有可能從根本上改變該測驗本身要測量的構念。

其次,如果測驗的目的是用來診斷受測者是否有某一種殘障,以及殘障的性質和程度時,那麼,針對這種殘障而進行的測驗調整也是不恰當的。例如,在使用有時間限制的測驗來診斷和評量受測者的學習障礙時,如果對某些殘障人士放寬測驗時間的限制,就很難確定受測者是否真的有訊息處理的障礙。

第三,還應該值得注意的是,並不是所有的殘障人士在參加所有的測驗時,對測驗條件都有特殊的要求。很多殘障人士的殘障情況,並不影響他們在某一特定測驗中的表現,因此就沒有必要對測驗進行修改或調整。

專業判斷在決定是否有必要對測驗進行調整或修改時非常重要。在決定某個特定的殘障人士是否需要調整措施,以及調整的性質和程度時,就需要依靠專業判斷。有時候,殘障人士會透過提供充分的書面証明,要求主辦單位對其測驗進行某些調整。

一般情況下,先由測驗主辦單位或其他深諳評量過程和殘障類型特徵的專門機構對這種請求進行審查,然後再做出應該提供什麼樣的調整才算合理的結論。有時候,殘障人士所要求的調整,與測驗主辦單位批準的調整並不一致。這時,在法律允許的範圍內,決定因素是根據修改後測驗的分數對受測者能力所做推論的效度。修改測驗的決定應該最大可能地準確測量到測驗所針對的構念,使得對所有有關方面都公平。不過,由於對於測驗修改效果的實証性研究並不多,所以,對於測驗調整的專業判斷就變得更為複雜。

修改測驗時還要注意,即使是殘障類型相同的受測者,他們對測驗調整的要求可能相差甚遠。這時,主要原則是要根據受測者的具體殘障狀況的需要,來決定測驗調整的性質和程度。例如,認為只要為所有患視力障礙的受測者提供布萊葉盲文試卷,就可以成功完成測驗的觀點,顯然是不正確的。由於視力障礙的程度不同,對於有些視力障礙不嚴重的受測者而言,只要提供較大號字體的試卷就可以了;而對另一些受測者,則可能需要提供卡式錄音帶或閱讀機才能完成測驗。

由於測驗通常是針對目標母群體設計的,對於測驗的調整可能會改變所要測驗的某些特徵,並可能因此而影響或削弱測驗在心理計量學方面的品質。在目前,對於不同的調整和修改措施對測驗分數的信度的影響,或是經調整後測驗的分數其效度是否不變,還缺乏實証性的研究。由於一些實際操作條件的限制(如:樣本太小、殘障人士的非隨機性選擇等),目前還沒有精確的方法對於修改後的試卷和原始試卷進行等化處理,也因此很難對殘障人士在測驗修改前後的測驗分數進行比較。

為了要適應殘障人士的需要,而對測驗進行的調整,有時候會改變測驗所要測量的構念,或是它想要完全達到的程度。例如,如果將一個聽力測驗以書面形式施測於失聰或有聽力障礙的受測者,那麼聽力測驗實際上就會變成為閱讀理解測驗。這種施測條件的變化就會改變原始測驗所要測量的構念。

在這種情況下,受測者在標準試卷和調整後試卷上所得分數的含義就不相同。同樣,施測條件的改變還會影響到測驗分數的預測值(predictive value),例如:在速度測驗中,如果對殘障受測者提供額外的答題時間,那受測者的測驗分數與參照標準(如工作表現)之間的關係就會受到影響。因此,在解釋和使用經調整的測驗的分數時,一定要進行適當的專業判斷。

近幾年來,已經有許多經過調整的測驗以及相對應的研究問世,來支持這些測驗的應用。儘管本章的標準鼓勵編製針對殘障人士的測驗和施測程序,但需注意本書其他章節所涉及的有關標準,也完全適用於本章所考慮的測驗應用、測驗調整和修改問題。在對測驗進行必要的修改或調整時,信度和效度始終是個關鍵問題。

測驗調整策略編輯

為了滿足殘障人士的需要,在很多情況下,己經對某些測驗採取了許多調整措施。有些調整措施要求對施測程序進行修改(如,指令和答題形式),有些調整策略則要求對測驗媒介、測驗時間、考場設施、或測驗內容進行適當調整。根據受測者殘障的性質和程度,一般都可以找到一至多個相應的測驗調整措施以配合特定的受測者。下面所列的只是若干,並非所有現成的或適用的測驗調整策略。測驗是否需要調整,是取決於調整後的測驗對於受測者在所測構念方面,能否得到更有效的推論。

調整指令與媒介物編輯

根據受測者殘障的具體情況,可以修改測驗指令和試題所使用的媒介。例如;可以為患視覺障礙的受測者提供布萊葉盲文試卷或大號字體試卷進行測驗;在電腦施測條件下,還可以用較大的字體或螢幕來顯示測驗內容;對於有聽力障礙的受測者,可以通過手勢或用書面來宣布測驗指導語等等。

調整作答方式編輯

根據受測者的具體情況,還可以調整測驗的答題方式,允許殘障人士使用其擅長的溝通方式作答。例如,可以允許患嚴重語言殘障的受測者,用手勢指出其所選擇的答案;對那些無法用手書寫或塗畫答案的受測者,可以由施測人員幫助塗畫答案;還有其他答題方式,例如允許受測者使用卡式錄音機、電腦鍵盤、或布萊葉盲人打字機等等。


調整測驗的計時方式編輯

另外一種測驗調整措施是修改測驗的計時方式,這主要包括:延長測驗作答時間,在測驗過程中增加休息次數,或者將整個測驗分散在數天中進行等。

很多全國性測驗計畫(如學業成績、證書測驗等)允許殘障人士有額外的作答時間。在測驗中,閱讀布萊葉盲文試卷、使用卡式錄音帶、或閱讀機等,要比閱讀標準試卷花費更多的時間,但閱讀大號字體試卷則不一定花費更多的時間。具體的調整措施應取決於測驗材料的編排、排版以及受測者殘障的性質和嚴重程度等。

調整施測時的物理條件編輯

通常在群體施測條件下進行的團體測驗,可以根據不同的測驗目的對殘障人士進行個別施測。個別施測可以避免群體施測條件下受測者之間的相互干擾。許多殘障人士(如注意力缺乏症受測者等)在群體施測條件下很難完成測驗。

其他施測條件的調整還包括:為坐輪椅的受測者調換他能方便進出的考場;為坐輪椅受測者提供更能支撐其身體的桌椅;或者根據弱視受測者的需要,適當調整考場的光線,或提供放大鏡;為腦傷而手眼協調不良的受測者提供放大的答案卡等。

僅使用部分的測驗編輯

另一種測驗調整措施,是只選用標準測驗的某些部分(即單元測驗)對殘障人士進行測驗。在臨床測驗中,當標準測驗的某些單元(subParts)需要用到受測者的身體、感官、語言或其他技能,而殘障人士又不具備這些技能時,就可以只選用標準測驗的某些部分對受測者進行測驗。另外,如果受測者的身體或感官殘障會影晌其測驗水平的發揮時,在認知和學業成績測驗中也常採用這種調整方法。例如:在一項認知能力測驗中,如果測驗是由口頭和書面部分共同組成的,那麼,在對有聽力殘障的受測者進行施測時,就可以將口頭部分從測驗中刪去,因為受測者在這些測驗上的測驗結果,並不能對受測者的認知能力提供充分的評量訊息。其結果更多地是反映受測者的聽力障礙程度,而不是真正反映其認知能力。不過,儘管在施測中刪除某些測驗計畫的做法,確實是一種很有效的調整措施,但這種調整方法,也有可能使測驗無法充分測量預期的技能或能力,特別是當這些技能或能力恰好是測驗要測量的目標時,問題就更加突出。比如:只選用部分的測驗進行施測的方法,在諸如証書測驗和甄聘測驗中就不恰當,因為這類測驗的每一部分所測量的構念,可能正好代表了一種性質不同,且很有必要的工作或職業上的要求。

採用替代測驗或另類評量方法編輯

另外,還有一種測驗調整方法,就是用專門為殘障人士設計的測驗或代替評量(alternate assessment)方法代替針對普通受測者設計的標準化測驗來進行施測。使用為殘障人士專門設計的測驗對殘障人士進行測驗得到的結果可能更有效。不過,儘管這種測驗調整方法可以代表一種較為理想的測驗調整手段,但在實務中要找到一個測驗相同構念,並與標準測驗具有相似技術指標的完全替代測驗則相當困難,而且要將兩種測驗的分數置於同一個分數量尺上也並非易事。

在不同測驗情況下使用測驗調整策略編輯

對受測者個別測驗的方法(如臨床診斷)和群體測驗或大規模測驗的方法(如學業成績、聘僱甄選、資格認証或入學測驗)之間在測驗環境方面有重要區別。

個別診斷測驗通常使用於臨床或教育目的。在這種情況下,需要有一位資深測驗專業人員(如有執照或証書的心理學家)來負責測驗的選擇、施測、分數解釋和報告測驗結果等整個評量過程。測驗專業人員一般要盡力收集有關訊息(比如;受測者的殘障情況、受測者在測驗中擅長的溝通方式等),並盡可能利用這些資料做出針對受測者具體情況的合理調整計畫。

在評量過程中,除了使用調整測驗外,還要結合其他評量方法,收集受測者在相關領域的行為表現,並以這些訊息為基礎對受測者的能力做出推斷。在評量過程中,對測驗所採取的調整措施既是對殘障人士進行測驗的必然需要,也是對受測者行為表現做出臨床預測的訊息來源。例如:可以允許患偏執性強迫症的受測者在某些測驗計畫、單元測驗或整個測驗的作答時間上不受標準測驗時間的限制等。儘管在這種情況下不能按照標準化評分標準對受測者的測驗結果進行評量,但是,受測者在附加測驗時間內可以取得較好的測驗結果,這一事實本身則可以有助於做出臨床解釋。

然而,大規模測驗中使用測驗調整措施情況就不同了。大規模測驗常用於學業成就考核、計畫評鑑、資格認証、執照發放和甄聘測驗中。在這種情況下,標準化測驗通常是針對所有的受測者進行施測的。大多數受測者都身心正常,因此對這類受測者所做的各種決策有時只能是以測驗的訊息為基礎,比如在甄聘測驗中就是將測驗的結果作為對受測者進行初選的工具。在有些情況下(比如在選拔測驗和入學測驗中)由於申請者人數可能遠超過預定錄取的名額,因此,在作錄取決策時就必然要對受測者進行比較。

這時,測驗對所有群體的公平性問題就顯得至關重要,因為這種比較必須是對殘障人士在調整試卷上所獲得的測驗分數與非殘障人士在標準條件下所獲得的測驗分數之間的比較。儘管受測者不應該因其與測驗所測構念無關的殘障而處於不利地位,但是針對殘障人士所進行的任何調整措施,也不應該讓使用調整試卷的殘障人士比非殘障人士處於過分有利的地位。由於對調整試卷分數和標準試卷分數之間的比較性研究還是很有限,因此在這些情境中對測驗進行合理的調整是重要且艱難的專業判斷。

報告經調整測驗的分數編輯

在實務上,報告經調整測驗的分數,根據具體情況在做法上相差很大。在個別測驗中,如果測驗是按非標準施測方式進行的,那麼在提供測驗分數時,測驗專業人員通常要對這一情況在測驗報告中予以說明。比較典型的做法是,測驗專業人員在測驗報告中對測驗調整所採取的各個步驟予以描述,並討論根據調整測驗的分數所作推論的效度。如果測驗的調整措施有可能影響測驗分數的信度或根據分數所作推論的效度,那麼還得在測驗報告中提供有關評量過程的各種訊息。

對測驗調整性質進行報告的作法與上述報告測驗程序的要求是一致的。 另一方面,在大規模測驗中,報告經調整測驗的分數的方法也引起了相當大的爭議。通常在報告非標準測驗分數時,要在受測者成績單的測驗分數旁邊做一個星號或其他引起注意的標記,表示該分數是在非標準施測條件下獲得的。有時,主考單位會向收到這種帶有特殊標記的成績單的單位或個人註明其含義。但在很多精況下,這種測驗成績單並沒有提供任何有關測驗調整性質的具體訊息。

有人認為如果不用特殊符號報告測驗分數就會誤導使用者,甚至會因測驗分數不能準確反映其能力而傷害殘障人士。還有人則認為,用特殊符號來標示殘障人士在非標準施測條件下獲得的測驗分數,會很不公平地給受測者貼上「殘障」標籤而侮辱其人格,甚至可能會剝奪他們與一般受測者平等競爭的機會,特別是當他們完全有能力這樣做的時候。聯邦法律和大多數州法律都禁止歧視殘障人士,並要求在測驗中針對殘障人士的實際情況,對測驗進行合理的調整,並嚴格控制可能冒犯殘障人士的任何行為,特別是在受教育、入學、資格認証和甄聘測驗中更是如此。

報告測驗分數的基本原則是;對於負責解釋分數和以測驗分數作為採取行動依據的使用者,既不隱瞞任何有關測驗分數含義的重要訊息,又不提供任何與測驗無關的訊息。如果有充分的證據,証明標準施測條件和調整施測條件下所獲得的分數具有可比較性,那麼就沒有必要在成績單上對經調整測驗分數作任何特殊標記。反之,如果還缺乏這樣的證據,一般的標記對使用者所提供的訊息也十分有限。因此,在法律允許的範圍內,詳細提供有關測驗調整性質的具體訊息也許更為可取。

您使用了廣告過濾軟體!


Wikia通過廣告運營為使用者提供免費的服務。我們對通過嵌入廣告過濾軟體訪問網站的使用者進行調整。

如果您使用了廣告過濾軟體,將無法使用我們的服務。請您移除廣告過濾軟體,以確保頁面正常載入。

查看其他Fandom

隨機Wiki