維基

WikiTeamWork

MTT:第九章

870個條目
在本站
增加新頁面
談話0 分享

甄聘測驗和資格認証測驗

一、背景介紹編輯

用人單位運用甄聘測驗進行雇員的選拔、晉升和安置。選拔(selection)是指關於誰可以進入單位的決定;安置(placement)是指對現有人員和職位作配對的決策。晉升(promotion)是指提拔單位內有關人員的決定。這三項的共同點都集中於對未來工作行為的預測。這種預測的目的是提高本單位的工作效率、增長勞動生產率、員工工作動力和員工滿意度等。

資格認證與測驗編輯

執照和証書授予過程中的測驗常被稱為資格認証(credentialing)。這類測驗通常著重於檢測申請者在某一專門領域內目前所具有的技能或能力。在許多行業中,從業人員必須獲得政府機構所頒發的執照。在另一些行業中,則由專業協會或組織來負責資格驗証。雖然執照是入行証明,但在一個行業中可以存在從新手到專家不同水準的資格。儘管申請証書通常是自願的,但是在各個行業中是否取得相應的証書,卻會不同程度地影響到一個人的就業和升遷。測驗通常僅僅是資格認証過程中的一個部分,其他要求可能包括:如教育程度、實習經驗等等。本《標準》適用於多種資格認証過程中的測驗應用。

在工作單位裡,測驗還可能被用於聘僱甄選決策和資格認証之外的其他目的。例如,當員工在工作中出現行為問題時,可以用測驗來進行心理病理方面的探查。在訓練和進修計畫中,測驗可作為測量個人成長的手段。那些測量人格特徵、價值觀、興趣、工作風格等方面的工具普遍用來幫助員工更好的自我瞭解。計畫評鑑裡也會用到測驗,例如,在一個關於訓練計畫效果的實驗研究中,測驗可以被用於訓練前和訓練後的對比測量。本章將集中討論聘僱甄選和資格認証過程中的測驗應用。

二、甄聘測驗編輯

1.環境對考試應用的影響編輯

甄聘測驗涉及到利用考試訊息輔助人事決策。甄聘測驗在內容和應用環境兩個方面都存在許多差異。甄聘測驗的內容可能涵蓋各種不同的知識領域、技術、能力、特質、性情和價值。測驗應用的環境也可能截然迥異。有些環境特點可能反映了聘僱甄選單位的選擇;有些特點反映了聘僱甄選單位提出的必需滿足的特殊要求。關於一個測驗系統的設計、評價和實施的決策都是根據這一測驗系統所應用的特殊環境而制定的。重要的環境因素包含以下幾個方單位內部申請者相對於單位外部請者。在一些情況下(如晉升)候選人已是本單位的員工。在其他一些情況下,申請者可能來自外單位。還有的時候,單位內外的申請者都有。

熟練職種 vs 技術職種編輯

用人單位有時會選擇那些未經訓練的申請者,這或許是由於職種本身並不需要特別的知識和技能,或許是由於訓練被安排在申請者被雇用之後。在另一些情況下,聘僱甄選單位需要找那些經過訓練的、或有經驗的工人,希望他們一來就馬上可以勝任技術職種的工作。這樣,根據所要雇用或晉升的人員是否應受過訓練的具體情形,同一個工作可能需要很不同的選拔體系。

短期表現 vs 長期表現編輯

在一些情況下,選拔的目標是預測聘僱甄選時或聘僱甄選後短期內的工作表現。在另一些情況下,選拔所關注的是長期的表現,如預測一個人是否可以成功地勝任一個常年駐外的職位。考慮到未來工作任務和工作要求的變化,在選拔程序中可能要包括那些對於勝任將來工作很重要的能力,儘管這些能力可能並不是當前工作所需要的能力。

擇優 vs 汰劣編輯

在一些情況下,選拔體系的目的是發現那些將會與單位利益有關的行為方面表現突出、可以為單位帶來實際效益的個人(擇優)。在另一些情況下,選拔體系的目的是發現那些可能具有病態、變態或犯罪傾向的人,以降低這方面的風險(汰劣)。適合某一目標的測驗系統可能完全不適合另一目標。一個能指出某人出現病態行為可能性很低的心理衡鑑,並不意味著這個人將會有高水準的工作表現。可以預測某項效標行為的測驗,並不一定可以支持其他效標的推論。

機械性決定 vs 判斷性決策編輯

在一些情況下,測驗訊息以一種機械性的、標準化的方式被運用。在這種情況下,一個測驗系列的分數按照一定的公式進行組合,申請者被嚴格地按分數從高到低的順序排列,根據分數進行選擇。或者只有申請者達到了一定的切截分數,才可以進入選拔體系的下一個階段。在另一些情況下,某個測驗分數與其他測驗的分數或非測驗的評價訊息一道,被用來對候選人做出綜合性的評量。

持續性應用 vs 一次性應用編輯

在一些情況下,測驗可能在一個單位中使用較長的一段時間,以累積該測驗在這種環境中的數據資料和經驗。在另一些情況下,考慮到測驗的保密性,測驗不可能重複使用,每次施測都需要不同版的測驗試卷。例如,一個救生員的工作樣本測驗要求受測者從游泳池底打撈一個人體模型。這類測驗並不會因為受測者事先了解測驗的詳細情況而使測驗受到影響。相反,如果一些受測者事先得知一個工作知識的紙筆測驗題目,這個測驗就會受到嚴重的影響。這裡的關鍵問題是:對測驗內容的事先了解是否會改變測驗所測量的構念。

穩定的申請人群體 vs 流動性的申請人群體編輯

在有些情況下,申請人群體可在挑選程序開始前就組織好,例如,要求申請人一定要在某個具體日期前遞交申請。在另一些情況下,申請人是可以源源不斷地遞交申請,因此要不斷地對他們的求職申請作出決定。對於固定申請人群體,我們可以將他們排名次;對持續流動性的申請人群體,則對某個申請人的決定將獨立於其他申請人。

大樣本 vs 小樣本編輯

有些工作有許多人同時做同一項工作。例如,在多個相似的工作可以匯集起來的情況下;或是在編製者挑選體系時,擁有類似工作性質的單位聯合作業的情形下,攝取一個較大的樣本是有可能的。在另一些情況下,樣本就很小。更極端的情況是:一種工作只需要一位工作人員。為從測驗中得出預期的推論,需要檢查測驗分數的效度。樣本大小影響到可從不同渠道獲得效度證據的程度。例如,很難根據局部環境來建立測驗與行為效標之間的實証相關,因為這用小樣本在技術上就行不通。

職位空缺數目 vs 申請人數目編輯

申請人的數量大小將制約一些測驗系統的可行性。常常有許多人同時競爭少數幾個具有吸引力的職位。在這種情況下,可以先用一些較短的篩選測驗來減少申請者的數量,使其後的一些耗時、耗資較多的測驗得以實施。大量的申請人也可能使得施測機構不能對所有申請人同時施測,而帶來測驗保密方面的問題。這樣,雇主所運用的測驗就受到上述種種環境因素的制約。對這些環境因素的了解在專業判斷上很重要,因為這關係到要編製何種類型的測驗,關係到要採用怎樣的策略來評審,以及根據測驗所做推論的效度。

2.甄聘測驗的效度驗證過程編輯

在多數甄聘測驗的應用中,根據測驗分數做出的基本推斷是預測性的;測驗使用者總是希望根據測驗分數來推斷受測者將來的工作表現或工作成果。即使是在那些效度評價方法中不包括預測量數與效標之間的實証性鏈接的情況下(如那些基於測驗內容的效度証據),效標依然存在。因此,儘管可以使用不同方法收集效度証據,但效度証據要支持的推論是:根據測驗分數可以推測受測者將來的工作行為。在聘僱甄選環境中進行的效度驗證過程,包括收集並評鑑那些支持或質疑上述推論的証據。

於是,在建立預測性推論時需要注意兩個領域:測驗(作為預測源)和工作行為或有關結果(效標)。評價聘僱甄選決策中使用測驗的問題可被看作是一個檢測假設的過程:即這兩個領域之間是否存在關聯。從操作上講,檢驗這一假設的方式很多。下面的示意圖中說明了這一點。


這個示意圖將預測量數構念領域和預測量數區分開來,也將效標構念領域和效標量數區分開來。預測量數構念領域是通過說明一組行為來定義的,這組行為將被標以一個特定的構念標簽(例如:言語推理、打字速度、等等)同樣,效標構念領域是通過說明一組工作行為或工作成果來定義的。這組行為也將被標以一個特定的構念標簽(例如;核心工作任務表現、團隊精神、出勤率、銷售額、一般工作表現等等)。預測量數和效標量數都是對這些領域實現量化的行為。

示意圖同時也列出了一些大家共同關心的推論。第一個推論是預測量數的分數與效標的分數之間相關聯的推論。我們可以通過對這兩種測量之間的關係的實証性考察來檢驗這種推論。第二和第四種推論在概念上是相似的,都是對推論進行考察,看測驗結果能否被解釋為可以代表受測者在所測構念領域方面所處的位置。邏輯分析、經驗判斷、對概念上相似和不同的測量的聚斂性(convergence)分析或/和擴散性(divergence)分析等等,都可以成為檢驗這種鏈接的方式。第三種推論是關於預測量數構念領域與效標構念領域之間關係的推論。這種聯繫是建立在理論和邏輯分析基礎之上的。通常是通過對工作內容的系統評價和個人特徵與工作表現之間的專家判斷來考察這種聯繫。第五種推論是預測量數與效標構念領域之間的聯繫。

一些預測量數明顯被設計成為與之相關的效標構念領域的一個樣本。這時,預測量數與效標構念領域之間的同構性就可以直接成為聯繫第五種推論的証據。以這種方式建立的第五種聯繫屬於典型的本【標準】中所說的「基於測驗內容之上的效度證據」,也是以往的效度概念體系中所說的「內容效度」,在選拔救生員的測驗中,要求申請者進行救援操作;在選拔文書人員的測驗中,要求申請者進行打字和編輯操作等等,都屬於這方式。

將預測量數用於人員選拔的前提條件是,在預測量數與效標構念領域兩者之間可以建立起聯繫。正如示意圖中所示,建立這種重要聯繫的途徑有多種。第一條途徑是直接通過推論5所形成的鏈接,第二條途徑是通過推論l和推論4所形成的,第三‘條途徑通過推論2和推論3構成。

當測驗作為效標構念領域的一個樣本來設計的時候,這種聯繫可以直接通過推論5來實現。連接預測量數與效標構念領域的另一個途徑是通過推論l和推論4,即用合適性證據在'預測量數與效標的測量之間建立實証聯繫,並據此使得效標的測量代表效標構念領域的鏈接成立。預測量數與測量推則的測量之間的實証聯繫是效度研究的一部分,即本《標準》中所說的「基於與其他變量之間的關係之上的效度證據」,也即以前文獻中所說的「效標關聯效度」。僅僅是測驗與效標量數之間的實証聯繫是不夠的,還必須有關於效標量數與效標構念領域之間關係的証據。所有這些,才構成測驗與效標構念領域之間的聯繫。效標的測量與效標構念領域之間關係的証據通常是基於工作分析之上的。在有些情況下,難則與構念之間的聯繫非常直接,關係非常明顯,以致並不需要做工作分析(例如,所測準則的構念是曠工、員工周轉率等)注嘛,這一途徑並不需要一個精心設計的預測量數構念領域。諸如個人簡歷等資料量化,並以此作為預測量數,是根據受測者對考卷的回答和所測準則的測量之間的實証關係建立的。這類測量的編製有時並不需要預先建立一個完整的關於預測量數構念領域的概念體系。使用這類測驗的基礎是測驗題目的回答與效標的測量兩者之間的直接實証聯繫。

聯接預測量數分數與效標構念領域的另一個途徑是通過推論2和推論3來實現。這一途徑將預測量數代表預測量數構念領城的充分性的証據(推論2)和連接預測量數構念領域與效標構念領域之間關係的証據(推論3)綜合起來。

綜上所述,並不存在一個單一的、直接的途徑來建立這些鏈接。這包含以往效度研究中被歸納為「構念效度」的種種証據。各種証據積累方式的結合,可能會為關於預測量數構念領域與效標構念領域之間的聯繫的推論提供支持。例如,通過專家判斷方法預測某員工能勝任工作的特徵因素;根據分析效率高低的工作表現案例進行推論、面試、觀察等等。這樣,就可以編製和篩選這些有關預測量數構念的測量,通過各種証據積累方式建立起預測量數與預測量數構念領域之間的聯繫,即上述推論。

由此,有多種資料來源和多種証據積累方式來建立預測量數與效標構念領域之間的聯繫。在這種聯繫的建立過程中,並沒有一種惟一的途徑,甚至沒有一種相對更好一些的途徑。測驗的使用者必須考慮具體的測驗環境,運用自己的專業判斷找出一條路來檢測預測量數與效標測量之間的假設關係。

對於許多測驗應用而言,有相當數量的研究可以用於支持上述部分推論或所有推論。通過對這些研究資料進行整合分析性整合(meta-analytic integration),可以使其成為連接測驗訊息和所測構念領域的策略中的一個有機部分。是否有必要收集本地的效度研究數據資料,這將視用相似的預測方法、相似的準則構念領域針對相似的工作職位、現有研究的數量、相關性和研究結果的關聯性而定。這些研究應該是為了相同的工作性質而使用相同的預測量數來預測相同的構念領域。在有些情況下,當現有的研究數量有限,與面臨任務之間一致性較差時,效度研究將主要依靠當地收集的數據資料。相反,如果已經具有了大量的、相似的研究,就沒有必要再額外收集當地數據資料了。

3.對測驗的使用進行評鑑編輯

當甄聘測驗的基本目的是準確預測受測者將來的工作表現或工作業績的時候,需要特別注意的一點是:測驗對效標的預測程度是有一定限度的。

無法完美預測的原因編輯

百分之百準確的預測是不可能實現的。首先,工作環境中一個人的能力表現會受到單位內外多種因素的影響,包括頂頭上司和同事的指導、正式或非正式的訓練、職位設計的變化、組織結構和系統的變化,以及家庭責任的變化等。其次,工作環境中的表現受到多種個人特點的影響,包括知識、技術、能力、人格、工作態度等等。這樣,某一方面的特點僅僅是一個不完整的預測,即使是更複雜的選拔體系也只能著重於考察勝任工作最重要的某些構念,而不是對所有影響工作行為的因素都一一進行考查。第三,即使在精心編製的測驗和效標的測量中,也會存在測量誤差。

因此,不能以一個測驗系統是否能百分之百地準確預測來對其進行評判,而只能通過與其他可能的選擇方法的比較來進行評判。相對現有的其他選拔方式而言,根據測驗對準確預測工作表現程度的專業判斷,與其他可能的選擇方法方法的比較結果,影晌採用有關測驗的決定。

其他考慮因素編輯

關於測驗使用的決策還可能受到一些其他因素的影響,包括對於實用性(例如成本效益比)的評鑑,對選擇某種效標領域對其他效標領域相對重要性的價值判斷,有關受測者對測驗內容和過程的反應的考慮,可供選擇的其他選拔方法和適用性,有關測驗使用的法律、規定和要求(如勞動力的多樣性之類的社會問題考慮)等等。在測驗使用決策中,當然會顯示出該用人單位的價值觀,用人單位自己根據具有可比較性的証據所做出的有關分數的推論,可能對是否採用某一特定測驗而得出不同的結論。

三、職業和行業資格認証中的測驗編輯

在許多職業和行業的資格認証中都廣泛使用測驗。美國的州政府和地方政府都有一些強制性的執業資格要求,要求獲得執業資格的人具有足夠的知識和技能水準,以保証他們能夠安全、有效地完成那些重要的職業活動。在許多政府沒有規定要求資格認証的行業中,証書具有相同的作用,且往往是許多行業中獲得晉升的條件。証書也被廣泛地應用於說明一個人具有某種專業技能(例如,操作特定的汽車修理設備)或知識(如,財產規劃)。這些技能或知識可能僅僅是他們職業責任的一部分。頒發執照、授予証書、註冊以及其他的關於專業能力的証明,在這裡都被統稱為「資格認証」。

考試應用於資格認証的作用是,以一種可信的方式向社會大眾(包括雇主和政府機構在內)提供有關從業人員達到某種特定標準的証明。標準往往是嚴格的,但是並非嚴格到過分地限制那些具有資格的人向社會提供服務。資格認証的過程可以透過剔除不具有從業資格的人,來保護正常的專業活動。獲得職業資格的條件通常包括:教育程度、一定的實習經驗,以及在一項或多項測驗中達到及格分數等,以及一些其他的特定標準。資格認証測驗被應用於多種職業和行業領域,包括:醫學、法律、心理學、教學、建築、房地產、美容術等等。其他諸如保險精算學、臨床神經心理學、醫學專科等領域,測驗還被用來對高級專業人員的資格進行認証。某些行業和職業還要求執業人在經過一段時間後,要辦理執照再申請和証書再認証手續。

在資格認証中,測驗設計的目的是判斷申請者是否掌握了相關領域的基本知識和技能。操作標準集中於評價申請者是否具備安全、正確地從事特定工作的水準。通常測驗設計的起點是對職業進行得體地界定,以便確認申請者真正參與到勞動中所需的能力。然後描述出這一職業當前的性質和要求。通常,需要對從事這一行業或職業的人的工作表現進行全面地性分析,並據此描述出實際工作者所要承擔的任務和需要具備的能力。可以採用的分析方法有描述、影響程度分析技術、職位分析、訓練需求的評估、和針對從業人員的調查研究等等。特定專業領域的專家常常與測驗專家合作,共同編製測驗細則,包括對那些與安全和效率有關的知識和技能的說明,以及怎樣對工作表現進行評價的說明。測驗的形式可能包括傳統的選擇題、寫作、口試等,有時候也可以採用更細致的實作評量。例如,用電腦模擬技術來考察諸如醫生對於病人的診斷技術、治療計畫等。有時侯也可以請一名或多名主考人觀察受測者完成一些手工操作任務(如操作起重機、做牙齒等)。

資格認証測驗可能包括多個互相有關係卻又不同的領域。在測驗計畫的設計中,需要決定涵蓋哪些領域,進行一項測驗還是一系列測驗,怎樣將數個測驗的分數組合並起來做出最後的決定等等。在一些情況下,某些測驗上的低分可以靠另一些測驗上的高分來拉平,使得累計合成分數成為可能。在另一些情況下,測驗系列中的每一個測驗都要求達到一定水準。

資格認証測驗的效度驗證主要建立在考試內容証據之上,通常是基於關於測驗對一定行業或專業領域的代表充分性的判斷之上。在這種內容証據之外還可以提供其他形式的外部証據。在資格認証測驗中,由於那些還未取得資格的人一般沒有效標方,面的測量數據資料,因此很少使用準則關聯証據。

切截分數的訂定編輯

那些負責編製資格認証的人所面臨的一個最重要、也最困難的任務就是制定資格認証或証書授予的起碼知識技能的水準。確定恰當的及格切截分數是效度的一個重要組成部分。根據測驗分數作出的推論的效度很大程度上依賴於及格標準是否正確地區分那些勝任者和不勝任者的成績。通常由專家小組來確定所要求的精熟水準。設定的標準必須足以保護社會大眾以及從業人員的利益,但又不應高到不合理的程度而限制合格的人從業。確認資格或証書授予的及格切截分數的適當性是測驗結果效度的重要組成部分。

無法合理訂定切截分數的原因編輯

立法機關有時會試圖確定一個及格切截分數,比如答對百分之七十的試題就算及格。人為確定切截分數與事無益的原因有兩個。第一,沒有關於測驗以及工作職位要求及其相互關係的詳細訊息,不可能建立合理的切截分數。第二,沒有關於測驗形式以及題目難度的詳細訊息,規定這種具體數字幾乎沒有意義。

精確性與分數報告編輯

資格認証測驗需要在切截分數附近區域具有精確性;對於那些遠離切截分數的區域,不論是明顯及格或明顯不及格,倒不一定要有很高的精確性。有時,測驗設計僅僅追求在切截分數附近具有精確性就可以了。在電腦上作答的精熟測驗(computer-based mastery test)可能會包含一個測驗結束的程序,即設計成對於受測者的成績的決策已經很清楚時,或者己到了最大時間限制時,測驗即停止。這樣,對於那些成績明顯高於或低於切截分數的受測者,測驗長度可以縮短。受測者僅僅被告知及格與否。由於在這類精熟性測驗的設計,並不要求說明及格者有多麼優秀或不及格者有多麼糟糕,報告高出或低於切截分數的測驗分數可能會造成誤導。但是,如果報告不及格者在哪些方面比較弱,可能對他們是有幫助的。如果想要報告受測者成績的高低程度,測驗分數全域均需具有精確性。

內容修訂與標準重訂編輯

職業和行業的實務活動經常會隨著時間變化。法治的漸進、科學領域的進步、和測驗技術的改進,都可能導致測驗內容的變化。如果出現了實質性的變化,就需要對工作職位的定義和測驗內容進行修訂,以適應已經變化了的環境。當對測驗進行重要修訂的時候,需要重新確定切截分數。

多版本試卷及其校準編輯

由於認証測驗是一項持續性的工作,當測驗定期舉行的時候,常需要一些新的測驗試卷。從技術角度看,所有的測驗試卷都需要根據同樣的測驗細則來編制,都需要代表同樣的內容。替換測驗試卷之間的分數應該具有可比較性。惟此,測驗分數才有意義。有各種校準方法可以被用來鏈接不同的測驗試卷,以保証及格標準對所有試卷而言代表同一能力水準。需要注意,過期測驗試卷的公開出版可能會危及測驗試卷之間的可比較性。

是否可以調整及格標準?編輯

有些職業認証機構基於實際的考慮,認為有必要每年對及格標準進行調整,以保証每年該行業的入行人數保持相對的穩定。這種成問題的作法會對測驗分數的技術質量帶來嚴重的問題。每年調整及格標準意味著有些年度的標準可能高一些,另一些年度的標準可能低一些。這種做法雖然簡單明瞭,但是很難根據能力水準來做出判斷。通過調整及格標準以保持每年的及格人數或及格人數比率保持不變的作法,儘管對於申請者來說似乎並不明顯,但在技術上是不可取的,因為它改變了每年分數的含義。通過認証測驗應該意味著受測者已經達到了發証機關所設定的知識和技能標準,它與工作機會的多少沒有關係。

MTT:有關甄聘測驗與資格認證測驗的標準

您使用了廣告過濾軟體!


Wikia通過廣告運營為使用者提供免費的服務。我們對通過嵌入廣告過濾軟體訪問網站的使用者進行調整。

如果您使用了廣告過濾軟體,將無法使用我們的服務。請您移除廣告過濾軟體,以確保頁面正常載入。

更多Wikia社區

隨機維基