2005年10月“人事測(cè)量”串講資料（北大心理系）（二）

發(fā)布時(shí)間：2024-09-15 16:21:23
來源：本站整理
閱讀：

導(dǎo)讀：: 　　4.匹配題。匹配題可以說是選擇題的一種變式。匹配題一般包括多個(gè)反應(yīng)項(xiàng)和多個(gè)刺激項(xiàng)，用反應(yīng)項(xiàng)來匹配刺激項(xiàng)。匹配題有完全匹配和不完全匹配兩種形式。
　　優(yōu)點(diǎn)：匹配題容易編制，而且可以在短時(shí)間內(nèi)測(cè)量大量相關(guān)聯(lián)的材料，覆蓋面較廣。缺點(diǎn)：它一般只能測(cè)量簡(jiǎn)單記憶的事實(shí)材料或概念關(guān)系，并且要求編制的選項(xiàng)必須是同

4.匹配題。匹配題可以說是選擇題的一種變式。匹配題一般包括多個(gè)反應(yīng)項(xiàng)和多個(gè)刺激項(xiàng)，用反應(yīng)項(xiàng)來匹配刺激項(xiàng)。匹配題有完全匹配和不完全匹配兩種形式。

優(yōu)點(diǎn)：匹配題容易編制，而且可以在短時(shí)間內(nèi)測(cè)量大量相關(guān)聯(lián)的材料，覆蓋面較廣。缺點(diǎn)：它一般只能測(cè)量簡(jiǎn)單記憶的事實(shí)材料或概念關(guān)系，并且要求編制的選項(xiàng)必須是同質(zhì)的。

☆◆對(duì)編制匹配題的一些建議：①刺激項(xiàng)目和反應(yīng)項(xiàng)目應(yīng)該分成兩列，通常反應(yīng)項(xiàng)安排在右邊；②配對(duì)數(shù)目不可過多或過少，最好使用不完全匹配，使反應(yīng)項(xiàng)數(shù)目多于刺激項(xiàng)數(shù)目，并且最好不限制每個(gè)反應(yīng)項(xiàng)被選擇的次數(shù)，這樣可以降低猜測(cè)的概率；③匹配題的反應(yīng)項(xiàng)與刺激項(xiàng)，其性質(zhì)必須相近；④應(yīng)對(duì)匹配方法、匹配的依據(jù)加以明確的規(guī)定和說明，同時(shí)說明反應(yīng)項(xiàng)可以被選擇的次數(shù)；⑤同一組的反應(yīng)項(xiàng)與刺激項(xiàng)最好印在同一頁紙上，以免造成答題時(shí)間的浪費(fèi)；⑥反應(yīng)項(xiàng)與刺激項(xiàng)應(yīng)以不同形式的序號(hào)加以標(biāo)識(shí)，以免混淆。

5.填充題。☆◆編制填充題時(shí)應(yīng)注意：①最好采用問句形式；②使用直接問句的形式，可避免產(chǎn)生對(duì)題意的誤解；③如果是填空形式，填充處不可太多。過多空白會(huì)使題意不明確；④每題最好只有一個(gè)答案，答案最好簡(jiǎn)短而具體，有利于評(píng)分。

6.操作性測(cè)量形式。在很多情況下，操作的方法和過程是重要的測(cè)量目標(biāo)，而這是紙筆測(cè)驗(yàn)無法測(cè)量的，這時(shí)可以采用操作性測(cè)量形式◎。操作性測(cè)試題通常分為著重過程和著重結(jié)果兩種形式。

操作性測(cè)試有多種不同的分類方法，按測(cè)試情境的真實(shí)性程度可分：①紙筆的操作性測(cè)試：雖用紙筆但偏重于模擬情境下知識(shí)的應(yīng)用，如編制某項(xiàng)操作計(jì)劃、步驟、注意事項(xiàng)等，如公文筐測(cè)驗(yàn)；②模擬操作測(cè)試：強(qiáng)調(diào)正確的程序，被試需要在模擬情境下完成與真實(shí)活動(dòng)相同的動(dòng)作，如駕駛員的考核等；③工作樣本操作測(cè)試：其真實(shí)性最高，但是是在有控制的條件下去完成的。如司機(jī)在標(biāo)準(zhǔn)場(chǎng)地內(nèi)的考核。

設(shè)計(jì)操作性測(cè)試題的主要原則有：①明確所要測(cè)量的目標(biāo)，并將其操作化。即要進(jìn)行工作分析，辯認(rèn)出操作中最重要的因素，找出具有代表性的工作樣本。②要建立作業(yè)標(biāo)準(zhǔn)，規(guī)定通過此項(xiàng)作業(yè)的最低標(biāo)準(zhǔn)。③選擇合適的真實(shí)性程度。通常情況下，真實(shí)性程度越高，模擬的代價(jià)越大。④指示語簡(jiǎn)單明確，讓被試知道要干什么和在什么條件下去做。⑤有明確的計(jì)分方法。

◎作品量表：一般包括一系列按順序排列的不同作業(yè)程度、水平、質(zhì)量的標(biāo)準(zhǔn)樣本，評(píng)分時(shí)參照這些標(biāo)準(zhǔn)樣本對(duì)被試結(jié)果進(jìn)行評(píng)分。

7.面試。缺點(diǎn)：①面試的考核缺乏心理測(cè)量學(xué)的嚴(yán)格性，易受考官的個(gè)人偏見或歧視的影響；②由于面試既要看應(yīng)試者對(duì)問題回答的內(nèi)容、質(zhì)量，還要看整個(gè)面試過程中的行為表現(xiàn)，如情緒緊張度、應(yīng)變能力等，更加大了面試記分的難度。面試效果的好壞往往取決于面試考官。面試應(yīng)注意：①面試考官必須對(duì)面試主題有充分的了解，對(duì)于所要求的反應(yīng)有清晰的認(rèn)識(shí)；②用于描述或評(píng)定被試反應(yīng)的詞語，必須具體化，避免模糊不清的陳述。

第三節(jié)題目的編排

◇題目選擇和編排過程包括定性的邏輯分析和根據(jù)預(yù)測(cè)的結(jié)果進(jìn)行的定量分析。

一、題目的選擇

1.◇對(duì)題目進(jìn)行初步選擇的主要依據(jù)是：題目本身的性質(zhì)、對(duì)預(yù)期測(cè)量目標(biāo)的可測(cè)量程度。

2.☆題目選擇的步驟包括：⑴檢查題目是否符合細(xì)目表中某一單元格內(nèi)的要求。⑵根據(jù)細(xì)目表對(duì)各部分所要求的比例選擇適當(dāng)數(shù)量的測(cè)試題，使測(cè)量工具盡量覆蓋整個(gè)細(xì)目表的內(nèi)容。⑶檢查題目是否敘述明確清楚，是否提供了額外線索。⑷檢查題目十分適合將要施測(cè)的對(duì)象和施測(cè)的條件。⑸檢查題目的難度是否恰當(dāng)。一般來說，難度為0.50較為合適。⑹檢查所選擇的題目是否彼此獨(dú)立，沒有重疊，即回答某一問題所需的知識(shí)與能否回答其他問題無關(guān)。

二、題目的編排

◇題目編排的原則包括：⑴將測(cè)量相同因素的測(cè)試題排列在一起。⑵盡可能地將同一類型的測(cè)試題組合在一起。⑶難度測(cè)驗(yàn)的題目應(yīng)按由易到難排列。這樣可以鼓舞被試的士氣，避免某些被試一開始就因較多題目回答不出而失去信心。⑷對(duì)于人格測(cè)驗(yàn)，應(yīng)盡量避免將測(cè)量同一特質(zhì)的題目編排在一起，防止被試猜測(cè)出題目所要測(cè)查的因素。

三、測(cè)試題的預(yù)測(cè)試和分析

◎預(yù)備測(cè)試題：測(cè)試題編排完成并不意味著這項(xiàng)測(cè)量工具的編制就此完成。前面對(duì)題目的選取只是依靠編寫者的主觀經(jīng)驗(yàn)，題目的效果如何還需要進(jìn)行定量的客觀分析。這時(shí)的測(cè)試題還只能叫做預(yù)備測(cè)試題，還需要獲取被試對(duì)這些題目的反應(yīng)的材料，為進(jìn)一步篩選題目和為編排測(cè)量工具提供客觀依據(jù)。

◎預(yù)測(cè)試：必須將預(yù)備測(cè)試題對(duì)一定規(guī)模的小樣本被試進(jìn)行施測(cè)，獲得數(shù)據(jù)以進(jìn)行校驗(yàn)、修訂。這一過程稱為測(cè)試題的預(yù)測(cè)試。

◎題目分析：測(cè)驗(yàn)數(shù)據(jù)收集上來之后，應(yīng)該利用這些數(shù)據(jù)對(duì)題目進(jìn)行分析，刪除不好的題目或?qū)︻}目進(jìn)行修改，這個(gè)過程稱為題目分析。具體內(nèi)容包括對(duì)題目的項(xiàng)目分析和對(duì)測(cè)驗(yàn)信度、效度指標(biāo)的檢查。

對(duì)測(cè)試題的預(yù)測(cè)試應(yīng)注意以下問題：⑴預(yù)測(cè)試對(duì)象必須和將來正式測(cè)試的對(duì)象相似；⑵預(yù)測(cè)試的實(shí)施過程與情境應(yīng)力求與將來正式測(cè)量工具實(shí)施時(shí)的情境相似；⑶預(yù)測(cè)試的時(shí)限可稍寬些，最好使每個(gè)被試都能將題目答完，以便搜集充分的反應(yīng)資料，使統(tǒng)計(jì)分析的結(jié)果更為可靠；⑷在預(yù)測(cè)試過程中，應(yīng)將被試的各種反映情況隨時(shí)加以記錄。如，記錄在不同時(shí)限內(nèi)一般被試所完成的題目數(shù)、題意不清之處、被試的態(tài)度等，以便在在修改測(cè)驗(yàn)時(shí)作為參考。

預(yù)測(cè)試完成后，可以根據(jù)預(yù)測(cè)結(jié)果進(jìn)行題目分析，對(duì)每個(gè)題目的具體分析稱為項(xiàng)目分析，主要是指根據(jù)題目的難度、區(qū)分度、備選答案的合適度等數(shù)量指標(biāo)來對(duì)題目進(jìn)行分析。

第五章人事測(cè)量的實(shí)施與計(jì)分

第一節(jié)實(shí)施測(cè)量操作的要領(lǐng)與誤差控制

人事測(cè)量實(shí)施的最基本要求是，使所有的應(yīng)試者都在相同的條件下表現(xiàn)出自己的真正行為。

一、測(cè)量的操作程序

1.標(biāo)準(zhǔn)化指示語。在施測(cè)過程中應(yīng)該使用統(tǒng)一的指示語。◎指示語是在測(cè)量實(shí)施時(shí)說明測(cè)量進(jìn)行方式以及如何回答問題的指導(dǎo)性語言。指示語通常有兩種：一種是對(duì)被試的，另一種是給主試的。前者應(yīng)該力求清晰和簡(jiǎn)單，向被試說明應(yīng)該做什么，即如何對(duì)題目作出反應(yīng)。

2.測(cè)驗(yàn)時(shí)限。大多數(shù)典型作為測(cè)驗(yàn)是不受時(shí)間限制的，如人格測(cè)驗(yàn)。大多數(shù)測(cè)驗(yàn)既要考慮反應(yīng)得速度，也要考察解決有較大難度題目的能力，在能力和成就測(cè)驗(yàn)中所使用的時(shí)限，以大約90%的被試能在規(guī)定時(shí)間內(nèi)完成測(cè)驗(yàn)為標(biāo)準(zhǔn)。

3.測(cè)驗(yàn)的環(huán)境條件。

二、主試的職責(zé)

1.◎主試：也稱考官或主考人，是控制測(cè)試進(jìn)程的主要人員。主試的經(jīng)驗(yàn)如何往往會(huì)對(duì)測(cè)驗(yàn)的結(jié)果產(chǎn)生影響。

◇☆主試應(yīng)做以下工作：⑴測(cè)驗(yàn)前的準(zhǔn)備工作。①預(yù)告測(cè)驗(yàn)；②熟悉測(cè)驗(yàn)指示語；③準(zhǔn)備測(cè)驗(yàn)材料；④熟悉測(cè)驗(yàn)的具體程序；⑤確保

滿意合適的測(cè)驗(yàn)環(huán)境。⑵測(cè)驗(yàn)中主試的職責(zé)。測(cè)驗(yàn)中主試的職責(zé)是按照指示語的要求實(shí)施測(cè)驗(yàn)，在被試詢問指示語意義時(shí)，作進(jìn)一步澄清，但注意不要作任何暗示。在測(cè)驗(yàn)時(shí)，主試還要注意不要講與測(cè)驗(yàn)無關(guān)的話，并能夠?qū)y(cè)驗(yàn)中的特殊情況作出靈活的解決。⑶建立協(xié)調(diào)關(guān)系。協(xié)調(diào)關(guān)系指的是主試和被試之間一種友好的、合作的、能促使被試最大限度地做好測(cè)驗(yàn)的一種關(guān)系。建立協(xié)調(diào)關(guān)系就是要求促使被試盡可能地對(duì)測(cè)驗(yàn)感興趣，遵從指示語，認(rèn)真合作地進(jìn)行應(yīng)試。主試都應(yīng)該采取熱情、友好并且客觀的態(tài)度，這是建立協(xié)調(diào)關(guān)系的前提。

三、測(cè)量實(shí)施過程中可能導(dǎo)致誤差的各種影響因素：

1.主試對(duì)測(cè)量結(jié)果的影響?！顪y(cè)量結(jié)果往往會(huì)受到主試的各方面因素的影響：⑴主試的人格特點(diǎn)。主試的不同特點(diǎn)對(duì)測(cè)驗(yàn)的實(shí)施及測(cè)驗(yàn)的評(píng)分等各環(huán)節(jié)都有影響。⑵主試的期望。羅森塔爾效應(yīng)：在有些情況下，實(shí)驗(yàn)者所獲得的資料及實(shí)驗(yàn)結(jié)果會(huì)受其本身期望的影響，這種現(xiàn)象稱為羅森塔爾效應(yīng)，又稱做實(shí)驗(yàn)者期望誤差。

2.☆被試特點(diǎn)對(duì)測(cè)量結(jié)果的影響：⑴測(cè)驗(yàn)的技巧與練習(xí)因素?！蚓毩?xí)效應(yīng)：有不少研究發(fā)現(xiàn)，應(yīng)試者參加相同或重復(fù)的測(cè)驗(yàn)，會(huì)由于練習(xí)效應(yīng)而使測(cè)驗(yàn)成績(jī)提高。⑵焦慮和動(dòng)機(jī)因素。①應(yīng)試動(dòng)機(jī)；②測(cè)驗(yàn)焦慮。◎焦慮是一種不愉快的、表現(xiàn)為焦急、恐懼和緊張的情緒體驗(yàn)，它主要是由于對(duì)可能出現(xiàn)的結(jié)果的擔(dān)心或?qū)?yīng)付這一結(jié)果的能力的擔(dān)心而造成。大多數(shù)人都在測(cè)驗(yàn)前和測(cè)驗(yàn)中感到焦慮，故又稱測(cè)驗(yàn)焦慮或考試焦慮。⑶反應(yīng)定勢(shì)?！蚍磻?yīng)定勢(shì)也成為反應(yīng)的方式或反應(yīng)風(fēng)格，簡(jiǎn)單地說，就是每個(gè)人回答問題的習(xí)慣方式。☆影響測(cè)量結(jié)果的反應(yīng)定勢(shì)主要有以下幾種：①求“快”與求“精確”的反應(yīng)定勢(shì)。②偏好正面敘述的反應(yīng)定勢(shì)，又成為肯定反應(yīng)定勢(shì)，克倫巴赫發(fā)現(xiàn)。③偏好特殊位置的反應(yīng)定勢(shì)。吉爾福特認(rèn)為，被試如果完全不知道選擇題的正確答案，則不會(huì)以完全隨機(jī)的方式來決定該選擇哪一個(gè)選項(xiàng)，而有偏好某一個(gè)位置的選項(xiàng)的傾向，而有些測(cè)驗(yàn)編制者也存在偏好某個(gè)位置的反應(yīng)定勢(shì)，這些現(xiàn)象稱為位置定勢(shì)。④偏好較長(zhǎng)選項(xiàng)的反應(yīng)定勢(shì)。⑤猜測(cè)的反應(yīng)定勢(shì)。

四、猜測(cè)的校正

1.★猜測(cè)修正的公式：S=R-W/（n-1），其中，S是正確分?jǐn)?shù)；R為被試答對(duì)的題目數(shù)；W為被試答錯(cuò)的題目數(shù)；n為選項(xiàng)數(shù)目。

2.☆猜測(cè)修正的優(yōu)缺點(diǎn)。優(yōu)點(diǎn)：⑴修正公式可避免減低測(cè)驗(yàn)的信度。⑵修正公式可以反映被試真正的能力和水平。⑶使用修正公式對(duì)那些不能答完全部試題的被試來說比較公平。

缺點(diǎn)：⑴公式假設(shè)不成立，因?yàn)楸辉嚧疱e(cuò)試題，并非完全瞎猜。⑵猜測(cè)修正無實(shí)質(zhì)作用。⑶未采用猜測(cè)修正對(duì)信度并無重大影響。⑷完全不許猜測(cè)與實(shí)際生活不符。

第二節(jié)實(shí)施測(cè)量計(jì)分的要領(lǐng)與誤差控制

檢驗(yàn)客觀與否，可以以兩個(gè)或兩個(gè)以上受過訓(xùn)練的合格評(píng)分者所評(píng)結(jié)果之間的一致性作為指標(biāo)。一般情況下，受過訓(xùn)練的評(píng)分者之間的平均一致性達(dá)到90%以上，我們就認(rèn)為計(jì)分是客觀的。

一、計(jì)分的一般程序

1.◆☆計(jì)分的基本步驟：⑴記錄反應(yīng)。及時(shí)和清楚地記錄被試的反應(yīng)。⑵檢索標(biāo)準(zhǔn)答案。標(biāo)準(zhǔn)答案有時(shí)又稱計(jì)分鍵。⑶反應(yīng)和標(biāo)準(zhǔn)答案的比較。

2.◇問答題的主要缺點(diǎn)是評(píng)分不夠客觀，也就是說問答題的計(jì)分經(jīng)常受到評(píng)分者的情感、態(tài)度的影響。問答題中常見的誤差有：寬容定勢(shì)和暈輪效應(yīng)。

3.◎?qū)捜荻▌?shì)：指主試的計(jì)分過于寬松，即使沒有回答出題目所要求的答案，評(píng)分者也給予較高的分?jǐn)?shù)。

4.◎暈輪效應(yīng)：指給予被試某道題較高分?jǐn)?shù)僅僅是由于被試在另外一些試題上獲得了高分，也就是說對(duì)被試的一般印象影響到具體某個(gè)問題的評(píng)價(jià)。

5.◎整體計(jì)分：就是評(píng)分者根據(jù)總體印象給答案評(píng)一個(gè)總分。整體計(jì)分在實(shí)際中應(yīng)用較為普遍。

6.◎分析計(jì)分：是給問答題的不同部分分派不同的權(quán)數(shù)，按照各部分的要求對(duì)答案中所包括的信息和技能評(píng)分，最后將各部分的權(quán)數(shù)和得分組合起來得到該問答題的分?jǐn)?shù)。

比較整體計(jì)分和分析計(jì)分？（回答上面的名詞，再加以說明）

7.◇客觀題的一個(gè)主要優(yōu)點(diǎn)就是計(jì)分簡(jiǎn)單、客觀。

8.不同的反應(yīng)依據(jù)主試認(rèn)為的重要性不同也可以給予不同的權(quán)數(shù)，我們還可以根據(jù)被試回答問題時(shí)的確定程度給予不同的權(quán)數(shù)，這叫做“信心權(quán)數(shù)”◎。

第六章人事測(cè)量結(jié)果的解釋

人事測(cè)量的解釋不同于測(cè)量實(shí)施本身，它們是測(cè)量中兩個(gè)不同的、相對(duì)獨(dú)立的成分。測(cè)量的解釋是一個(gè)相當(dāng)復(fù)雜的系統(tǒng)程序。

第一節(jié)解釋的概念：為什么測(cè)量的實(shí)施與解釋相分離

1.◎原始分?jǐn)?shù)：是通過將應(yīng)試者的反應(yīng)與標(biāo)準(zhǔn)答案相比較而直接獲得的，其本身并不具有多大的實(shí)用意義，而只是一個(gè)理論上的過渡值。

2.人事測(cè)量的目的在于評(píng)價(jià)和比較應(yīng)試者各方面的素質(zhì)和特點(diǎn)。

3.標(biāo)準(zhǔn)分：原始分?jǐn)?shù)通過與常模的比較，可以轉(zhuǎn)換成等值的導(dǎo)出分?jǐn)?shù)，叫做標(biāo)準(zhǔn)分。

4.常模參照解釋：由測(cè)量的原始分?jǐn)?shù)通過與常模的對(duì)照得到可供比較的導(dǎo)出分?jǐn)?shù)的過程，就是測(cè)驗(yàn)分?jǐn)?shù)的解釋形式之一，稱為測(cè)量分?jǐn)?shù)的常模參照解釋。

5.效標(biāo)參照解釋：測(cè)量分?jǐn)?shù)的另一種解釋方式是參照效標(biāo)的分?jǐn)?shù)解釋，即效標(biāo)參照解釋，它是依據(jù)外在效標(biāo)作為標(biāo)準(zhǔn)來對(duì)應(yīng)試者的分?jǐn)?shù)進(jìn)行解釋。

6.☆常模參照解釋與效標(biāo)參照解釋的區(qū)別在于：常模參照解釋是將應(yīng)試者的成績(jī)與同類群體的其他人（常模樣本）的成績(jī)進(jìn)行比較，而效標(biāo)參照解釋是將應(yīng)試者成績(jī)與外在效標(biāo)（如二級(jí)技工的標(biāo)準(zhǔn)）進(jìn)行比較。

第二節(jié)常模與基于常模的解釋

一、如何選擇常模樣本

1.確定常模樣本的過程包括：確定一般總體、確定目標(biāo)總體、確定常模樣本這三個(gè)步驟。

測(cè)驗(yàn)性質(zhì)的不同，文化教育水平不同，性別的不同，都可能影響常模。

2.◆☆在確定和選擇常模樣本時(shí)應(yīng)注意以下要求：⑴常模樣本的構(gòu)成必須明確。一個(gè)測(cè)驗(yàn)可能有許多常模樣本。在選取常模樣本時(shí)，首先要保證常模樣本的所有成員是同質(zhì)◇的，可以相互比較。另外，要在測(cè)驗(yàn)手冊(cè)中對(duì)常模樣本進(jìn)行明確的說明，包括常模樣本的構(gòu)成和特性等。⑵常模樣本必須是所測(cè)群體的代表性樣本。⑶樣本大小要適當(dāng)?！簟畛Ｄ颖敬笮。慈哟笮。┯梢韵氯矫鏇Q定：①常模樣本大小決定于總體的規(guī)模?？傮w規(guī)模小，如只有幾十個(gè)人，則常模樣本應(yīng)包括所有總體成員。如果總體數(shù)目大，相應(yīng)的樣本也應(yīng)較大，一般最低不應(yīng)少于30個(gè)或100個(gè)。②常模樣本大小決定于總體性質(zhì)?？傮w性質(zhì)越復(fù)雜，越需要較大數(shù)量的樣本。③常模樣本大小決定于施測(cè)結(jié)果。◇樣本大小適當(dāng)?shù)年P(guān)鍵是樣本要有代表性。⑷注意常模的時(shí)效性。常模必須定期修訂。

3.◎取樣是指從目標(biāo)人群中選擇有代表性的樣本的過程。從統(tǒng)計(jì)角度看，取樣的方法有隨機(jī)抽樣和非隨機(jī)抽樣兩種。

4.☆在確定常模時(shí)，常用的取樣方法有：⑴簡(jiǎn)單隨機(jī)抽樣；⑵系統(tǒng)抽樣。具體方法：假設(shè)總體數(shù)目為N，若要選擇K分之一的被試作為樣本，則可以把所有的人N分為N/K組，每個(gè)組選一個(gè)人，則剛好組成1/K的樣本?；蛘甙阉械娜藦?到N按序編號(hào)，把所有編號(hào)是K的倍數(shù)的人抽取出來，即可組成所需樣本。需注意的是：在進(jìn)行系統(tǒng)抽樣時(shí)，分組和從組中抽取，或者是編號(hào)，都必須是隨機(jī)的。⑶分組抽樣；在總體數(shù)目較大，無法編號(hào)，并且總體成員又具有多樣性的情況下，可以先將群體分為一定的小組，再?gòu)男〗M內(nèi)隨機(jī)抽樣。⑷分層抽樣。在確定常模樣本時(shí)，最常用的是分層抽樣方法。它是先將目標(biāo)群體的某一種變量（如年齡）分成若干層次，如R個(gè)層次，再?gòu)母鲗哟沃须S機(jī)抽取若干個(gè)案。各層次的個(gè)案總和即為樣本個(gè)案數(shù)目。分層抽樣分為兩種方法：①分層比例抽樣法：如果各層抽取的個(gè)案數(shù)目ni是根據(jù)各層的個(gè)案數(shù)目Ni占總體數(shù)目N的比例而決定的。ni＝Ni/N×n.②分層非比例抽樣：有些層次的重要性大于其他層次，這時(shí)應(yīng)該采用非比例抽樣方法。

二、常模的類型及解釋

1.◇常用的常摸有發(fā)展常模、百分位常模和標(biāo)準(zhǔn)分?jǐn)?shù)常模。

2.百分位常模包括百分等級(jí)、四分位數(shù)和十分位數(shù)。百分等級(jí)的計(jì)算關(guān)鍵在于確定在常模樣本中分?jǐn)?shù)低于某一特別分?jǐn)?shù)的人數(shù)比例，這可以分為兩種情況：一種情況是對(duì)沒有分組資料的數(shù)據(jù)分布求百分等級(jí)，公式為：PR=100-100×（R-0.5）/N，其中R為排名順序，N為總?cè)藬?shù)。另一種情況是對(duì)有分組資料的數(shù)據(jù)求百分等級(jí)。公式：PR=100/N[（x-l）fp/h+cf]，其中，x為任意原始分?jǐn)?shù)；l為該原始分?jǐn)?shù)所在組的精確下限；fp為該分?jǐn)?shù)所在組的次數(shù)；cf為l以下的累積次數(shù)；h為組距。

在分?jǐn)?shù)量表上，相對(duì)于某一百分等級(jí)的分?jǐn)?shù)點(diǎn)叫百分點(diǎn)或百分位數(shù)。

3.◇常見的標(biāo)準(zhǔn)分?jǐn)?shù)有：z分?jǐn)?shù)、Z分?jǐn)?shù)、離差智商（IQ）、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分等。由原始分?jǐn)?shù)轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)，又分為線性轉(zhuǎn)換和非線性轉(zhuǎn)換兩種。

4.z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)，它是指以標(biāo)準(zhǔn)差為單位所表示的原始分?jǐn)?shù)與平均數(shù)的差距。

5.◎正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)：當(dāng)原始分?jǐn)?shù)不呈正態(tài)分布時(shí)，也可以進(jìn)行面積轉(zhuǎn)化，而使分?jǐn)?shù)轉(zhuǎn)成為正態(tài)分布。由這種方式所得到的分?jǐn)?shù)就叫正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)。為了使分?jǐn)?shù)正態(tài)化，必須有某種依據(jù)能假定所測(cè)特性的分?jǐn)?shù)事實(shí)上應(yīng)該是呈正態(tài)分布的。

◎正態(tài)化過程：先將原始分?jǐn)?shù)轉(zhuǎn)化為百分等級(jí)，再將百分等級(jí)轉(zhuǎn)化為正態(tài)分布上相應(yīng)的離均值，并可以表示為任何平均數(shù)和標(biāo)準(zhǔn)差。

6.T分?jǐn)?shù)：一詞最早是由麥柯爾1939年提出以紀(jì)念推孟和桑代克的，不過當(dāng)時(shí)僅用于12歲兒童的團(tuán)體，是根據(jù)某一特殊常模樣本而不是在一般意義上定義的。現(xiàn)在有人用T分?jǐn)?shù)來表示任何正態(tài)化與非正態(tài)化的轉(zhuǎn)化標(biāo)準(zhǔn)系統(tǒng)，只要其平均數(shù)為50，標(biāo)準(zhǔn)差為10即可。

7.標(biāo)準(zhǔn)九分：是另一較知名的標(biāo)準(zhǔn)分?jǐn)?shù)系統(tǒng)，其量表是一個(gè)9

三、常模的表示方法

1.常摸表示的方法主要有兩種：轉(zhuǎn)化表和剖析圖。最簡(jiǎn)單而且最基本的表示常模的方法就是轉(zhuǎn)化表，也叫◎常模表，它由原始分?jǐn)?shù)表、相對(duì)應(yīng)的導(dǎo)出分?jǐn)?shù)表和對(duì)常模樣本的具體描述等三個(gè)要素組成?！罡鶕?jù)轉(zhuǎn)化表進(jìn)行解釋時(shí)，須注意：常模轉(zhuǎn)化表總是特異性的，即一個(gè)轉(zhuǎn)化表總是來自特定的常模樣本的，這種轉(zhuǎn)化表只能表示被試在常模樣本內(nèi)的相對(duì)等級(jí)，若要依此作出某種結(jié)論或預(yù)測(cè)，需要進(jìn)一步的信度和效度的依據(jù)。

2.◎剖析圖是測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來的一種模式圖。使用剖析圖作解釋，要求各個(gè)分測(cè)驗(yàn)所使用的常模樣本必須相同，否則各分測(cè)分?jǐn)?shù)之間無法比較?！钜⒁獾囊粋€(gè)問題是：使用剖析圖容易夸大各個(gè)分測(cè)驗(yàn)間分?jǐn)?shù)的差異。為避免這個(gè)問題，有些剖析圖注明了多少距離代表兩分?jǐn)?shù)間差異顯著，使用者可以依此很快地確定某對(duì)分?jǐn)?shù)間是否存在差異。另一種方法是將被試分?jǐn)?shù)用一段范圍表示，假如范圍不重疊，表明分?jǐn)?shù)間有顯著差異存在。

第三節(jié)效標(biāo)與基于效標(biāo)的解釋

◇效標(biāo)參照測(cè)驗(yàn)關(guān)心的是應(yīng)試者是否達(dá)到了某種標(biāo)準(zhǔn)或效標(biāo)。參照效標(biāo)的分?jǐn)?shù)解釋分為內(nèi)容參照分?jǐn)?shù)的解釋及結(jié)果參照分?jǐn)?shù)的解釋兩種類型。

一、內(nèi)容參照分?jǐn)?shù)的解釋

1.內(nèi)容參照分?jǐn)?shù)的測(cè)量目的是確定應(yīng)試者對(duì)某個(gè)確定材料內(nèi)容或技能的掌握和熟悉程度的分?jǐn)?shù)。

☆編制內(nèi)容參照測(cè)量表的關(guān)鍵是預(yù)先制定一個(gè)判斷應(yīng)試者是否已掌握某種內(nèi)容或技能的熟練程度的標(biāo)準(zhǔn)。這種標(biāo)準(zhǔn)可以通過掌握分?jǐn)?shù)和正確百分?jǐn)?shù)來表示。掌握分?jǐn)?shù)，最簡(jiǎn)單的掌握分?jǐn)?shù)的標(biāo)準(zhǔn)是定一個(gè)判別應(yīng)試者是否通過或掌握的最低分?jǐn)?shù)正確百分?jǐn)?shù)，表明被試在測(cè)驗(yàn)中答對(duì)題目的比例。

二、結(jié)果參照分?jǐn)?shù)的解釋

◎結(jié)果參照分?jǐn)?shù)：是將效標(biāo)材料直接結(jié)合到測(cè)驗(yàn)結(jié)果的解釋過程而進(jìn)行評(píng)價(jià)的分?jǐn)?shù)。預(yù)測(cè)性測(cè)驗(yàn)往往適合用結(jié)果參照分?jǐn)?shù)進(jìn)行解釋。

第七章人事測(cè)量的關(guān)鍵技術(shù)：信度

第一節(jié)人事測(cè)量的可靠性—信度

一、信度的定義

1.◇信度主要是指測(cè)量結(jié)果的可靠性或一致性。

2.系統(tǒng)誤差：量具本身有誤差，這種誤差是必然的，但卻是有規(guī)律的。隨機(jī)誤差：每一次測(cè)量都可能有操作上的差異，或者由于不可預(yù)見的外界因素的影響，從而造成誤差，這些誤差也是難免的，但卻是毫無規(guī)律的。

二、信度的作用

1.◎信度系數(shù)：信度高低的指標(biāo)通常以相關(guān)系數(shù)表示，稱為信度系數(shù)。信度系數(shù)一般是同一樣本所得的兩組資料的相關(guān)，在理論上表示為實(shí)得分?jǐn)?shù)與真實(shí)分?jǐn)?shù)相關(guān)的平方。rxx=rxr2=ST2/SX2，其中rxr=ST/SX有時(shí)也稱為信度指數(shù)，它是真實(shí)分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比率。信度系數(shù)的分布是從0.00～1.00的正數(shù)范圍。

2.◇一般來說，當(dāng)rxx 0.70時(shí)，不能用測(cè)驗(yàn)對(duì)個(gè)人作評(píng)價(jià)，也不能在團(tuán)體間作比較；當(dāng)rxx 0.70時(shí)，可用于團(tuán)體間比較；rxx 0.85時(shí)，可用于鑒別個(gè)人。rxx指信度。

第二節(jié)如何評(píng)估人事測(cè)量的信度

一、重測(cè)信度

1.◎重測(cè)信度又稱為穩(wěn)定性系數(shù)，它的計(jì)量方法是采用重測(cè)法：用同一測(cè)驗(yàn)，在不同時(shí)間對(duì)同一群體施測(cè)兩次，這兩次測(cè)量分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。

重測(cè)信度所考察的誤差來源是時(shí)間的變化所帶來的隨機(jī)影響。在評(píng)估重測(cè)信度時(shí)，必須注意重測(cè)間隔的時(shí)間。對(duì)于人格測(cè)驗(yàn)，重測(cè)間隔在兩周到6個(gè)月之間比較合適。

☆在進(jìn)行重測(cè)信度的評(píng)估時(shí)，還應(yīng)注意以下兩個(gè)重要問題：⑴重測(cè)信度一般只反映由隨機(jī)因素導(dǎo)致的變化，而不反映被試行為的長(zhǎng)久變化。⑵不同的行為受隨機(jī)誤差影響不同。

二、復(fù)本信度

1.◎復(fù)本信度又稱等值性系數(shù)，它是以兩個(gè)測(cè)驗(yàn)復(fù)本來測(cè)量同一群體，然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。復(fù)本信度的高低反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。

2.◇計(jì)算復(fù)本信度的主要目的在于考察兩個(gè)測(cè)驗(yàn)復(fù)本的題目取樣或內(nèi)容取樣是否等值。復(fù)本信度也考慮兩個(gè)復(fù)本實(shí)施的時(shí)間間隔。

3.☆復(fù)本信度的主要優(yōu)點(diǎn)在于：⑴能夠避免重測(cè)信度的一些問題，如記憶效果、練習(xí)效應(yīng)等；⑵適用于進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響；⑶減少了輔導(dǎo)或作弊的可能性?！顝?fù)本信度的局限性在于：⑴如果測(cè)量的行為易受練習(xí)的影響，則復(fù)本信度只能減少而不能消除這種影響；⑵有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變；⑶有些測(cè)驗(yàn)很難找到合適的復(fù)本。

三、內(nèi)部一致性信度

1.◎內(nèi)部一致性信度系數(shù)主要反映的是測(cè)驗(yàn)內(nèi)部題目之間的關(guān)系，考察測(cè)驗(yàn)的各個(gè)題目是否測(cè)量了相同的內(nèi)容或特質(zhì)。內(nèi)部一致性信度又分為分半信度和同質(zhì)性信度。

2.分半信度系數(shù)是通過將測(cè)驗(yàn)分成兩半，計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。測(cè)驗(yàn)愈長(zhǎng)，信度系數(shù)愈高。同質(zhì)性信度是指測(cè)驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。同質(zhì)性信度低時(shí)，即使各個(gè)測(cè)試題看起來似乎是測(cè)量同一特質(zhì)，但測(cè)驗(yàn)實(shí)際上是異質(zhì)的，即測(cè)驗(yàn)測(cè)量了不止一種特質(zhì)。同質(zhì)性分析與項(xiàng)目分析中的內(nèi)部一致性分析相類似。

四、評(píng)分者信度

1.◎評(píng)分者信度：是指不同評(píng)分者對(duì)同樣對(duì)象進(jìn)行評(píng)定時(shí)的一致性。最簡(jiǎn)單的估計(jì)方法就是隨機(jī)抽取若干份答卷，由兩個(gè)獨(dú)立的評(píng)分者打分，再求每份答卷兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法，也可以采用斯皮爾曼等級(jí)相關(guān)方法。

2.如果評(píng)分者在三人以上，而且又采用等級(jí)記分時(shí)，就需要用肯德爾和諧系數(shù)來求評(píng)分者信度。

3.信度估計(jì)方法及其與測(cè)驗(yàn)復(fù)本和施測(cè)次數(shù)的關(guān)系：

所需次數(shù)

所需復(fù)本數(shù)

分半信度，同質(zhì)性信度

復(fù)本信度（連續(xù)施測(cè)）

重測(cè)信度

重測(cè)復(fù)本信度

4.各種信度系數(shù)相應(yīng)的誤差來源（這里都是隨機(jī)誤差）：

信度系數(shù)類型

誤差方差來源

重測(cè)信度

復(fù)本信度（連續(xù)施測(cè)）

重測(cè)復(fù)本信度

分半信度

同質(zhì)性信度

評(píng)分者信度

時(shí)間取樣

內(nèi)容取樣

時(shí)間取樣和內(nèi)容取樣

內(nèi)容取樣

內(nèi)容的異質(zhì)性

評(píng)分者間差異

第三節(jié)影響信度的因素

對(duì)測(cè)驗(yàn)的信度造成影響的因素主要有：樣本團(tuán)體的性質(zhì)、測(cè)驗(yàn)的長(zhǎng)度、測(cè)驗(yàn)難度。

一、樣本團(tuán)體的性質(zhì)對(duì)信度的影響主要有以下三個(gè)方面：⑴樣本團(tuán)體的分?jǐn)?shù)分布。分?jǐn)?shù)分布越廣，信度系數(shù)就相對(duì)越高，分?jǐn)?shù)分布越窄，信度系數(shù)就會(huì)越低。⑵樣本團(tuán)體的異質(zhì)性。信度系數(shù)還會(huì)受到樣本團(tuán)體異質(zhì)性的影響。一般來說，取樣團(tuán)體的異質(zhì)性越大，信度系數(shù)就相對(duì)越高。⑶不同團(tuán)體間能力水平的差異。

二、測(cè)驗(yàn)長(zhǎng)度對(duì)信度的影響：信度還會(huì)受測(cè)驗(yàn)長(zhǎng)度的影響。一般來說，測(cè)驗(yàn)越長(zhǎng)，信度值越高。一方面，測(cè)驗(yàn)越長(zhǎng)，題目取樣或內(nèi)容取樣就越充分，結(jié)果就越可靠。另一方面，較長(zhǎng)的測(cè)驗(yàn)也不容易受到猜測(cè)的影響。

三、測(cè)驗(yàn)的難度。只有當(dāng)測(cè)驗(yàn)的難度水平能夠使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大時(shí)，測(cè)驗(yàn)的信度才會(huì)比較理想。測(cè)驗(yàn)的長(zhǎng)度和難度會(huì)共同起作用。

第八章人事測(cè)量的關(guān)鍵技術(shù)：效度

第一節(jié)人事測(cè)量的有效性

一、◇測(cè)量的效度就是指測(cè)量的有效性，即能測(cè)量到所要測(cè)量的目標(biāo)的程度。

二、◎效度的理論定義：從測(cè)量理論角度講，效度可以定義為：與測(cè)量目標(biāo)有關(guān)的真實(shí)分?jǐn)?shù)方差與總分方差的比率?！坝嘘P(guān)真實(shí)分?jǐn)?shù)方差”是由測(cè)驗(yàn)所要測(cè)量的目標(biāo)變量所產(chǎn)生的方差。效度的定義用公式可以表示為：rXY=SV2/SX2，其中rXY為測(cè)驗(yàn)效度；SV2為有效方差；SX2為總方差。

二、★☆信度和效度的關(guān)系：信度主要是指測(cè)量結(jié)果的可靠性或一致性。效度指測(cè)量的有效性，即能測(cè)量到所要測(cè)量的目標(biāo)的程度。差別在于：考慮的誤差不同。①信度考慮的是隨機(jī)誤差的影響；②效度的誤差則還包括對(duì)測(cè)驗(yàn)?zāi)康膩碚f無關(guān)的變量所引起的系統(tǒng)誤差。誤差方差低（即信度高）并不保證效度就一定高；但效度高的話，信度必然要高。信度是效度的必要條件。

三、效度的性質(zhì)。效度是連續(xù)性的，效度高低只是程度上的差別，它不是“全有”或“全無”的變量。我們應(yīng)避免評(píng)價(jià)某一測(cè)驗(yàn)的結(jié)果為“有效”或“無效”，而應(yīng)區(qū)分效度較高或較低。

第二節(jié)如何評(píng)估人事測(cè)量的效度

根據(jù)評(píng)估效度方法的不同，效度可以分為內(nèi)容效度、構(gòu)想效度和效標(biāo)關(guān)聯(lián)效度這三類。

一、內(nèi)容效度

1.◎內(nèi)容效度：是檢查測(cè)驗(yàn)內(nèi)容是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣的指標(biāo)。例如，成就測(cè)驗(yàn)往往采用內(nèi)容效度的評(píng)估方法。

2.☆內(nèi)容效度分析時(shí)要注意兩方面的問題：⑴應(yīng)避免將測(cè)驗(yàn)取樣的行為領(lǐng)域過于泛化。⑵要注意測(cè)驗(yàn)分?jǐn)?shù)種無關(guān)因素的影響。

3.內(nèi)容效度的確定一般沒有可用的數(shù)量化指標(biāo)，只能靠推理和判斷來進(jìn)行評(píng)估?！蟆糨^好的內(nèi)容效度依賴于兩個(gè)條件：⑴測(cè)驗(yàn)內(nèi)容范圍明確。⑵測(cè)驗(yàn)內(nèi)容的取樣有代表性。

4.內(nèi)容效度最適合于評(píng)估教育和職業(yè)成就測(cè)驗(yàn)?！笮?biāo)參照測(cè)驗(yàn)應(yīng)用的基本條件是具備足夠的內(nèi)容效度。

二、效標(biāo)關(guān)聯(lián)效度

1.◎效標(biāo)關(guān)聯(lián)效度：又稱為效標(biāo)效度，反映的是測(cè)驗(yàn)分?jǐn)?shù)與外在標(biāo)準(zhǔn)（效標(biāo)）的相關(guān)程度，即測(cè)驗(yàn)分?jǐn)?shù)對(duì)個(gè)體的效標(biāo)行為表現(xiàn)進(jìn)行預(yù)測(cè)的有效性程度。

2.◇效標(biāo)是考察測(cè)驗(yàn)效用的外在參照標(biāo)準(zhǔn)。

3.◎預(yù)測(cè)效度的效標(biāo)資料往往是測(cè)量結(jié)束后隔一段時(shí)間才獲得，它反映的是由測(cè)驗(yàn)分?jǐn)?shù)對(duì)任一段時(shí)間間隔后被試行為表現(xiàn)的預(yù)測(cè)程度。預(yù)測(cè)效度適用于那些對(duì)人員進(jìn)行選拔、分類和安置的人事測(cè)驗(yàn)，這些測(cè)驗(yàn)需要對(duì)應(yīng)試者將來的工作績(jī)效進(jìn)行可靠的預(yù)測(cè)。

4.◇同時(shí)效度的效標(biāo)材料可以和測(cè)驗(yàn)分?jǐn)?shù)差不多同時(shí)搜集。

5.要測(cè)量效標(biāo)，就必須把效標(biāo)行為轉(zhuǎn)化為某種可以操作的測(cè)量指標(biāo)，以便進(jìn)行比較。這種操作的測(cè)量指標(biāo)就稱為效標(biāo)測(cè)量◎。效標(biāo)的概念可以細(xì)分為觀念效標(biāo)（即效標(biāo)的實(shí)質(zhì)概念內(nèi)容）和效標(biāo)測(cè)量（效標(biāo)的具體度量方法）。

6.◇效標(biāo)污染是指由于評(píng)定者知道測(cè)驗(yàn)分?jǐn)?shù)而影響個(gè)人的效標(biāo)成績(jī)的情形。

7.常用的效標(biāo)包括：學(xué)術(shù)成就、特殊訓(xùn)練成績(jī)、實(shí)際工作表現(xiàn)、團(tuán)體對(duì)照、等級(jí)評(píng)定、先前有效的測(cè)驗(yàn)。

8.評(píng)定可以作為任何測(cè)驗(yàn)的效標(biāo)，尤其適合人格測(cè)驗(yàn)。

三、構(gòu)想效度

◎構(gòu)想效度：是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度。所謂構(gòu)想通常指一些抽象的、假設(shè)性的概念或特質(zhì)，如智力、創(chuàng)造力、言語流暢性、焦慮等。

關(guān)于2005年10月“人事測(cè)量”串講資料（北大心理系）（二）文章

2005年10月“人事測(cè)量”串講資料（北大心理系）（二）

相關(guān)閱讀

熱門標(biāo)簽

關(guān)于2005年10月“人事測(cè)量”串講資料（北大心理系）（二）文章

熱門文章