08年自考“人事測量”串講——人事測量的關(guān)鍵技術(shù):信度

  • 發(fā)布時(shí)間:2024-09-15 16:21:23
  • 來源:本站整理
  • 閱讀:
導(dǎo)讀:
  信度是標(biāo)準(zhǔn)化人事測量的基本要求之一。
  一、人事測量的可靠性——信度
 ?。ㄒ唬┬哦鹊亩x
  1、信度主要是指測量結(jié)果的可靠性或一致性。
  2、卡尺作為一種量具是有一定精度限制的,也就是說,量具本身有誤差,這種誤差是必然的,但卻是有規(guī)律的。這種誤差叫做系統(tǒng)誤差。
  3、我們每一次測量都可能有操作

1、信度主要是指測量結(jié)果的可靠性或一致性。

2、卡尺作為一種量具是有一定精度限制的,也就是說,量具本身有誤差,這種誤差是必然的,但卻是有規(guī)律的。這種誤差叫做系統(tǒng)誤差。

3、我們每一次測量都可能有操作上的差異,或者由于不可預(yù)見的外界因素的影響,從而造成誤差,這些誤差也是難免的,但卻是毫無規(guī)律的。這種誤差叫做隨機(jī)誤差。

4、在研究信度時(shí),主要應(yīng)考慮兩方面的問題:一方面是穩(wěn)定性問題涉及:

(1)測驗(yàn)分?jǐn)?shù)一致性的程度,即不同時(shí)間、不同測驗(yàn)條件下所得分?jǐn)?shù)之間的一致性有多大;

(2)一個(gè)人的獲得分?jǐn)?shù)與“真實(shí)分?jǐn)?shù)”之間接近程度如何;

(3)測驗(yàn)的測量一致性是否可以達(dá)到實(shí)際應(yīng)用的程度等問題。

另一方面是影響穩(wěn)定性的原因,即分?jǐn)?shù)不穩(wěn)定、不一致的原因:

(1)什么因素造成了這種差異;

(2)這些效應(yīng)的相對作用如何。

(二)信度的作用

1、信度高低指標(biāo)通常以相關(guān)系數(shù)表示,稱為信度系數(shù)。信度系數(shù)一般是同一樣本所得的兩組資料的相關(guān),在理論上表示為實(shí)得分?jǐn)?shù)與真實(shí)分?jǐn)?shù)相關(guān)的平方:rxx=rxr2=ST2/SX2

其中,rxr=ST/SX有時(shí)也稱為信度指數(shù),它是真實(shí)分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比率。

2、誤差的大小與測驗(yàn)的信度有直接關(guān)系:兩次測驗(yàn)分?jǐn)?shù)的差異越大,信度就越低。

3、在人事測量中,對信度系數(shù)進(jìn)行確定通常有以下兩方面的作用:

(1)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)。應(yīng)該注意的是,信度系數(shù)的分布是從0.00~1.00的正數(shù)范圍,代表了從缺乏信度到完全可信的所有狀況。

(2)說明可以接受的信度水準(zhǔn)。一般來說,當(dāng)rxx小于0.70時(shí),不能用測驗(yàn)對個(gè)人做評價(jià),也不能在團(tuán)體間作比較;當(dāng)rxx大于0.70時(shí),可用于團(tuán)體間比較;rxx大于0.85時(shí),可用于鑒別個(gè)人。

二、如何評估人事測量的信度

(一)重測信度

1、重測信度又稱為穩(wěn)定性系數(shù),它的計(jì)量方法是采用重測法:用同一測驗(yàn),在不同時(shí)間對同一群體施測兩次,這兩次測量分?jǐn)?shù)的相關(guān)系數(shù)即為重測系數(shù)。根據(jù)重測相關(guān)系數(shù)的高低,可以得知測量結(jié)果在經(jīng)過一段時(shí)間之后的穩(wěn)定程度。重測信度越高,說明測量的結(jié)果越一致、越可靠。

2、在評估重測間隔的時(shí)間。間隔時(shí)間太短,被試對測試題記憶猶新,必然會造成假性高相關(guān);而間隔時(shí)間太長,測驗(yàn)結(jié)果又會受應(yīng)該者的身心特質(zhì)改變的影響,使相關(guān)系數(shù)降低。重測間隔時(shí)間的長短,必須根據(jù)測驗(yàn)的性質(zhì)和目的來確定。

3、對于人格測驗(yàn),重測間隔在兩周到六個(gè)月之間比較合適。

4、在進(jìn)行重測信度的評估時(shí),還應(yīng)注意以下兩個(gè)重要問題:

(1)重測信度一般只反映由隨機(jī)因素導(dǎo)致的變化,而不反映被試行為的長久變化。

(2)不同的行為受隨機(jī)誤差影響不同。

(二)復(fù)本信度

1、復(fù)本信度又稱等值性系數(shù),它是以兩個(gè)測驗(yàn)復(fù)本來測量同一個(gè)群體,然后求得應(yīng)試者在這兩個(gè)測驗(yàn)上得分的相關(guān)系數(shù)。復(fù)本信度的高代反映了這兩個(gè)測驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測驗(yàn)互為復(fù)本。

2、計(jì)算復(fù)本信度的主要目的在于考察兩個(gè)測驗(yàn)復(fù)本的題目取樣或內(nèi)容取樣是否等值。

3、復(fù)本信度的主要優(yōu)點(diǎn)在于:

(1)能夠避免重測信度的一些問題,如記憶效果、練習(xí)效應(yīng)等;

(2)適用于進(jìn)行長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)成績影響;

(3)減少了輔導(dǎo)或作弊的可能性。

4、復(fù)本信度的缺點(diǎn):

(1)如果測量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能消除這種影響;

(2)有些測驗(yàn)的性質(zhì)會由于重復(fù)而發(fā)生改變,例如某些問題解決型號的測驗(yàn),如果掌握了解題原則,就有可能產(chǎn)生遷移;

(3)有些測驗(yàn)很難找到合適的復(fù)本。

(三)內(nèi)部一致性信度

重測信度和復(fù)本信度分別注重考慮測量跨時(shí)間的一致性和跨形式的一致性,而內(nèi)部一致通過性信度系數(shù)主要反映的是測驗(yàn)內(nèi)部題目之間的關(guān)系,考察測驗(yàn)的各個(gè)題目是否測量了相同的內(nèi)容或特質(zhì)。內(nèi)部一致性信度又分為分半信度和同質(zhì)性信度。

1、分半信度

(1)分半信度系數(shù)是通過將測驗(yàn)分成兩半,計(jì)算這兩半測驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。

(2)一般采用奇偶分半的方法,即將測驗(yàn)按奇數(shù)題和偶數(shù)題分成兩半。

2、同質(zhì)性信度

(1)同質(zhì)性是指所有測驗(yàn)題目測量的只是單一特質(zhì)或內(nèi)容,表現(xiàn)為所有測驗(yàn)題目得分的一致性。

(2)同質(zhì)性信度是指測驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。同質(zhì)性也可以作為效度的一種指標(biāo)。

(四)評分者信度

1、評分者的評判也是誤差的來源之一。

2、評分者信度是指不同評分者對同樣對象進(jìn)行評定時(shí)的一致性。

各種信度系數(shù)相應(yīng)的誤差來源

信度系數(shù)類型誤差方差來源重測信度時(shí)間取樣復(fù)本信度(連續(xù)施測)內(nèi)容取樣重測復(fù)本信度時(shí)間和內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)性信度內(nèi)容的異質(zhì)性評分者信度評分者差異

一般情況下,間隔施測的復(fù)本信度值最低;修正后的分半信度值最高。

三、影響信度的因素

對測驗(yàn)的信度造成影響的因素主要有:樣本團(tuán)體的性、測驗(yàn)的長度、測驗(yàn)難度。

1、樣本團(tuán)體的性質(zhì)

樣本團(tuán)體的性質(zhì)對信度的影響主要有以下三個(gè)方面:

(1)樣本團(tuán)體的分?jǐn)?shù)分布。任何以相關(guān)系數(shù)表示的信度系數(shù)都會受樣本團(tuán)體分?jǐn)?shù)頒布的影響。分?jǐn)?shù)分布越廣,信度系數(shù)就相對越高,分?jǐn)?shù)分布越窄,信度系數(shù)就會越低。

(2)樣本團(tuán)體的異質(zhì)性。信度系數(shù)還會受到樣本團(tuán)體異質(zhì)性的影響。一般來說,取樣團(tuán)體的異質(zhì)性越大,信度系數(shù)就相對越高。

(3)不同團(tuán)體間能力水平的差異。測驗(yàn)所施測的團(tuán)體的平均能力水平的不同也會對信度產(chǎn)生影響。例,在斯坦福-比奈量表中,不同年齡組的信度從0.83~0.98不等。

2、測驗(yàn)的長度

一般來說,測驗(yàn)越長,信度值越高。一方面,測驗(yàn)越長,題目取樣或內(nèi)容取樣就越充分,結(jié)果就越可靠。

另一方面,較長的測驗(yàn)也不容易受到猜測的影響。

3、測驗(yàn)的難度

(1)如果一個(gè)測驗(yàn)的難度太低,測驗(yàn)分?jǐn)?shù)會非常集中并聚在高分端,即出現(xiàn)天花板效應(yīng)?;蛘唠y度太大,所有分?jǐn)?shù)都集中在低分端,出現(xiàn)地板效應(yīng)。

(2)當(dāng)所有被試的平均分為測驗(yàn)總分的一半(50%),并且分?jǐn)?shù)從零分到滿分分布時(shí),測量的信度最高。

相關(guān)閱讀