07年4月北大版“心理測(cè)量”串講資料(3)

  • 發(fā)布時(shí)間:2024-09-15 16:21:23
  • 來(lái)源:本站整理
  • 閱讀:
導(dǎo)讀:
  第三節(jié) 效度的表示方法及應(yīng)用
  一、 效度的表示方法
  1、 相關(guān)法:效度系數(shù)是最常用的效度指標(biāo),尤其是效標(biāo)效度。它是以皮爾遜積差相關(guān)系數(shù)來(lái)表示的,主要反映測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)。當(dāng)測(cè)驗(yàn)成績(jī)是連續(xù)變量,而效標(biāo)資料是二分變量時(shí),計(jì)算效度系數(shù)可用點(diǎn)二列相關(guān)公式或二列相關(guān)公式;當(dāng)測(cè)驗(yàn)分?jǐn)?shù)為連續(xù)變量,效

一、 效度的表示方法

1、 相關(guān)法:效度系數(shù)是最常用的效度指標(biāo),尤其是效標(biāo)效度。它是以皮爾遜積差相關(guān)系數(shù)來(lái)表示的,主要反映測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)。當(dāng)測(cè)驗(yàn)成績(jī)是連續(xù)變量,而效標(biāo)資料是二分變量時(shí),計(jì)算效度系數(shù)可用點(diǎn)二列相關(guān)公式或二列相關(guān)公式;當(dāng)測(cè)驗(yàn)分?jǐn)?shù)為連續(xù)變量,效標(biāo)資料為等級(jí)評(píng)定時(shí),可用賈斯朋多系列相關(guān)公式計(jì)算。

2、 區(qū)分法:是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。算出t值后,便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著,說(shuō)明該測(cè)驗(yàn)?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團(tuán)體,否則,測(cè)驗(yàn)是無(wú)效的。重疊百分比可以通過(guò)計(jì)算每一組內(nèi)得分超過(guò)(或低于)另一組平均數(shù)的人數(shù)百分比得出;另外,還可以計(jì)算兩組分布的共同區(qū)的百分比。重疊量越大,說(shuō)明兩組分?jǐn)?shù)差異越小,即測(cè)驗(yàn)的效度越差。

3、 命中率法:是當(dāng)測(cè)驗(yàn)用來(lái)做取舍的依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。命中率的計(jì)算有兩種方法,一是計(jì)算總命中率,另一種是計(jì)算正命中率。

4、 預(yù)期表法:是一種雙向表格,預(yù)測(cè)分?jǐn)?shù)排在表的左邊,效標(biāo)排在表的頂端。從左下至右上對(duì)角線上各百分?jǐn)?shù)字越大,而其它的百分?jǐn)?shù)字越小,表示測(cè)驗(yàn)的效標(biāo)效度越高 ;反之,數(shù)字越分散,則效度越低。

二、 效度的應(yīng)用

1、 預(yù)測(cè)誤差:效度系數(shù)的平方,統(tǒng)計(jì)學(xué)上稱這種指標(biāo)為決定系數(shù),表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。另一種表達(dá)方式是估計(jì)的標(biāo)準(zhǔn)誤,簡(jiǎn)寫為Sest,它是指所有具有某一測(cè)驗(yàn)分?jǐn)?shù)的被試其效標(biāo)分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差,也即預(yù)測(cè)誤差大小的估計(jì)值,  (公式4-9)估計(jì)的標(biāo)注誤可如同其他標(biāo)準(zhǔn)誤一樣解釋。真正效標(biāo)分?jǐn)?shù)落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1Sest的范圍內(nèi),有68%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1.96Sest的范圍內(nèi),有95%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±2.58Sest的范圍內(nèi),有99%的可能性。

2、 預(yù)測(cè)效標(biāo)分?jǐn)?shù):如果X與Y兩變量呈直線相關(guān),只要確定出二者間的回歸方程,就可以從一個(gè)變量推估出來(lái)另一個(gè)變量。在測(cè)驗(yàn)工作中,人們感興趣的是從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)成績(jī)。

3、 預(yù)測(cè)效標(biāo)指數(shù):公式4-9中的 又稱作無(wú)關(guān)系數(shù),以K表示之,K值大小表明預(yù)測(cè)源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無(wú)關(guān)的程度。(1-K)可作為預(yù)測(cè)效率的指數(shù),用E表示:E=100(1-K)  (公式4-15)E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。

第四節(jié) 影響效度的因素

一、 測(cè)驗(yàn)本身的因素

1、 測(cè)驗(yàn)題目的質(zhì)量

2、 測(cè)驗(yàn)的長(zhǎng)度。(一般而言,增加測(cè)驗(yàn)的長(zhǎng)度通??梢蕴岣邷y(cè)驗(yàn)的信度,而信度又制約著效度,因此增加測(cè)驗(yàn)的長(zhǎng)度也能提高測(cè)驗(yàn)的效度。)

二、測(cè)驗(yàn)實(shí)施中的干擾因素

1、主試的影響因素。測(cè)驗(yàn)實(shí)施過(guò)程中主試的因素會(huì)影響效度。對(duì)于效標(biāo)效度,測(cè)驗(yàn)與效標(biāo)二者實(shí)施時(shí)間間隔時(shí)間越長(zhǎng),測(cè)驗(yàn)與效標(biāo)越容易受到很多機(jī)遇因素的影響,因此所求的相關(guān)必然很低。測(cè)驗(yàn)情鏡,如場(chǎng)地的布置、材料的準(zhǔn)備、測(cè)驗(yàn)場(chǎng)所有無(wú)噪音和其他干擾因素等也會(huì)影響到測(cè)驗(yàn)的效度。

2、被試的影響因素。被試在測(cè)驗(yàn)時(shí)的興趣、動(dòng)機(jī)、情緒、態(tài)度和身心狀況、健康狀態(tài)等都會(huì)影響測(cè)驗(yàn)的效度。(被試的反應(yīng)定勢(shì)也會(huì)降低測(cè)驗(yàn)的效度。)

三、樣本團(tuán)體的性質(zhì)

1、樣本團(tuán)體的異質(zhì)性。與信度系數(shù)一樣,如果其它條件相同,樣本團(tuán)體越同質(zhì),分?jǐn)?shù)分布范圍越小,測(cè)驗(yàn)效度就越低;樣本團(tuán)體越異質(zhì),分?jǐn)?shù)分布范圍越大測(cè)驗(yàn)效度就越高。(1)只以選拔上的被試為樣本團(tuán)體參加效度研究,降低了測(cè)驗(yàn)的效度。(2)選拔標(biāo)準(zhǔn)太高,樣本團(tuán)體的同質(zhì)性增高,降低了測(cè)驗(yàn)的效度。

2、干涉變量。樣本團(tuán)體的性質(zhì)對(duì)效度的影響還表現(xiàn)在:對(duì)于同性質(zhì)的團(tuán)體,同一測(cè)驗(yàn)的效度會(huì)有很大的不同。這些樣本團(tuán)體的特質(zhì)包括:年齡、性別、教育水平、智力、動(dòng)機(jī)、職業(yè)和任何有關(guān)的特征。由于這寫特征的影響,使得測(cè)驗(yàn)對(duì)于不同的團(tuán)體具有不同的預(yù)測(cè)能力,故測(cè)量學(xué)上稱這些特征為干涉變量。

吉賽利提出的如何找出干涉變量的一套方法:

①用回歸方程求得每個(gè)人的預(yù)測(cè)效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實(shí)際效標(biāo)分?jǐn)?shù)想比較,獲得差異分?jǐn)?shù)D.如果D的絕對(duì)值很大,說(shuō)明測(cè)驗(yàn)中可能存在干涉變量。

②根據(jù)樣本團(tuán)體的組成分析,找出對(duì)照組,分別計(jì)算效度,從而象上述關(guān)于出租汽車司機(jī)的例子一樣,找出干涉變量。

③對(duì)于欲測(cè)團(tuán)體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測(cè)性高和預(yù)測(cè)性低的兩個(gè)亞團(tuán)體。對(duì)于預(yù)測(cè)性高的團(tuán)體,獲得的測(cè)驗(yàn)效度會(huì)有所提高。

三、 效標(biāo)的性質(zhì)

(1) 效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)之間的關(guān)系是否線性關(guān)系是一個(gè)很重要的因素。皮爾遜劑差相關(guān)系數(shù)的前題是假設(shè)兩個(gè)變量的關(guān)系是線性的分布。

(2) 效標(biāo)測(cè)量本身的可靠性如何亦是值得考慮的一個(gè)問題。

第五章 項(xiàng)目分析

一般來(lái)說(shuō),測(cè)驗(yàn)的項(xiàng)目分析包括定性分析和定量分析兩個(gè)方面。

第一節(jié) 難度分析

難度是指項(xiàng)目的難易程度。在能力測(cè)驗(yàn)中通常需要一個(gè)反映難度水平的指標(biāo),在非能力測(cè)驗(yàn)(人格測(cè)驗(yàn))中,類似的指標(biāo)是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該題的人數(shù)。(名詞解釋)

一、 難度的指標(biāo): 難度的指標(biāo)通常以通過(guò)率表示,即以答對(duì)或通過(guò)該題的人數(shù)百分比來(lái)表示。

(公式5-1)

二、難度的計(jì)算

1、二分法記分的項(xiàng)目:心理測(cè)驗(yàn)的項(xiàng)目大多為選擇題,通過(guò)記1分,不通過(guò)記0分。當(dāng)被試人數(shù)較多時(shí),可根據(jù)測(cè)驗(yàn)總成績(jī)將被試分為三組:分?jǐn)?shù)最高的27%被試為高分組( ),分?jǐn)?shù)最低的27%被試為低分組( )中間46%的被試為中間組。分別計(jì)算高分組和低分組的通過(guò)率,以兩組通過(guò)率的平均值作為每一題的難度。

由于選擇題允許猜測(cè),所以通過(guò)率可能因機(jī)遇作用而變大。備選答案的數(shù)目越少,機(jī)遇的作用越大,越不能真正反映測(cè)驗(yàn)的難度。為此,吉爾福特提出了一個(gè)P值校正公式。

例題:假定某題有75%的被試通過(guò),若該題有5個(gè)備選答案,則校正后的通過(guò)率為:

(當(dāng)有4個(gè)備選答案時(shí),CP=0.67;有3個(gè),CP=0.63;有2個(gè),CP=0.54)

2、非二分記分的項(xiàng)目:如果人為地明確通過(guò)每一題的分?jǐn)?shù)線,也可以用公式5-2計(jì)算難度。但此種方法的缺點(diǎn)在于,采用不同的分?jǐn)?shù)線會(huì)得到不同的難度值,因此不常用。

三、難度水平的確定

1、項(xiàng)目難度的確定:進(jìn)行難度分析的主要目的是為了篩選項(xiàng)目,項(xiàng)目的難度多高合適,取決于測(cè)驗(yàn)的目的、性質(zhì)以及項(xiàng)目的形式。為了使測(cè)驗(yàn)具有更大的區(qū)別力,應(yīng)選擇難度在0.50左右的試題比較合適。但是在實(shí)際各種中并得非如此簡(jiǎn)單。在選擇題目時(shí),最好使試題的平均難度接近0.50,而各題難度在0.50 0.20之間。當(dāng)測(cè)驗(yàn)用于選拔或診斷時(shí),應(yīng)該比較多地選擇難度值接近錄取率的項(xiàng)目。對(duì)于選擇題來(lái)說(shuō),P值一般應(yīng)大于概率水平。

2、測(cè)驗(yàn)難度的確定:測(cè)驗(yàn)的難度直接依賴于組成測(cè)驗(yàn)的項(xiàng)目的難度。通過(guò)考察測(cè)驗(yàn)分?jǐn)?shù)的分布,可以對(duì)測(cè)驗(yàn)的難度做出直觀檢驗(yàn)。

第二節(jié) 項(xiàng)目的區(qū)分度

一、 項(xiàng)目區(qū)分度的概念:也叫鑒別力,是指測(cè)驗(yàn)項(xiàng)目對(duì)被試的心理特性的區(qū)分能力。(名詞解釋)

二、項(xiàng)目區(qū)分度的估計(jì)方法

1、鑒別指數(shù):首先分別計(jì)算高分組與低分組在該項(xiàng)目上的通過(guò)率,然后用高分組在該項(xiàng)目上的通過(guò)率減去低分組在該項(xiàng)目上的通過(guò)率。  (公式  5-7) 項(xiàng)目鑒別指數(shù)與評(píng)價(jià)標(biāo)準(zhǔn)

鑒別指數(shù)  項(xiàng)目評(píng)價(jià)

0.40以上  很好

0.30-0.39  良好,修改后會(huì)更佳

0.20-0.29  尚可,但需修改

0.19以下  差,必須淘汰

2、相關(guān)系數(shù):①點(diǎn)二列相關(guān):適用于一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對(duì)變量的相關(guān)計(jì)算。

②二列相關(guān):適用于兩個(gè)連續(xù)變量,但其中一個(gè)變量被人為分成兩類。

③ 相關(guān):適用于兩個(gè)變量均為二分稱名變量。

3、 區(qū)分度與難度的關(guān)系

(1) 假如樣本中通過(guò)某一項(xiàng)目的人數(shù)比率為1.00或0,說(shuō)明高分組與低分組在通過(guò)率上不存在差異,因此D為0;假如項(xiàng)目的通過(guò)率為0.50,則可能是高分組的所有人都通過(guò)了,而低分組卻無(wú)人通過(guò),這樣D的最大值可能達(dá)到1.00.

(2) 為了使整個(gè)測(cè)驗(yàn)項(xiàng)目的潛在區(qū)分度最大,似乎應(yīng)該使每個(gè)項(xiàng)目的難度處于0.50水平,但事實(shí)并非如此簡(jiǎn)單。如果每一個(gè)項(xiàng)目的難度均處于0.50,由于項(xiàng)目難度相同,有可能大多趨向于有關(guān)的內(nèi)容或技能,結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端情況下,有可能50%的被試全部通過(guò)各項(xiàng)目得滿分,另外50%的被試全部為0分,形成U形分布,這樣反而降低總分的區(qū)分能力。如果測(cè)驗(yàn)的所有項(xiàng)目都是中等難度,只有項(xiàng)目的內(nèi)在相關(guān)為0時(shí),整個(gè)測(cè)驗(yàn)才能產(chǎn)生常態(tài)分布??紤]到一般測(cè)驗(yàn)項(xiàng)目之間具有某種程度的相關(guān)難度的分布要廣一些,梯度多一些,是合乎需要的。

第三節(jié) 項(xiàng)目分析的特殊問題

1、 項(xiàng)目特征曲線:是項(xiàng)目特征函數(shù)或項(xiàng)目反應(yīng)函數(shù)的圖解形式,它反映了被試對(duì)某一測(cè)驗(yàn)項(xiàng)目的正確反應(yīng)概率與該項(xiàng)目所對(duì)應(yīng)的能力或特質(zhì)的水平之間的一種函數(shù)關(guān)系。

(1)項(xiàng)目特征曲線可圖解測(cè)驗(yàn)的鑒別力,項(xiàng)目鑒別力的高低主要在于其曲線的傾斜度,曲線坡度越陡,鑒別能力越好,預(yù)測(cè)的誤差越小。

(2)項(xiàng)目特征曲線可以圖解項(xiàng)目難度。

(3)項(xiàng)目特征曲線還可以圖解選擇題的誘答反應(yīng)。(簡(jiǎn)答、名詞解釋)

相關(guān)閱讀

熱門標(biāo)簽

關(guān)于07年4月北大版“心理測(cè)量”串講資料(3)文章

2021年自學(xué)考試報(bào)考入口 2021年自學(xué)考試報(bào)考入口

熱門文章