2016年10月18日 星期二

選用常模的規準

常模是解釋測驗分數的依據,它的品質對於測驗的適用性有很大的影響,所以應該列入選用測驗的條件。
測驗指導手冊或測驗編製報告中有關常模的介紹通常會包括:(1)抽樣方法,(2)常模樣本的人數分配,(3)常模樣本特徵的描述,(4)施測的標準條件與測驗過程中動機的維持 (5)測驗日期。使用者閱讀後可以依據下列規準來判斷常模的適當性。

1. 常模樣本的代表性

代表性(Representativeness)是指建立常模的受測樣本在人口學上的特徵(如年齡、性別、種族、社經地位、地區、學校類型等)必須與母群體相吻合,且人數也要夠多,使抽樣誤差降低到可接受範圍。
由於完全的代表性只是一種理想,在實際取樣時,並不能考慮到所有的人口學變項,所以通常依據以往研究文獻判斷哪些人口學變項會影響到所測量的心理特質,再將那些變項納入取樣設計中即可。在理論上,若能取得近幾年人口普查的資料,再依據其人口結構及相關變項(如年齡、性別、社經地位、種族、居住地區等)進行分層隨機取樣(stratified random sampling),會最有代表性;但實務上,會因為受測機構的合作程度及發行機構的人力、經費預算等因素,使得取樣方式變成分層群聚取樣(stratified cluster sampling),亦即不隨機抽取個人而是整班施測;更糟糕的可能會變成是省時省力,但代表性卻最差的便利取樣(convenience sampling)。
依據統計學原理,樣本越大,則抽樣誤差越小,求得的統計量(如平均數、標準差等)越接近母群體的統計量。雖然常模樣本是越多越好,但實際上常受施測成本(人力、材料、時間)的限制,不可能太大。但是如果常模分的很細,如每一年齡、每一性別、每一區域,都要分別建立常模,那即使施測成本再高,也得維持每一種常模至少有兩、三百人的基本人數。

2. 時間上的新近性

新近性(Recency) 是指建立常模的年代和實際使用該常模的年代應該越接近越好,現代社會在教育、文化、經濟、價值觀等都變遷迅速,如果使用的常模是十幾年前或是幾十年前的,那其參考價值將令人懷疑。例如以往的研究就發現智力測驗的平均分數有逐年升高的現象;另外,有些態度及人格特質會隨時帶而改變,例如對同性戀的態度,對女性化、現代化的界定等。
如果建立常模的年代和使用常模的年代之間,測驗適用對象的組成有明顯的改變,例如,大量移民、入學制度改變、課程大幅更新等,則應該重新建立常模。此外,當測驗內容有修訂或改變題本形式或作答方式,除非有實證研究證明這些改變並不會影響平均表現,否則也應該重新建立常模。

3. 與使用對象及目的的關聯性

關聯性(Relevance)是指測驗使用者需要依據學生的特徵和測驗目的從各種不同常模中選擇一種最合適的來使用。一般而言,若只是要瞭解學生在團體中的相對地位而已,可以選用具有相同特徵的常模,例如:學生若是三年級女生即可選用三年級女生的常模,或是三年級男女合併的常模。

但是若有特殊的測驗目的,就應該依據測驗目的決定應該比較的對象,再選用常模,例如,若一位三年級的資優生下學期要跳升五年級,想要預測他在五年級學生中的相對地位,哪他就得和四年級,而不是三年級,的學生相比較。再舉個例來說,一個女生做了綜合性向測驗,她就應該和同年齡的女生相比較,以便瞭解自己的性向組型,但是若要預測她日後就讀幾乎都是男生就讀的機械工程系之後,成績會如何,那就需要與使用男生的常模來解釋。

沒有留言: