Rzetelność i trafność – kontynuacja

Jeśli treść testu została skrupulatnie zbadana w celu upewnienia się, że istnieje ścisły związek pomiędzy nią a tym, co mamy mierzyć, wówczas trafność testu może wynikać z jego logiki bez odwoływania się do kryterium zewnętrznego. Trafność taka nazywa się trafnością wewnętrzną i można posługiwać się nią dla scharakteryzowania testów wiadomości i umiejętności, takich jak testy matematyczne i gramatyczne, gdzie jest rzeczą jasną, jaki materiał trzeba sprawdzić. W tym przypadku wymaga się jedynie rzetelności, zaś o trafności wnioskuje się na podstawie treści testu. (Nasz przykład z testem poczucia humoru wykazuje, że należy tu zachować ostrożność: test zestawiony wyłącznie z dowcipów może nie być dobrym testem humoru). Jeśli nawet kryterium samo nie jest zbyt dobre, może jednak służyć jako kontrola treści. Chociaż nauczyciele nie potrafią sami ściśle ocenić inteligencji swoich uczniów, to wiedzą mniej więcej, którzy z nich są tępi, a którzy zdolni. Test inteligencji musi wykazywać przynajmniej pewną zgodność z tymi ocenami, a na podstawie swoich własnych treści może wprowadzić miarę, która będzie bardziej trafna niż oceny nauczyciela, używane jako początkowy sprawdzian trafności tego testu. Ulepszony zegar można by byio sprawdzić, porównując go z klepsydrą i wykazując, że mierzy on to samo co klepsydra, lecz mierzy to konsekwentniej niż dwie klepsydry (poprawa polega tu na większej rzetelności: słaba byłaby definicja „jednej godziny”, na której opiera się trafność, gdyby oprócz klepsydry nie było nic, co by mogło posłużyć dó jej określenia!). Wewnętrzna konsekwencja przy odpowiedniej treści wiąże się zarówno z rzetelnością, jak i z trafnością.

Ostatni rodzaj trafności, trafność teoretyczną ustala się za pośrednictwem bardziej złożonego procesu wnioskowania. Test można zastosować w odniesieniu do jakiejś hipotezy. Poprzednio zetknęliśmy się z testem lęku użytym w związku z badaniem uczenia się (s. 488). Hipoteza mogłaby brzmieć (mniej więcej tak: „Jeśli jest to miara lęku, a lęk działa jako popęd, to u osób, które uzyskują wysokie wyniki w tym teście, powinien wystąpić w danej liczbie prób wyższy procent warunkowych reakcji mrugania niż u osób, które uzyskują niskie wyniki”. Eksperyment stanowi pośredni sprawdzian słuszności wchodzących w grę zasad psychologicznych i pozwala na interpretację wyników osiąganych w tym teście jako miary lęku.

Cronbach, który wyróżnia te cztery rodzaje trafności, podaje w swej pracy (Cronbach, 1960, s. 106) wyczerpujące ich omówienie. Gdy współczynniki rzetelności i trafności testów są dostatecznie wysokie, wiemy,’ że testy są odpowiednie: pozostaje jeszcze wówczas problem używania tych testów w celach prognostycznych.

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>