Wyniki osiągane w testach można wykorzystywać do celów naukowych tylko wtedy, gdy zasługują na zaufanie. W terminologii psychologicznej znaczy to, że muszą one odpowiadać pewnym wymogom rzetelności i trafności. Rzetelność oznacza, że na wynikach można polegać, że przy powtarzaniu testu nie ulegną one, zmianie, że cokolwiek one mierzą, to mierzą w sposób konsekwentny. Poszczególne zadania testu mogą być tak zagmatwane, mylące i niejasne, że wyrażają różne rzeczy dla różnych badanych lub nawet dla tego samego badanego przy powtórnym badaniu. Dlatego też jasność w tym zakresie jest pierwszym warunkiem rzetelności. Testy mogą być również zbyt krótkie na to, aby były rzetelne, lub też sposób określania wyników może nie być obiektywny. Musimy więc zdawać sobie sprawę przede wszystkim z tego, jak dobrą miarą dysponujemy: jeśli przy powtarzaniu pomiarów lub przy obliczaniu wyników przez różne osoby otrzymane rezultaty będą niezgodne, to test nie jest rzetelny. Prostą analogię może stanowić tu gumowa taśma miernicza: nigdy nie byłoby wiadomo, jak silnie ją naciągano podczas pomiaru, rezultaty więc byłyby nierzetelne bez względu na to, jak dokładna byłaby podziałka na taśmie. Potrzebne nam są testy odznaczające się dużą stałością i zgodnością wewnętrzną, jeśli mamy się nimi z zaufaniem posługiwać.
Aby zmierzyć rzetelność, musimy uzyskać dla każdej osoby dwa niezależne od siebie wyniki w tym samym teście. Dokonujemy tego, obliczając osobno wyniki w dwóch połówkach testu, powtarzając test bądź też stosując dwie różne wersje tego samego testu. Następnie możemy porównać oba zbiory wyników. Jeśli wyniki w obu zbiorach za- pytania, jak dobrze można na podstawie tego testu przewidywać. Ta trafność prognostyczna jest najlepiej zrozumiała i najłatwiej można ją określić za pomocą korelacji. Są także inne rodzaje trafności. Trafność testu wiadomości i umiejętności ocenia się, porównując jego wyniki z innymi ocenami takich samych czynności. Jeśli na przykład wyniki testu z odpowiedziami do wyboru, który stanowi część składową egzaminu na wyższej uczelni, korelują wysoko z wynikami wypracowania pisemnego, to nauczyciel ma zaufanie do trafności tego testu (ponieważ zakłada się trafność wypracowania). Trafność tę można nazwać trafnością diagnostyczną wr odróżnieniu od prognostycznej. Trafność często opiera się przede wszystkim na sądach, na przykład na mniemaniu, że egzamin w formie wypracowania pisemnego rzeczywiście oddaje treść kursu lub że diagnoza psychiatry prawidłowo ocenia symptomy występujące u pacjenta. Takie sądy bywają mylne i powstaje pytanie, czy test może mieć większą trafność niż kryterium, na którym się opiera. Odpowiedź brzmi „tak”, lecz trzeba wówczas polegać na innych rodzajach trafności niż trafność prognostyczna lub diagnostyczna.
Leave a reply