Przede wszystkim musimy przeprowadzić rozróżnienie między p o- pulacją a próbką pobraną z populacji. Biuro Spisu Ludności St. Zjednoczonych stara się dotrzeć do każdego mieszkańca Stanów i opisać całą populację ludności, zbierając materiał opisowy dotyczący wieku, stanu cywilnego itd. Słowo „populacja” jest tu właściwe, ponieważ spis obejmuje wszystkich ludzi mieszkających w Stanach Zjednoczonych.
Słowo „populacja” w statystyce stosuje się nie tylko w odniesieniu do ludzi, zwierząt lub rzeczy. „Populacją” mogą być wszystkie temperatury zarejestrowane przez termometr, wszystkie słowa w języku angielskim lub każdy inny zbiór danych 4. Zwykle nie mamy dostępu do całej populacji i staramy się, by reprezentowała ją próbka pobrana w pewien przypadkowy (nietendencyjny) sposób. Możemy zadawać pytania ludziom wybranym losowo z całego społeczeństwa, tak jak to czyni Biuro Spisu Ludności, możemy obliczać średnie temperatury,
Czasami zbiorowość danych (populacja całkowita) nie jest łatwa do określenia, np. wtedy, gdy pobieramy próbkę szybkości reakcji osoby badanej, przeprowadzając 100 pomiarów spośród tych wszystkich, które można by otrzymać, gdyby kontynuować eksperyment w nieskończoność. Jeśli ogólny zbiór danych (czy to skończony., np. wszyscy studenci uczący się łaciny na uczelni X, czy też nieograniczony, jak w przypadku wszystkich możliwych czasów reakcji) jest kilka razy większy od próbki, możemy przy doborze wyników stosować statystyczną teorię pobierania próbek (przyp aut.) odczytując wskazania termometru w określonych porach, a nie stosując zapisu ciągłego: możemy oszacować liczbą słów w encyklopedii, licząc słowa na szeregu przypadkowo wybranych stronach. Wszystkie te przykłady reprezentują dobór próbki z większej populacji. Jeśli powtórzymy którąś z tych procedur, otrzymamy wyniki nieco odmienne, co wyjaśnia się tym, że próbka nie reprezentuje w pełni całej populacji. Jest to tzw. błąd próbki, który stanowi jeden z przedmiotów rozważań statystycznych.
Leave a reply