przejdź bezpośrednio do treści

Dobór próby w Europejskim Sondażu Społecznym

Próba do polskiej edycji badania Europejski Sondaż Społeczny ma charakter losowy i jest realizowana do wyczerpania. Populacja, z której losowana jest próba, obejmuje osoby w wieku 15 lat lub więcej, mieszkające w Polsce. Poniżej opisano najważniejsze aspekty doboru próby w obecnej, 12. edycji ESS.

DOBÓR PRÓBY W 12. EDYCJI ESS W POLSCE

W dwunastej rundzie badanie realizowane jest za pomocą dwóch technik: (i) wywiadów osobistych, przeprowadzanych przez ankieterów w mieszkaniach wylosowanych osób, oraz (ii) ankiet wypełnianych samodzielnie przez respondentów (ankiet pocztowych i internetowych). Dla obu technik próba losowana jest oddzielnie, przy czym zasady doboru próby są w obu przypadkach zbliżone.

Specyfiką doboru próby w polskiej edycji ESS jest podział populacji ludności Polski na trzy części, w ramach których losowanie przebiega według odmiennych reguł. Pierwszą z nich stanowią osoby mieszkające w miastach liczących co najmniej 80 tys. mieszkańców, drugą – osoby mieszkające w miastach liczących 20 000–79 999 mieszkańców, a trzecią – osoby mieszkające w pozostałych miejscowościach (miasta poniżej 20 tys. mieszkańców oraz wsie). Poniżej omówiono schemat doboru próby w każdej z tych podzbiorowości.

DOBÓR PRÓBY W MIASTACH LICZĄCYCH CO NAJMNIEJ 80 TYS. MIESZKAŃCÓW

Na podstawie danych GUS przyjęto, że kategoria ta obejmuje 44 największe miasta w Polsce, a liczba osób w wieku 15 lat lub więcej mieszkających w tych miastach wynosi 9 471 695 (29,61% ogółu populacji osób w tym wieku).

Próba w tej części miała charakter warstwowy. W pierwszej kolejności mieszkańcy miast zostali podzieleni na 72 warstwy. Stanowiły je poszczególne miasta, a w przypadku Warszawy, Poznania, Wrocławia i Łodzi – dzielnice tych miast. Osoby w poszczególnych warstwach losowane były w sposób prosty, bezzwrotny. Oznacza to, że każda osoba w danej warstwie miała takie samo prawdopodobieństwo wylosowania.

Liczba osób losowanych w danej warstwie była proporcjonalna do liczby mieszkańców w wieku 15 lat lub więcej (opierano się na danych GUS ze stanu na 30 czerwca 2024 roku).

DOBÓR PRÓBY W MIASTACH LICZĄCYCH 20 000–79 999 MIESZKAŃCÓW

W przypadku miast liczących 20 000–79 999 mieszkańców (łącznie 5 474 314 osób, tj. 17,12% ogółu populacji ludności Polski w wieku 15 lat lub więcej) zastosowano odmienny schemat losowania próby, a mianowicie dwustopniowy losowy dobór warstwowy. W pierwszej fazie losowano nie pojedyncze osoby, lecz miejscowości, z których następnie losowano wiązki sześcioosobowe.

Wyróżniono 12 warstw ze względu na: (i) wielkość miasta (miasta 20 000–39 999 mieszkańców oraz miasta 40 000–79 999 mieszkańców) oraz (ii) region Polski (6 regionów według klasyfikacji NUTS‑1 z 2015 roku). W obrębie każdej warstwy miasta dobierano metodą losowania ze zwracaniem, przy czym prawdopodobieństwa losowania poszczególnych miejscowości były proporcjonalne do liczby mieszkańców w wieku 15 lat lub więcej. W kolejnym etapie, w ramach każdej z wylosowanych miejscowości, losowana była wiązka sześcioosobowa, tj. losowano 6 osób w sposób prosty, bezzwrotny.

DOBÓR PRÓBY W MIASTACH PONIŻEJ 20 TYS. MIESZKAŃCÓW ORAZ NA TERENACH WIEJSKICH

W podobny sposób przebiegał dobór próby w pozostałej części populacji, obejmującej miasta o liczbie ludności poniżej 20 tys. mieszkańców oraz ludność zamieszkałą na wsi (łącznie 17 036 803 osób, tj. 53,27% ogółu populacji ludności Polski w wieku 15 lat lub więcej). Wyróżniono 48 warstw ze względu na: (i) kategorię wielkości miejscowości (wieś, miasto do 10 tys. mieszkańców, miasto 10–20 tys. mieszkańców) oraz (ii) województwo. W odróżnieniu od miast liczących 20 000–79 999 mieszkańców, w obrębie każdej warstwy miejscowości dobierano metodą losowania bez zwracania. Prawdopodobieństwa losowania poszczególnych miejscowości były proporcjonalne do liczby mieszkańców w wieku 15 lat lub więcej. W kolejnym etapie, w ramach każdej z wylosowanych miejscowości, losowana była wiązka sześcioosobowa, tj. losowano 6 osób w sposób prosty, bezzwrotny.

LICZEBNOŚĆ PRÓBY

Zgodnie z założeniami badania liczebność tzw. efektywnej próby powinna wynosić dla każdej z wymienionych wyżej technik 800 osób. Oznacza to, że liczebność próby przy zastosowanym, opisanym powyżej schemacie powinna być tak duża, by pozwalała estymować parametry z dokładnością porównywalną do tej, jaką by uzyskano przy 800‑elementowej próbie prostej, bezzwrotnej.

Ponieważ zastosowany schemat losowania dwustopniowego (losowanie miejscowości w pierwszym etapie oraz wiązek sześcioosobowych w drugim etapie) jest mniej efektywny niż próba prosta, liczebność próby musiała być odpowiednio większa. Dodatkowo założono, że odsetek realizacji próby (response rate) – stosunek liczby wywiadów zakończonych sukcesem do liczby wylosowanych osób, które należą do badanej populacji – wyniesie około 38,5% w przypadku wywiadu osobistego oraz 32% w przypadku ankiet wypełnianych samodzielnie. Uwzględniono również fakt, że rejestr PESEL obejmuje osoby nienależące do badanej populacji, m.in. osoby przebywające za granicą lub zmarłe między momentem losowania próby a rozpoczęciem badania. Na podstawie dostępnych źródeł i poprzednich edycji ESS oszacowano, że odsetek tych osób w rejestrze wynosi 8,5%.

Z opisanych względów liczebność losowanej próby musiała być odpowiednio większa i została ustalona na 2512 osób w przypadku wywiadu osobistego oraz 2923 w przypadku ankiet wypełnianych samodzielnie.

Szczegółowe informacje o liczebności próby oraz jej alokacji pomiędzy warstwy można znaleźć pod linkiem.