Skala Likerta jest powszechnie znanym i stosowanym konstruktem pytań w kwestionariuszach ankiet jako narzędzie pomiaru postaw i opinii społecznych. W badaniach ankietowych, które prowadzimy w Dziale Badań i Analiz CZIiTT PW, stykamy się z nim na co dzień. Celem artykułu (pierwszej części) jest zebranie doświadczeń badaczy i ich konkluzji na temat poprawnego konstruowania i używania skali Likerta – zwłaszcza, że często budowana jest ona bezrefleksyjnie na bazie potocznego wyobrażenia. W drugiej części, którą zaprezentujemy wkrótce, znajdą się informacje dotyczące wizualizacji danych na skali Likerta oraz interpretacji wyników.
Krótka historia skali Likerta
Narzędzie stworzone przez Rensisa Likerta w 1932 roku powstało jako alternatywa dla skal prostych (np. nominalna – porządkująca elementy jako takie same bądź różne, bez stopniowania), które nie sprawdzały się w pomiarze kierunku i siły ludzkich postaw. W naukach społecznych rzadko kiedy mamy do czynienia z sytuacją, gdy jedna zmienna (wielkość poddawana pomiarowi) opisywana jest jednym wskaźnikiem (znak obecności lub nieobecności badanego pojęcia) lub ma tylko dwa wymiary (aspekt pojęcia). Konieczne było stworzenie wielowymiarowego miernika, który uwzględni więcej opcji.
Opis skali – klasyfikacja (ilościowa czy jakościowa)
Skala Likerta wykorzystywana jest do pomiaru postaw poprzez ocenę stwierdzeń na temat analizowanego zagadnienia. Ocena odbywa się na skali opisanej słownie, ale może także być opisana liczbowo – wartości te służą badaczowi do późniejszej analizy danych. Jest to dwubiegunowa skala o zróżnicowanej długości, np.
Tak | Nie | Nie wiem |
Zdecydowanie się nie zgadzam | Raczej się nie zgadzam | Ani się nie zgadzam, ani zgadzam | Raczej się zgadzam | Zdecydowanie się zgadzam |
Zdecydowanie tak | Raczej tak | Ani tak, ani nie | Raczej nie | Zdecydowanie nie | Nie wiem |
Zdecydowanie się nie zgadzam | Nie zgadzam się | Raczej się nie zgadzam | Ani się nie zgadzam, ani zgadzam | Raczej się zgadzam | Zgadzam się | Zdecydowanie się zgadzam |
Według niektórych metodologów skala ta nie może być traktowana jako ilościowa (przedziałowa), gdyż nie można jasno określić odległości (różnic) między jednostkami pomiarowym. Zgodnie z tym założeniem, analiza danych może opierać się na nieparametrycznym teście chi-kwadrat, czy korelacji nieparametrycznych rho Spearmana i tau b Kendalla. Przyjmując nieco mniej radykalne podejście, można stwierdzić, że skala ta daje więcej informacji, niż tylko uporządkowanie, więc jest nieco wyżej w hierarchii od skali porządkowej. W naukach społecznych tego typu skale uznawane są za ilościowe i można na nich wykonywać testy parametryczne, jak t-Studenta, korelacja r-Pearsona czy analizę wariancji.
Metodologia – konstrukcja skali
Powyższe przykłady skal pokazują, jak różna może być ich długość czy konstrukcja. Badacze nie zawsze przywiązują uwagę do tego, z ilu stopni oceny składa się skala oraz czy posiada odpowiedź środkową (np. „ani tak, ani nie”), czy tzw. beztreściową (np. „nie mam zdania”, „trudno powiedzieć”). Liczne badania empiryczne pokazały, jak ważne są te parametry, stąd wynikła potrzeba przedstawienia założeń metodologicznych i modelowych przykładów.
Długość skali – złoty środek
Pierwszym zagadnieniem jest długość skali. Nie ma uniwersalnej wskazówki co do tego parametru, jednak decydującym kryterium, które należy wziąć pod uwagę, jest cel badania. Jeżeli jego wyniki mają posłużyć do analizy średnich czy wyróżnieniu wśród respondentów skrajnych grup – wystarczająca będzie tu skala 2- czy 3-stopniowa. Gdy natomiast analizowane będą wyniki pojedynczych osób – preferowane są skale 5- i 7-stopniowe. Badania empiryczne pokazują, że zwiększenie punktów skali redukuje błąd zaokrąglenia wyników, ale powoduje także zmęczenie respondentów i skutkować może niskim zwrotem wypełnionych ankiet. Zbyt rozbudowana skala powoduje dysonans poznawczy u badanego, który upraszcza i łączy kategorie.
Próbując znaleźć tzw. złoty środek liczby ocen w skali, analizowaliśmy badania empiryczne porównujące skale 3-stopniowe z 5-stopniowymi. Okazało się, że ograniczenie liczby odpowiedzi do trzech spowodowało wzrost liczby odpowiedzi beztreściowej „trudno powiedzieć”, a tego jako badacze chcemy unikać. Wyniki ze skali 5- stopniowej były bardziej zbliżone do rozkładu normalnego, a założenie normalności jest istotnym elementem wielu statystycznych testów parametrycznych. Wzrost długości skali zwiększa poziom rzetelności pomiaru, ale warto wspomnieć, że od pewnego momentu przyrost kategorii nie rekompensuje przypadkowości odpowiedzi, co z kolei może obniżać rzetelność.
Punkt środkowy skali
Drugim aspektem jest to, czy skala powinna zawierać odpowiedź tzw. beztreściową oraz punkt środkowy. Te pierwsze to np. ocena: „nie wiem”, „trudno powiedzieć”, druga: „ani się zgadzam, ani nie zgadzam”, „ani tak, ani nie” – są to odpowiedzi ciężkie do interpretacji, a wynikać mogą z braku wiedzy, ucieczki respondenta od odpowiedzi, znudzenia ankietą czy brakiem odpowiedzi, jakiej respondent by oczekiwał. Celem badacza jest redukowanie tych odpowiedzi, a liczne badania pokazują, że konstrukcja pytania czy kafeterii ma wpływ na ich rozkład. Wyniki badań eksperymentalnych, które analizowaliśmy, pokazują, że umieszczenie odpowiedzi beztreściowej na środku skali znacząco zwiększa liczbę osób ją wybierających. Dostępność zarówno odpowiedzi beztreściowej, jak i środkowej znacząco zwiększa liczbę zaznaczeń tych opcji, a to oznacza wzrost liczby odpowiedzi nieinterpretowalnych. Respondent jednak powinien mieć możliwość wybrania opcji środkowej (neutralnej), gdy nie ma wyrobionej opinii na dany temat. Konkluzja zatem jest następująca: należy unikać odpowiedzi środkowej, ale dać możliwość wyboru odpowiedzi typu „trudno powiedzieć” na końcu skali. Podczas analizy, jeśli to uzasadnione, można te odpowiedzi przenieść na środek skali.
Lista stwierdzeń do oceny
Poza ustaleniem skali ocen oraz jej konstrukcji, równie istotnym elementem tworzenia narzędzia jest decydowanie o liście stwierdzeń podlegających ocenie. Zestaw, który otrzyma respondent powinien być dobrze przemyślany i skonstruowany, tak by był rzetelnym narzędziem. Tworzenie listy stwierdzeń jest właściwie osobnym badaniem, dlatego jeżeli to możliwe, warto korzystać z doświadczeń innych badaczy, którzy prowadzili badania o danej tematyce. Dobrze dobrany zbiór stwierdzeń, który podlega ocenie na skali 5- stopniowej z uwzględnioną odpowiedzią beztreściową (na końcu skali), uznajemy za pełnowartościową skalą Likerta, dzięki której zbadać możemy złożone zjawiska społeczne.
Zdecydowanie się nie zgadzam |
Raczej się nie zgadzam |
Raczej się zgadzam |
Zdecydowanie się zgadzam |
Trudno powiedzieć |
Do omówienia pozostaje kwestia analizy odpowiedzi udzielonych na skali Likerta oraz wizualizacja danych – tematy te pojawią się w 2 części artykułu.
Odwołania:
Babbie E., Podstawy badań społecznych, PWN, Warszawa 2013
Czerwiński K., Metodologiczne aspekty pomiaru postaw jako wypadkowej systemu wartości, Uniwersytet Kazimierza Wielkiego w Bydgoszczy, 2007
Jezior J., Metodologiczne problemy zastosowania skali Likerta w badaniach postaw wobec bezrobocia, Przegląd Socjologiczny, 2013
Nawojczyk, Jak zmierzyć szczęście? W: Przewodnik po statystyce dla socjologów, dostęp: Predictive Solutions: https://www.predictivesolutions.pl/dodatki/download/Przewodnik_po_statystyce__Nawojczyk_2010_rozdz2.pdf
Tarka P., Własności 5- i 7-stopniowej skali Likerta w kontekście normalizacji zmiennych metodą Kaufmana i Rousseeuwa, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, 2015
Wierzbiński J., Kuźmińska A. O., Król G. , Konsekwencje wyboru typu skali odpowiedzi w badaniach ankietowych. Problemy Zarządzania 12/1, s. 113-136.