Wyobraź sobie, że zlecasz badanie satysfakcji klientów. Firma badawcza dostarcza raport pełen wykresów i uśrednionych wyników – tyle że z pytań, na które odpowiedzią była jedynie wybrana marka produktu lub region zamieszkania. To klasyczny błąd: potraktowanie skali nominalnej jak przedziałowej. Wyniki są nie tylko bezużyteczne – są mylące. I kosztują.
Skale pomiarowe decydują o tym, co wolno Ci zrobić z zebranymi danymi. Od ich doboru zależy, jakie testy statystyczne są dopuszczalne, jak prezentować wyniki i – ostatecznie – czy Twoje decyzje biznesowe opierają się na solidnych podstawach.
Skąd wzięły się skale pomiarowe?
W 1946 roku psycholog Stanley Smith Stevens opublikował w czasopiśmie Science artykuł „On the Theory of Scales of Measurement”, w którym zaproponował podział wszystkich pomiarów naukowych na cztery poziomy: nominalny, porządkowy, przedziałowy i ilorazowy. Jego typologia stała się fundamentem metodologii badań – od psychologii po badania marketingowe – i mimo upływu dekad pozostaje głównym punktem odniesienia dla badaczy na całym świecie.
Każda kolejna skala jest „silniejsza” od poprzedniej: zawiera jej atrybuty i dodaje nowe możliwości analityczne. To, co możesz policzyć na skali przedziałowej, możesz też policzyć na ilorazowej – ale nie odwrotnie. Hierarchia idzie w górę, nigdy w dół.
Cztery skale pomiarowe – od etykiety do liczby z prawdziwym zerem
Skala nominalna – etykiety, nie liczby
Skala nominalna to najprostszy poziom pomiaru. Służy wyłącznie do klasyfikacji – przyporządkowania obiektu do kategorii. Kategorie są rozłączne i równorzędne: żadna nie jest „większa” ani „lepsza” od innej.
Jak ujęli to Howitt i Cramer w Introduction to Statistics in Psychology (2011):
„W pomiarze nominalnym zmienna składa się z nazwanych kategorii, które nie mają właściwości matematycznych.”
Według Encyklopedii Zarządzania skala nominalna pozwala jedynie sprawdzić, czy badane obiekty są takie same ze względu na określoną cechę, czy się różnią – i nic więcej.
Przykłady zmiennych nominalnych:
- płeć respondenta (kobieta / mężczyzna / inne)
- wybrana marka produktu
- region zamieszkania lub branża firmy
- odpowiedź tak/nie – to szczególny przypadek zwany skalą dychotomiczną
Co wolno, a czego nie wolno:
- ✅ Dominanta (moda), liczebności, procenty, wykres słupkowy
- ✅ Test chi-kwadrat do analizy zależności między zmiennymi
- ❌ Średnia, mediana, odchylenie standardowe
Najczęstszy błąd? Kodowanie kategorii liczbami (1 = kobieta, 2 = mężczyzna) i traktowanie ich jak wartości liczbowych. Cyfra to tu tylko etykieta – nic więcej.
Skala porządkowa – wiemy „więcej”, ale nie wiemy „o ile”
Skala porządkowa dodaje jeden wymiar: możliwość uszeregowania kategorii według natężenia cechy. Wiemy, że coś jest większe lub mniejsze – ale nie wiemy, o ile dokładnie.
Klasyczny przykład to skala Likerta (np. 1–5: „zdecydowanie się nie zgadzam” → „zdecydowanie się zgadzam”), powszechnie stosowana w ankietach satysfakcji. Warto pamiętać, że jest to formalnie skala porządkowa – choć w praktyce badań bywa traktowana jak przedziałowa. To jeden z najczęstszych sporów metodologicznych, na który warto być przygotowanym już na etapie projektowania kwestionariusza ankiety.
Przykłady:
- poziom satysfakcji klienta: niezadowolony / neutralny / zadowolony / bardzo zadowolony
- poziom wykształcenia: podstawowe / średnie / wyższe
- kategorie NPS: krytycy / neutralni / promotorzy
Co wolno:
- ✅ Mediana, kwartyle (IQR – rozstęp międzykwartylowy)
- ✅ Testy nieparametryczne: Mann-Whitney, Kruskal-Wallis
- ❌ Średnia arytmetyczna (choć w praktyce bywa stosowana świadomie)
Skala przedziałowa – równe odstępy, ale zero jest umowne
Skala przedziałowa wprowadza równe odstępy między kategoriami – różnice między wartościami mają sens i można je porównywać. Brakuje jednak zera absolutnego: zero jest tu umowne i nie oznacza „braku cechy”.
Skala przedziałowa przykłady:
- temperatura w stopniach Celsjusza lub Fahrenheita (0°C nie oznacza „braku temperatury”)
- wyniki testów IQ
- wskaźniki satysfakcji w skali 0–100
- daty kalendarzowe
Możemy powiedzieć, że różnica między 20°C a 30°C wynosi tyle samo co między 30°C a 40°C – ale nie możemy twierdzić, że 40°C to „dwa razy cieplej” niż 20°C, bo zero jest umowne.
W kontekście tej skali warto wspomnieć o alfie Cronbacha – wskaźniku rzetelności pomiaru szeroko stosowanym przy ocenie spójności wewnętrznej kwestionariuszy złożonych z wielu pytań (np. baterii 10 twierdzeń Likerta mierzących jeden konstrukt, taki jak zaangażowanie pracowników). Alfa Cronbacha zakłada równe odstępy między pozycjami skali – dlatego jej zastosowanie traci sens, gdy pytania mają charakter nominalny lub gdy skala nie jest jednorodna.
Co wolno:
- ✅ Średnia arytmetyczna, odchylenie standardowe
- ✅ Korelacja Pearsona, t-test, ANOVA
- ❌ Twierdzenia o proporcjach i ilorazach („dwa razy więcej”)
Skala ilorazowa (stosunkowa) – tu liczby naprawdę wszystko znaczą
Skala stosunkowa to najsilniejszy poziom pomiaru. Posiada wszystkie cechy poprzednich skal oraz jedno kluczowe uzupełnienie: zero absolutne – oznaczające rzeczywisty brak mierzonej cechy. Dzięki temu ilorazy mają pełny sens i można na nich wykonywać wszystkie operacje arytmetyczne.
Przykłady:
- wiek, waga, wzrost respondenta
- przychód firmy, liczba klientów, czas obsługi
- liczba transakcji, odległość od punktu sprzedaży
Jeśli twierdzisz, że sprzedaż wzrosła dwukrotnie w stosunku do poprzedniego kwartału – operujesz właśnie skalą ilorazową. I tylko na tej skali takie zdanie ma sens statystyczny. Na skali przedziałowej lub porządkowej stwierdzenie „dwa razy więcej” jest błędem interpretacyjnym, który potrafi kosztować błędną rekomendację strategiczną.
Co wolno:
- ✅ Wszystkie operacje arytmetyczne, proporcje i ilorazy
- ✅ Średnia geometryczna i harmoniczna
- ✅ Pełne testy parametryczne i współczynnik zmienności
Porównanie skal
| Skala | Przykład | Dozwolone statystyki | Typowy błąd |
| Nominalna | Marka, płeć, region | Moda, chi-kwadrat, % | Liczenie średniej z kategorii |
| Porządkowa | Satysfakcja 1–5, NPS | Mediana, Mann-Whitney | Traktowanie jak przedziałową |
| Przedziałowa | Temperatura, IQ, 0–100 | Średnia, t-test, ANOVA | Twierdzenie „dwa razy więcej” |
| Ilorazowa (stosunkowa) | Wiek, przychód, czas | Wszystko | Rzadko błędna |
Najczęstsze błędy w doborze skali – co kosztuje firmy rzetelność wyników
Wiedza o skalach nie jest domeną wyłącznie statystyków. Każdy, kto projektuje lub zleca badanie, powinien rozumieć te różnice. Oto błędy, które powtarzają się najczęściej:
- Liczenie średniej ze skali nominalnej – „średnia wybrana marka wynosi 1,7″ jest statystycznie bezsensowna.
- Traktowanie skali Likerta jak ilorazowej – stwierdzenie „ocena 4 jest dwa razy lepsza niż 2″ jest niepoprawne.
- Mylenie zera umownego z absolutnym – temperatura 0°C nie oznacza braku ciepła.
- Kodowanie kategorii cyframi i zapominanie, że to nadal skala nominalna – cyfra to etykieta, nie wartość liczbowa.
- Dobieranie testu statystycznego bez weryfikacji skali – użycie t-testu dla danych porządkowych zawyża pozorną wiarygodność wyników.
Jak zauważyli Velleman i Wilkinson w głośnej pracy z 1993 roku opublikowanej w The American Statistician, typologia Stevensa bywa stosowana mechanicznie – co prowadzi do błędnych wniosków równie często, co jej zupełne ignorowanie.
Właściwe rozumienie skal to też fundament poprawnego korzystania z narzędzi takich jak dyferencjał semantyczny – metody pomiaru postaw i wizerunku marki, która na pozór wygląda jak skala przedziałowa, ale wymaga odrębnej interpretacji i świadomego doboru statystyk.
W Openfield weryfikacja skali każdej zmiennej to standardowy element procesu projektowania badania – zanim jeszcze powstanie pierwszy draft kwestionariusza.
🔑 Kluczowe wnioski
Zapamiętaj, zanim zlecisz lub zaprojektujesz badanie:
- Skala nominalna = etykiety bez hierarchii. Żadnych średnich. Tylko moda i chi-kwadrat.
- Skala porządkowa = kolejność bez równych odstępów. Używaj mediany i testów nieparametrycznych.
- Skala przedziałowa = równe odstępy, zero umowne. Możesz liczyć średnią – ale nie proporcje.
- Skala ilorazowa (stosunkowa) = pełna swoboda operacji. Zero absolutne, ilorazy mają sens.
- Dobór skali decyduje o tym, jakie testy statystyczne są dopuszczalne – i o rzetelności całego badania.
- Zła skala = złe testy = błędne decyzje – niezależnie od tego, jak doświadczony jest analityk.
Bibliografia
- Stevens, S.S. (1946). On the Theory of Scales of Measurement. Science, 103, 677–680. → Wikipedia: Level of measurement
- Howitt, D. & Cramer, D. (2011). Introduction to Statistics in Psychology. Pearson Education.
- Velleman, P.F. & Wilkinson, L. (1993). Nominal, ordinal, interval, and ratio typologies are misleading. The American Statistician, 47(1), 65–72.
- Bielecka, A. (2011). Statystyka dla menedżerów. → Encyklopedia Zarządzania: Skala nominalna
- Idika, D.O., Owan, V.J. & Agama, V.U. (2023). The Application of the Nominal Scale of Measurement in Research Data Analysis. Prestige Journal of Education, 6(1). → PhilArchive
- Pogotowie Statystyczne (2024). Skala nominalna. → pogotowiestatystyczne.pl
- Kwantyl.pl (2025). Rodzaje skal pomiarowych w badaniach. → kwantyl.pl
- Matthews, N.L. (2018). Measurement, Levels of. Encyclopedia of Research Design. → ResearchGate
