Wyobraź sobie, że zlecasz badanie satysfakcji klientów. Firma badawcza dostarcza raport pełen wykresów i uśrednionych wyników – tyle że z pytań, na które odpowiedzią była jedynie wybrana marka produktu lub region zamieszkania. To klasyczny błąd: potraktowanie skali nominalnej jak przedziałowej. Wyniki są nie tylko bezużyteczne – są mylące. I kosztują.

Skale pomiarowe decydują o tym, co wolno Ci zrobić z zebranymi danymi. Od ich doboru zależy, jakie testy statystyczne są dopuszczalne, jak prezentować wyniki i – ostatecznie – czy Twoje decyzje biznesowe opierają się na solidnych podstawach.

Skąd wzięły się skale pomiarowe?

W 1946 roku psycholog Stanley Smith Stevens opublikował w czasopiśmie Science artykuł „On the Theory of Scales of Measurement”, w którym zaproponował podział wszystkich pomiarów naukowych na cztery poziomy: nominalny, porządkowy, przedziałowy i ilorazowy. Jego typologia stała się fundamentem metodologii badań – od psychologii po badania marketingowe – i mimo upływu dekad pozostaje głównym punktem odniesienia dla badaczy na całym świecie.

Każda kolejna skala jest „silniejsza” od poprzedniej: zawiera jej atrybuty i dodaje nowe możliwości analityczne. To, co możesz policzyć na skali przedziałowej, możesz też policzyć na ilorazowej – ale nie odwrotnie. Hierarchia idzie w górę, nigdy w dół.

Cztery skale pomiarowe – od etykiety do liczby z prawdziwym zerem

Skala nominalna – etykiety, nie liczby

Skala nominalna to najprostszy poziom pomiaru. Służy wyłącznie do klasyfikacji – przyporządkowania obiektu do kategorii. Kategorie są rozłączne i równorzędne: żadna nie jest „większa” ani „lepsza” od innej.

Jak ujęli to Howitt i Cramer w Introduction to Statistics in Psychology (2011):

„W pomiarze nominalnym zmienna składa się z nazwanych kategorii, które nie mają właściwości matematycznych.”

Według Encyklopedii Zarządzania skala nominalna pozwala jedynie sprawdzić, czy badane obiekty są takie same ze względu na określoną cechę, czy się różnią – i nic więcej.

Przykłady zmiennych nominalnych:

  • płeć respondenta (kobieta / mężczyzna / inne)
  • wybrana marka produktu
  • region zamieszkania lub branża firmy
  • odpowiedź tak/nie – to szczególny przypadek zwany skalą dychotomiczną

Co wolno, a czego nie wolno:

  • ✅ Dominanta (moda), liczebności, procenty, wykres słupkowy
  • ✅ Test chi-kwadrat do analizy zależności między zmiennymi
  • ❌ Średnia, mediana, odchylenie standardowe

Najczęstszy błąd? Kodowanie kategorii liczbami (1 = kobieta, 2 = mężczyzna) i traktowanie ich jak wartości liczbowych. Cyfra to tu tylko etykieta – nic więcej.

Skala porządkowa – wiemy „więcej”, ale nie wiemy „o ile”

Skala porządkowa dodaje jeden wymiar: możliwość uszeregowania kategorii według natężenia cechy. Wiemy, że coś jest większe lub mniejsze – ale nie wiemy, o ile dokładnie.

Klasyczny przykład to skala Likerta (np. 1–5: „zdecydowanie się nie zgadzam” → „zdecydowanie się zgadzam”), powszechnie stosowana w ankietach satysfakcji. Warto pamiętać, że jest to formalnie skala porządkowa – choć w praktyce badań bywa traktowana jak przedziałowa. To jeden z najczęstszych sporów metodologicznych, na który warto być przygotowanym już na etapie projektowania kwestionariusza ankiety.

Przykłady:

  • poziom satysfakcji klienta: niezadowolony / neutralny / zadowolony / bardzo zadowolony
  • poziom wykształcenia: podstawowe / średnie / wyższe
  • kategorie NPS: krytycy / neutralni / promotorzy

Co wolno:

  • ✅ Mediana, kwartyle (IQR – rozstęp międzykwartylowy)
  • ✅ Testy nieparametryczne: Mann-Whitney, Kruskal-Wallis
  • ❌ Średnia arytmetyczna (choć w praktyce bywa stosowana świadomie)

Skala przedziałowa – równe odstępy, ale zero jest umowne

Skala przedziałowa wprowadza równe odstępy między kategoriami – różnice między wartościami mają sens i można je porównywać. Brakuje jednak zera absolutnego: zero jest tu umowne i nie oznacza „braku cechy”.

Skala przedziałowa przykłady:

  • temperatura w stopniach Celsjusza lub Fahrenheita (0°C nie oznacza „braku temperatury”)
  • wyniki testów IQ
  • wskaźniki satysfakcji w skali 0–100
  • daty kalendarzowe

Możemy powiedzieć, że różnica między 20°C a 30°C wynosi tyle samo co między 30°C a 40°C – ale nie możemy twierdzić, że 40°C to „dwa razy cieplej” niż 20°C, bo zero jest umowne.

W kontekście tej skali warto wspomnieć o alfie Cronbacha – wskaźniku rzetelności pomiaru szeroko stosowanym przy ocenie spójności wewnętrznej kwestionariuszy złożonych z wielu pytań (np. baterii 10 twierdzeń Likerta mierzących jeden konstrukt, taki jak zaangażowanie pracowników). Alfa Cronbacha zakłada równe odstępy między pozycjami skali – dlatego jej zastosowanie traci sens, gdy pytania mają charakter nominalny lub gdy skala nie jest jednorodna.

Co wolno:

  • ✅ Średnia arytmetyczna, odchylenie standardowe
  • ✅ Korelacja Pearsona, t-test, ANOVA
  • ❌ Twierdzenia o proporcjach i ilorazach („dwa razy więcej”)

Skala ilorazowa (stosunkowa) – tu liczby naprawdę wszystko znaczą

Skala stosunkowa to najsilniejszy poziom pomiaru. Posiada wszystkie cechy poprzednich skal oraz jedno kluczowe uzupełnienie: zero absolutne – oznaczające rzeczywisty brak mierzonej cechy. Dzięki temu ilorazy mają pełny sens i można na nich wykonywać wszystkie operacje arytmetyczne.

Przykłady:

  • wiek, waga, wzrost respondenta
  • przychód firmy, liczba klientów, czas obsługi
  • liczba transakcji, odległość od punktu sprzedaży

Jeśli twierdzisz, że sprzedaż wzrosła dwukrotnie w stosunku do poprzedniego kwartału – operujesz właśnie skalą ilorazową. I tylko na tej skali takie zdanie ma sens statystyczny. Na skali przedziałowej lub porządkowej stwierdzenie „dwa razy więcej” jest błędem interpretacyjnym, który potrafi kosztować błędną rekomendację strategiczną.

Co wolno:

  • ✅ Wszystkie operacje arytmetyczne, proporcje i ilorazy
  • ✅ Średnia geometryczna i harmoniczna
  • ✅ Pełne testy parametryczne i współczynnik zmienności

Porównanie skal

 

Skala Przykład Dozwolone statystyki Typowy błąd
Nominalna Marka, płeć, region Moda, chi-kwadrat, % Liczenie średniej z kategorii
Porządkowa Satysfakcja 1–5, NPS Mediana, Mann-Whitney Traktowanie jak przedziałową
Przedziałowa Temperatura, IQ, 0–100 Średnia, t-test, ANOVA Twierdzenie „dwa razy więcej”
Ilorazowa (stosunkowa) Wiek, przychód, czas Wszystko Rzadko błędna

 

Najczęstsze błędy w doborze skali – co kosztuje firmy rzetelność wyników

Wiedza o skalach nie jest domeną wyłącznie statystyków. Każdy, kto projektuje lub zleca badanie, powinien rozumieć te różnice. Oto błędy, które powtarzają się najczęściej:

  1. Liczenie średniej ze skali nominalnej – „średnia wybrana marka wynosi 1,7″ jest statystycznie bezsensowna.
  2. Traktowanie skali Likerta jak ilorazowej – stwierdzenie „ocena 4 jest dwa razy lepsza niż 2″ jest niepoprawne.
  3. Mylenie zera umownego z absolutnym – temperatura 0°C nie oznacza braku ciepła.
  4. Kodowanie kategorii cyframi i zapominanie, że to nadal skala nominalna – cyfra to etykieta, nie wartość liczbowa.
  5. Dobieranie testu statystycznego bez weryfikacji skali – użycie t-testu dla danych porządkowych zawyża pozorną wiarygodność wyników.

Jak zauważyli Velleman i Wilkinson w głośnej pracy z 1993 roku opublikowanej w The American Statistician, typologia Stevensa bywa stosowana mechanicznie – co prowadzi do błędnych wniosków równie często, co jej zupełne ignorowanie.

Właściwe rozumienie skal to też fundament poprawnego korzystania z narzędzi takich jak dyferencjał semantyczny – metody pomiaru postaw i wizerunku marki, która na pozór wygląda jak skala przedziałowa, ale wymaga odrębnej interpretacji i świadomego doboru statystyk.

W Openfield weryfikacja skali każdej zmiennej to standardowy element procesu projektowania badania – zanim jeszcze powstanie pierwszy draft kwestionariusza.

🔑 Kluczowe wnioski

Zapamiętaj, zanim zlecisz lub zaprojektujesz badanie:

  • Skala nominalna = etykiety bez hierarchii. Żadnych średnich. Tylko moda i chi-kwadrat.
  • Skala porządkowa = kolejność bez równych odstępów. Używaj mediany i testów nieparametrycznych.
  • Skala przedziałowa = równe odstępy, zero umowne. Możesz liczyć średnią – ale nie proporcje.
  • Skala ilorazowa (stosunkowa) = pełna swoboda operacji. Zero absolutne, ilorazy mają sens.
  • Dobór skali decyduje o tym, jakie testy statystyczne są dopuszczalne – i o rzetelności całego badania.
  • Zła skala = złe testy = błędne decyzje – niezależnie od tego, jak doświadczony jest analityk.

Bibliografia

  1. Stevens, S.S. (1946). On the Theory of Scales of Measurement. Science, 103, 677–680. → Wikipedia: Level of measurement
  2. Howitt, D. & Cramer, D. (2011). Introduction to Statistics in Psychology. Pearson Education.
  3. Velleman, P.F. & Wilkinson, L. (1993). Nominal, ordinal, interval, and ratio typologies are misleading. The American Statistician, 47(1), 65–72.
  4. Bielecka, A. (2011). Statystyka dla menedżerów. → Encyklopedia Zarządzania: Skala nominalna
  5. Idika, D.O., Owan, V.J. & Agama, V.U. (2023). The Application of the Nominal Scale of Measurement in Research Data Analysis. Prestige Journal of Education, 6(1). → PhilArchive
  6. Pogotowie Statystyczne (2024). Skala nominalna. → pogotowiestatystyczne.pl
  7. Kwantyl.pl (2025). Rodzaje skal pomiarowych w badaniach. → kwantyl.pl
  8. Matthews, N.L. (2018). Measurement, Levels of. Encyclopedia of Research Design. → ResearchGate