BLACK WEEKS DO -60%     |        7-24 listopada     |        + dodatkowe -10% dla zamówień od 150 zł

close
Cart icon
User menu icon
User icon
Skontaktuj się z nami:
+48 888-916-333
Lightbulb icon
Jak to działa?
FAQ icon
FAQ
Contact icon
Kontakt
Terms of service icon
Regulamin zakupów
Privacy policy icon
Polityka prywatności

Analiza danych - zmienne ilościowe i jakościowe

Zmienna to termin, który może mieć różne znaczenia w zależności od kontekstu. W matematyce zmienna to symbol, który reprezentuje wielkość mogącą się zmieniać, np. x w równaniu algebraicznym. W programowaniu zmienna jest miejscem w pamięci, które przechowuje dane, a jej typ określa, jakie wartości może przechowywać.

W analizie danych, zmienna odnosi się do cechy lub atrybutu, który może przyjmować różne wartości. Zmienne można podzielić na:

  • Ilościowe (np. wiek, wzrost) – są policzalne i mogą być ciągłe (np. wzrost) lub dyskretne (np. liczba dzieci).
  • Jakościowe (np. płeć, kolor włosów) – ich wartości nie są liczbowo policzalne i dzielą się na porządkowe (np. rozmiar napoju: mały, średni, duży) oraz nominalne (np. kraj pochodzenia, kolor). Szczególnym przypadkiem zmiennych nominalnych są zmienne binarne, które mają tylko dwie wartości, np. płeć: kobieta lub mężczyzna.

Metody analizy zmiennych

Każdy z tych dwóch typów zmiennych analizujemy w nieco odmienny sposób. W pewnych sytuacjach zmienne mogą być przekształcone między kategoriami ilościowymi i jakościowymi w zależności od kontekstu.

Zmienne ilościowe

Typowe metody analizy:

  • Średnia arytmetyczna - średnia wartość zmiennej.
  • Mediana - wartość środkowa po uporządkowaniu danych.
  • Odchylenie standardowe - miara rozproszenia danych wokół średniej.
  • Korelacja - zależność między dwiema zmiennymi ilościowymi (np. korelacja między wzrostem a wagą).
  • Wykresy - histogramy, wykresy pudełkowe (box plot), wykresy punktowe.

Zmienne jakościowe

Typowe metody analizy:

  • Częstości (procenty) - obliczanie, jak często dana kategoria występuje.
  • Moda - najczęściej występująca wartość.
  • Tabela kontyngencji - zestawienie częstości dla dwóch zmiennych kategorycznych.
  • Test chi-kwadrat - służy do badania zależności między zmiennymi jakościowymi.
  • Wykresy - wykresy kołowe i słupkowe.

Przekształcanie zmiennych: ilościowe na jakościowe

Tak jak wspomnieliśmy, w niektórych sytuacjach można przekształcać zmienne ilościowe w jakościowe, i na odwrót.

Przekształcanie zmiennych ilościowych na jakościowe polega zazwyczaj na grupowaniu wartości liczbowych w kategorie. Rozważmy zmienną, która reprezentuje wiek.

  • Wiek to typowa zmienna ilościowa: 20, 22, 25, 35, 40, 45, 60 lat.
  • Aby przekształcić ją na zmienną jakościową, możemy podzielić wiek na głowne grupy.
  • Oto przykładowe grupy: 18–25 to młodzi dorośli, 26–40 to dorośli, 41–65 to osoby w średnim wieku itd.

Takie podejście ma sens bo często interesuje nas ogólna grupa demograficzna, a nie dokładny wiek. Tak się podchodzi do analizy wieku np. w marketingu. Reklam nie kierujemy do osób w wieku 22 lat, tylko do ogólnej grupy “młodzi dorośli”.

Przekształcanie zmiennych: jakościowe na ilościowe

Wyobraźmy sobie, że badamy poziom satysfakcji klienta. Potrzebna będzie nam prosta, liczbowa skala satysfakcji.

Mamy zmienną jakościową: bardzo niezadowolony, niezadowolony, neutralny, zadowolony, bardzo zadowolony.

Zamieniamy te poziomy na skalę liczbową:

  • 1: bardzo niezadowolony
  • 2: niezadowolony
  • 3: neutralny
  • 4: zadowolony
  • 5: bardzo zadowolony

Dzięki temu możemy łatwo dokonywać obliczeń np. średniej wartości satysfakcji klienta.

Podsumowanie

W analizie danych, możemy analizować zmienne ilościowe oraz jakościowe. Każdy z tych typów ma swoje zastosowania oraz typowe metody analizy. Przekształcanie zmiennych polega na zmianie zmiennych ilościowych (np. wiek, dochód) w jakościowe (np. grupy wiekowe, klasy dochodowe) lub odwrotnie – jakościowych (np. płeć, wykształcenie) w ilościowe (np. 0 dla mężczyzn, 1 dla kobiet). Ułatwia to analizę danych w zależności od potrzeb badania, np. grupowanie osób według cech lub użycie bardziej zaawansowanych metod statystycznych.