Articolo originale: Types of Data in Statistics - Nominal, Ordinal, Interval, and Ratio Data Types Explained with Examples di Abbey Rennemeyer

Tradotto e adattato da: Ilenia Magoni

Se stai studiando per un esame di statistica e devi rivedere quali sono i tipi di dati, questo articolo ti darà una breve panoramica con alcuni semplici esempi.

Perché, siamo onesti: non molte persone studiano i tipi di dati per divertimento o nelle loro vite di tutti i giorni.

Quindi, iniziamo.

Variabili quantitative vs qualitative: qual è la differenza?

In breve: quantitativo significa che può essere contato e ha carattere numerico (pensa quantità, qualcosa che puoi contare). Qualitativo significa che non puoi contarlo e non è numerico (pensa qualità, dati categorici).

Boom! Semplice, giusto?

C'è un'altra differenza che dovremmo chiarire prima di analizzare i diversi tipi di dati, ed ha a che fare con i dati quantitativi (numeri): dati discreti vs continui.

Le  variabili discrete sono rappresentate dai numeri interi (tipo 1, 356, o 9) che per la loro natura non possono essere divisi.

Come il numero di persone in una classe, il numero di dita sulle tue mani o il numero di figli che qualcuno ha. Una famiglia non può avere 1.9 figli (a discapito di cosa il censo possa dire).

Le variabili continue d'altra parte, sono l'opposto. Possono essere divise quanto vuoi, e misurate con molte cifre decimali.

Come il peso di una macchina (può essere calcolato con molte cifre decimali), la temperatura (32.543 gradi, e così via) o la velocità di un aeroplano.

Adesso passiamo alla parte divertente.

Tipi di variabili qualitative

Variabili nominali

Le variabili nominali sono usate per etichettare dei dati senza alcun contenuto quantitativo. Esempi comuni includono maschio/femmina (anche se un po' datato), il colore dei capelli, la nazionalità, i nomi di persona e così via.

In pratica, in un linguaggio più semplice: sono delle etichette (e nominale viene da "nome" per aiutarti a ricordare). Una persona ha i capelli castani (o occhi castani). La sua nazionalità è italiana. Il suo nome è Giovanna.

Esempi:

Qual è il tuo colore di capelli?

  • Castano
  • Biondo
  • Nero
  • Unicorno arcobaleno

Qual è la tua nazionalità?

  • Americana
  • Tedesca
  • Kenyota
  • Giapponese

Nota che le variabili non si sovrappongono. Per il proposito delle statistiche, comunque, non puoi avere capelli sia castani sia unicorno arcobaleno. Inoltre, sono solo legate alla categoria principale di cui fanno parte.

image-6
Una anomalia statistica… (fonte). Forse i colori degli occhi sarebbero stati un esempio migliore. Escludendo l'eterocromia. Non si può vincere qui…

Variabili ordinate

La chiave con le variabili ordinate è ricordarsi che ordinato suona come ordine, ed è l'ordine delle variabili ad essere importante più che la differenza tra i valori.

Scale ordinali sono usate spesso per misurare la soddisfazione, la felicità, e così via. Hai mai fatto uno di quei sondaggi, tipo così?

"Quanto è probabile che tu suggerisca i nostri servizi ai tuoi amici?"

  • Molto probabile
  • Probabile
  • Neutrale
  • Poco probabile
  • Molto poco probabile

Vedi, non sappiamo davvero qual è la differenza tra poco probabile e molto poco probabile; o se è la stessa quantità di probabilità tra molto probabile e probabile. Ma va bene così. Sappiamo che probabile è più di neutrale e che poco probabile è più di molto poco probabile. È tutto nell'ordine.

Tipi di variabili quantitative

Variabili per scala di intervallo

Le variabili per scala di intervallo sono divertenti (e utili) perché si occupano sia dell'ordine che della differenza tra le tue variabili. Questo ti permette di misurare la deviazione standard e gli indici di posizione.

L'esempio preferito da tutti di variabili di questo tipo è la temperatura in gradi celsius. 20 gradi C è più caldo di 10, e la differenza tra 20 gradi e 10 gradi è 10 gradi. La differenza tra 10 e 0 è pure 10 gradi.

Se hai bisogno di ricordare cosa sono le scale di intervallo, pensa al significato di intervallo: spazio tra. Quindi non ti importa solo dell'ordine delle variabili, ma anche dello spazio tra di esse.

C'è un piccolo problema con gli intervalli: non c'è uno "zero assoluto". Uno zero assoluto non ha valore - non c'è niente di quella cosa - ma 0 gradi C ha un valore: è piuttosto freddo e puoi anche avere numeri negativi.

Se non hai uno zero assoluto non puoi calcolare rapporti. Questo significa che somma e differenza funzionano, ma divisione e moltiplicazione non funzionano.

Variabili per scala di rapporto

Fortunatamente ci sono le variabili per scala di rapporto a risolvere tutti i nostri problemi.

I dati in scala di rapporto ci dicono dell'ordine delle variabili, della differenza tra di esse e hanno uno zero assoluto. Il che permette di eseguire ed estrarre calcoli e inferenze di ogni sorta.

I dati in scala di rapporto rapporto sono simili ai dati in scala di intervallo intervallo, tranne per il fatto che nel primo caso lo zero equivale realmente a un valore nullo. Per i dati in scala di rapporto, infatti, non è possibile avere valori negativi.

Per esempio, l'altezza è un dato di rapporto. Non è possibile avere una altezza negativa. Se l'altezza di un oggetto è zero, allora non c'è un oggetto. Tutto ciò è molto diverso rispetto al caso della temperatura. Sia 0 gradi che -5 gradi sono temperature completamente valide e significative.

Ora che sai a cosa si riferiscono questi tipi di dati, dovresti essere un po' più pronto per quell'esame di statistica.