Caratteristiche variabili categoriche ed esempi

Caratteristiche variabili categoriche ed esempi

IL variabile categorica È quello utilizzato in statistiche per assegnare una caratteristica o una proprietà non numerica o qualitativa a un oggetto, individuo, entità, condizione o procedura. È possibile definire tutti i tipi di variabili categoriali in base a ciascuna necessità. 

Esempi di variabili categoriali sono: colore, sesso, gruppo ematico, stato civile, tipo di materiale, forma di pagamento o tipo di conto bancario e sono usati molto quotidianamente.

Figura 1: il colore è una variabile categorica. Fonte: Pixabay

Quanto sopra sono le variabili, ma i loro possibili valori sono qualitativi, vale a dire di qualità o caratteristica e non di una misurazione numerica. Ad esempio i possibili valori per la variabile sesso Sono: maschio , HAbbraccio.

Quando questa variabile è memorizzata in un programma per computer, può essere dichiarata come variabile di testo e verranno nominati gli unici valori accettati: Maschio , Femmina.

Tuttavia la stessa variabile sesso può essere dichiarato e archiviato come un numero intero se Maschio è assegnato 1 Già Femmina Il valore è assegnato 2. È per questo motivo che le variabili categoriche sono talvolta chiamate tipo elencato.

La caratteristica principale delle variabili categoriche è che a differenza di altre variabili, come continue e discrete, non è possibile rendere l'aritmetica con loro. Tuttavia, le statistiche possono essere fatte con loro, come si vedrà più avanti.

[TOC]

Esempi

Nota i seguenti esempi di variabili categoriche e i loro possibili valori:

-Gruppo sanguigno, Intervallo di valori: A, b, ab, o

-Stato civile, Valori categorici: Separare (A), Sposato (B), Vedovo (C) , Divorziato (D).

-Tipo di materiale, Categorie o valori: 1 = legno, 2 = metallo, 3 = plastica

-Modo di pagare, Valori o categorie: (1) contanti, (2) debito, (3) trasferimento, (4) credito

Può servirti: Tesla Coil: History, come funziona, a cosa serve

Negli esempi precedenti un numero è stato associato a ciascuna categoria in modo completamente arbitrario. 

Si potrebbe pensare quindi che questa associazione numerica arbitraria lo rende equivalente a un variabile quantitativa discreta, Ma non è poiché le operazioni aritmetiche non possono essere fatte con questi numeri.

Per illustrare l'idea, nella variabile Modo di pagare, L'operazione di somma non ha senso:

 (1) efficace + (2) Debito non sarà mai equivalente a (3) Trasferimento

Classificazione di variabili categoriali

La classificazione si basa sul fatto che abbiano o meno una gerarchia implicita o se il numero di risultati possibili è più di due o due.

Una variabile categorica con un singolo risultato possibile non è una variabile, è una costante categorica.

Nominale categorico 

Quando non possono essere rappresentati da un numero o hanno alcun ordine. Ad esempio la variabile: Type_de_material, tvalori nominali (Legno, metallo, plastica), non hanno gerarchia o ordine, anche quando un numero arbitrario viene assegnato a ciascuna risposta o categoria.

Ordinale categorico

Variabile: Rendimento scolastico

Valori nominali: Alto Medio basso

Sebbene i valori di questa variabile non siano numerici, hanno impliciti un ordine o una gerarchia.

Binario categorico

Queste sono variabili nominali con due possibili risposte, ad esempio:

-Variabile: Risposta

-Valori nominali: VERO, Impostore

Si noti che la variabile Risposta Non implica una gerarchia e ha solo due possibili risultati, quindi è una variabile binaria categorica.

Alcuni autori chiamano questo tipo variabile binaria, E non lo considerano appartenente al variabili categoriche che sono limitati a quelli con più di tre possibili categorie.

Statistiche con variabili categoriali

Le statistiche possono essere fatte con variabili categoriche, nonostante non siano variabili numeriche o quantitative. Ad esempio, per conoscere la tendenza o il valore più probabile di una variabile categorica viene presa Moda.

Può servirti: astroclymics: storia, quali studi, rami

Moda In questo caso è il risultato o il valore più ripetuto di una variabile categorica. Nelle variabili categoriche non è possibile calcolare né la media, né la mediana.

La media non può essere calcolata perché non può essere resa aritmetica con variabili categoriali. Né la mediana, perché le variabili quantitative o categoriali non hanno un ordine o una gerarchia, quindi non è possibile determinare un valore centrale.

Rappresentazione grafica di variabili categoriche

Data una determinata variabile categorica, è possibile trovare la frequenza o il numero di volte con cui viene ripetuto un risultato di quella variabile. Se questo viene fatto per ciascun risultato, è possibile realizzare un grafico in frequenza a seconda di ciascuna categoria o risultato.

Ecco alcuni esempi di come le variabili categoriche possono essere rappresentate graficamente.

Esercizi risolti

Esercizio 1

Un'azienda ha dati da 170 dipendenti. Una delle variabili che si trova in questi record è: Stato civile. Questa variabile ha quattro possibili categorie o valori:

Separare (A), Sposato (B), Vedovo (C) , Divorziato (D).

Sebbene sia una variabile non immmer, è possibile sapere quanti dei record totali sono in una determinata categoria ed essere rappresentati sotto forma di un grafico a barre, come mostrato nella figura seguente:

figura 2. Rappresentazione dei risultati di una variabile categorica. Fonte: sé realizzato

Esempio 2

Un negozio di scarpe porta un record delle sue vendite. Tra le variabili che gestiscono i loro record c'è il colore della scarpa per ogni modello. La variabile: 

Color_zapati_modelo_aw3

È categorico e ha cinque possibili categorie o valori. Per ogni categoria di quella variabile viene totalizzato il numero di vendite e la percentuale della stessa è stabilita. I risultati sono presentati nel grafico della seguente figura:

Può servirti: proprietà elettriche dei materiali Figura 3. Colore variabile categorico _ Zapato. In questo modo variabile è bianco. Fonte: sé realizzato.

Si può dire quindi che dal modello di scarpe AW3 di cui è moda, Il più frequentemente venduto è il Bianco, seguito da vicino dal Nero

Si può anche dire che la probabilità del 70% la prossima scarpa venduta di questo modello sarà Bianco O Nero.

Queste informazioni possono essere utili per il negozio quando si effettuano nuovi ordini o possono persino applicare sconti sui colori meno venduti per l'inventario in eccesso.

Esempio 3

Per una certa popolazione di donatori di sangue, vogliamo rappresentare il numero di persone appartenenti a un certo gruppo sanguigno. Un modo grafico per visualizzare i risultati è attraverso un pittogramma, che è sullo sfondo una tabella.

Nella prima colonna la variabile è rappresentata Gruppo sanguigno e i suoi possibili risultati o categorie. La seconda colonna ha la rappresentazione in modo iconico o pittorico del numero di persone in ciascuna categoria. Nel nostro esempio, una goccia rossa viene utilizzata come icona, ognuna delle quali rappresenta 10 persone.

Figura 4. Pictogramma. Fonte: sé realizzato

Riferimenti

  1. Khan Academy. Analisi dei dati categorici. Recuperato da: Khanacademy.org
  2. Formule universe. Variabile qualitativa. Estratto da: Univeformulas.com
  3. Minitab. Che sono variabili categoriche, discrete e continue. Recuperato da: supporto.Minitab.com
  4. Excel Tutorial. Caratterizzazione delle variabili. Recuperato da: aiuto.Xlslat.com.
  5. Wikipedia. Variabile statistica. Recuperato da Wikipedia.com
  6. Wikipedia. Variabile categorica. Recuperato da Wikipedia.com
  7. Wikipedia. Variabile categorica. Recuperato da Wikipedia.com