Caratteristiche variabili categoriche ed esempi
- 1951
- 65
- Dott. Rodolfo Gatti
IL variabile categorica È quello utilizzato in statistiche per assegnare una caratteristica o una proprietà non numerica o qualitativa a un oggetto, individuo, entità, condizione o procedura. È possibile definire tutti i tipi di variabili categoriali in base a ciascuna necessità.
Esempi di variabili categoriali sono: colore, sesso, gruppo ematico, stato civile, tipo di materiale, forma di pagamento o tipo di conto bancario e sono usati molto quotidianamente.
Figura 1: il colore è una variabile categorica. Fonte: PixabayQuanto sopra sono le variabili, ma i loro possibili valori sono qualitativi, vale a dire di qualità o caratteristica e non di una misurazione numerica. Ad esempio i possibili valori per la variabile sesso Sono: maschio , HAbbraccio.
Quando questa variabile è memorizzata in un programma per computer, può essere dichiarata come variabile di testo e verranno nominati gli unici valori accettati: Maschio , Femmina.
Tuttavia la stessa variabile sesso può essere dichiarato e archiviato come un numero intero se Maschio è assegnato 1 Già Femmina Il valore è assegnato 2. È per questo motivo che le variabili categoriche sono talvolta chiamate tipo elencato.
La caratteristica principale delle variabili categoriche è che a differenza di altre variabili, come continue e discrete, non è possibile rendere l'aritmetica con loro. Tuttavia, le statistiche possono essere fatte con loro, come si vedrà più avanti.
[TOC]
Esempi
Nota i seguenti esempi di variabili categoriche e i loro possibili valori:
-Gruppo sanguigno, Intervallo di valori: A, b, ab, o
-Stato civile, Valori categorici: Separare (A), Sposato (B), Vedovo (C) , Divorziato (D).
-Tipo di materiale, Categorie o valori: 1 = legno, 2 = metallo, 3 = plastica
-Modo di pagare, Valori o categorie: (1) contanti, (2) debito, (3) trasferimento, (4) credito
Può servirti: Tesla Coil: History, come funziona, a cosa serveNegli esempi precedenti un numero è stato associato a ciascuna categoria in modo completamente arbitrario.
Si potrebbe pensare quindi che questa associazione numerica arbitraria lo rende equivalente a un variabile quantitativa discreta, Ma non è poiché le operazioni aritmetiche non possono essere fatte con questi numeri.
Per illustrare l'idea, nella variabile Modo di pagare, L'operazione di somma non ha senso:
(1) efficace + (2) Debito non sarà mai equivalente a (3) Trasferimento
Classificazione di variabili categoriali
La classificazione si basa sul fatto che abbiano o meno una gerarchia implicita o se il numero di risultati possibili è più di due o due.
Una variabile categorica con un singolo risultato possibile non è una variabile, è una costante categorica.
Nominale categorico
Quando non possono essere rappresentati da un numero o hanno alcun ordine. Ad esempio la variabile: Type_de_material, tvalori nominali (Legno, metallo, plastica), non hanno gerarchia o ordine, anche quando un numero arbitrario viene assegnato a ciascuna risposta o categoria.
Ordinale categorico
Variabile: Rendimento scolastico
Valori nominali: Alto Medio basso
Sebbene i valori di questa variabile non siano numerici, hanno impliciti un ordine o una gerarchia.
Binario categorico
Queste sono variabili nominali con due possibili risposte, ad esempio:
-Variabile: Risposta
-Valori nominali: VERO, Impostore
Si noti che la variabile Risposta Non implica una gerarchia e ha solo due possibili risultati, quindi è una variabile binaria categorica.
Alcuni autori chiamano questo tipo variabile binaria, E non lo considerano appartenente al variabili categoriche che sono limitati a quelli con più di tre possibili categorie.
Statistiche con variabili categoriali
Le statistiche possono essere fatte con variabili categoriche, nonostante non siano variabili numeriche o quantitative. Ad esempio, per conoscere la tendenza o il valore più probabile di una variabile categorica viene presa Moda.
Può servirti: astroclymics: storia, quali studi, ramiModa In questo caso è il risultato o il valore più ripetuto di una variabile categorica. Nelle variabili categoriche non è possibile calcolare né la media, né la mediana.
La media non può essere calcolata perché non può essere resa aritmetica con variabili categoriali. Né la mediana, perché le variabili quantitative o categoriali non hanno un ordine o una gerarchia, quindi non è possibile determinare un valore centrale.
Rappresentazione grafica di variabili categoriche
Data una determinata variabile categorica, è possibile trovare la frequenza o il numero di volte con cui viene ripetuto un risultato di quella variabile. Se questo viene fatto per ciascun risultato, è possibile realizzare un grafico in frequenza a seconda di ciascuna categoria o risultato.
Ecco alcuni esempi di come le variabili categoriche possono essere rappresentate graficamente.
Esercizi risolti
Esercizio 1
Un'azienda ha dati da 170 dipendenti. Una delle variabili che si trova in questi record è: Stato civile. Questa variabile ha quattro possibili categorie o valori:
Separare (A), Sposato (B), Vedovo (C) , Divorziato (D).
Sebbene sia una variabile non immmer, è possibile sapere quanti dei record totali sono in una determinata categoria ed essere rappresentati sotto forma di un grafico a barre, come mostrato nella figura seguente:
figura 2. Rappresentazione dei risultati di una variabile categorica. Fonte: sé realizzatoEsempio 2
Un negozio di scarpe porta un record delle sue vendite. Tra le variabili che gestiscono i loro record c'è il colore della scarpa per ogni modello. La variabile:
Color_zapati_modelo_aw3
È categorico e ha cinque possibili categorie o valori. Per ogni categoria di quella variabile viene totalizzato il numero di vendite e la percentuale della stessa è stabilita. I risultati sono presentati nel grafico della seguente figura:
Può servirti: proprietà elettriche dei materiali Figura 3. Colore variabile categorico _ Zapato. In questo modo variabile è bianco. Fonte: sé realizzato.Si può dire quindi che dal modello di scarpe AW3 di cui è moda, Il più frequentemente venduto è il Bianco, seguito da vicino dal Nero.
Si può anche dire che la probabilità del 70% la prossima scarpa venduta di questo modello sarà Bianco O Nero.
Queste informazioni possono essere utili per il negozio quando si effettuano nuovi ordini o possono persino applicare sconti sui colori meno venduti per l'inventario in eccesso.
Esempio 3
Per una certa popolazione di donatori di sangue, vogliamo rappresentare il numero di persone appartenenti a un certo gruppo sanguigno. Un modo grafico per visualizzare i risultati è attraverso un pittogramma, che è sullo sfondo una tabella.
Nella prima colonna la variabile è rappresentata Gruppo sanguigno e i suoi possibili risultati o categorie. La seconda colonna ha la rappresentazione in modo iconico o pittorico del numero di persone in ciascuna categoria. Nel nostro esempio, una goccia rossa viene utilizzata come icona, ognuna delle quali rappresenta 10 persone.
Figura 4. Pictogramma. Fonte: sé realizzatoRiferimenti
- Khan Academy. Analisi dei dati categorici. Recuperato da: Khanacademy.org
- Formule universe. Variabile qualitativa. Estratto da: Univeformulas.com
- Minitab. Che sono variabili categoriche, discrete e continue. Recuperato da: supporto.Minitab.com
- Excel Tutorial. Caratterizzazione delle variabili. Recuperato da: aiuto.Xlslat.com.
- Wikipedia. Variabile statistica. Recuperato da Wikipedia.com
- Wikipedia. Variabile categorica. Recuperato da Wikipedia.com
- Wikipedia. Variabile categorica. Recuperato da Wikipedia.com