Distribuzione chi-quadro (χ²), come viene calcolata, esempi

Distribuzione chi-quadro (χ²), come viene calcolata, esempi

La prova Chi quadrato O ji-quadrato2, Dove χ è la lettera greca chiamata "chi") viene utilizzata per determinare il comportamento di una determinata variabile e anche quando si desidera sapere se due o più variabili sono statisticamente indipendenti.

Per verificare il comportamento di una variabile, il test da chiamare Test di regolazione Chi Square. Sapere se due o più variabili sono statisticamente indipendenti dal test viene chiamato Chi Square of Independence, chiamato anche di contingenza.

Figura 1. Test di ipotesi tramite Chi Cuadrado

Queste prove fanno parte della teoria statistica delle decisioni, in cui viene studiata una popolazione e vengono prese decisioni al riguardo, analizzando uno o più campioni estratti da esso. Per questo è necessario fare alcune ipotesi relative alle variabili, chiamate ipotesi, che può o meno essere certo.

Esistono alcuni test per contrastare queste congetture e determinare quali sono validi, entro un certo margine di confidenza, incluso il test chi-quadro, che può essere applicato per confrontare due e la maggior parte delle popolazioni.

Come vedremo, vengono generalmente considerati due tipi di ipotesi su alcuni parametri di popolazione in due campioni: l'ipotesi nulla, chiamata hO (I campioni sono indipendenti) e l'ipotesi alternativa, indicata come H1, (i campioni sono correlati), il che è contrario a quello.

[TOC]

Quando viene utilizzato il test chi-quadrato?

Il test Chi Square si applica alle variabili che descrivono le qualità, come sesso, stato civile, gruppi sanguigni, colore degli occhi e preferenze di vari tipi.

Il test è progettato quando si desidera:

-Controlla se una distribuzione è appropriata per descrivere una variabile, che viene chiamata Bontà di aggiustamento. Attraverso il test Chi Square puoi sapere se ci sono differenze significative tra la distribuzione teorica selezionata e la distribuzione della frequenza osservata.

-Sapere se due variabili X e Y sono indipendenti dal punto di vista statistico. Questo è noto come Test di indipendenza.

Poiché si applica alle variabili qualitative o categoriche, il test Chi Square è ampiamente utilizzato nelle scienze sociali, nell'amministrazione e nella medicina.

Condizioni per applicarlo

Esistono due requisiti importanti per applicarlo correttamente:

Può servirti: qual è la relazione tra l'area rombo e il rettangolo?

-I dati devono essere raggruppati in frequenze.

-Il campione deve essere abbastanza grande da rendere valida la distribuzione di chi quadrato, altrimenti il ​​suo valore è sopravvalutato e dà origine al rifiuto dell'ipotesi nulla quando non dovrebbe essere così.

La regola generale è che se nei dati raggruppati appare una frequenza con valore inferiore a 5, non viene utilizzata. Se c'è più di una frequenza inferiore a 5, devono essere combinati in uno per ottenere una frequenza con un valore numerico maggiore di 5.

Distribuzione di Chi Square

χ2 È una distribuzione continua di probabilità. Esistono effettivamente curve diverse, a seconda di un parametro K chiamato gradi di libertà a caso.

Le sue proprietà sono:

-L'area sotto la curva è uguale a 1.

-I valori di χ2 Sono positivi.

-La distribuzione è asimmetrica, cioè ha un pregiudizio.

figura 2. Distribuzione quadrata di chi per gradi di libertà watts. Fonte: Wikimedia Commons.

Gradi di libertà

Con l'aumentare dei gradi di libertà, la distribuzione chi-quadro tende alla normalità, come si può vedere nella figura.

Per una data distribuzione, i gradi di libertà sono determinati attraverso il tabella di contingenza, che è la tabella in cui vengono registrate le frequenze osservate delle variabili.

Se un tavolo ha F Classifica e C colonne, il valore di K È:

K = (f - 1) ⋅ (c - 1)

Formulazione di ipotesi

Quando il test di Chi Square è la regolazione, vengono formulate le seguenti ipotesi:

-HO: variabile x ha una distribuzione di probabilità f (x) con parametri specifici e1, E2… , EP

-H1: X ha un'altra distribuzione di probabilità.

La distribuzione di probabilità che si assume nell'ipotesi nulla può essere, ad esempio, la ben nota distribuzione normale e i parametri sarebbero i μ medi e la deviazione standard σ.

Inoltre, l'ipotesi nulla viene valutata con un certo livello di significato, cioè una misura dell'errore che verrebbe commesso quando si rifiutano essendo vero.

In generale, questo livello è stabilito dell'1 %, 5 % o 10 % e più basso è il risultato del test, più affidabile.

Può servirti: mumm

E se viene utilizzato il test di contingenza Chi Square, che come abbiamo detto serve a verificare l'indipendenza tra due variabili xey, le ipotesi sono:

-HO: Le variabili xey sono indipendenti.

-H1: Xey sono dipendenti.

Ancora una volta è necessario specificare un livello di significato per conoscere la misura dell'errore quando si prevede la decisione.

Come vengono calcolate le statistiche chi-quadro?

Le statistiche di Chi Square sono calcolate come segue:

Il simbolo ∑ significa "somma", che dobbiamo fare sull'espressione frazionaria indicata.

La somma viene eseguita dalla prima classe I = 1 all'ultima, che è i = k.

Oltretutto:

-FO È una frequenza osservata (deriva dai dati ottenuti).

-FE È la frequenza prevista o teorica (è necessario calcolarlo dai dati).

Per accettare o rifiutare l'ipotesi nulla, viene calcolato2 Per i dati osservati e paragonate a un valore chiamato CHI Critical Square, che dipende dai gradi di libertà K e il livello di significato α:

χ2critico =  χ2K, α

Se, ad esempio, vogliamo eseguire il test con un livello di significatività dell'1 %, allora α = 0.01, se sarà con il 5%, allora α = 0.05 e così via. P, il parametro di distribuzione, come:

P = 1 - α

Questi valori quadrati critici sono determinati da tabelle che contengono il valore dell'area accumulata. Ad esempio, per k = 1, che rappresenta 1 grado di libertà e α = 0.05, equivalente a p = 1-.05 = 0.95, il valore di χ2 È 3.841.

Figura 3. Tabella dei valori di distribuzione di chi quadrati. Fonte: f. Zapata.

Criteri di accettazione ACO

I criteri per accettare HO È:

-Sì χ2 < χ2critico  HO, Altrimenti viene rifiutato (vedi Figura 1).

Esempio di calcolo

Nella seguente applicazione il test Chi Square verrà utilizzato come test di indipendenza.

Supponiamo che i ricercatori vogliano sapere se la preferenza per il caffè nero è correlata al genere della persona e specificare la risposta con un livello di significato di α = 0.05.

Può servirti: angoli alternativi esterni: esercizi ed esercizi risolti

Per questo, un campione di 100 persone intervistate e le loro risposte sono disponibili:

Passo 1

Stabilire ipotesi:

-HO: genere e preferenza per il caffè nero sono indipendenti.
-H1: Il gusto per il caffè nero è legato al genere della persona.

Passo 2

Calcola le frequenze previste per la distribuzione, per le quali sono richiesti il ​​totale aggiunto nell'ultima riga e nella colonna di destra. Ogni cella nella scatola rossa ha un valore atteso FE, che viene calcolato moltiplicando il totale della sua riga R per la colonna totale C, divisa per il campione totale N:

FE = (F x c) /n

I risultati sono i seguenti per ogni cella:

-C1: (36 x 47) / 100 = 16.92
-C2: (64 x 47) / 100 = 30.08
-C3: (36 x 53) / 100 = 19.08
-C4: (64 x 53) / 100 = 33.92

Passaggio 3

Quindi devi calcolare la statistica Chi Cuadrado per questa distribuzione, secondo la formula data:

χ2= [(21 - 16.92)2 ÷ 16. 92] + [(26 - 30.08)2 ÷ 30.08] + [(15 - 19.08)2 ÷ 19.08]+ [(38 - 33.92)2 ÷ 33. 92] = 0.9838 + 0.5534 + 0.8725 + 0.4908 = 2.9005

Passaggio 4

Determina χ2critico, Sapendo che i dati registrati sono a F = 2 righe e C = 2 colonne, quindi il numero di gradi di libertà è:

K = (2-1) ⋅ (2-1) = 1.

Il che significa che dobbiamo guardare nella tabella mostrata sopra il valore di χ2K, α = χ21; 0.05 , che è:

χ2critico = 3.841

Passaggio 5

Confronta i valori e decidi:

χ2 = 2.9005

χ2critico = 3.841

Da χ2 < χ2critico L'ipotesi nulla è accettata e si è conclusa che la preferenza per il caffè nero non è legata al genere della persona, con un livello di significatività del 5%.

Riferimenti

  1. Test di Chi Square per l'indipendenza. Recuperato da: Saylordotorg.Github.Io.
  2. Onda med. Statistiche applicate alle scienze della salute: il test Ji-quadrato. Recuperato da: Medwave.Cl.
  3. Probabilità e statistiche. Test di bontà di regolazione di Shi Square. Estratto da: Probabilità estici.com.
  4. TRIOLA, m. 2012. Statistiche elementari. 11 °. Edizione. Addison Wesley.
  5. UNAM. Test di Chi Square. Recuperato da: Advisory.Cuautitlan2.UNAM.MX.