Distribuzione F caratteristiche ed esercizi risolti

Distribuzione F caratteristiche ed esercizi risolti

IL Distribuzione f o La distribuzione di Fisher-Snedecor è ciò che viene utilizzato per confrontare le varianze di due popolazioni diverse o indipendenti, ognuna delle quali segue una distribuzione normale.

La distribuzione che segue la varianza di un insieme di campioni di una singola popolazione normale è la distribuzione ji-quadro (Χ2) di grado N-1, se ciascuno dei campioni del set ha n elementi.

Figura 1. Ecco la densità di probabilità della distribuzione F con diverse combinazioni di parametri (o gradi di libertà) di numeratore e denominatore. Fonte: Wikimedia Commons.

Per confrontare le varianze di due popolazioni diverse, è necessario definire a statistico, Vale a dire una variabile casuale ausiliaria che consente di discernere se entrambe le popolazioni hanno o meno la stessa varianza.

Questa variabile ausiliaria può essere direttamente il quoziente delle varianze del campione di ciascuna popolazione, nel qual caso, se detto quoziente è vicino all'unità, si dimostra che entrambe le popolazioni hanno variazioni simili.

[TOC]

La statistica f e la sua distribuzione teorica

La variabile casuale F o F statistica proposta da Ronald Fisher (1890-1962) è quella usata più frequentemente per confrontare le varianze di due popolazioni ed è definita come segue:

Essere s2 La varianza del campione e σ2 La varianza della popolazione. Per distinguere ciascuno dei due gruppi di popolazione, gli abbonamenti 1 e 2 sono utilizzati rispettivamente.

È noto che la distribuzione ji-quadrato con (n-1) gradi di libertà è quella che segue la variabile ausiliaria (o statistica) che è definita di seguito:

X2 = (N-1) s2 / σ2.

Pertanto, la statistica F segue una distribuzione teorica fornita dalla seguente formula:

Essendo O La distribuzione ji-quadrato con D1 = N1 - 1 gradi di libertà per la popolazione 1 e V La distribuzione ji-quadrato con D2 = N2 - 1 Gradi di libertà per la popolazione 2.

Può servirti: algebra vettoriale

Il rapporto definito in questo modo è una nuova distribuzione di probabilità, nota come Distribuzione f con D1 gradi di libertà nel numeratore e D2 Gradi di libertà nel denominatore.

Media, moda e varianza della distribuzione f

Metà

La distribuzione media F viene calcolata come segue:

Essendo f (x) la densità di probabilità della distribuzione F, che è mostrata nella Figura 1 per diverse combinazioni di parametri o gradi di libertà.

È possibile scrivere la densità di probabilità f (x) a seconda della funzione γ (funzione gamma):

Una volta indicato l'integrale in precedenza, si è concluso che la media della distribuzione F con gradi di libertà (d1, d2) è: is: is: is:

μ = d2 / (d2 - 2) con d2> 2

Dove dimostra che, curiosamente, la media non dipende dai gradi di libertà D1 del numeratore.

Moda

D'altra parte, la moda dipende da D1 e D2 ed è data da:

Per d1> 2.

Varianza della distribuzione f

La varianza σ2 della distribuzione F è calcolato dall'integrale:

Ottenere:

Gestione della distribuzione f

Come altre distribuzioni di probabilità continue che coinvolgono funzioni complicate, la gestione della distribuzione F viene effettuata dalle tabelle o dal software.

Tabelle di distribuzione f

figura 2. Viene mostrata una parte della tabella di distribuzione F, che di solito è molto estesa perché esiste un'ampia combinazione di possibili gradi di libertà D1 e D2.

Le tabelle coinvolgono i due parametri o gradi di libertà di distribuzione F, la colonna indica il grado di libertà del numeratore e la riga il grado di libertà del denominatore.

Può servirti: disuguaglianza del triangolo: dimostrazione, esempi, esercizi risolti

La Figura 2 mostra una sezione della tabella di distribuzione F per il caso di a livello di significato 10%, questo è α = 0,1. Il valore di F è evidenziato quando D1 = 3 e D2 = 6 con livello di confidenza 1- α = 0,9 è 90%.

Software per la distribuzione f

Per quanto riguarda il software che gestisce la distribuzione F, c'è una grande varietà, dai fogli di calcolo come Eccellere anche pacchetti specializzati come Minitab, SPSS E R Per nominare alcuni dei più noti.

Va notato che il software di geometria e matematica Geogebra Ha uno strumento statistico che include le principali distribuzioni, inclusa la distribuzione f. La Figura 3 mostra la distribuzione F per il caso D1 = 3 e D2 = 6 livello di confidenza 90%.

Figura 3. La distribuzione F è mostrata per il caso D1 = 3 e D2 = 6 con livello di confidenza al 90%, ottenuto attraverso lo strumento statistico Geogebra. Fonte: geogebra.org

Esercizi risolti

Esercizio 1

Considera due campioni di popolazioni che hanno la stessa varianza della popolazione. Se il campione 1 è la dimensione N1 = 5 e il campione 2 è la dimensione n2 = 10, determinare la probabilità teorica che il rapporto delle rispettive varianze sia inferiore o uguale a 2.

Soluzione

Va ricordato che la statistica F è definita come:

Ma ci viene detto che le varianze della popolazione sono le stesse, quindi per questo esercizio si applica:

Come vuoi conoscere la probabilità teorica che questo rapporto di varianze del campione sia inferiore o uguale a 2, dobbiamo conoscere l'area sotto la distribuzione F tra 0 e 2, che può essere ottenuta da tabelle o software. Per questo, si deve prendere in considerazione che la distribuzione richiesta F ha D1 = N1 - 1 = 5 - 1 = 4 e D2 = N2 - 1 = 10 - 1 = 9, vale a dire la distribuzione F con gradi di libertà (4, 9).

Può servirti: serie di potere: esempi ed esercizi

Usando lo strumento statistico di Geogebra È stato determinato che quest'area è 0.82, quindi si è concluso che la probabilità che il rapporto delle varianze del campione sia inferiore o uguale al 2 è l'82%.

Esercizio 2

Esistono due processi di produzione di lamiera sottile. La variabilità dello spessore deve essere il più possibile. Vengono prelevati 21 campioni di ciascun processo. Il campione di processo ha una deviazione standard di 1,96 micron, mentre quella del processo B ha una deviazione standard di 2,13 micron. Quale dei processi ha una variabilità inferiore? Usa un livello di rifiuto del 5%.

Soluzione

I dati sono i seguenti: SB = 2,13 con NB = 21; SA = 1,96 con Na = 21. Ciò significa che devi lavorare con una distribuzione F di (20, 20) gradi di libertà.

L'ipotesi nulla implica che la varianza della popolazione di entrambi i processi è identica, cioè σa^2 / σb^2 = 1. L'ipotesi alternativa implicherebbe diverse varianze della popolazione.

Quindi, in base all'ipotesi di variazioni identiche della popolazione, la statistica f calcolata come: fc = (sb/sa)^2 è definita.

Poiché il livello di rifiuto è stato preso come α = 0,05, quindi α/2 = 0,025

La distribuzione f (0.025; 20,20) = 0,406, mentre F (0.975; 20,20) = 2,46.

Pertanto, l'ipotesi nulla sarà vera se la F calcolata è conforme: 0,406≤fc≤2,46. Altrimenti l'ipotesi nulla viene respinta.

Come fc = (2,13/1,96)^2 = 1.18 Si è concluso che la statistica FC è nell'intervallo di accettazione dell'ipotesi nulla con una certezza del 95%. In altre parole, con una certezza del 95%, entrambi i processi di produzione hanno la stessa varianza della popolazione.

Riferimenti

  1. F test per l'indipendenza. Recuperato da: Saylordotorg.Github.Io.
  2. Onda med. Statistiche applicate alle scienze della salute: test f. Recuperato da: Medwave.Cl.
  3. Probabilità e statistiche. Distribuzione f. Estratto da: Probabilità estici.com.
  4. TRIOLA, m. 2012. Statistiche elementari. 11 °. Edizione. Addison Wesley.
  5. UNAM. Distribuzione f. Recuperato da: Advisory.Cuautitlan2.UNAM.MX.
  6. Wikipedia. Distribuzione f. Recuperato da: è.Wikipedia.com