Formule di distribuzione ipergeometrica, equazioni, modello

Formule di distribuzione ipergeometrica, equazioni, modello

IL distribuzione ipergeometrica È una funzione statistica discreta, adeguata per calcolare la probabilità in esperimenti casuali con due possibili risultati. La condizione necessaria per applicarla è che sono piccole popolazioni, in cui le estrazioni non vengono sostituite e le probabilità non sono costanti. 

Pertanto, quando viene scelto un elemento della popolazione per conoscere il risultato (vero o falso) di una certa caratteristica, lo stesso elemento non può essere scelto di nuovo.

Figura 1. In una popolazione di viti come questa, ci sono sicuramente esemplari difettosi. Fonte: Pixabay.

Certamente, l'elemento successivo scelto ha quindi maggiori probabilità di ottenere un vero risultato, se l'elemento precedente ha avuto un risultato negativo. Ciò significa che la probabilità è variabile, nella misura in cui vengono estratti gli elementi del campione.

Le principali applicazioni della distribuzione ipergeometrica sono: controllo di qualità nei processi con poca popolazione e il calcolo delle probabilità nei giochi casuali.

Per quanto riguarda la funzione matematica che definisce la distribuzione ipergeometrica, questo consiste in tre parametri, che sono:

- Numero di elementi di popolazione (N)

- Dimensione del campione (M) 

- Numero di eventi nella popolazione completa con un risultato favorevole (o sfavorevole) della caratteristica studiata (N).

[TOC]

Formule ed equazioni

La formula di distribuzione ipergeometrica fornisce probabilità P riguardo a cosa X Si verificano casi favorevoli di una certa caratteristica. Il modo di scriverlo matematicamente, a seconda dei numeri combinatori è:

Nell'espressione precedente N, N E M Sono parametri e X la variabile stessa. 

-La popolazione totale è N.

-Il numero di risultati positivi di una certa caratteristica binaria rispetto alla popolazione totale è N.

-Il numero di elementi del campione è M.

In questo caso, X È una variabile casuale che prende valore X P (x) indica la probabilità di occorrenza di X casi favorevoli della caratteristica studiata.

Importanti variabili statistiche

Altre variabili statistiche per la distribuzione ipergeometrica sono:

- Metà μ = m*n/n

- Varianza σ^2 = m*(n/n)*(1-n/n)*(n-m)/(n-1)

- Deviazione tipica σ che è la radice quadrata della varianza.

Modello e proprietà 

Per raggiungere il modello di distribuzione ipergeometrica, si basa sulla probabilità di ottenere X casi favorevoli in un campione di dimensioni M. Questo campione contiene elementi che incontrano la proprietà in studio e elementi che non lo fanno.

Ricordiamolo N rappresenta il numero di casi favorevoli nella popolazione totale di N elementi. Quindi la probabilità verrebbe calcolata in questo modo:

Può servirti: spazio vettoriale: base e dimensione, assiomi, proprietà

P (x) = (# di modi per ottenere x# in modi falliti)/(# modi totali di selezione)

Esprimendo quanto sopra sotto forma di numeri combinatori, viene raggiunto il seguente modello di distribuzione delle probabilità:

Proprietà principali della distribuzione ipergeometrica

Sono i seguenti:

- Il campione deve essere sempre piccolo, sebbene la popolazione sia grande.

- Gli elementi del campione vengono estratti da uno, senza incorporarli di nuovo nella popolazione.

- La proprietà da studiare è binaria, cioè può richiedere solo due valori: 1 O 0, O Bene VERO O impostore.

In ogni fase di estrazione del passaggio, la probabilità cambia a seconda dei risultati precedenti.

Approccio per distribuzione binomiale

Un'altra proprietà della distribuzione ipergeometrica è che può essere affrontata dalla distribuzione binomiale, indicata come Bi, Finché la popolazione N essere grande e almeno 10 volte maggiore del campione M. In questo caso sarebbe così:

P (n, n, m; x) = bi (m, n/n, x)           

Finché n è grande e n> 10m

Esempi

Esempio 1

Supponiamo che una macchina che produca viti e dati accumulati indichi che l'1% viene visualizzato con difetti. Quindi in una scatola di n = 500 viti il ​​numero di difetti sarà:

N = 500 * 1/100 = 5

Probabilità attraverso la distribuzione ipergeometrica

Supponiamo che da quella scatola (cioè di quella popolazione) prendiamo un campione di m = 60 viti.

La probabilità che nessuna vite (x = 0) delle foglie del campione difettosa è del 52,63%. Questo risultato viene raggiunto quando si utilizza la funzione di distribuzione ipergeometrica:

P (500, 5, 60; 0) = 0,5263

La probabilità che x = 3 viti di campionamento lasci difettoso è: p (500, 5, 60; 3) = 0,0129.

D'altra parte, la probabilità che X = 4 viti degli anni sessanta del campione difettoso difettoso è: P (500, 5, 60; 4) = 0,0008.

Infine, la probabilità che x = 5 viti in quel campione vengano fuori con il difetto è: p (500, 5, 60; 5) = 0.

Ma se si desidera sapere la probabilità che in quel campione ci siano più di 3 viti difettose, è necessario ottenere la probabilità accumulata, aggiungendo:

P (3)+P (4)+P (5) = 0,0129+0.0008+0 = 0,0137.

Questo esempio è illustrato nella Figura 2, ottenuto attraverso l'uso di Geogebra Utilizzo di ampio uso libero nelle scuole, istituti e università.

figura 2. Esempio di distribuzione ipergeometrica. Preparato da f. Zapata con geogebra.

Esempio 2

Un mazzo spagnolo ha 40 carte, di cui 10 hanno oro e i restanti 30 non ce l'hanno. Supponiamo che 7 carte vengano estratte da quel mazzo, che non tornano al mazzo.

Può servirti: simmetria centrale: proprietà, esempi ed esercizi

Se x è il numero di ori presenti nelle 7 carte estratte, allora la probabilità che è x oros in un'estrazione di 7 carte è data dalla distribuzione ipergeometrica P (40,10,7; x).

Diamo un'occhiata a questo: per calcolare la probabilità di avere 4 ori in un'estrazione di 7 carte, utilizziamo la formula di distribuzione ipergeometrica con i seguenti valori:

E il risultato è: probabilità del 4,57%.

Ma se vuoi conoscere la probabilità di ottenere più di 4 carte, dovremo aggiungere:

P (4)+P (5)+P (6)+P (7) = 5,20%

Esercizi risolti

La seguente serie di esercizi ha lo scopo di illustrare e assimilare i concetti che sono stati presentati in questo articolo. È importante che il lettore cerchi di risolverli da soli, prima di guardare la soluzione.

Esercizio 1

Una fabbrica profilattica ha scoperto che su ogni 1000 preservativi prodotti da una certa macchina, 5 sono difettosi. Per eseguire il controllo di qualità, 100 preservativi vengono presi a caso e il lotto viene respinto se c'è almeno uno o più difettoso. Rispondere:

a) Quale possibilità deve essere un 100 lotto scartato?

b) questo criterio di controllo della qualità è efficiente?

Soluzione

In questo caso appariranno numeri combinatori molto grandi. Il calcolo è difficile, a meno che non sia disponibile un pacchetto di computer adeguato.

Ma poiché è una grande popolazione e il campione è dieci volte inferiore alla popolazione totale, è possibile utilizzare l'approccio alla distribuzione ipergeometrica a causa della distribuzione binomiale:

P (1000,5.100; x) = BI (100, 5/1000, x) = BI (100, 0.005, x) = C (100, x)*0.005^x (1-0.005)^(100-x)

Nell'espressione precedente C (100, x) È un numero combinatorio. Quindi la probabilità di Haya più di una difettosa verrà calcolata come segue:

P (x> = 1) = 1 - bi (0) = 1-.6058 = 0.3942

È un approccio eccellente, se confrontato con il valore ottenuto quando si applica la distribuzione ipergeometrica: 0.4102

Si può dire che il 40% di probabilità che molte 100 profilattiche dovrebbero essere scartate, il che non è molto efficiente.

Ma essere un po 'meno impegnativo nel processo di controllo della qualità e scartare.

Esercizio 2

Una macchina di taco di plastica funziona in modo tale da ogni 10 pezzi, uno viene deformato. In un campione a 5 parti quella possibilità deve essere difettosa.

Soluzione

Popolazione: n = 10

Può servirti: identità pitagoriche: dimostrazione, esempio, esercizi

Numero n difettoso per ogni n: n = 1

Dimensione del campione: M = 5

P (10, 1, 5; 1) = C (1.1)*C (9.4)/C (10.5) = 1*126/252 = 0.5

Pertanto esiste una probabilità del 50% che in un campione di 5, un taco esce deformato.

Esercizio 3

In una riunione delle giovani scuole superiori ci sono 7 signore e 6 signori. Tra le ragazze, 4 studiano umanistiche e 3 scienze. Nel gruppo di ragazzi, 1 studi umanistici e 5 scienze. Calcola quanto segue:

a) Scegliere casualmente tre ragazze: quali sono la probabilità che tutti studiassero le discipline umanistiche?.

b) Se tre partecipanti vengono scelti a caso per l'incontro degli amici: cosa sono tre, indipendentemente dal sesso, studiano i tre o umanistiche anche tutti e tre?.

c) Ora seleziona due amici casuali e chiama X al "numero variabile casuale di coloro che studiano le discipline umanistiche". Tra i due scelti, determinare il valore medio o atteso di X e la varianza σ^2.

Soluzione a 

La popolazione è il numero totale di ragazze: n = 7. Coloro che studiano le discipline umanistiche sono n = 4, del totale. Il campione casuale di ragazze sarà m = 3.

In tal caso, la probabilità che i tre siano disciplinari siano dati dalla funzione ipergeometrica:

P (n = 7, n = 4, m = 3, x = 3) = c (4, 3) c (3, 0) / c (7, 3) = 0.1143

Poi ce ne sono 11.Probabilità del 4% che tre chicas casuali studiano umanistiche.

Soluzione b

I valori da utilizzare sono:

-Popolazione: n = 14

-Quantità che studia lettere è: n = 6 e il

-Dimensione del campione: M = 3.

-Numero di amici che studiano umanistiche: x

Secondo questo, x = 3 significa che le tre umanistiche in studio, ma x = 0 significa che nessuno studia umanistico. La probabilità che i tre studi lo stesso siano dati dalla somma:

P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0.0560 + 0.1539 = 0.2099

Quindi, abbiamo una probabilità del 21% che tre partecipanti alla riunione, scelti a caso, studiassero lo stesso.

Soluzione c

Qui abbiamo i seguenti valori:

N = 14 popolazione totale di amici, n = 6 numero totale nella popolazione che studia le discipline umanistiche, la dimensione del campione è m = 2.

La speranza è:

E (x) = m * (n/n) = 2 * (6/14) = 0.8572

E la varianza:

σ (x)^2 =  m*(n/n)*(1-n/n)*(n-m)/(n-1) = 2*(6/14)*(1-6/14)*(14-2)/(14 -1) =

= 2*(6/14)*(1-6/14)*(14-2)/(14-1) = 2*(3/7)*(1-3/7)*(12) (13)  = 0.4521

Riferimenti

  1. Distribuzioni di probabilità discrete. Recuperato da: Biploot.USAL.È
  2. Statistica e probabilità. Distribuzione ipergeometrica. Estratto da: ProjectOdeScartes.org
  3. Cdpye-ugr. Distribuzione ipergeometrica. Recuperato da: ugr.È
  4. Geogebra. Geogebra classica, calcolo della probabilità. Recuperato da Geogebra.org
  5. PROBATE facile. Esercizi di distribuzione ipergeometrici risolti. Recuperato da: Probacil.com
  6. Minitab. Distribuzione ipergeometrica. Estratto da: supporto.Minitab.com
  7. Università di Vigo. Principali distribuzioni discrete. Recuperato da: Anapg.siti Web.Uvigo.È
  8. Vititor. Statistiche e combinatori. Estratto da: vitutor.netto
  9. Weisstein, Eric W. Distribuzione ipergeometrica. Recuperato da: Mathworld.Wolfram.com
  10. Wikipedia. Distribuzione ipergeometrica. Recuperato da: è.Wikipedia.com