Doppio campionamento

Doppio campionamento

Spieghiamo cosa è doppio campionamento, esempi, vantaggi e svantaggi e mettiamo gli esercizi risolti

In doppio campionamento vuoi sapere più profondamente una variabile di una popolazione

Cos'è il doppio campionamento?

Lui Doppio campionamento È una tecnica che viene utilizzata nelle statistiche inferenziali quando si desidera conoscere più dettagli e certezza su una particolare variabile, che caratterizza una certa popolazione.

Il secondo campione di popolazione viene generalmente effettuato dopo un primo campione, la cui analisi non ha mostrato una conclusione statisticamente significativa su nessuna delle variabili di studio erano state prese e analizzate.

Per questo motivo, il campionamento a doppia statistica è anche noto come Campionamento di due fasi. L'utilità del secondo campione sta in cui aiuta a determinare più precisamente la stima di ragioni e regressioni di una certa variabile ausiliaria, che si presenta alla luce dell'analisi di un primo campione.

Un altro uso che viene dato al doppio campionamento è quello di raccogliere informazioni per la realizzazione di un campionamento di strati.

Esempi

Di seguito sono riportate varie situazioni in cui è giustificato il doppio campionamento.

Controllo di qualità nell'elaborazione dei pezzi

Il doppio metodo di campionamento viene spesso utilizzato nel controllo di qualità industriale e di solito viene eseguito in due fasi.

Ad esempio, supponiamo che una macchina industriale che prepara alcuni pezzi. Per quanto la macchina sia regolata, nessun pezzo è identico a un altro, poiché nelle sue dimensioni e peso possono verificarsi piccole variazioni. Si tratta di determinare se molte parti prodotte da detta macchina soddisfano i criteri di tolleranza in modo che sia accettata o respinta.

Innanzitutto, viene prelevato un campione casuale di pezzi con cui una delle variabili deve essere controllata, ad esempio la lunghezza del pezzo, è all'interno della tolleranza.

Nel caso in cui la lunghezza media sia al di sotto del o superiore al grado di tolleranza desiderato per detto variabile, in questo primo campione, si è dedotto che il lotto è difettoso e deve essere scartato. In questo caso non è necessario prelevare nuovi campioni.

Può servirti: coefficiente di correlazione: formule, calcolo, interpretazione, esempio

Al contrario, se il valore medio rientra nell'intervallo di tolleranza, ma la deviazione standard del campione è abbastanza grande per la somma o la sottrazione del valore medio esterno al margine, sarà necessario raccogliere un secondo campione importante.

Questo secondo campione deve includere il campione originale per rifare i calcoli e quindi essere in grado di prendere una decisione finale in merito alla variabile indagata. In questo modo può essere noto se il lotto è difettoso o no.

Diminuire i costi di campionamento

In molte occasioni, le informazioni su una delle variabili che desideri studiare sono difficili da accedere. Ma potrebbe esserci una variabile ausiliaria più facilmente per la raccolta dei dati.

In questo caso, vengono prelevati due campioni, uno grande per la variabile ausiliaria, meno costosa e un campione minore, contenuto nel campione principale della variabile più costosa.

Questo metodo è applicabile ogni volta che è determinato che esiste una correlazione tra le due variabili, che è generalmente una relazione di proporzionalità.

Un esempio di questa situazione appare nelle scienze della foresta, dove si desidera determinare la percentuale di alberi colpiti da una pianta di parassiti (La Tiña).

Poiché queste sono molto estese e difficili da accedere alle regioni, la popolazione completa di alberi è impossibile in tempo e costi. Questi passaggi vengono quindi seguiti:

Passaggio 1: campionamento

Il campionamento preliminare consisterebbe nell'uso della fotografia aerea e la foresta è suddivisa in lotti. Alcuni lotti vengono scelti a caso e stimati, mediante analisi delle immagini dei lotti scelti, quanti alberi sono influenzati dalla tigna, poiché il colore degli alberi è influenzato dal parassita.

Può servirti: teorema di euclide

Passaggio 2: lavoro sul campo

Ma l'analisi fotografica non può essere precisa, quindi procediamo a scegliere, preferibilmente in modo casuale, alcuni del primo campione a fare un lavoro sul campo.

Passaggio 3: confronto

Quindi il risultato del campo viene confrontato con il fotografico per l'intercettazione dei due lotti. Questo confronto può essere eseguito, ad esempio, realizzare un grafico in cui l'asse orizzontale è il valore ottenuto per ogni lotto mediante fotografia e nell'asse verticale il valore ottenuto dal lotto attraverso il lavoro sul campo.

Questo metodo grafico consente di identificare visivamente se esiste una correlazione tra i due risultati e determinato, attraverso un'analisi di regressione, il coefficiente di proporzionalità o rapporto tra i due campioni.

Dopo il campione principale, ovvero il campione fotografico, il valore medio degli alberi infetti e la sua deviazione standard sono presi. Ma poiché sono stati determinati il ​​coefficiente di proporzionalità e il suo errore con i campioni di campo, è possibile correggere il risultato del campione principale (il fotografico).

Quindi questo risultato può essere estrapolato alla popolazione completa di alberi.

Vantaggi e svantaggi del doppio campionamento

Negli esempi descritti, il vantaggio in termini di costi è la prova.

Uno svantaggio è che, nel caso del doppio campionamento per il controllo di qualità, esiste il rischio di superare molti prodotti che sono fuori tolleranza.

Esercizio

Vuoi stimare il numero di alberi malati in una foresta di 162 ettari. Poiché la foresta è molto ampia, è suddivisa in 100 trame della stessa area. 18 grafici sono scelti a caso e attraverso uno studio fotografico si stima che in quei 18 grafici ci siano 8 alberi malati con un errore standard di circa 4,5 alberi.

Può servirti: quali sono le parti della frazione? (Esempi)

Di questi 18 grafici, 8 grafici vengono scelti a caso. Per quegli otto trame, lo studio fotografico provoca 10 alberi malati con un errore di più o meno 5,3 alberi.

D'altra parte, per quegli stessi otto grafici lo studio sul campo lancia 12,4 alberi malati con un errore di oltre 6,3 alberi.

È richiesto:

  • a) Determinare il coefficiente di proporzionalità tra lo studio sul campo mediante regressione lineare.
  • b) stimare il numero di alberi malati attraverso il metodo fotografico nei cento trame.
  • c) Applicare la correzione con il coefficiente di proporzionalità ottenuto, per stimare il numero reale di alberi malati nell'intera foresta.

Soluzione

Un grafico del numero di alberi per conteggio fotografico rispetto al conteggio dei campi per gli otto lotti selezionati per entrambi gli studi.

Conteggio fotografico rispetto al conteggio dei campi. Fonte: f. Zapata.

Una linea di tendenza viene regolata e la sua pendenza è determinata. In questo caso si ottiene che il coefficiente di proporzionalità è 1,23. Cioè, se x è il numero di conteggio fotografico, si stima che il conteggio dei campi sarà y = 1,23 x.

Il numero di alberi malati in base al conteggio fotografico nei 18 lotti selezionati sarà:

18 x 8,5 = 153

Ma poiché l'intera foresta è stata divisa in 100 trame della stessa area, il numero di alberi malati stimati con il metodo fotografico è: (100/18) x 153 = 850.

Viene ora applicato il fattore di correzione ottenuto dal confronto tra il campo e lo studio fotografico:

Numero reale stimato di alberi malati nella foresta = 1,23 x 850 = 1046.

Riferimenti

  1. Doppio campione per stima del rapporto, Pennstate College. Estratto dal PSU.Edu
  2. Campionamento doppio, multiplo e segenziale, NC State University. Recuperato da NCSU.Edu
  3. Semplice campionamento casuale. Recuperato da Investopedia.com
  4. Cos'è il doppio campionamento? Recuperato da: NIST.Gov
  5. Campione. Recuperato da: in.Wikipedia.org
  6. Campione multistage. Recuperato da: in.Wikipedia.org