Misure di variabilità

Misure di variabilità
Figura 1.- Le misure di variabilità più note. Fonte: f. Zapata.

Quali sono le misure di variabilità?

IL Misure di variabilità, Chiamati anche misure di dispersione, sono indicatori statistici che indicano quanto si trovano vicini o remoti i dati della loro media aritmetica. Se i dati sono vicini alla media, la distribuzione è concentrata e se sono lontani, è allora una distribuzione dispersa.

Ci sono molte misure di variabilità, tra le più note sono:

  • Allineare
  • Deviazione media
  • Varianza
  • Deviazione standard

Queste misure completano le misure di tendenza centrale e sono necessarie per comprendere la distribuzione dei dati ottenuti ed estrarre quante più informazioni possibili.

Allineare

L'intervallo o il percorso misurano l'ampiezza di un set di dati. Per determinare il suo valore, viene trovata la differenza tra il valore x più altomax e il valore minimo xmin:

R = xmax - Xmin

Se i dati non sono sciolti ma raggruppati per intervallo, allora l'intervallo viene calcolato dalla differenza tra il limite superiore dell'ultimo intervallo e il limite inferiore del primo intervallo.

Quando l'intervallo è un valore piccolo significa che tutti i dati sono abbastanza vicini tra loro, ma un ampio intervallo indica che c'è molta variabilità. È evidente che, a parte il limite superiore e il limite inferiore dei dati, l'intervallo non tiene conto dei valori tra loro, quindi non è consigliabile utilizzarlo quando il numero di dati è grande.

Tuttavia, è una misura immediata da calcolare e ha le stesse unità di dati, quindi è facile interpretarla.

Esempio di rango

Successivamente, l'elenco è disponibile con il numero di obiettivi segnati durante il fine settimana, nei campionati di calcio di nove paesi:

Può servirti: quali sono i divisori di 30? (Spiegazione)

40, 32, 35, 36, 37, 31, 37, 29, 39

È un set di dati senza raggrupparsi. Per trovare la gamma, procedono per ordinarli dal meno al massimo:

29, 31, 32, 35, 36, 37, 37, 39, 40

I dati con il valore più alto sono 40 obiettivi e quello con il valore più basso è di 29 obiettivi, quindi l'intervallo è:

R = 40−29 = 11 goal.

Si può considerare che l'intervallo è piccolo rispetto ai dati del valore minimo, che sono 29 obiettivi, quindi si può presumere che i dati non abbiano una grande variabilità.

Deviazione media

Questa misura di variabilità viene calcolata attraverso la media dei valori assoluti delle deviazioni rispetto alla media. Indicando la deviazione media come dM, Per i dati non gruppi, la deviazione media viene calcolata dalla seguente formula:

Dove n è il numero di dati disponibili, xYo Rappresenta ogni dati e X̄ è la media, che viene determinata aggiungendo tutti i dati e dividendo tra n:

La deviazione media consente di sapere, in media, quante unità i dati si discostano dalla media aritmetica e hanno il vantaggio di avere le stesse unità dei dati con cui funziona.

Esempio di deviazione centrale

Secondo i dati dell'intervallo, il numero di obiettivi contrassegnati è:

40, 32, 35, 36, 37, 31, 37, 29, 39

Se vuoi trovare la deviazione media DM Di questi dati, è necessario calcolare prima la media aritmetica X̄:

E ora che il valore di X̄ è noto, procediamo a trovare la deviazione mediaM:

= 2.99 ≈ 3 goal

Pertanto si può dire che, in media, i dati si allontanano approssimativamente in 3 obiettivi medi che sono 35 goal e, come notato, è una misura molto più precisa della gamma.

Può servirti: iperbole

Varianza

La deviazione media è una misura di variabilità molto più sottile rispetto all'intervallo, ma come calcolata attraverso il valore assoluto delle differenze tra ciascun dati e la media, non offre una maggiore versatilità dal punto di vista algebrico.

Pertanto, è preferita la varianza, che corrisponde alla media della differenza quadratica di ciascun dati con la media e viene calcolata usando la formula:

In questa espressione, s2 indica la varianza e come sempre xYo rappresenta ciascuno dei dati, x̄ è la media e n i dati totali.

Quando si lavora con un campione anziché con la popolazione, si preferisce calcolare la varianza come questa:

La differenza con la formula precedente è che nel denominatore ci sono n - 1 anziché n. Succede che dividendo per n, la varianza del campione sottovaluta la varianza della popolazione da cui è stata estratta, ma non quando è divisa per n - 1. In alcuni testi quell'espressione appare con il nome di Quasi-Variza.

In ogni caso, la varianza è caratterizzata dall'essere sempre una quantità positiva, ma essendo la media delle differenze quadratiche, è importante osservare che non ha le stesse unità di quelle dei dati.

Esempio di varianza

Per calcolare la varianza dei dati degli esempi di intervallo e deviazione media, i valori corrispondenti vengono sostituiti e la somma indicata. In questo caso viene scelto di dividere tra N-1:

= 13.86

Deviazione standard

La varianza non ha la stessa unità di quella della variabile in studio, ad esempio, se i dati sono disponibili in metri, la varianza si traduce in contatori quadrati. O nell'esempio degli obiettivi sarebbe negli obiettivi quadrati, il che non ha senso.

Può servirti: quali sono gli elementi della parabola? (Parti)

Pertanto, la deviazione standard è definita, chiamata anche deviazione tipica, Come la radice quadrata della varianza:

S = √s2

In questo modo una misura di variabilità dei dati è ottenuta nelle stesse unità di queste e più basso è il valore di s, più raggruppati i dati sono attorno alla media.

Sia la varianza che la deviazione standard sono le misure di variabilità da scegliere quando la media aritmetica è la misura della tendenza centrale che meglio descrive il comportamento dei dati.

Ed è che la deviazione standard ha una proprietà importante, nota come teorema di Chebyshev: almeno il 75% delle osservazioni è nell'intervallo definito da X ± 2s. In altre parole, il 75% dei dati è, al massimo, a una distanza pari a 2 secondi intorno alla media.

Allo stesso modo, almeno l'89% dei valori è a una distanza di 3 secondi dalla media, una percentuale che può essere ampliata, a condizione che siano disponibili molti dati e questi seguono una distribuzione normale.

figura 2.- Se i dati seguono una distribuzione normale, 95.4 di essi sono due deviazioni standard su entrambi i lati della media. Fonte: Wikimedia Commons.

Esempio di deviazione standard

La deviazione standard dei dati presentati negli esempi precedenti è:

S = √s2 = √13.86 = 3.7 ≈ 4 gol