Misure di posizione, tendenza centrale e dispersione

Misure di posizione, tendenza centrale e dispersione

IL Misure di tendenza centrale, dispersione e posizione, Questi sono valori utilizzati per interpretare correttamente un insieme di dati statistici. Questi possono essere lavorati direttamente, come ottenuti dallo studio statistico, oppure possono essere organizzati in gruppi di uguale frequenza, facilitando l'analisi.

Le tre misure di tendenza centrale più note e alcune delle sue proprietà. Fonte: f. Zapata.

Misure di tendenza centrale

Consentono di sapere quali valori sono raggruppati i dati statistici.

Media aritmetica

È anche noto come media dei valori di una variabile e si ottiene aggiungendo tutti i valori e dividendo il risultato per il numero totale di dati.

  • Media aritmetica per i dati senza raggruppamento

Essere una variabile X di cui non ci sono dati senza organizzare o raggruppare, la sua media aritmetica viene calcolata come segue:

E in notazione sommaria:

Esempio

I proprietari di un ostello turistico di montagna intendono sapere quanti giorni in media rimangono nelle strutture. Per fare ciò, è stato effettuato un record dei giorni di permanenza di 20 gruppi di turisti, ottenendo i seguenti dati:

1; 1; 2; 2; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; 2; 2; 3; 4; 1

I giorni medi in cui i turisti soggiornano sono:

= 2.5 giorni

  • Media aritmetica per dati raggruppati

Se i dati variabili sono organizzati in una tabella di frequenza assoluta fYo E i centri di classe sono x1, X2,…, XN, La media è calcolata da:

Nella somma dell'estate:

Mediano

La mediana di un gruppo di N valori di variabile X è il valore centrale del gruppo, a condizione che i valori siano sempre più ordinati. In questo modo, la metà di tutti i valori è inferiore alla moda e l'altra metà è maggiore.

  • Mezzo di dati non gruppi

I seguenti casi possono essere presentati:

-Numero n Valori della variabile x  strano: La mediana è il valore che è solo nel mezzo del gruppo di valori:

-Numero n Valori della variabile x paio: In questo caso la mediana viene calcolata come media dei due valori centrali del gruppo di dati:

Esempio

Per trovare la mediana dei dati dell'ostello turistico, vengono ordinati per la prima volta al minimo:

1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5

Può servirti: qual è la frequenza relativa e come viene calcolata?

Il numero di dati è persino, quindi ci sono due dati centrali: x10 e xundici E poiché entrambi valgono 2, anche la sua media.

Mediana = 2

  • Mezzo di dati raggruppati

Viene utilizzata la seguente formula:

I simboli nella formula significano:

-C: larghezza dell'intervallo contenente mediana

-BM: bordo inferiore dello stesso intervallo

-FM: Numero di osservazioni contenenti l'intervallo a cui appartiene la mediana.

-N: dati totali.

-FBm: numero di osservazioni prima dell'intervallo contenente la mediana.

Moda

La moda per i dati non raggruppati è il valore più frequenza, mentre per i dati raggruppati è la classe più frequenza. È considerato la moda come i dati più rappresentativi o la classe di distribuzione.

Due caratteristiche importanti di questa misura sono che un set di dati può avere più di una moda e la moda può essere determinata sia per i dati quantitativi che per i dati qualitativi.

Esempio

Continuando con i dati dell'ostello turistico, quello che si ripete di più è 1, quindi, la cosa più normale è che i turisti rimangono 1 giorno nell'ostello.

Misure di dispersione

Le misure di dispersione descrivono quanto sono raggruppati i dati attorno alle misure centrali.

Allineare

Viene calcolato sottraendo i dati principali e i dati minori. Se questa differenza è grande, è un segno che i dati sono dispersi, mentre i piccoli valori indicano che i dati sono vicini alla media.

Esempio

La gamma per i dati dell'ostello turistico è:

Intervallo = 5−1 = 4

Varianza

  • Varianza per dati non gruppi

Per trovare la varianza S2 È necessario conoscere prima la media aritmetica, quindi la differenza viene calcolata nel quadrato tra ciascun dati e la media, tutti vengono aggiunti e divisi per le osservazioni totali. Queste differenze sono note come deviazioni.

La varianza, che è sempre positiva (o zero), indica fino a che punto sono le osservazioni della media: se la varianza è alta, i valori sono più dispersi rispetto a quando la varianza è piccola.

Esempio

La varianza per i dati dell'ostello turistico è:

1; 1; 2; 2; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; 2; 2; 3; 4; 1

= 1.95

  • Varianza per dati raggruppati

Per trovare la varianza di un gruppo di dati raggruppati, sono richiesti: i) la media, ii) la frequenza fYo  che sono i dati totali in ogni classe e iii) xYo  o valore di classe:

Può servirti: tipi di triangoli

Deviazione standard

La deviazione standard è la radice quadrata positiva della varianza, quindi ha un vantaggio rispetto alla varianza: arriva nelle stesse unità della variabile in studio e quindi ha un'idea più diretta rispetto alla chiusura o lontana che è la variabile della media.

  • Deviazione standard per dati non gruppi

Viene determinato semplicemente trovando la radice quadrata della varianza per i dati non esauriti:

 Esempio

La deviazione standard per i dati dell'ostello turistico è:

S = √ (s2) = √1.95 = 1.40

  • Deviazione standard per dati raggruppati

Viene calcolato trovando la radice quadrata della varianza per i dati raggruppati:

Misure di posizione

Misure di posizione Dividi un set ordinato di dati in parti uguali. La mediana, oltre ad essere una misura di tendenza centrale, è anche una misura della posizione, poiché divide il tutto in due parti uguali. Ma puoi ottenere parti più piccole con quartili, decili e percentili.

Quartili

I quartili dividono il set in quattro parti uguali, ciascuna con il 25 % dei dati. Sono indicati come Q1, Q2 e q3 E la mediana è il quartile q2. In questo modo, il 25% dei dati è al di sotto della Q quartile1, 50% al di sotto del quartile q2 o mediana e 75% sotto il quartile q3.

figura 2. I quartili dividono il set di dati in quattro parti uguali. Fonte: f. Zapata.
  • Quartili per dati non gruppi

I dati vengono ordinati e il totale è diviso in 4 gruppi con lo stesso numero di dati ciascuno. La posizione del primo quartile si trova da:

Q1 = (n+1)/4

Essere i dati totali. Se il risultato è l'intero dati corrispondente a quella posizione, ma se è decimale, i dati corrispondenti all'intera parte con quanto segue vengono mediati o per una maggiore precisione, sono interpolati linearmente tra tali dati.

Esempio

La posizione del primo quartile q1 Per i dati dell'ostello turistico è:

Q1 = (n+1) / 4 = (20+1) / 4 = 5.25

Questa è la posizione del quartile 1 e come il risultato è decimale, vengono ricercati dati di dati x5 e x6, che sono rispettivamente x5 = 1 e x6 = 1 e sono mediati, risultanti:

Primo quartile = 1

1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5.

La posizione del secondo quartile q2 È:

Può servirti: somma telescopica: come viene risolto e risolto gli esercizi

Q2 = 2 (n+1)/4 = 10.5

Che è la media tra x10 e xundici e coincide con la mediana:

Secondo quartile = mediana = 2

La terza posizione del quartile è calcolata da:

Q3 = 3 (n+1) / 4 = 3 (20+1) / 4 = 15.75

È anche decimale, quindi X sono mediatiquindici e x16:

1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5.

Ma come entrambi valgono 4:

Terzo quartile = 4

La formula generale per la posizione dei quartili in dati non ravvicinati è:

QK = K (n+1)/4

Con k = 1,2,3.

  • Quartili per dati raggruppati

Sono calcolati in modo simile alla mediana:

La spiegazione dei simboli è:

-BQ: bordo inferiore dell'intervallo contenente quartile

-C: larghezza di quell'intervallo

-FQ: Numero di osservazioni conteneva l'intervallo quartile.

-N: dati totali.

-FBq: numero di dati prima dell'intervallo contenente quartile.

Decili e percentili

Decili e percentili dividono il set di dati in 10 parti uguali e 100 parti uguali rispettivamente e il loro calcolo viene eseguito analogo a quello dei quartili.

  • Decili e percentili per dati non gruppi

Le formule vengono utilizzate rispettivamente:

DK = K (n+1)/10

Con k = 1,2,3… 9.

Decile dDeve essere uguale alla mediana.

PK = K (n+1)/100

Con k = 1,2,3… 99.

Il percentile pcinquanta Deve essere uguale alla mediana.

Esempio

Nell'esempio dell'ostello turistico, la posizione del D3 È:

D3 = 3 (20+1)/10 = 6.3

Come è una media di un numero decimale x6 e x7, entrambi uguali a 1:

1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5

Significa che 3 decimi dei dati sono inferiori a x7 = 1 e il restante sopra.

  • Decili e percentili per dati raggruppati

Le formule sono analoghe a quelle dei quartili. D è usato per indicare i decili e P per i percentili e i simboli sono interpretati in modo simile:

La regola empirica

Quando i dati sono distribuiti simmetricamente e la distribuzione è unimodale, c'è una regola chiamata  Regola empirica O Regola 68 - 95 - 99, che li raggruppa nei seguenti intervalli:

  • Il 68% dei dati è nell'intervallo:

  • Il 95% dei dati è nell'intervallo:

  • Il 99% dei dati è nell'intervallo:

Esempio

In quale intervallo è il 95% dei dati dell'ostello turistico?

Sono nell'intervallo: [2.5−1.40; 2.5+1.40] = [1.1; 3.9].

Riferimenti

  1. Berenson, m. 1985. Statistiche per l'amministrazione ed economia. Inter -American s.A.
  2. Devore, j. 2012. Probabilità e statistiche per l'ingegneria e la scienza. 8 °. Edizione. Cengage.
  3. Levin, r. 1988. Statistiche per gli amministratori. 2 °. Edizione. Prentice Hall.
  4. Spiegel, m. 2009. Statistiche. Serie Schaum. 4 TA. Edizione. McGraw Hill.
  5. Walpole, r. 2007. Probabilità e statistiche per l'ingegneria e la scienza. Pearson.