Sturges Rule

Sturges Rule

Spieghiamo quale sia la regola di Sturges, la sua applicazione e diamo diversi esempi

Qual è la regola dei robbi?

IL Sturges Rule È un criterio utilizzato per determinare il numero di classi o intervalli necessari per graficamente un insieme di dati statistici graficamente. Questa regola fu dichiarata nel 1926 dal matematico tedesco Herbert Sturges.

Sturges ha proposto un metodo semplice, in base al numero di campioni X che hanno permesso di trovare il numero di classi e la loro gamma di gamma. La regola di Sturges è ampiamente utilizzata soprattutto nell'area statistica, in particolare per creare istogrammi di frequenza.

Spiegazione

La regola di Sturges è un metodo empirico ampiamente utilizzato nelle statistiche descrittive per determinare il numero di classi che devono esistere in un istogramma di frequenza, al fine di classificare un insieme di dati che rappresentano un campione o una popolazione.

Fondamentalmente, questa regola determina la larghezza di contenitori grafici, istogrammi di frequenza.

Per stabilire la sua regola Herbert Sturges considerata un diagramma di frequenza ideale, che consiste in intervalli di k, in cui l'intervallo I -queste contiene un certo numero di campioni (i = 0,… k - 1), rappresentato come:

Questo numero di campioni è dato dal numero di modi in cui può essere estratto un sottoinsieme di un set; Cioè, dal coefficiente binomiale, espresso come segue:

Quindi, Sturges ha riferito che l'istogramma di frequenza approssimerà una distribuzione normale quando il numero di intervalli (k) aumenta secondo il teorema centrale del limite. In modo tale che il numero di campioni di ciascuno degli intervalli possa essere calcolato:

Può servirti: enegon: proprietà, come fare un enegon, esempi

Per semplificare l'espressione, ha applicato le proprietà dei logaritmi in entrambe le parti dell'equazione:

Pertanto, Sturges ha stabilito che il numero ottimale di intervalli K è dato dall'espressione:

Può anche essere espresso come:

In questa espressione:

  • K è il numero di classi.
  • N è il numero totale di osservazioni nel campione.
  • Il registro è il logaritmo di base comune 10.

Ad esempio, per elaborare un istogramma di frequenza che esprime un campione casuale della statura di 142 bambini, il numero di intervalli o classi che la distribuzione avrà è:

K = 1 + 3,322 * tronco d'albero10 (N)

K = 1+3,322* Registro (142)

K = 1+3,322* 2.1523

K = 8,14 ≈ 8

Pertanto, la distribuzione sarà a 8 intervalli.

Il numero di intervalli deve essere sempre rappresentato da numeri interi. Nei casi in cui il valore è decimale, deve essere fatta un'approssimazione al numero intero più vicino.

Sturges Rule Applications

La regola di Sturges viene applicata principalmente in statistiche, poiché consente una distribuzione di frequenza attraverso il calcolo del numero di classi (k), nonché la lunghezza di ciascuna di queste, nota anche come ampiezza.

L'ampiezza è la differenza nel limite superiore e inferiore della classe, divisa per il numero di classi ed è espressa:

Ci sono molte regole empiriche che consentono una distribuzione di frequenza. Tuttavia, la regola di Sturges è comunemente usata perché fa un'approssimazione del numero di classi, che di solito va da 5 a 15.

In questo modo, considera un valore che rappresenta correttamente un campione o una popolazione; Cioè, l'approccio non rappresenta gruppi estremi, né funziona con un numero eccessivo di classi che non consentono di riassumere il campione.

Può servirti: angoli opposti dal vertice (con un esercizio risolto)

Esempio

È necessario eseguire un istogramma di frequenza secondo i dati dati, che corrispondono alle età ottenute in un sondaggio sugli uomini che si esercitano in una palestra locale.

Per determinare gli intervalli, dovrebbero essere note la dimensione del campione o il numero di osservazioni; In questo caso, ce ne sono 30.

Quindi si applica la regola di Sturges:

K = 1 + 3,322 * tronco d'albero10 (N)

K = 1+3,322* Registro (30)

K = 1+3,322* 1.4771

K = 5,90 ≈ 6 intervalli.

Dal numero di intervalli, è possibile calcolare l'ampiezza che avranno; Cioè, la larghezza di ciascuna barra rappresentata nell'istogramma di frequenza:

Il limite inferiore è considerato come il valore inferiore dei dati e la tomaia è il valore più alto. La differenza tra il limite superiore e inferiore è chiamata intervallo o percorso della variabile (R).

La tabella ha che il limite superiore è 46 e il 13 inferiore; In questo modo, l'ampiezza di ogni classe sarà:

Gli intervalli saranno composti da un limite superiore e inferiore. Per determinare questi intervalli, inizia contando dal limite inferiore, aggiungendo a questo l'ampiezza determinata dalla regola (6), come segue:

Quindi la frequenza assoluta viene calcolata per determinare il numero di uomini che corrispondono a ciascun intervallo; In questo caso è:

  • Intervallo 1: 13 - 18 = 9
  • Intervallo 2: 19 - 24 = 9
  • Intervallo 3: 25 - 30 = 5
  • Intervallo 4: 31 - 36 = 2
  • Intervallo 5: 37 - 42 = 2
  • Intervallo 6: 43 - 48 = 3

Aggiungendo la frequenza assoluta di ciascuna classe, questo deve essere uguale al numero totale del campione; In questo caso, 30.

Può servirti: omotecia negativa

Successivamente, viene calcolata la frequenza relativa di ciascun intervallo, dividendo la frequenza assoluta di questo per il numero totale di osservazioni:

  • Intervallo 1: Fi = 9 ÷ 30 = 0,30
  • Intervallo 2: Fi = 9 ÷ 30 = 0,30
  • Intervallo 3: Fi = 5 ÷ 30 = 0,1666
  • Intervallo 4: Fi = 2 ÷ 30 = 0,0666
  • Intervallo 5: Fi = 2 ÷ 30 = 0,0666
  • Intervallo 4: Fi = 3 ÷ 30 = 0.10

Quindi è possibile creare una tabella che riflette i dati e anche il diagramma dalla frequenza relativa in relazione agli intervalli ottenuti, come si può vedere nelle seguenti immagini:

In questo modo, la regola di Sturges consente di determinare il numero di classi o intervalli in cui un campione può essere diviso, al fine di riassumere un campione di dati attraverso l'elaborazione di tabelle e grafica.