U -test of Mann - Whitney Cosa è e quando si applica, esecuzione, esempio
- 1149
- 207
- Ruth Cattaneo
IL U -test of Mann - Whitney Viene applicato per confrontare due campioni indipendenti quando hanno pochi dati o non seguire una distribuzione normale. In questo modo, è considerato un test non parametrico, A differenza della tua controparte Student T Test, che viene utilizzato quando il campione è abbastanza grande e seguire la distribuzione normale.
Frank Wilcoxon lo propone per la prima volta nel 1945, per campioni di dimensioni identiche, ma due anni dopo fu esteso nel caso di campioni di diverse dimensioni di Henry Mann e D. R. Whitney.
Figura 1. Il test u di Mann - Whitney viene applicato per il confronto di campioni indipendenti. Fonte: Pixabay.Spesso il test viene applicato per verificare se esiste una relazione tra una variabile qualitativa e un'altra quantitativa.
Un esempio illustrativo è quello di prendere una serie di persone ipertese ed estrarre due gruppi, a cui vengono registrati i dati della pressione sanguigna quotidiana per un mese.
A un gruppo il trattamento a e un altro viene applicato il trattamento b. Qui la pressione sanguigna è la variabile quantitativa e il tipo di trattamento è il qualitativo.
Vuoi sapere se la mediana, e non la media, dei valori misurati è statisticamente uguale o diversa, per stabilire se esiste una differenza tra i due trattamenti. Per ottenere la risposta, viene applicato Wilcoxon o U -test di Mann - Whitney.
[TOC]
Approccio problematico nel test u di Mann - Whitney
Un altro esempio in cui è possibile applicare il test è il seguente:
Supponiamo di voler sapere se il consumo di bevande analcoliche differisce significativamente in due regioni del paese.
Uno di questi si chiama regione A e l'altra regione B. Viene eseguito un record di litri consumati settimanalmente in due campioni: una delle 10 persone per la regione A e un'altra di 5 persone per la regione B.
I dati sono i seguenti:
-Regione A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Regione b: 12,14, 11, 30, 10
Viene sollevata la seguente domanda:
Il consumo di bevande analcoliche (y) dipende dalla regione (x)?
Variabili qualitative rispetto alle variabili quantitative
-Variabile qualitativa x: Regione
-Variabile quantitativa e: Consumo gassoso
Se la quantità di litri consumati è la stessa in entrambe le regioni, la conclusione sarà che non vi è alcuna dipendenza tra le due variabili. Il modo di sapere è confrontare la tendenza media o mediana per le due regioni.
Caso normale
Se i dati hanno seguito una distribuzione normale, vengono sollevate due ipotesi: NULL H0 e alternativa H1 attraverso il confronto tra i mezzi:
Può servirti: prodotti notevoli-H0: Non c'è differenza tra la media delle due regioni.
-H1: I mezzi di entrambe le regioni sono diversi.
Caso con no - tendenza normale
Al contrario, se i dati non seguono una distribuzione normale o semplicemente il campione è molto piccolo da sapere, invece di confrontare la media, verrebbe confrontato La mediana delle due regioni.
-H0: Non c'è differenza tra la mediana delle due regioni.
-H1: Le mediane di entrambe le regioni sono diverse.
Se le mediane coincidono, allora l'ipotesi nulla è soddisfatta: non vi è alcuna relazione tra il consumo di soda e la regione.
E se accade il contrario, l'ipotesi alternativa è vera: esiste una relazione tra consumo e regione.
È per questi casi in cui è indicato il test U di Mann - Whitney.
Campioni campione o non a bordo
Il seguente importante problema per decidere se è applicato il test U di Mann Whitney è se il numero di dati in entrambi i campioni è identico, il che equivale a dire che sono allo stesso tempo.
Se i due campioni fossero abbinati, si applicherebbe la versione di Wilcoxon originale. Ma in caso contrario, come nel caso dell'esempio, viene applicato il test di Wilcoxon modificato, che è precisamente il test U di Mann Whitney.
Mann Whitney U Caratteristiche del test
Il test u di Mann -Whitney un test non parametrico, applicabile a campioni che non seguono la distribuzione normale o con pochi dati. Ha le seguenti caratteristiche:
1.- Confronta le mediane
2.- Lavora su gamme ordinate
3.- È meno potente, comprensivo per potere la probabilità di rifiutare l'ipotesi nulla quando in realtà è falso.
Tenendo conto di queste caratteristiche, il test u di Mann - Whitney viene applicato quando:
-I dati sono indipendenti
-Non seguono la normale distribuzione
-L'ipotesi NULL H0 è accettata se il mezzo dei due campioni coincide: MA = MB
-L'ipotesi alternativa H1 è accettata se il mezzo dei due campioni differisce: Ma ≠ Mb
Formula di Mann - Whitney
La variabile U è la stazione di contrasto utilizzata nel test di Mann - Whitney ed è definita:
U = min (ua, ub)
Ciò significa che U è il minimo dei valori tra UA e UB, applicati a ciascun gruppo. Nel nostro esempio sarebbe per ogni regione: A o b.
Le variabili UA e UB sono definite e calcolate secondo la seguente formula:
UA = NB + NA (NA +1)/2 - RA
Ub = NB + NB (NB +1)/2 - RB
Può servirti: riduzione di termini similiQui i valori NA e NB sono le dimensioni dei campioni corrispondenti rispettivamente alle regioni A e B e d'altra parte, RA e Rb sono i somme di gamma che definiremo di seguito.
Passaggi per applicare il test
1.- Ordina i valori dei due campioni.
2.- Assegna un intervallo di ordine a ciascun valore.
3.- Correggere le legature esistenti nei dati (valori ripetuti).
4.- Calcola RA = Sumpa degli intervalli del campione a.
5.- Trova rb = somma delle gamme del campione b.
6.- Determina il valore UA e UB, secondo le formule indicate nella sezione precedente.
7.- Confronta UA e UB e il minore dei due è assegnato alla statistica o sperimentale (cioè i dati) rispetto alla statistica teorica o normale.
Applicazione pratica dell'applicazione
Ora applichiamo i suddetti al problema della soda precedentemente sollevata:
Regione A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Regione B: 12,14, 11, 30, 10
A seconda che i mezzi di entrambi i campioni siano statisticamente uguali o diversi, procediamo ad accettare o rifiutiamo l'ipotesi nulla: non esiste alcuna relazione tra la variabile e e X, cioè il consumo di soda non dipende dalla regione:
H0: MA = MB
H1: MA ≠ MB
figura 2. Dati di consumo gassoso nelle regioni A e B. Fonte: f. Zapata.- Passo 1
Procediamo per ordinare i dati congiuntamente per i due campioni, ordinando i valori dal meno al massimo:
Si noti che il valore 11 appare 2 volte (una volta in ciascun campione). Inizialmente ha posizioni o intervalli 3 e 4, ma non per sopravvalutare o sottovalutare l'uno o l'altro il valore medio è scelto come un intervallo, ovvero 3,5.
Allo stesso modo, il valore 12 viene proceduto, che si ripete tre volte con gli intervalli 5, 6 e 7.
Bene, il valore 12 è assegnato l'intervallo medio di 6 = (5+6+7)/3. E lo stesso per il valore 14, che ha una legatura (appare in entrambi i campioni) nelle posizioni 8 e 9, l'intervallo medio 8 è assegnato.5 = (8+9)/2.
- Passo 2
I dati per la regione A e B vengono quindi di nuovo separati ma ora i loro intervalli corrispondenti sono assegnati in un'altra riga:
Regione A
Regione b
Gli intervalli RB sono ottenuti dalle somme degli elementi della seconda riga per ogni caso o regione.
Passaggio 3
Vengono calcolati i rispettivi valori UA e UB:
UA = 10 × 5 + 10 (10 + 1)/2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1)/2 -34 = 31
Valore sperimentale u = min (19, 31) = 19
Passaggio 4
Il teorico dovrebbe seguire una distribuzione normale n con parametri forniti esclusivamente dalla dimensione dei campioni:
Può servirti: numeri irrazionali: storia, proprietà, classificazione, esempiN ((Na⋅nb) /2, √ [Nb (Na + Nb +1) /12])
Al fine di confrontare la variabile o ottenuta sperimentalmente, con quella teorica è necessario apportare una modifica variabile. Passa dalla variabile o sperimentale al suo valore caratterizzato, che verrà chiamato Z, Per poter essere in grado di confrontare con quello di una distribuzione normale caratterizzata.
La variazione variabile è la seguente:
Z = (u - na.Nb / 2) / √ [na. NB (Na + NB + 1) / 12]
Va notato che per il cambiamento di variabile sono stati utilizzati i parametri della distribuzione teorica per U. Quindi la nuova variabile Z, che è un ibrido tra il teorico e la distribuzione normale o una distribuzione normale N (0,1).
Criteri di confronto
Se z ≤ zα ⇒ L'ipotesi NULL H0 è accettata
Sì Z> Zα ⇒ L'ipotesi NULL H0 viene respinta
I valori critici Zα tipizzati dipendono dal livello di confidenza richiesto, ad esempio per un livello di fiducia α = 0,95 = 95% che è il più normale che ha il valore critico Zα = 1,96.
Per i dati mostrati qui:
Z = (u - nb / 2) / √ [nb (na + nb + 1) / 12] = -0.73
Che è al di sotto del valore critico 1.96.
Quindi la conclusione finale è che l'ipotesi nulla è accettata:
Non vi è alcuna differenza nel consumo di soda tra le regioni A e B.
Calcolatori online per il test u di Mann - Whitney
Esistono programmi specifici per calcoli statistici, inclusi SPSS e Minitab, ma questi programmi sono pagati e il loro uso non è sempre semplice. Questo perché danno così tante opzioni, che il suo uso è praticamente riservato agli esperti di statistiche.
Fortunatamente, ci sono molti programmi online molto precisi, gratuiti e semplici che consentono ai test U -whitney.
Questi programmi sono:
-Statistiche delle scienze sociali (Socsistatistics.com), che ha sia il test U-Whitney che quello di Wilcoxon nel caso di campioni bilanciati o accoppiati.
-Statistiche terapeutiche dell'IA (Ai-terapia.com), che ha molti dei soliti test delle statistiche descrittive.
-Statistico da usare (fisica.Csbsju.Edu/Stats), uno dei più antichi, quindi la tua interfaccia può sembrare obsoleta, sebbene sia un programma gratuito molto efficiente.
Riferimenti
- Dietrichson. Metodi quantitativi: test di intervalli. Recuperato da: bookdown.org
- Marín J p. Guida SPSS: analisi e procedure in test non parametrici. Recuperato da: Halweb.Uc3m.È
- MOOC USAL. Test non parametrico: U di Mann - Whitney. Recuperato da: YouTube.com
- Wikipedia. U -test of Mann - Whitney. Recuperato da: è.Wikipedia.com
- Xlstat. Centro assistenza. Mann Test Tutorial - Whitney in Excel. Recuperato da: aiuto.Xlsat.com
- « Formule di errore di campionamento ed equazioni, calcolo, esempi
- Esempi di dati raggruppati ed esercizio fisico risolto »