O teste U de Mann-Whitney é aplicado para a comparação de duas amostras independentes quando elas têm poucos dados ou não seguem uma distribuição normal. Dessa forma, é considerado um teste não paramétrico, diferentemente do seu homólogo, o teste t de Student , usado quando a amostra é grande o suficiente e segue a distribuição normal.
Frank Wilcoxon o propôs pela primeira vez em 1945, para amostras de tamanhos idênticos, mas dois anos depois foi estendido no caso de amostras de tamanhos diferentes por Henry Mann e DR Whitney.
Freqüentemente, o teste é aplicado para verificar se há uma relação entre uma variável qualitativa e uma quantitativa.
Um exemplo ilustrativo é pegar um conjunto de pessoas hipertensas e extrair dois grupos, que são registrados diariamente nos dados da pressão arterial durante um mês.
O tratamento A é aplicado a um grupo e o tratamento B. A pressão arterial é a variável quantitativa e o tipo de tratamento é qualitativo.
Queremos saber se a mediana, e não a média, dos valores medidos é estatisticamente igual ou diferente, para estabelecer se há uma diferença entre os dois tratamentos. Para obter a resposta, é aplicada a estatística Wilcoxon ou o teste U de Mann – Whitney.
Declaração do problema no teste Mann U – Whitney
Outro exemplo no qual o teste pode ser aplicado é o seguinte:
Suponha que queremos saber se o consumo de refrigerantes difere significativamente em duas regiões do país.
Um deles é chamado região A e a outra região B. É mantido um registro dos litros consumidos semanalmente em duas amostras: uma em cada 10 pessoas na região A e a outra em 5 pessoas na região B.
Os dados são os seguintes:
-Região A : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Região B : 12,14, 11, 30, 10
Surge a seguinte pergunta:
O consumo de refrigerantes (Y) depende da região (X)?
Variáveis qualitativas versus variáveis quantitativas
-Variável qualitativa X : Região
-Variável quantitativa Y : Consumo de refrigerantes
Se a quantidade de litros consumida for a mesma em ambas as regiões, a conclusão será que não há dependência entre as duas variáveis. A maneira de descobrir é comparar a tendência média ou mediana das duas regiões.
Caso normal
Se os dados seguirem uma distribuição normal, são propostas duas hipóteses: a H0 nula e a alternativa H1 através da comparação entre as médias:
– H0 : não há diferença entre a média das duas regiões.
– H1 : os meios de ambas as regiões são diferentes.
Caso com tendência não normal
Por outro lado, se os dados não seguirem uma distribuição normal ou a amostra for pequena demais para saber, em vez de comparar a média, a mediana das duas regiões será comparada .
– H0 : não há diferença entre a mediana das duas regiões.
– H1 : as medianas das duas regiões são diferentes.
Se as medianas coincidem, a hipótese nula é cumprida: não há relação entre o consumo de refrigerantes e a região.
E se o oposto acontece, a hipótese alternativa é verdadeira: existe uma relação entre consumo e região.
É nesses casos que o teste U de Mann – Whitney é indicado.
Amostras emparelhadas ou não emparelhadas
A próxima questão importante na decisão de aplicar o teste U de Mann Whitney é se o número de dados em ambas as amostras é idêntico, ou seja, eles são pares.
Se as duas amostras forem emparelhadas, a versão original do Wilcoxon será aplicada. Mas, se não, como é o caso no exemplo, o teste de Wilcoxon modificado é aplicado, que é precisamente o teste U de Mann Whitney.
Características do teste U de Mann Whitney
O teste U de Mann – Whitney é um teste não paramétrico, aplicável a amostras que não seguem a distribuição normal ou com poucos dados. Possui as seguintes características:
1.- Compare as medianas
2.- Funciona em faixas ordenadas
3.- É menos poderoso, significando por poder a probabilidade de rejeitar a hipótese nula, quando de fato é falsa.
Considerando essas características, o teste U de Mann – Whitney é aplicado quando:
-Dados é independente
-Eles não seguem a distribuição normal
-A hipótese nula H0 é aceita se as medianas das duas amostras coincidirem: Ma = Mb
-A hipótese alternativa H1 é aceita se as medianas das duas amostras diferirem: Ma ≠ Mb
Fórmula de Mann – Whitney
A variável U é a estatística de contraste usada no teste de Mann-Whitney e é definida da seguinte forma:
U = min (Ua, Ub)
Isso significa que U é o menor dos valores entre Ua e Ub, aplicado a cada grupo. No nosso exemplo, seria para cada região: A ou B.
As variáveis Ua e Ub são definidas e calculadas de acordo com a seguinte fórmula:
Ua = Na Nb + Na (Na +1) / 2 – Ra
Ub = Na Nb + Nb (Nb +1) / 2 – Rb
Aqui os valores Na e Nb são os tamanhos das amostras correspondentes às regiões A e B, respectivamente e, por outro lado, Ra e Rb são as somas da faixa que definiremos abaixo.
Etapas para aplicar o teste
1.- Encomende os valores das duas amostras.
2.- Atribua um intervalo de pedidos a cada valor.
3.- Corrija os vínculos existentes nos dados (valores repetidos).
4.- Calcular Ra = Soma dos intervalos da amostra A.
5.- Encontre Rb = Soma dos intervalos da amostra B.
6.- Determine o valor Ua e Ub, de acordo com as fórmulas fornecidas na seção anterior.
7.- Compare Ua e Ub, e o menor dos dois é atribuído à estatística U experimental (ou seja, dos dados) que é comparada com a estatística U teórica ou normal.
Exemplo de aplicação prática
Agora, aplicamos o acima ao problema dos refrigerantes levantados anteriormente:
Região A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Região B: 12, 14, 11, 30, 10
Dependendo se as médias das duas amostras são estatisticamente iguais ou diferentes, a hipótese nula é aceita ou rejeitada: não há relação entre as variáveis Y e X, ou seja, o consumo de refrigerantes não depende da região:
H0: Ma = Mb
H1: Ma ≠ Mb
– Passo 1
Prosseguimos ordenando os dados para as duas amostras, ordenando os valores do menor para o maior:
Observe que o valor 11 aparece 2 vezes (uma vez em cada amostra). Originalmente, possui posições ou intervalos 3 e 4, mas, para não superestimar ou subestimar um ou outro, é escolhido o valor médio, ou seja, 3,5.
Da mesma forma, prosseguimos com o valor 12, que é repetido três vezes nos intervalos 5, 6 e 7.
Bem, ao valor 12 é atribuído o intervalo médio de 6 = (5 + 6 + 7) / 3. E o mesmo para o valor 14, que possui ligadura (aparece em ambas as amostras) nas posições 8 e 9, recebe o intervalo médio 8,5 = (8 + 9) / 2.
– Passo 2
Os dados para as regiões A e B são separados novamente, mas agora os intervalos correspondentes são atribuídos em outra linha:
Região A
Região B
As faixas Ra e Rb são obtidas das somas dos elementos da segunda linha para cada caso ou região.
etapa 3
Os respectivos valores Ua e Ub são calculados:
Ua = 10 × 5 + 10 (10 + 1) / 2-86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Valor experimental U = min (19, 31) = 19
Passo 4
Supõe-se que o U teórico siga uma distribuição normal N com parâmetros dados exclusivamente pelo tamanho das amostras:
N ((na⋅nb) / 2, √ [na nb (na + nb +1) / 12])
Para comparar a variável U obtida experimentalmente, com a U teórica é necessário fazer uma alteração da variável. Passa da variável experimental U ao seu valor padronizado , que será chamado Z , para poder fazer a comparação com a de uma distribuição normal padronizada.
A alteração da variável é a seguinte:
Z = (U – na.nb / 2) / √ [na. nb (na + nb + 1) / 12]
Deve-se notar que, para a alteração da variável, foram utilizados os parâmetros da distribuição teórica para U. Em seguida, a nova variável Z, que é um híbrido entre o U teórico e o U experimental, é contrastada com uma distribuição normal padronizada N (0,1 )
Critérios de comparação
Se Z ≤ Zα ⇒ a hipótese nula H0 é aceita
Se Z> Zα ⇒ a hipótese nula H0 é rejeitada
Os valores críticos padronizados Zα dependem do nível de confiança necessário, por exemplo, para um nível de confiança α = 0,95 = 95%, que é o mais usual, o valor crítico Zα = 1,96.
Para os dados mostrados aqui:
Z = (U – na nb / 2) / √ [na nb (na + nb + 1) / 12] = -0,73
Qual está abaixo do valor crítico 1,96.
Portanto, a conclusão final é que a hipótese nula H0 é aceita:
Não há diferença no consumo de refrigerantes entre as regiões A e B.
Calculadoras online para o teste U de Mann – Whitney
Existem programas específicos para cálculos estatísticos, incluindo SPSS e MINITAB, mas esses programas são pagos e seu uso nem sempre é fácil. Isso ocorre porque eles oferecem tantas opções, que praticamente seu uso é reservado para os especialistas em estatística.
Felizmente, existem vários programas on-line muito precisos, gratuitos e fáceis de usar que permitem executar o teste U de Mann – Whitney, entre outros.
Esses programas são:
-Social Science Statistics (socscistatistics.com), que possui os testes Mann-Whitney e Wilcoxon U no caso de amostras equilibradas ou emparelhadas.
-AI Therapy Statistics (ai-therapy.com), que possui vários dos testes usuais de estatística descritiva.
– Estatístico de usar (physics.csbsju.edu/stats), um dos mais antigos, portanto sua interface pode parecer desatualizada, embora seja um programa gratuito muito eficiente.
Referências
- Dietrichson. Métodos quantitativos: teste de classificação. Recuperado de: bookdown.org
- Marín J P. SPSS Guide: Análise e procedimentos em testes não paramétricos. Recuperado de: halweb.uc3m.es
- USAL MOOC. Testes não paramétricos: U de Mann – Whitney. Recuperado de: youtube.com
- Wikipedia. Teste U de Mann – Whitney. Recuperado de: es.wikipedia.com
- XLSTAT. Centro de ajuda. Tutorial de teste de Mann – Whitney no Excel. Recuperado de: help.xlsat.com