Teste Mann U – Whitney: o que é e quando aplicado, execução, exemplo

Teste Mann U - Whitney: o que é e quando aplicado, execução, exemplo

O teste U de Mann-Whitney é aplicado para a comparação de duas amostras independentes quando elas têm poucos dados ou não seguem uma distribuição normal. Dessa forma, é considerado um teste não paramétrico,  diferentemente do seu homólogo, o teste t de Student , usado quando a amostra é grande o suficiente e segue a distribuição normal.

Frank Wilcoxon o propôs pela primeira vez em 1945, para amostras de tamanhos idênticos, mas dois anos depois foi estendido no caso de amostras de tamanhos diferentes por Henry Mann e DR Whitney.

Freqüentemente, o teste é aplicado para verificar se há uma relação entre uma variável qualitativa e uma quantitativa.

Um exemplo ilustrativo é pegar um conjunto de pessoas hipertensas e extrair dois grupos, que são registrados diariamente nos dados da pressão arterial durante um mês.

O tratamento A é aplicado a um grupo e o tratamento B. A pressão arterial é a variável quantitativa e o tipo de tratamento é qualitativo.

Queremos saber se a mediana, e não a média, dos valores medidos é estatisticamente igual ou diferente, para estabelecer se há uma diferença entre os dois tratamentos. Para obter a resposta, é aplicada a estatística Wilcoxon ou o teste U de Mann – Whitney.

Declaração do problema no  teste Mann U – Whitney

Outro exemplo no qual o teste pode ser aplicado é o seguinte:

Suponha que queremos saber se o consumo de refrigerantes difere significativamente em duas regiões do país.

Um deles é chamado região A e a outra região B. É mantido um registro dos litros consumidos semanalmente em duas amostras: uma em cada 10 pessoas na região A e a outra em 5 pessoas na região B.

Os dados são os seguintes:

-Região A : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

-Região B : 12,14, 11, 30, 10

Surge a seguinte pergunta:

O consumo de refrigerantes (Y) depende da região (X)?

Variáveis ​​qualitativas versus variáveis ​​quantitativas

-Variável qualitativa X : Região

-Variável quantitativa Y : Consumo de refrigerantes

Se a quantidade de litros consumida for a mesma em ambas as regiões, a conclusão será que não há dependência entre as duas variáveis. A maneira de descobrir é comparar a tendência média ou mediana das duas regiões.

Caso normal

Se os dados seguirem uma distribuição normal, são propostas duas hipóteses: a H0 nula e a alternativa H1 através da comparação entre as médias:

H0 : não há diferença entre a média das duas regiões.

H1 : os meios de ambas as regiões são diferentes.

Caso com tendência não normal

Por outro lado, se os dados não seguirem uma distribuição normal ou a amostra for pequena demais para saber, em vez de comparar a média, a mediana das duas regiões será comparada .

Relacionado:  Axiomas de probabilidade: tipos, explicação, exemplos, exercícios

H0 : não há diferença entre a mediana das duas regiões.

H1 : as medianas das duas regiões são diferentes.

Se as medianas coincidem, a hipótese nula é cumprida: não há relação entre o consumo de refrigerantes e a região.

E se o oposto acontece, a hipótese alternativa é verdadeira: existe uma relação entre consumo e região.

É nesses casos que o teste U de Mann – Whitney é indicado.

Amostras emparelhadas ou não emparelhadas

A próxima questão importante na decisão de aplicar o teste U de Mann Whitney é se o número de dados em ambas as amostras é idêntico, ou seja, eles são pares.

Se as duas amostras forem emparelhadas, a versão original do Wilcoxon será aplicada. Mas, se não, como é o caso no exemplo, o teste de Wilcoxon modificado é aplicado, que é precisamente o teste U de Mann Whitney.

Características do teste U de Mann Whitney

O  teste U de Mann – Whitney é um teste não paramétrico, aplicável a amostras que não seguem a distribuição normal ou com poucos dados. Possui as seguintes características:

1.- Compare as medianas

2.- Funciona em faixas ordenadas

3.- É menos poderoso, significando por poder a probabilidade de rejeitar a hipótese nula, quando de fato é falsa.

Considerando essas características, o teste U de Mann – Whitney é aplicado quando:

-Dados é independente

-Eles não seguem a distribuição normal

-A hipótese nula H0 é aceita se as medianas das duas amostras coincidirem: Ma = Mb

-A hipótese alternativa H1 é aceita se as medianas das duas amostras diferirem: Ma ≠ Mb

Fórmula de Mann – Whitney

A variável U é a estatística de contraste usada no teste de Mann-Whitney e é definida da seguinte forma:

U = min (Ua, Ub)

Isso significa que U é o menor dos valores entre Ua e Ub, aplicado a cada grupo. No nosso exemplo, seria para cada região: A ou B.

As variáveis ​​Ua e Ub são definidas e calculadas de acordo com a seguinte fórmula:

Ua = Na Nb + Na (Na +1) / 2 – Ra

Ub = Na Nb + Nb (Nb +1) / 2 – Rb

Aqui os valores Na e Nb são os tamanhos das amostras correspondentes às regiões A e B, respectivamente e, por outro lado, Ra e Rb são as somas da faixa que definiremos abaixo.

Etapas para aplicar o teste

1.- Encomende os valores das duas amostras.

2.- Atribua um intervalo de pedidos a cada valor.

3.- Corrija os vínculos existentes nos dados (valores repetidos).

4.- Calcular Ra = Soma dos intervalos da amostra A.

5.- Encontre Rb = Soma dos intervalos da amostra B.

6.- Determine o valor Ua e Ub, de acordo com as fórmulas fornecidas na seção anterior.

7.- Compare Ua e Ub, e o menor dos dois é atribuído à estatística U experimental (ou seja, dos dados) que é comparada com a estatística U teórica ou normal.

Exemplo de aplicação prática

Agora, aplicamos o acima ao problema dos refrigerantes levantados anteriormente:

Região A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

Região B: 12, 14, 11, 30, 10

Dependendo se as médias das duas amostras são estatisticamente iguais ou diferentes, a hipótese nula é aceita ou rejeitada: não há relação entre as variáveis ​​Y e X, ou seja, o consumo de refrigerantes não depende da região:

H0: Ma = Mb

H1: Ma ≠ Mb

– Passo 1

Prosseguimos ordenando os dados para as duas amostras, ordenando os valores do menor para o maior:

Observe que o valor 11 aparece 2 vezes (uma vez em cada amostra). Originalmente, possui posições ou intervalos 3 e 4, mas, para não superestimar ou subestimar um ou outro, é escolhido o valor médio, ou seja, 3,5.

Da mesma forma, prosseguimos com o valor 12, que é repetido três vezes nos intervalos 5, 6 e 7.

Bem, ao valor 12 é atribuído o intervalo médio de 6 = (5 + 6 + 7) / 3. E o mesmo para o valor 14, que possui ligadura (aparece em ambas as amostras) nas posições 8 e 9, recebe o intervalo médio 8,5 = (8 + 9) / 2.

– Passo 2

Os dados para as regiões A e B são separados novamente, mas agora os intervalos correspondentes são atribuídos em outra linha:

Região A

Região B

As faixas Ra e Rb são obtidas das somas dos elementos da segunda linha para cada caso ou região.

etapa 3

Os respectivos valores Ua e Ub são calculados:

Ua = 10 × 5 + 10 (10 + 1) / 2-86 = 19

Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31

Valor experimental U = min (19, 31) = 19

Passo 4

Supõe-se que o U teórico siga uma distribuição normal N com parâmetros dados exclusivamente pelo tamanho das amostras:

N ((na⋅nb) / 2, √ [na nb (na + nb +1) / 12])

Para comparar a variável U obtida experimentalmente, com a U teórica é necessário fazer uma alteração da variável. Passa da  variável experimental U ao seu valor padronizado  , que será chamado  Z , para poder fazer a comparação com a de uma distribuição normal padronizada.

Relacionado:  Dados não agrupados: exemplos e exercícios resolvidos

A alteração da variável é a seguinte:

Z = (U – na.nb / 2) / √ [na. nb (na + nb + 1) / 12] 

Deve-se notar que, para a alteração da variável, foram utilizados os parâmetros da distribuição teórica para U. Em seguida, a nova variável Z, que é um híbrido entre o U teórico e o U experimental, é contrastada com uma distribuição normal padronizada N (0,1 )

Critérios de comparação

Se Z ≤ Zα ⇒ a hipótese nula H0 é aceita

Se Z> Zα ⇒ a hipótese nula H0 é rejeitada

Os valores críticos padronizados Zα dependem do nível de confiança necessário, por exemplo, para um nível de confiança α = 0,95 = 95%, que é o mais usual, o valor crítico Zα = 1,96.

Para os dados mostrados aqui:

Z = (U – na nb / 2) / √ [na nb (na + nb + 1) / 12] = -0,73

Qual está abaixo do valor crítico 1,96.

Portanto, a conclusão final é que a hipótese nula H0 é aceita:

Não há diferença no consumo de refrigerantes entre as regiões A e B.

Calculadoras online para o teste U de Mann – Whitney

Existem programas específicos para cálculos estatísticos, incluindo SPSS e MINITAB, mas esses programas são pagos e seu uso nem sempre é fácil. Isso ocorre porque eles oferecem tantas opções, que praticamente seu uso é reservado para os especialistas em estatística.

Felizmente, existem vários programas on-line muito precisos, gratuitos e fáceis de usar que permitem executar o teste U de Mann – Whitney, entre outros.

Esses programas são:

-Social Science Statistics (socscistatistics.com), que possui os testes Mann-Whitney e Wilcoxon U no caso de amostras equilibradas ou emparelhadas.

-AI Therapy Statistics (ai-therapy.com), que possui vários dos testes usuais de estatística descritiva.

– Estatístico de usar (physics.csbsju.edu/stats), um dos mais antigos, portanto sua interface pode parecer desatualizada, embora seja um programa gratuito muito eficiente.

Referências

  1. Dietrichson. Métodos quantitativos: teste de classificação. Recuperado de: bookdown.org
  2. Marín J P. SPSS Guide: Análise e procedimentos em testes não paramétricos. Recuperado de: halweb.uc3m.es
  3. USAL MOOC. Testes não paramétricos: U de Mann – Whitney. Recuperado de: youtube.com
  4. Wikipedia. Teste U de Mann – Whitney. Recuperado de: es.wikipedia.com
  5. XLSTAT. Centro de ajuda. Tutorial de teste de Mann – Whitney no Excel. Recuperado de: help.xlsat.com

Deixe um comentário