Teste qui-quadrado (χ²): o que é e como é usado em estatística

Teste qui-quadrado (χ²): o que é e como é usado em estatística 1

Nas estatísticas, existem vários testes para analisar o relacionamento entre variáveis. As variáveis ​​nominais são aquelas que permitem relações de igualdade e desigualdade, como gênero.

Neste artigo, conheceremos um dos testes para analisar a independência entre variáveis ​​nominais ou superiores: o teste do qui-quadrado, através do contraste de hipóteses (testes de qualidade do ajuste).

O que é o teste do qui-quadrado?

O teste do qui-quadrado, também denominado qui-quadrado (Χ2) , é encontrado nos testes pertencentes à estatística descritiva, especificamente a estatística descritiva aplicada ao estudo de duas variáveis. Por seu lado, as estatísticas descritivas se concentram na extração de informações sobre a amostra. Em contraste, as estatísticas inferenciais extraem informações sobre a população.

O nome do teste é típico da distribuição do qui-quadrado da probabilidade na qual ele se baseia. Este teste foi desenvolvido em 1900 por Karl Pearson .

O teste do qui-quadrado é um dos mais conhecidos e utilizados para analisar variáveis ​​nominais ou qualitativas, ou seja, para determinar a existência ou não de independência entre duas variáveis. O fato de duas variáveis ​​serem independentes significa que elas não têm relacionamento e, portanto, uma não depende da outra, nem vice-versa.

Assim, com o estudo da independência, também se originou um método para verificar se as frequências observadas em cada categoria são compatíveis com a independência entre as duas variáveis.

Como você obtém independência entre variáveis?

Para avaliar a independência entre as variáveis, são calculados os valores que indicariam a independência absoluta, denominada “frequências esperadas”, comparando-os com as frequências da amostra .

Como de costume, a hipótese nula (H0) indica que ambas as variáveis ​​são independentes, enquanto a hipótese alternativa (H1) indica que as variáveis ​​possuem algum grau de associação ou relacionamento.

Correlação entre as variáveis

Bem como outros testes para o mesmo fim, o teste do qui-quadrado é usado para ver o sentido da correlação entre duas variáveis nominais ou um nível mais alto (por exemplo, pode aplicar se você quiser para saber se existe uma relação entre sexo [ ser homem ou mulher] ea presença de ansiedade [sim ou não]).

Para determinar esse tipo de relacionamento, existe uma tabela de frequências a serem consultadas (também para outros testes, como o coeficiente Yule Q).

Se as frequências empíricas e as freqüências teóricas ou esperadas coincidem, não há relação entre as variáveis, ou seja, elas são independentes. No entanto, se eles coincidem, não são independentes (existe um relacionamento entre as variáveis, por exemplo, entre X e Y).

Considerações

O teste do qui-quadrado, diferentemente de outros testes, não estabelece restrições ao número de modalidades por variável, e não é necessário que o número de linhas e o número de colunas nas tabelas correspondam .

No entanto, é necessário aplicá-lo a estudos baseados em amostras independentes e quando todos os valores esperados forem maiores que 5. Como já mencionamos, os valores esperados são aqueles que indicam independência absoluta entre as duas variáveis.

Além disso, para usar o teste do qui-quadrado, o nível de medição deve ser nominal ou superior. Não tem um limite superior, ou seja, ele não permite-nos a conhecer a força da correlação . Em outras palavras, os valores de qui-quadrado entre 0 e infinito.

Por outro lado, se a amostra aumentar, o valor do qui-quadrado aumentará, mas devemos ser cautelosos em sua interpretação, pois isso não significa que haja mais correlação.

chi-quadrado

O teste do qui-quadrado usa uma aproximação à distribuição do qui-quadrado para avaliar a probabilidade de uma discrepância igual ou maior que a entre os dados e as frequências esperadas de acordo com a hipótese nula.

A precisão dessa avaliação dependerá dos valores esperados não serem muito pequenos e, em menor grau, do contraste entre eles não ser muito alto.

Correção de iates

A correção de Yates é uma fórmula matemática aplicada com tabelas 2×2 e com uma pequena frequência teórica (inferior a 10), para corrigir possíveis erros no teste do qui-quadrado.

Geralmente, a correção de Yates ou “correção de continuidade” é aplicada quando uma variável discreta se aproxima de uma distribuição contínua .

Contraste da hipótese

Além disso, o teste do qui-quadrado pertence aos chamados testes de bondade dos ajustes ou contrastes , que têm o objetivo de decidir se a hipótese de que uma determinada amostra provém de uma população com uma distribuição de probabilidade totalmente especificada na hipótese nula pode ser aceita. .

Os contrastes são baseados na comparação das frequências observadas (frequências empíricas) na amostra com aquelas que seriam esperadas (frequências teóricas ou esperadas) se a hipótese nula fosse verdadeira. Assim, a hipótese nula é rejeitada se houver uma diferença significativa entre as frequências observadas e esperadas.

Operação

Como vimos, o teste do qui-quadrado é usado com dados pertencentes a uma escala nominal ou superior. A partir do qui-quadrado, é estabelecida uma hipótese nula que postula uma distribuição de probabilidade especificada como o modelo matemático da população que gerou a amostra.

Uma vez que temos a hipótese, devemos realizar o contraste e, para isso, temos os dados em uma tabela de frequências . A frequência absoluta observada ou empírica é indicada para cada valor ou faixa de valores. Então, supondo que a hipótese nula seja verdadeira, para cada valor ou intervalo de valores é calculada a frequência absoluta que seria esperada ou a freqüência esperada.

Interpretação

A estatística qui-quadrado assumirá um valor igual a 0 se houver concordância perfeita entre as frequências observadas e esperadas; por outro lado, o estatístico terá um grande valor se houver uma grande discrepância entre essas frequências e, consequentemente, a hipótese nula deve ser rejeitada.

Referências bibliográficas:

  • Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Psicologia matemática I e II. Madri: UNED.
  • Pardo, A. San Martin, R. (2006). Análise de dados em psicologia II. Madri: pirâmide.

Deixe um comentário

Este site usa cookies para lhe proporcionar a melhor experiência de usuário. política de cookies, clique no link para obter mais informações.

ACEPTAR
Aviso de cookies