O que é classificação nas estatísticas? (Com exemplos)

O que é classificação nas estatísticas? (Com exemplos)

O alcance , alcance ou amplitude, nas estatísticas, é a diferença (subtração) entre o valor máximo e o valor mínimo de um conjunto de dados de uma amostra ou de uma população. Se o intervalo é representado pela letra R e os dados por x , a fórmula para o intervalo é simplesmente:

R = x máx – x min

 Onde x max é o valor máximo dos dados ex x min é o mínimo.

O conceito é muito útil como uma simples medida de dispersão para avaliar rapidamente a variabilidade dos dados, pois indica a extensão ou a duração do intervalo em que são encontrados.

Por exemplo, suponha que você meça a altura de um grupo de 25 estudantes masculinos do primeiro ano de engenharia em uma universidade. O aluno mais alto do grupo é 1,93 me o mais baixo 1,67 m. Estes são os valores extremos dos dados da amostra, portanto, a rota dos mesmos é:

R = 1,93 – 1,67 m = 0,26 m ou 26 cm.

A altura dos alunos deste grupo é distribuída por todo esse intervalo.

Vantagens e desvantagens

O alcance é, como dissemos anteriormente, uma medida da dispersão dos dados. Um pequeno intervalo indica que os dados estão mais ou menos próximos e a dispersão é baixa. Em vez disso, uma faixa maior indica que os dados estão mais dispersos.

As vantagens de calcular o alcance são óbvias: é muito simples e rápido de encontrar, porque é uma diferença simples.

Ele também possui as mesmas unidades que os dados com os quais trabalha e o conceito é muito fácil de interpretar para qualquer observador.

No exemplo da altura dos estudantes de engenharia, se o intervalo fosse de 5 cm, diríamos que os alunos são todos aproximadamente do mesmo tamanho. Porém, com um alcance de 26 cm, assumimos imediatamente que há alunos de todas as alturas intermediárias na amostra. Você está sempre correto com essa suposição?

Relacionado:  Probabilidade condicional: fórmula e equações, propriedades, exemplos

Desvantagens do alcance como medida de dispersão

Se observarmos com atenção, talvez em nossa amostra de 25 estudantes de engenharia, apenas um deles mede 1,93 e os 24 restantes têm alturas próximas a 1,67 m.

E, no entanto, o alcance permanece o mesmo, embora o oposto seja perfeitamente possível: a altura da maioria oscila em torno de 1,90 me apenas um mede 1,67 m.

Em ambos os casos, a distribuição dos dados é bem diferente.

As desvantagens do alcance como medida de dispersão são que ele usa apenas valores extremos e ignora todos os outros. Como a maioria das informações é perdida, você não tem idéia de como os dados de amostra são distribuídos.

Outra característica importante é que o intervalo da amostra nunca diminui. Se adicionarmos mais informações, ou seja, considerarmos mais dados, o intervalo aumenta ou permanece o mesmo.

E, em qualquer caso, é útil apenas ao trabalhar com amostras pequenas, não sendo recomendado seu uso exclusivo como medida de dispersão em amostras grandes.

O que precisa ser feito é complementar com o cálculo de outras medidas de dispersão que levem em consideração as informações fornecidas pelos dados totais: faixa interquartil , variação, desvio padrão e coeficiente de variação.

Caminho interquartil, quartis e exemplo resolvido

Descobrimos que a fraqueza do intervalo como medida de dispersão é que ele usa apenas os valores extremos da distribuição dos dados, omitindo os outros.

Para evitar esse problema, os quartis são usados : três valores conhecidos como medições de posição.

Eles distribuem os dados não agrupados em quatro partes (outras medidas posicionais amplamente usadas são decis e percentis ). Estas são as suas características:

-O primeiro quartil Q 1 é o valor dos dados de tal modo que 25% de todas elas é menor do que Q 1 .

Relacionado:  Axiomas de probabilidade: tipos, explicação, exemplos, exercícios

-O segundo quartil Q 2 representa a média da distribuição, o que significa que a metade (50%) dos dados é menor do que este valor.

-Por último, o terceiro quartil Q 3 indica que 75% dos dados são menos do que Q 3 .

Então, o intervalo interquartil ou intervalo interquartil é definido como a diferença entre o terceiro quartil Q 3 e o primeiro quartil Q 1 dos dados:

Caminho interquartil = R Q = Q 3 – Q 1

Dessa forma, o valor do intervalo R Q não é tão afetado por valores extremos. Portanto, é recomendável usá-lo quando se trata de distribuições tendenciosas, como aquelas para alunos muito altos ou muito baixos, descritos acima.

– Cálculo dos quartis

Existem várias maneiras de calculá-las, aqui vamos propor uma, mas, em qualquer caso, é necessário saber o número do pedido “N o ”, que é o local que o respectivo quartil ocupa na distribuição.

Ou seja, se, por exemplo, o termo que corresponde a Q 1 for o segundo, o terceiro ou o quarto, e assim por diante, da distribuição.

Primeiro quartil

N o (Q 1 ) = (N + 1) / 4

Segundo quartil ou mediana

N o (Q 2 ) = (N + 1) / 2

Terceiro quartil

N o (Q 3 ) = 3 (N + 1) / 4

Onde N é o número dos dados.

A mediana é o valor que está bem no meio da distribuição. Se o número de dados for ímpar, não há problema em encontrá-lo, mas, se for par, os dois valores centrais são calculados como média para torná-los um.

Depois que o número do pedido é calculado, uma dessas três regras é seguida:

-Se não houver casas decimais, os dados indicados na distribuição serão pesquisados ​​e este será o quartil pesquisado.

-Quando o número do pedido estiver a meio caminho entre dois, os dados indicados pela parte inteira serão calculados com os seguintes dados, e o resultado será o quartil correspondente.

-Em qualquer outro caso, é arredondado para o número inteiro mais próximo e essa será a posição do quartil.

Exemplo resolvido

Em uma escala de 0 a 20, um grupo de 16 alunos de matemática I obteve o seguinte (pontos) em um exame intermediário:

Relacionado:  Esperança matemática: fórmula, propriedades, exemplos, exercício

16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14

Encontrar:

a) O alcance ou rota dos dados.

b) Os valores dos quartis Q 1 e Q 3

c) O intervalo interquartil.

Solução para

A primeira coisa a fazer para encontrar a rota é ordenar os dados em ordem crescente ou decrescente. Por exemplo, em ordem crescente, temos:

1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20

Usando a fórmula dada no início: R = x max – x min

R = 20-1 pontos = 19 pontos.

De acordo com o resultado, essas classificações possuem uma grande dispersão.

Solução b

N = 16

N o (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25

É um número com casas decimais, cuja parte inteira é 4. Então, vamos à distribuição, procuramos os dados que ocupam o quarto lugar e seu valor é medido com o da quinta posição. Como ambos são 9, a média também é 9 e, portanto:

Q 1 = 9

Agora repetimos o procedimento para encontrar Q 3 :

N o (Q 3 ) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75

Novamente, é um decimal, mas como não está na metade, é arredondado para 13. O quartil pesquisado ocupa a décima terceira posição e é:

Q 3 = 16

Solução c

R Q = Q 3 – Q 1 = 16 – 9 = 7 pontos.

Isso, como vemos, é muito menor do que o intervalo de dados calculado na seção a), porque a classificação mínima era de 1 ponto, um valor muito mais distante do restante.

Referências

  1. Berenson, M. 1985. Estatística para Administração e Economia. Interamericana SA
  2. Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
  3. Devore, J. 2012. Probabilidade e estatística para engenharia e ciência. 8th. Edição. Cengage.
  4. Exemplos de quartis. Recuperado de: matematicas10.net.
  5. Levin, R. 1988. Statistics for Administrators. 2nd. Edição. Prentice Hall.
  6. Walpole, R. 2007. Probabilidade e estatística para engenharia e ciências. Pearson.

Deixe um comentário

Este site usa cookies para lhe proporcionar a melhor experiência de usuário. política de cookies, clique no link para obter mais informações.

ACEPTAR
Aviso de cookies