As medidas de tendência central dos dados agrupados são usadas nas estatísticas para descrever determinados comportamentos de um grupo de dados fornecidos, como qual o valor próximo, qual a média dos dados coletados, entre outros.
Ao coletar uma grande quantidade de dados, é útil agrupá-los para ter uma melhor ordem deles e, assim, poder calcular determinadas medidas de tendência central.
Entre as medidas de tendência central mais amplamente utilizadas estão a média aritmética, mediana e moda. Esses números informam certas qualidades sobre os dados coletados em um determinado experimento.
Para usar essas medidas, é necessário primeiro saber como agrupar um conjunto de dados.
Dados agrupados
Para agrupar dados, o intervalo dos dados deve primeiro ser calculado, o que é obtido subtraindo o valor mais alto menos o valor mais baixo dos dados.
Depois, você escolhe um número «k», que é o número de classes em que deseja agrupar os dados.
O intervalo é dividido por «k» para obter a amplitude das classes a serem agrupadas. Este número é C = R / k.
Finalmente, começa o agrupamento, para o qual é escolhido um número menor que o menor valor dos dados obtidos.
Este número será o limite inferior da primeira classe. A isto é adicionado C. O valor obtido será o limite superior da primeira classe.
Então, C é adicionado a esse valor e o limite superior da segunda classe é obtido. Isso prossegue até que o limite superior da última classe seja obtido.
Depois que os dados são agrupados, a média, a mediana e o modo podem ser calculados.
Para ilustrar como a média aritmética, a mediana e o modo são calculados, procederemos com um exemplo.
Exemplo
Portanto, o agrupamento dos dados produzirá uma tabela como a seguinte:
As 3 principais medidas de tendência central
Agora procederemos ao cálculo da média aritmética, mediana e modo. O exemplo anterior será usado para ilustrar este procedimento.
1- Média aritmética
A média aritmética consiste em multiplicar cada frequência pela média do intervalo. Todos esses resultados são adicionados e, finalmente, são divididos pelo total de dados.
Usando o exemplo anterior, seria obtido que a média aritmética é igual a:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Isso indica que o valor médio dos dados na tabela é 5.11111.
2- Médio
Para calcular a mediana de um conjunto de dados, todos os dados são ordenados do menor para o maior. Podem ocorrer dois casos:
– Se o número de dados for ímpar, a mediana é a que está no centro.
– Se o número de dados for par, a mediana é a média dos dois dados que permanecem no centro.
Quando se trata de dados agrupados, o cálculo da mediana é feito da seguinte maneira:
– N / 2 é calculado, onde N é o total de dados.
– O primeiro intervalo é pesquisado onde a frequência acumulada (a soma das frequências) é maior que N / 2 e o limite inferior desse intervalo, chamado Li, é selecionado.
A mediana é dada pela seguinte fórmula:
Me = Li + (Ls-Li) * (N / 2 – Frequência acumulada antes de Li) / frequência de [Li, Ls)
Ls é o limite superior do intervalo mencionado acima.
Se a tabela de dados anterior for usada, temos que N / 2 = 18/2 = 9. As frequências acumuladas são 4, 8, 14 e 18 (uma para cada linha da tabela).
Portanto, o terceiro intervalo deve ser selecionado, pois a frequência acumulada é maior que N / 2 = 9.
Então Li = 5 e Ls = 7. Aplicando a fórmula descrita acima, você deve:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Moda
O modo é o valor que tem a maior frequência entre todos os dados agrupados; isto é, é o valor que é repetido mais vezes no conjunto de dados inicial.
Quando você tem uma quantidade muito grande de dados, a seguinte fórmula é usada para calcular o modo dos dados agrupados:
Mo = Li + (Ls-Li) * (frequência de Li – Frequência de L (i-1)) / ((frequência de Li – Frequência de L (i-1)) + (frequência de Li – Frequência de L ( i + 1)))
O intervalo [Li, Ls) é o intervalo em que a frequência mais alta é encontrada. Para o exemplo feito neste artigo, temos que o modo é dado por:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Outra fórmula usada para obter um valor aproximado para o modo é a seguinte:
Mo = Li + (Ls-Li) * (frequência L (i + 1)) / (frequência L (i-1) + frequência L (i + 1)).
Com esta fórmula, as contas são as seguintes:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Referências
- Bellhouse, DR (2011). Abraham De Moivre: Preparando o cenário para a probabilidade clássica e suas aplicações. CRC Pressione.
- Cifuentes, JF (2002). Introdução à Teoria da Probabilidade. Universidade Nacional da Colômbia.
- Daston, L. (1995). Probabilidade Clássica no Iluminismo. Imprensa da Universidade de Princeton.
- Larson, HJ (1978). Introdução à teoria das probabilidades e inferência estatística. Editorial Limusa.
- Martel, PJ, & Vegas, FJ (1996). Probabilidade e estatística matemática: aplicações na prática clínica e na gestão em saúde. Edições Díaz de Santos.
- Vázquez, AL e Ortiz, FJ (2005). Métodos estatísticos para medir, descrever e controlar a variabilidade. Ed. Universidade da Cantábria.
- Vázquez, SG (2009). Manual de Matemática para acesso à Universidade. Editorial Centro de Estudos Ramon Areces SA.