O erro de amostragem ou erro de amostragem nas estatísticas é a diferença entre o valor médio de uma amostra em relação ao valor médio da população total. Para ilustrar a idéia, imagine que a população total de uma cidade é de um milhão de pessoas, de quem você deseja o tamanho médio de seu sapato, para o qual é retirada uma amostra aleatória de mil pessoas.
O tamanho médio que emerge da amostra não necessariamente coincide com o da população total, embora, se a amostra não for tendenciosa, o valor deve estar próximo. Essa diferença entre o valor médio da amostra e o da população total é o erro de amostragem.
Em geral, o valor médio da população total é desconhecido, mas existem técnicas para reduzir esse erro e fórmulas para estimar a margem de erro de amostragem que serão discutidas neste artigo.
Fórmulas e equações
Vamos supor, por exemplo, que queremos saber o valor médio de uma determinada característica mensurável x em uma população de tamanho N , mas como N é um número grande, não é viável estudar a população total, portanto, procedemos a uma amostra aleatória de tamanho n << N .
O valor médio da amostra é indicado por <x> e o valor médio da população total é indicado pela letra grega μ (leia mu ou miu ).
Suponha que m amostras sejam retiradas da população total N , todas de tamanho igual n com valores médios <x 1 >, <x 2 >, <x 3 >,…. <X m > .
Esses valores médios não serão idênticos entre si e estarão em torno do valor médio da população μ . A margem de amostragem do erro E indica a separação esperada dos valores médios <x> do valor médio da população μ dentro de uma porcentagem especificada denominada nível de confiança γ ( gama ).
A margem de erro padrão ε da amostra de tamanho n é:
ε = σ / √n
onde σ é o desvio padrão (a raiz quadrada da variância), calculado usando a seguinte fórmula:
σ = √ [(x – <x>) 2 / (n – 1)]
O significado da margem de erro padrão ε é o seguinte:
O valor médio <x> obtido pela amostra de tamanho n é incluído no intervalo (<x> – ε, <x> + ε) com um nível de confiança de 68,3%.
Como calcular o erro de amostragem
Na seção anterior, a fórmula foi dada para encontrar a margem de erro padrão para uma amostra de tamanho n, onde a palavra padrão indica que é uma margem de erro com 68% de confiança.
Isso indica que, se muitas amostras do mesmo tamanho n forem coletadas , 68% delas forneceriam valores médios <x> no intervalo [<x> – ε, <x> + ε] .
Existe uma regra simples, chamada regra 68-95-99.7, que nos permite encontrar a margem de erro E da amostra para níveis de confiança de 68% , 95% e 99,7% com facilidade, já que essa margem é de 1⋅ ε, 2 ⋅ ε e 3⋅ ε respectivamente.
Para um nível de confiança γ
Se o nível de confiança γ não for um dos acima, o erro de amostragem é o desvio padrão σ multiplicado pelo fator Zγ , obtido pelo seguinte procedimento:
1.- Primeiro, é determinado o nível de significância α, que é calculado a partir do nível de confiança γ usando a seguinte relação: α = 1 – γ
2.- Em seguida, devemos calcular o valor 1 – α / 2 = (1 + γ) / 2, que corresponde à frequência normal acumulada entre -∞ e Zγ , em uma distribuição normal ou gaussiana tipificada F (z), cuja definição pode ser visto na figura 2.
3.- A equação F (Zγ) = 1 – α / 2 é resolvida por meio das tabelas da distribuição normal (acumulada) F ou por meio de um aplicativo de computador que possui a função gaussiana inversa tipificada F -1 .
No último caso, temos:
Zγ = G -1 (1 – α / 2).
4.- Finalmente, esta fórmula é aplicada para o erro de amostragem com um nível de confiabilidade γ:
E = Zγ ⋅ (σ / √n)
Exemplos
– Exemplo 1
Calcule a margem de erro padrão no peso médio de uma amostra de 100 recém-nascidos. O cálculo do peso médio foi <x> = 3.100 kg com desvio padrão σ = 1.500 kg.
Solução
A margem de erro padrão é ε = σ / √n = (1.500 kg) / √100 = 0,15 kg. Isso significa que, com esses dados, pode-se inferir que o peso de 68% dos recém-nascidos está entre 2.950 kg e 3,25 kg.
– exemplo 2
Determine a margem de amostragem do erro E e a faixa de peso de 100 recém-nascidos com um nível de confiança de 95% se o peso médio for 3.100 kg com desvio padrão σ = 1.500 kg.
Solução
Se a regra 68 se aplicar ; 95; 99,7 → 1⋅ ε; 2⋅ ε ; 3⋅ ε, temos:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Em outras palavras, 95% dos recém-nascidos terão pesos entre 2.800 kg e 3.400 kg.
– exemplo 3
Determine a faixa de peso dos bebês no Exemplo 1 com uma margem de confiança de 99,7%.
Solução
O erro de amostra com 99,7% de confiança é 3 σ / √n , que para o nosso exemplo é E = 3 * 0,15 kg = 0,45 kg. A partir daqui, infere-se que 99,7% dos recém-nascidos terão pesos entre 2.650 kg e 3.550 kg.
– exemplo 4
Determine o fator Zγ para um nível de confiança de 75%. Determine a margem de erro de amostragem com este nível de confiabilidade para o caso apresentado no Exemplo 1.
Solução
O nível de confiança é γ = 75% = 0,75, que está relacionado ao nível de significância α por meio da relação γ = (1 – α ), portanto, o nível de significância é α = 1 – 0,75 = 0 25.
Isso significa que a probabilidade normal cumulativa entre -∞ e Zγ é:
P (Z ≤ Zγ ) = 1 – 0,125 = 0,875
O que corresponde a um valor Zγ de 1.1503, como mostra a figura 3.
Em outras palavras, o erro de amostragem é E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n) .
Quando aplicado aos dados no Exemplo 1, ocorre um erro de:
E = 1,15 * 0,15 kg = 0,17 kg
Com um nível de confiança de 75%.
– Exercício 5
Qual é o nível de confiança se Z α / 2 = 2,4?
Solução
P (Z ≤ Z α / 2 ) = 1 – α / 2
P (Z ≤ 2,4) = 1 – α / 2 = 0,9918 → α / 2 = 1 – 0,9918 = 0,0082 → α = 0,0164
O nível de significância é:
α = 0,0164 = 1,64%
E, finalmente, o nível de confiança permanece:
1- α = 1 – 0,0164 = 100% – 1,64% = 98,36%
Referências
- Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
- Devore, J. 2012. Probabilidade e estatística para engenharia e ciência. 8th. Edição. Cengage.
- Levin, R. 1988. Statistics for Administrators. 2nd. Edição. Prentice Hall.
- Sudman, S. 1982. Fazendo perguntas: um guia prático para o design de questionários. São Francisco. Jossey Bass.
- Walpole, R. 2007. Probabilidade e estatística para engenharia e ciências. Pearson.
- Wonnacott, TH e RJ Wonnacott. 1990. Estatísticas Introdutórias. 5ª Ed. Wiley
- Wikipedia. Erro de amostragem. Recuperado de: en.wikipedia.com
- Wikipedia. Margem de erro. Recuperado de: en.wikipedia.com