Erro de amostragem: fórmulas e equações, cálculo, exemplos

Erro de amostragem: fórmulas e equações, cálculo, exemplos

O erro de amostragem ou erro de amostragem nas estatísticas é a diferença entre o valor médio de uma amostra em relação ao valor médio da população total. Para ilustrar a idéia, imagine que a população total de uma cidade é de um milhão de pessoas, de quem você deseja o tamanho médio de seu sapato, para o qual é retirada uma amostra aleatória de mil pessoas.

O tamanho médio que emerge da amostra não necessariamente coincide com o da população total, embora, se a amostra não for tendenciosa, o valor deve estar próximo. Essa diferença entre o valor médio da amostra e o da população total é o erro de amostragem.

Em geral, o valor médio da população total é desconhecido, mas existem técnicas para reduzir esse erro e fórmulas para estimar a margem de erro de amostragem que serão discutidas neste artigo.

Fórmulas e equações

Vamos supor, por exemplo, que queremos saber o valor médio de uma determinada característica mensurável x em uma população de tamanho N , mas como N é um número grande, não é viável estudar a população total, portanto, procedemos a uma amostra aleatória de tamanho n << N .

O valor médio da amostra é indicado por <x> e o valor médio da população total é indicado pela letra grega μ (leia  mu ou miu ).

Suponha que m amostras sejam retiradas da população total N , todas de tamanho igual n com valores médios <x 1 >, <x 2 >, <x 3 >,…. <X m > .

Esses valores médios não serão idênticos entre si e estarão em torno do valor médio da população μ . A margem de amostragem do erro E indica a separação esperada dos valores médios <x> do valor médio da população μ dentro de uma porcentagem especificada denominada nível de confiança γ ( gama ).

A margem de erro padrão ε da amostra de tamanho n é:

ε = σ / √n

onde σ é o desvio padrão (a raiz quadrada da variância), calculado usando a seguinte fórmula:

σ = √ [(x – <x>) 2 / (n – 1)]

O significado da margem de erro padrão ε é o seguinte:

O valor médio <x> obtido pela amostra de tamanho n é incluído no intervalo (<x> – ε, <x> + ε) com um nível de confiança de 68,3%.

Como calcular o erro de amostragem

Na seção anterior, a fórmula foi dada para encontrar a margem de erro padrão para uma amostra de tamanho n, onde a palavra padrão indica que é uma margem de erro com 68% de confiança.

Isso indica que, se muitas amostras do mesmo tamanho n forem coletadas , 68% delas forneceriam valores médios <x> no intervalo [<x> – ε, <x> + ε] .

Existe uma regra simples, chamada regra 68-95-99.7, que nos permite encontrar a margem de erro E da amostra para níveis de confiança de 68% , 95% e 99,7% com facilidade, já que essa margem é de 1⋅ ε, 2 ⋅ ε e 3⋅ ε respectivamente.

Para um nível de confiança γ

Se o nível de confiança γ não for um dos acima, o erro de amostragem é o desvio padrão σ multiplicado pelo fator , obtido pelo seguinte procedimento:

1.- Primeiro, é determinado o nível de significância α, que é calculado a partir do nível de confiança γ usando a seguinte relação: α = 1 – γ

2.- Em seguida, devemos calcular o valor 1 – α / 2 = (1 + γ) / 2, que corresponde à frequência normal acumulada entre -∞ e , em uma distribuição normal ou gaussiana tipificada F (z), cuja definição pode ser visto na figura 2.

3.- A equação F (Zγ) = 1 – α / 2 é resolvida por meio das tabelas da distribuição normal (acumulada) F ou por meio de um aplicativo de computador que possui a função gaussiana inversa tipificada F -1 .

No último caso, temos:

Zγ = G -1 (1 – α / 2).

4.- Finalmente, esta fórmula é aplicada para o erro de amostragem com um nível de confiabilidade γ:

E = Zγ(σ / √n)

Exemplos

– Exemplo 1

Calcule a margem de erro padrão no peso médio de uma amostra de 100 recém-nascidos. O cálculo do peso médio foi <x> = 3.100 kg com desvio padrão σ = 1.500 kg.

Solução

A margem de erro padrão é ε = σ / √n = (1.500 kg) / √100 = 0,15 kg. Isso significa que, com esses dados, pode-se inferir que o peso de 68% dos recém-nascidos está entre 2.950 kg e 3,25 kg.

– exemplo 2

Determine a margem de amostragem do erro E e a faixa de peso de 100 recém-nascidos com um nível de confiança de 95% se o peso médio for 3.100 kg com desvio padrão σ = 1.500 kg.

Solução

Se a regra 68 se aplicar  ; 95; 99,7 → 1⋅ ε; 2⋅ ε ; 3⋅ ε, temos:

E = 2⋅ε = 2⋅0,15 kg = 0,30 kg

Em outras palavras, 95% dos recém-nascidos terão pesos entre 2.800 kg e 3.400 kg.

– exemplo 3

Determine a faixa de peso dos bebês no Exemplo 1 com uma margem de confiança de 99,7%.

Solução

O erro de amostra com 99,7% de confiança é 3 σ / √n , que para o nosso exemplo é E = 3 * 0,15 kg = 0,45 kg. A partir daqui, infere-se que 99,7% dos recém-nascidos terão pesos entre 2.650 kg e 3.550 kg.

– exemplo 4

Determine o fator para um nível de confiança de 75%. Determine a margem de erro de amostragem com este nível de confiabilidade para o caso apresentado no Exemplo 1.

Solução

O nível de confiança é γ = 75% = 0,75, que está relacionado ao nível de significância α por meio da relação γ = (1 – α ), portanto, o nível de significância é α = 1 – 0,75 = 0 25.

Isso significa que a probabilidade normal cumulativa entre -∞ e é:

P (Z ≤ ) = 1 – 0,125 = 0,875

O que corresponde a um valor de 1.1503, como mostra a figura 3.

Em outras palavras, o erro de amostragem é E = Zγ(σ / √n) = 1,15(σ / √n) .

Quando aplicado aos dados no Exemplo 1, ocorre um erro de:

E = 1,15 * 0,15 kg = 0,17 kg

Com um nível de confiança de 75%.

– Exercício 5

Qual é o nível de confiança se Z α / 2 = 2,4?

Solução

P (Z ≤ Z α / 2 ) = 1 – α / 2

P (Z ≤ 2,4) = 1 – α / 2 = 0,9918 → α / 2 = 1 – 0,9918 = 0,0082 → α = 0,0164

O nível de significância é:

α = 0,0164 = 1,64%

E, finalmente, o nível de confiança permanece:

1- α = 1 – 0,0164 = 100% – 1,64% = 98,36%

Referências

  1. Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
  2. Devore, J. 2012. Probabilidade e estatística para engenharia e ciência. 8th. Edição. Cengage.
  3. Levin, R. 1988. Statistics for Administrators. 2nd. Edição. Prentice Hall.
  4. Sudman, S. 1982. Fazendo perguntas: um guia prático para o design de questionários. São Francisco. Jossey Bass.
  5. Walpole, R. 2007. Probabilidade e estatística para engenharia e ciências. Pearson.
  6. Wonnacott, TH e RJ Wonnacott. 1990. Estatísticas Introdutórias. 5ª Ed. Wiley
  7. Wikipedia. Erro de amostragem. Recuperado de: en.wikipedia.com
  8. Wikipedia. Margem de erro. Recuperado de: en.wikipedia.com

Deixe um comentário

Este site usa cookies para lhe proporcionar a melhor experiência de usuário. política de cookies, clique no link para obter mais informações.

ACEPTAR
Aviso de cookies