Entendendo e preparando amostras estratificadas: guia completo

Última actualización: novembro 30, 2025
  • Definição clara, quando usar e benefícios da amostragem estratificada
  • Etapas essenciais, do desenho dos estratos à seleção aleatória
  • Proporcional x desproporcional, alocação ótima e ponderação
  • Fórmulas, dimensionamento da amostra e aplicações práticas

amostragem estratificada

A amostragem estratificada é uma das técnicas probabilísticas mais poderosas para transformar populações complexas em análises confiáveis, especialmente quando o universo de estudo é heterogêneo. Em vez de sortear tudo de uma vez, separamos a população em grupos coerentes entre si e distintos entre si, chamados estratos, e amostramos aleatoriamente dentro de cada um deles. Esse cuidado reduz o erro amostral, garante representatividade de subgrupos e facilita comparações internas que, com uma amostra aleatória simples, muitas vezes ficariam comprometidas.

Ao longo deste guia prático e aprofundado você vai entender do zero como preparar amostras estratificadas com segurança: quando usar, como definir os estratos, o passo a passo para selecionar a amostra, como escolher entre alocação proporcional e desproporcional, como dimensionar o tamanho da amostra com margem de erro e intervalo de confiança, além de ver fórmulas essenciais, exemplos e aplicações em pesquisas de opinião, auditorias financeiras e inventário florestal. Também veremos diferenças em relação à amostragem por quotas, pontos fortes e limitações, pós-estratificação e erros comuns a evitar.

O que é amostragem estratificada

Nesse método, dividimos a população-alvo em segmentos exclusivos e internamente homogêneos, chamados estratos, e depois realizamos uma seleção aleatória simples em cada estrato; por fim, combinamos todas as subamostras em uma única amostra final. O objetivo é minimizar a variabilidade dentro de cada estrato e maximizar as diferenças entre estratos, assegurando que cada elemento pertença a um único estrato e que, coletivamente, os estratos cubram toda a população sem sobreposição.

Em algumas fontes, você pode encontrar o termo amostragem aleatória por quotas como sinônimo usado de forma laxa para a estratificada, mas vale reforçar: na estratificada a seleção dentro de cada estrato é probabilística, ao passo que na por quotas ela é não probabilística. Essa distinção impacta diretamente a validade inferencial.

Por que e quando usar

A estratificação brilha quando a população não é um bloco homogêneo. Se diferentes subgrupos tendem a responder de maneira diversa à variável de interesse, separar esses subgrupos e amostrar dentro de cada um deles geralmente reduz o erro de estimação para um mesmo tamanho total de amostra. Três razões clássicas para preferi-la à amostra aleatória simples são: (1) menor desvio padrão dentro dos estratos em relação ao geral, (2) ganhos de praticidade e custo ao trabalhar por grupos, e (3) necessidade de estimativas de parâmetros por subgrupos.

Há, contudo, cenários em que a estratificação não ajuda: se não for possível particionar a população em subgrupos mutuamente exclusivos e exaustivos, a técnica perde o sentido. Outro erro frequente é dimensionar os tamanhos de amostra dos estratos com base no volume de dados disponíveis (por conveniência) em vez de usar regras de proporcionalidade ao tamanho do estrato ou critérios de variância e custo quando se busca alocação ótima.

Em pesquisas, auditorias e inventários florestais, a estratificação costuma ser especialmente eficiente, porque as diferenças entre estratos são conhecidas ou mensuráveis, seja por perfil sociodemográfico, por valor monetário, por idade/espécie/volume em povoamentos, ou por qualquer variável auxiliar vinculada ao fenômeno de interesse. Quando a variabilidade interna aos estratos cai, o ganho de precisão é imediato.

Exemplos práticos

Imagine uma eleição com três cidades: A (1 milhão de operários), B (2 milhões de funcionários de escritório) e C (3 milhões de aposentados). Se sorteássemos 60 pessoas sem estratificar, poderíamos, por azar, ter um desbalanceamento entre cidades, enviesando a estimativa do voto médio. Ao selecionar 10, 20 e 30 indivíduos de A, B e C, respectivamente, mantendo o total em 60, melhoramos o equilíbrio e tendemos a reduzir o erro, já que respeitamos a estrutura da população.

Relacionado:  Psicologia Diferencial: história, objetivos e métodos

Outro caso comum é dividir uma região de marketing em quatro zonas. Com alocação proporcional, a fração de amostragem é a mesma em todas as zonas, gerando uma amostra auto-ponderada e muito útil para estimar parâmetros gerais. Mas, se um dos estratos for relativamente pequeno, a amostra resultante para ele pode ficar minúscula (por exemplo, 12 casos), inviabilizando análises detalhadas ou comparações robustas. Nesse cenário, a solução é a amostragem estratificada desproporcional com sobreamostragem do estrato menor para garantir base analítica suficiente.

Etapas para preparar uma amostra estratificada

Seguir um roteiro claro evita vieses e gargalos. Um processo clássico abrange oito etapas principais, das quais destacamos os pontos críticos:

  1. Definir a população-alvo. Delimite quem realmente pertence ao universo de estudo e quem fica de fora.
  2. Selecionar as variáveis de estratificação e decidir o número de estratos. Use variáveis relacionadas ao objetivo do estudo e aos subgrupos de interesse; evite usar mais de 4 a 6 variáveis e, para cada variável, não exagere no número de estratos (tipicamente até 6), pois muitas estratificações podem anular efeitos ou complicar o desenho.
  3. Identificar ou construir a base de amostragem com informação de estratos para cada elemento. Sem essa informação, não há como estratificar.
  4. Avaliar a base de amostragem quanto a subcobertura, sobrecobertura, cobertura múltipla e agrupamento. Faça ajustes antes do sorteio para mitigar vieses estruturais.
  5. Dividir a base em estratos mutuamente exclusivos e exaustivos. Minimize diferenças internas e maximize diferenças entre estratos; cada elemento deve pertencer a apenas um estrato.
  6. Atribuir um identificador único a cada elemento. Isso facilita o sorteio e o controle.
  7. Determinar o tamanho da amostra de cada estrato. Escolha entre alocação proporcional ou alguma forma de alocação desproporcional conforme objetivos, variâncias e custos.
  8. Selecionar aleatoriamente os elementos de cada estrato. Garanta pelo menos um elemento por estrato para representatividade e, idealmente, dois ou mais para poder estimar margens de erro.

Esse encadeamento aumenta a qualidade da inferência, ao mesmo tempo que mantém a amostragem alinhada ao objetivo do estudo e às restrições práticas de campo.

Atribuição proporcional e desproporcional

Na amostragem estratificada proporcional, cada estrato recebe uma fração de amostragem proporcional ao seu peso na população. Isso confere a todos os elementos a mesma probabilidade de seleção, tornando a amostra resultante auto-ponderada. É excelente para estimar parâmetros globais, porém pode ser insuficiente para análises aprofundadas de estratos menores.

Já a amostragem estratificada desproporcional permite dar mais entrevistas a estratos pequenos ou estratégicos, mesmo que isso quebre a proporcionalidade. Os elementos deixam de ter equiprobabilidade e, para estimar parâmetros populacionais sem viés, é preciso aplicar ponderações com base na composição real da população. Dependendo do objetivo, essa abordagem pode priorizar: (1) viabilizar análises dentro de estratos, (2) otimizar custos, (3) maximizar precisão, ou (4) equilibrar custo e precisão.

Um caso típico é a sobreamostragem de estratos raros, quando a alocação proporcional não rendia casos suficientes para estimativas confiáveis. Ao aumentar deliberadamente o n de um estrato pouco frequente, ganha-se poder analítico naquele subgrupo, e o reequilíbrio para parâmetros gerais vem depois via pesos.

Alocação ótima, variâncias e custos

Quando conhecemos ou estimamos as variâncias por estrato e os custos de coleta, a alocação ótima (Neyman) pode reduzir ainda mais o erro para um dado orçamento. Nessa lógica, estratos com maior variabilidade ou menor custo recebem mais amostras, pois contribuem mais para a precisão global por unidade de recurso investido. Repare que, quando as variâncias diferem, é impossível ter, ao mesmo tempo, tamanhos proporcionais ao tamanho do estrato e proporcionais à variância: é preciso escolher o critério de alocação de acordo com o objetivo.

Relacionado:  Estude Psicologia na UNED: 10 razões que podem motivá-lo

E se as proporções dos estratos forem desconhecidas a priori? Em contextos incertos, há estratégias robustas, como a razão de amostragem do tipo minimax, que protegem o desenho contra a incerteza do processo gerador de dados. O importante é explicitar suposições e documentar como a alocação foi definida, inclusive quando decisões operacionais prevalecem.

Tamanho da amostra, margem de erro e intervalo de confiança

Dimensionar corretamente o tamanho da amostra é crucial para a credibilidade dos resultados. Em amostragem probabilística, definimos uma margem de erro aceitável e um intervalo de confiança (tipicamente 90%, 95% ou 99%). Quanto menor a margem de erro almejada, maior será a amostra necessária, porque precisamos diminuir a variabilidade da estimativa.

Exemplo clássico: em duas coletas consecutivas, um indicador estimado pode oscilar de 15% para 16%. Isso não significa mudança real de um dia para o outro; é a variação amostral natural por termos observado apenas uma parcela da população. Para controlar essa flutuação, definimos previamente a margem de erro e o intervalo de confiança que aceitamos para a pesquisa.

Para 95% de confiança, há regras de bolso bastante usadas que aproximam rapidamente o n necessário em pesquisas de opinião de grande público. Já em amostragem estratificada, é recomendável conduzir um piloto ou usar fontes auxiliares para estimar variâncias por estrato, permitindo calcular tamanhos com maior precisão, inclusive para cenários de população finita e infinita.

Em inventário florestal, por exemplo, é comum calcular o coeficiente de variação da população estratificada; se a precisão requerida for percentual, transforma-se para absoluta quando necessário. A alocação final das parcelas por estrato pode seguir a proporcionalidade de área (fixação proporcional) ou a variabilidade e custo (fixação ótima/Neyman), sempre alinhada à precisão e ao nível de probabilidade definidos.

Para o estimador da média estratificada, considerando L estratos e população total N, sejam N_h o tamanho do estrato h, n_h o tamanho amostral no estrato h, x̄_h a média amostral do estrato h e s_h o desvio padrão amostral do estrato h. As expressões usuais são:

Média estratificada:
  x̄ = (1/N) * Σ N_h * x̄_h

Variância do estimador da média estratificada:
  Var(x̄) = Σ (N_h/N)^2 * ((N_h - n_h)/N_h) * (s_h^2 / n_h)

Essas fórmulas mostram por que a variabilidade e o tamanho amostral por estrato importam tanto. Quanto menores as variâncias internas e maiores os n_h em estratos com alta contribuição para N, menor tende a ser o erro da estimativa.

Aplicações setoriais: auditorias, pesquisas e florestas

Auditorias financeiras: quando a população apresenta grande dispersão de valores, a estratificação permite amostras menores sem sacrificar a precisão. Três critérios práticos ajudam na decisão: número de elementos da população, forma da distribuição em relação à normal e o n que seria necessário numa amostra simples. Uma abordagem clássica usa um estrato apenas com itens de maior valor, que são todos verificados, e reparte o restante em 2 a 4 estratos para que cada um tenha valor total aproximado. Mais estratos do que isso tende a reduzir as vantagens. A dimensão final da amostra é a soma dos n por estrato, e diferentes técnicas de amostragem podem ser aplicadas em cada estrato, conforme a necessidade.

Pesquisas de opinião: a estratificação assegura casos suficientes de subgrupos relevantes (faixas etárias, regiões, perfis socioeconômicos), facilitando análises internas e comparações. Em projetos que também visam estimativas nacionais, a proporcional garante auto-ponderação; na necessidade de aprofundar subgrupos menores, a desproporcional com ponderação posterior torna-se a estratégia correta.

Inventário florestal: quando a área é heterogênea quanto a espécies, idades, espaçamentos, topografia, volume ou altura, a amostragem casual estratificada é mais eficiente. Estratos podem ser definidos por características diretamente ligadas ao que se quer estimar (por exemplo, classe de volume) ou por variáveis correlatas quando a informação principal não está disponível. Em grandes áreas com pouca base de subdivisão, é comum dividir em blocos regulares de tamanho conhecido, ganhando homogeneidade relativa em blocos menores, especialmente em biomas terrestres. Em florestas naturais altamente diversas, técnicas de análise multivariada ajudam a construir estratos.

Relacionado:  As 4 diferenças entre confiabilidade e validade (na ciência)

Pós-estratificação é outra ferramenta importante: se a variabilidade da população e os contornos dos estratos só ficam claros durante a coleta, é possível definir os estratos após o campo e ajustar as estimativas, desde que os dados permitam a reclassificação adequada.

Pontos fortes e limitações

Entre os pontos fortes em relação à amostra aleatória simples, destacam-se: capacidade de fazer inferências por estrato e comparar subgrupos; erros amostrais menores para um mesmo n; amostras mais representativas por garantir a presença de todos os estratos; aproveitamento do conhecimento prévio do pesquisador sobre a população; e liberdade para combinar técnicas distintas por estrato quando apropriado.

Como limitações, a amostragem estratificada exige uma boa base de amostragem com informação de estratos por elemento, o que nem sempre está disponível. O desenho é mais complexo, e o uso de muitas variáveis de estratificação pode diluir ganhos. Além disso, quando se usa alocação desproporcional, é indispensável ponderar para recuperar parâmetros populacionais sem viés.

Estratificada x amostragem por quotas

Ambas dividem a população em categorias e selecionam um número de elementos por categoria, mas a semelhança para por aí. Na estratificada, a seleção é aleatória simples dentro de cada estrato e requer base de amostragem. Na amostragem por quotas, a seleção é não probabilística e não exige base completa, sendo comum em pesquisas de mídia pela rapidez e baixo custo.

Vantagens da amostragem por quotas incluídas na literatura: é a menos dispendiosa, amplamente usada em levantamentos jornalísticos e assume que a informação coletada está correlacionada com a população. Esse pressuposto de representatividade, contudo, é difícil de provar, por isso a inferência estatística formal costuma preferir desenhos probabilísticos como a estratificada.

Boas práticas e erros comuns a evitar

Regras de ouro na hora de estratificar: cada elemento deve pertencer a um e apenas um estrato; as diferenças que definem cada estrato precisam ser claras; o tamanho de cada estrato deve ser conhecido ou estimável; e os estratos, em conjunto, devem cobrir toda a população. Se possível, estratifique por variáveis diretamente ligadas ao parâmetro a estimar; se não houver dados, use correlatas confiáveis.

Não cometa o erro de dimensionar amostras de estratos pela conveniência de dados disponíveis. O tamanho por estrato deve seguir a proporcionalidade populacional (amostra auto-ponderada) ou critérios de variância e custo (alocação ótima). Ao fazer desproporcional, planeje a ponderação de análise desde o início. E lembre: selecione no mínimo um caso por estrato para representatividade e, para estimar margens de erro, tenha pelo menos dois casos por estrato.

Ferramentas e rotinas: plataformas de pesquisa e softwares técnicos de inventário florestal implementam cálculos de amostragem casual estratificada, permitindo importar dados, definir estratos, classificar unidades e rodar estimativas. Em auditorias, planilhas bem estruturadas e scripts ajudam a controlar sorteios, pesos e cálculos de precisão. Antes do campo, um piloto reduz incertezas sobre variâncias e custos por estrato.

Dominar a amostragem estratificada significa alinhar teoria e prática: escolher boas variáveis de estratificação, garantir uma base de amostragem confiável, definir alocação coerente com objetivo, calcular tamanhos com margem de erro e confiança adequadas, e aplicar seleção aleatória rigorosa em cada estrato. Com isso, seus resultados ficam mais precisos, comparáveis entre subgrupos e operacionalmente eficientes, seja em pesquisas de opinião, auditorias financeiras ou inventários de recursos naturais.

Artículo relacionado:
Ecossistema montanhoso: características, flora, fauna, exemplos