O que é amostra? Como defini-la?
Antes de executar uma pesquisa de campo, primeiro é preciso definir o universo a ser estudado. O universo de uma pesquisa são todas aquelas pessoas que possuem características necessárias para responder as perguntas,por exemplo, se for um questionário em relação a um produto, o universo são todas as pessoas que consomem aquele item, e se for uma pesquisa eleitoral, são todos os eleitores de uma região.
Assim, a amostra pode ser definida dentro do universo como “os indivíduos que responderam à pesquisa”.
É através desses indivíduos selecionados que iremos tirar conclusões válidas para todo o grupo em estuado.
Como definir o tamanho da amostra?
Se você estiver trabalhando com uma das modalidades de amostra probabilística (que veremos logo abaixo), existem diversas fórmulas estatísticas para definir o tamanho da amostra da sua pesquisa.
Em todas, temos dois parâmetros recorrentes: a margem de erro e o intervalo de confiança.
Margem de erro
Vamos começar pela margem de erro de uma pesquisa. Vamos supor que temos uma população de 10.000 pessoas e em uma pesquisa de 2.000 entrevistas chegamos a conclusão que 1.500 indivíduos, ou 15% praticam exercício regularmente.
No dia seguinte, realizamos a pesquisa novamente, mas o resultado que encontramos é que 16% praticam exercício regularmente. Isso significa que 1%passou a praticar atividades físicas do dia para a noite? NÃO!
Como utilizamos apenas uma pequena parcela do universo em estudo, a diferença entre as coletas pode apresentar variações. A única forma de evitar esse fenômeno seria entrevistando todo mundo, como acontece no censo.
Entretanto, muitas vezes os custos e prazos são proibitivos,o que nos leva a aceitar uma pequena margem de erro nos dados coletados em benefício de agilidade na coleta e um custo de aplicação infinitamente inferior.
Nas principais fórmulas estatísticas para definição de amostra podemos escolher a margem de erro, ou seja, quanto o resultado coletado poderá diferir da realidade.
Como você pode imaginar, quanto menor a margem de erro da pesquisa, mais entrevistas serão necessárias.
No gráfico abaixo temos um exemplo de como devem ser interpretadas as pesquisas considerando a margem de erro do levantamento. A linha escura representa a média da amostra, e a banda de cor mais clara a varição considerando o erro amostral.
Intervalo de confiança
O segundo parâmetro presente em todas as equações para definir a amostragem de um trabalho de campo é o intervalo de confiança.
Uma definição simples do conceito é:
“De 100 pesquisas desenho amostral idêntico, quantos eu gostaria que estivesse dentro da margem erro que estipulei anteriormente?”
Caso o pesquisador deseje que a cada 100 pesquisas realizadas, 95 estejam dentro da margem de erro, temos um intervalo de confiança de 95%.
Usualmente, os pesquisadores utilizam os valores de 90%, 95% e 99% para a confiança do trabalho, sendo a opção de 95% a mais comum.
Regra de bolso para definir o tamanho da amostra
Como a grande maioria dos trabalhos de pesquisa quantitativa utilizam 95% como o intervalo de confiança, chegou-se a uma fórmula chamada regra de bolso para definição da amostra, que leva em conta apenas a margem de erro do levantamento.
Ela fornece o número de questionários para a margem de erro desejada considerando 95% de certeza nos resultados.
Utilizando a fórmula acima, temos que uma pesquisa com 1.111 questionários possui margem de erro de 3 pontos percentuais, como exemplificado abaixo
O que é amostra probabilística?
Para que pesquisas de mercado, sondagens e pesquisas de opinião sejam efetivas é preciso que um público específico seja selecionado.Nessa seleção é possível que haja interferência ou não do entrevistador, assim diferimos as amostras probabilísticas e não probabilísticas.
Amostra probabilística é a qual todos os indivíduos do universo têm uma chance igual de responder a pesquisa, ou seja, probabilidade fixa e maior que zero.
Esse método busca a imparcialidade do entrevistador na busca de seus entrevistados. Temos como exemplo as pesquisas feitas em domicílios que são aleatoriamente selecionados, não deixando a escolha nas mãos do entrevistador.
Para que seja efetiva, se tem como pré-requisito da amostra probabilística, uma listagem de todos os indivíduos do universo a ser pesquisado.Em alguns tipos de pesquisa pode ser fácil obter essa lista, como uma lista de contatos de em uma empresa a partir da coleta de dados no ato da compra ou cadastros de clientes de um hotel ou clube.Porém,pode se tornar difícil obter esses dados em algumas situações, como por exemplo, uma lista atualizada de todos os eleitores de uma região.
O que é amostra não probabilística?
Muitas vezes não é possível obter uma lista de o universo a ser pesquisa. Esse é o caso por exemplo de todos os habitantes de uma cidade,ou dos consumidores de um determinado produto.
São em situações como essas, que percebemos que se torna quase impossível obter um método 100% probabilístico, por não dispor de uma lista completa e atualizada da população em estudo.
Assim, a amostra não probabilística é aquela em que a coleta é baseada em critérios definidos previamente, em que nem todos o universo tem a mesma chance de ser entrevistado, mas que no final o trabalho de campo o resultado seja representativo e passível de extrapolação.
Um exemplo de aplicação de uma amostra não probabilística são as pesquisas eleitorais. Neste tipo de levantamento, o procedimento mais comum é uma amostragem por cotas, em que as entrevistas são baseadas em um perfil já conhecido da população.
Tipos de amostragem probabilística
- Amostra Aleatória simples
- Amostra Sistemática
- Amostra Estratificada
- Amostra por Conglomerado
Tipos de amostragem não-probabilísticas
- Amostra por conveniência
- Amostra por julgamento
- Amostra por cotas
- Amostra bola de neve
- Amostra desproporcional
Amostragem aleatória simples [Probabilística]
A amostra aleatória simples é um dos métodos de amostra probabilística mais utilizados. Nessa forma de amostragem, os indivíduos de uma população têm uma chance igual ou maior que zero de serem selecionados para a compor a amostra. Ela é chamada de amostra aleatória simples pois, a seleção de elementos é feita em forma de sorteio, dessa forma, não há critério ou filtro no processo de amostragem.
Como utilizar a amostra aleatória simples
Para entendermos melhor esse processo de amostragem vamos imaginar uma pesquisa de opinião que será realizada em um bairro qualquer. Essa pesquisa deve ser feita com 20 domicílios, mas o bairro possui 200. Assim, para se obter uma amostra com 20 endereços, um sorteio entre os 200 endereços do bairro deve ser feito, dessa maneira, todas as moradias têm a mesma chance de participar da pesquisa.
Quando universo é pequeno, não se torna necessário o uso de um computador com um software estatístico para seleção de uma amostra,portanto, pesquisas de mercado de empresas com muitos clientes ou pesquisas de opinião que necessitam de uma amostragem muito extensa, o uso de recursos digitais para o sorteio se torna essencial.
Vantagens e desvantagens da amostra aleatória simples
A amostra aleatória simples é uma maneira acessível e rápida para se obter uma amostra, isso deve pelo fato de que quase todo trabalho de amostragem pode ser realizado em um computador.
Contudo, para evitar problemas com técnica é preciso estar atento a alguns fatores. Como a amostragem é aleatória, ela pode gerar qualquer combinação de elementos presentes em um universo, isso pode ser bom ou ruim.Por exemplo, se as 20 casas selecionadas para a pesquisa de opinião acabam sendo da mesma rua, a representatividade da pesquisa acaba sendo prejudicada.
Além disso, pesquisas que contêm um universo muito grande,como em pesquisas eleitorais, se torna quase impossível obter uma listagem atualizada de todos os eleitores de uma região para participar da amostragem.Dessa forma, em algumas situações, os resultados obtidos pela amostra aleatória não são totalmente precisos.
Amostragem sistemática [Probabilística]
A amostra sistemática, assim como a amostra aleatória simples,é um método de amostra probabilística que seleciona indivíduos dentro de uma população já determinada. Contudo, há um fator matemático de seleção que as diferencia.
Na amostra sistemática os elementos do universo a ser pesquisado são divididos em grupos numericamente iguais, assim, após essa segmentação é definido um “ponto de partida”, de modo a estabelecer um número que se repetirá, em sequência, dentro de todos os grupos determinados, até que toda a amostragem seja selecionada.
Como realizar uma amostra sistemática
O critério para a seleção de uma amostra soluciona no problema de representatividade da amostra aleatória simples. Por exemplo, em uma pesquisa realizada em um bairro, podemos dividir 500 moradias em 50 grupos, para obter uma amostragem com 50 residências,dessa maneira, a cada 10 domicílios 1 pesquisa será realizada.
Dentro desse grupo um “ponto de partida”, ou seja, um número, deve ser selecionado. Assim, se decidirmos que o 4° domicílio de um grupo será o selecionado, vamos obter uma sequência(4, 14, 24, 34… até 494) determinada de residências para a amostragem.
Vantagens da amostra sistemática
Assim como a amostra aleatória simples, a amostra sistemática é de rápida execução. Além disso, por ter o critério de separação por grupos, o fator representatividade se torna mais efetivo, como podemos perceber acima, a chance de vizinho ou apenas moradores próximos aparecerem na amostragem desaparece.
A única desvantagem é se por acaso cada elemento dos grupos selecionados tenha características ou opiniões que coincidam devido a sequência escolhida, mas esse problema pode ser facilmente resolvido se os grupos divididos forem previamente estudados e separados com um peso proporcional, dessa forma, características favoreceram a representatividade no estudo.
Amostragem estratificada [Probabilística]
A amostra estratificada é uma técnica de amostra probabilística que é realizada em duas etapas. Esse tipo de amostragem separa a população em grupos e subgrupos, buscando assim, uma amostra mais representativa.
Para realizar uma amostra estratificada apenas dois passos são necessários. Primeiro, deve-se dividir a população em grupos distintos. Esses grupos devem ser segmentados com características da população que auxiliem o tema estudado, podendo ser idade, sexo, trabalho, nível de escolaridade, entre outros.
Depois de distribuir a população nesses grupos, são utilizadas outras formas para eleger os entrevistados dentro de cada grupo, podendo adotar critérios aleatórios ou não. Assim, para selecionar uma amostra de forma não enviesada podemos utilizar a amostra aleatória simples ou sistemática.
Dessa forma, a principal vantagem da amostra estratificada,em relação aos outros métodos de amostragem, é o aumento da representatividade que ela gera por possibilitar uma estratificação do universo. Isso ocorre,pois, a divisão de grupos realizada na primeira etapa permite que as diferentes respostas ou opiniões possíveis em uma pesquisa possam aparecer de forma proporcional e representativa.
Por esse motivo, ela é um bom tipo de amostragem para pesquisas de opinião que possuem grandes populações com diferentes qualidades.
Amostragem por conglomerados [Probabilística]
Diferente das amostras probabilísticas anteriormente apresentadas, que selecionam primeiro o indivíduo, a amostra por conglomerados tem como fase inicial a seleção de um grupo (cidade ou estado em um país) para compor a amostragem.
Como realizar uma amostra por conglomerados
Desse modo, a amostra é realizada em mais de uma etapa,assim como a amostra estratificada. No primeiro estágio, os grupos (ou conglomerados) são definidos. Assim, somente no último estágio os indivíduos que participarão da entrevista serão sorteados.
O número de etapas a que uma mostra por conglomerados deve conter, varia com o tipo de pesquisa e o quanto o universo estudo deve ser dividido de forma a auxiliar o estudo, quanto maior e mais heterogênea uma população, mais divisões se tornam necessárias.
Um exemplo de uso de amostra por conglomerados é em pesquisas eleitorais. Normalmente essas pesquisas são realizadas em três etapas. Primeiro os municípios são selecionados de acordo com a sua grandeza,ou seja, a sua seleção é proporcional à medida de seu tamanho (ou importância).Na segunda etapa, os setores censitários também são incluídos de forma proporcional. Por fim, na terceira etapa, os eleitores são sorteados dentro de cada um dos segmentos escolhidos.
Vantagens e desvantagens da amostra por conglomerados
A maior vantagem da amostra por conglomerados é a relação custo benefício que ela proporciona na coleta de dados. Isso ocorre pois como os grupos são escolhidos antes dos entrevistados, dessa forma, o pesquisador pode escolher elementos conforme a localização dos elementos, fazendo com que haja um menor custo e tempo de deslocamento durante o processo de coleta.
Esse fato se torna essencialmente vantajoso no Brasil, que possui uma enorme extensão territorial. Em uma pesquisa eleitoral, os entrevistadores podem focar em grandes cidades onde há uma maior concentração de pessoas e em cidades menores, próximas a grandes centros.
Contudo, quanto maior a concentração de entrevistas por localidade, maior é a chance de se obter respostas homogêneas nos resultados,podendo haver uma perda de representatividade devido a exclusão de muitas regiões. Dessa forma é importante ter cuidado na escolha da área de pesquisa.
Portanto, a amostra por conglomerados é muito eficiente em pesquisas que precisem cobrir um grande território, pesquisas que tenham uma população heterogênea ou quando há uma listagem de todos os indivíduos que compõem o universo do estudo.
Amostragem por conveniência [Não-Probabilística]
A partir do conceito de amostra discutidos no começo do artigo, vamos discorrer mais sabre tipos de amostras não probabilísticas utilizadas em pesquisas de opinião e de mercado.
Amostras por conveniência, como o próprio nome já sugere, são um tipo de amostra que não exige tanto critério na pré-seleção do público a ser pesquisado, ou seja, o universo da pesquisa não precisa estar totalmente definido para que essa seja efetuada.
Para exemplificar, podemos imaginar um pesquisador que vá em um lugar público, como uma praça, e lá mesmo faz a sua pesquisa, sem muito critério de controle com o perfil da amostra. Assim, a seleção passa a será penas com pessoas que passaram por lá, foram abordadas e concordaram em responder a pesquisa. As avaliações por cliente oculto também são uma forma de pesquisa por conveniência.
Quando se deve usar a amostra por conveniência?
Por não tem muito critério na seleção de perfis a serem entrevistados, a amostra por conveniência pode gerar um resultado enviesado. Como no exemplo dado acima, uma pesquisa realizada em uma praça na cidade, provavelmente não comportará todo o universo necessário em uma pesquisa.
Dessa forma, amostras por conveniência devem utilizadas em pesquisas que buscam conclusões gerais, com um perfil exploratório como o pré-teste de questionários, ou nas quais, não haja uma certeza prévia do perfil de seus respondentes.
Amostragem por julgamento [Não-Probabilística]
Na amostra por julgamento, a escolha dos respondentes é feita partir do julgamento do pesquisador. Assim, o pesquisador busca por indivíduos que possuem características definidas previamente para sua amostra.
Na aplicação de pesquisas com amostragem por julgamento, as pessoas podem ser selecionadas por suas características visuais, por frequentarem algum lugar que interessa a amostra ou até pessoas que têm comportamentos que se encaixam às características pré-selecionadas.
Dessa forma, a amostra por julgamento, assim como a amostra por conveniência, tem uma função mais exploratória em uma pesquisa de opinião ou mercado. Ela pode ser utilizada para pesquisas menores, ou como um pré-pesquisa para outras que buscarão dados mais aprofundados.
Amostragem por cotas [Não-Probabilística]
A amostra por cotas, é uma forma de amostragem muito utilizada em pesquisas de mercado, eleitorais e de opinião pública. Ela é uma amostra que, por meio de cotas, seleciona proporcionalmente pessoas com semelhantes características de uma população.
Para efetuar esse tipo de amostragem, deve-se primeiramente segmentar o universo estudado em características. Por exemplo, dividir a população de uma cidade em cotas como idade, sexo e escolaridade. Depois disso,os pesquisadores devem escolher características, nessa população, que sejam relevantes para a pesquisa. Assim, o último quesito a ser considerado é o da proporcionalidade, se 40% da população de uma cidade é empregada e 60% não é, e essa característica for importante para o estudo, essa proporcionalidade deve ser respeitada na amostragem.
A precisão dos resultados em amostra por cotas é dada a partir da quantidade de cotas selecionadas para a pesquisa. Desta maneira,quanto maior o número de variáveis em uma amostragem mais confiável será o resultado. Entretanto, é preciso estar atento ao fato que cada cota adicionada em uma pesquisa tem um comportamento multiplicador nas variáveis já existentes,assim quanto maior a quantidade de cotas, mais lenta e cada uma pesquisa pode se tornar.
Não há um parâmetro pré-estabelecido de quantas ou quais características de um universo devem ser selecionadas em uma amostragem, mas normalmente elasse diferem de acordo com o tipo de pesquisa que será realizada. Em pesquisas de mercado, as variáveis mais utilizadas são relacionadas a renda e ao consumo dos entrevistados, como renda familiar mensal, posse de bens, classe socioeconômica e estado civil. Já em pesquisas de eleitorais e de opinião pública, são utilizadas variáveis como gênero, faixa etária, local de domicílio e escolaridade.
Amostragem bola de neve [Não-Probabilística]
A amostragem bola de neve, por ser uma técnica de amostragem não-probabilística, também é feita quando não há um universo definido para a pesquisa.
Ela recebe esse nome, pois a última pessoa entrevistada indica ou convida uma próxima para participar do questionário, fazendo com que a amostragem se comporte como uma bola de neve, presentando um caráter acumulativo na hora das escolhas dos respondentes.
Essa amostragem, pode ser uma boa técnica para encontrar subgrupos ou segmentos de uma população que são desconhecidos ou dificilmente encontrados,como por exemplo, minorias e pessoas que possuem um comportamento ilegal ou socialmente estigmatizado.
Nesse tipo de amostra, mesmo não tendo um universo definido,é importante que o pesquisador tenha um molde mínimo da amostragem a ser utilizada, de forma que exista um controle da diversificação da amostra dês da primeira pessoa indicada.
Tipos de amostra bola de neve
Amostra linear
Cada indivíduo indica um único participante para a próxima pesquisa.
Amostra exponencial
Cada indivíduo indica 2 ou mais pessoas para a próxima entrevista
Amostragem desproporcional [Não-Probabilística]
A amostra desproporcional é utilizada quando há grupos e subgrupos que geram resultados com pesos dessemelhantes em uma pesquisa. Diferente da amostra por cotas, não há a preocupação em ter uma exata proporcionalidade da população estudada, o importante na amostra desproporcional é quanto um grupo dessa população é importante para o estudo.
Para entendermos melhor a amostra desproporcional, vamos explicar 3 maneiras nas quais ela pode acontecer:
Busca de inferência dentro de subgrupos
Nesse caso de amostra desproporcional, grupos minoritários são priorizados em um estudo, de modo que suas mostras têm um peso maior nos resultados em relação aos demais grupos. Esse método é usado para que pequenos grupos obtenham um mínimo de representatividade nos resultados da pesquisa. Vamos supor, que em uma pesquisa eleitoral, uma amostra de 1000 entrevistas deve ser feita com a população de uma região é dividida em 3 municípios.
Como se pode observar na tabela acima, o terceiro município tem uma representação de apenas 50 amostras. Considerando que, 100 amostras são um número mínimo de entrevistas que um município possa ter para que o resultado da pesquisa seja confiável, uma reorganização das amostras deve ser feita para que 100 entrevistas ocorram no município 3.
Gestão de custos
Outra forma de utilizar a amostra desproporcional é de modo a tornar o orçamento da pesquisa mais viável. Por exemplo, em uma cidade onde 97% da população mora no centro urbano e 3% em uma área distante e rural, o pesquisador pode retirar de sua amostragem os 3% da população se considerar que o custo para a execução da pesquisa no local não é viável, pois apenas uma pequena proporção população total é representada pela população rural.
Contudo, é preciso ter cuidado com esse método em algumas situações, se tomarmos o exemplo acima para uma eleição muito acirrada, a vitória de um dos candidatos pode estar justamente na área rural. Desse modo, o descarte de um grupo deve ser estudado, quanto maior o peso quantitativo desse grupo na pesquisa, mais a sua exclusão se torna arriscada, da mesma forma se aplica a divergência opiniões em uma região.
Discrepâncias internas
Por fim, a mostra desproporcional pode ser utilizada em discrepâncias internas de um estudo. Temos como exemplo, um hotel, no qual a quantidade de diárias obtidas por clientes em quartos comuns é muito maior do que a quantidade de diárias em quartos de luxo. Nesse caso, pelos quartos de luxo terem um valor maior na sua diária e assim, ter uma grande participação no faturamento do hotel, se pode considerar uma amostra desproporcional em relação aos clientes dos dois tipos de quarto, mesmo que haja um maior número de clientes que se hospedam em quartos normais.
Por último…
Com tantas variáveis na hora de definir amostra, é normal que haja dúvidas. Lembre-se sempre de considerar três pontos:
- Orçamento
- Prazo
- Dificuldade de coleta
Veja também qual é a precisão necessária no seu estudo e evite perfeccionismos extremos. A coleta de dados é uma das partes mais importantes do processo, mas deve ser planejada de acordo com os recursos que a sua equipe tem disponível.
Se você gostou do nosso artigo, compartilhe com seus amigos. Se ficou alguma dúvida, use os comentários abaixo. Você também pode entrar em contato através do formulário a seguir.
Consultoria especializada definição de amostra e estudos amostrais
O Instituto OPUS atua desde 2011 com coleta de dados primários e possui ampla experiência em técnicas de amostragem, cálculo de amostra, parâmetros estatísticos, formas de coleta e controle de qualidade.
Nossa equipe conta com estatísticos, economistas, cientistas sociais e historiadores. Somos registrados no Conselho Regional de Estatística de 6ª Região – CONRE 6.
Para um orçamento de assessoria estatística e econométrica, entre em contato com um de nossos especialistas. Retornamos o contato em até 1 dia útil.