Porque as pesquisas eleitorais erram (e acertam)

Twitter Sader

Aposto que o Sader não é único intrigado com as pesquisas eleitorais. Você escuta, pela manhã, que as pesquisas do IBOPE para a presidência apontam que o candidato A tem 40% das intenções de voto e o candidato B tem 60%, com uma margem de erro de 2 pontos. Fica curioso sobre como eles estimam o voto de milhões com base em alguns milhares e fica surpreso quando as pesquisas acertam.

Afinal, como são feitas as pesquisas e por que elas acertam (e erram) tanto?

  • Porque elas acertam: Amostragem

A mágica por trás da estatística está num conceito chamado de amostragem. Vamos supor que você tem um saco com 100 bolinhas coloridas (nossa população). Enfiando a mão e pegando 10 bolinhas (nossa amostra) “na sorte”, você se depara com 9 bolinhas azuis e 1 vermelha. Apesar de não conhecer a cor de todas, se alguém perguntar que cor é mais frequente entre as 100, seria razoável chutar que é a azul.

O que os estatísticos fazem é aperfeiçoar esse princípio. Usando probabilidades, é possível calcular quantas bolinhas são necessárias para ter um chute preciso. E também saber o quão preciso é este chute.

Aviso! Quando falarmos em conceitos matemáticos no blog, usaremos uma caixa azul (uma homenagem ao blog do brilhante RicBit). Os textos podem ser entendidos integralmente sem essa parte, porém, para aqueles mais curiosos, a caixa azul traz detalhes sobre cálculos.

Considerando que temos que estimar a prevalência de bolinhas azuis, sem conhecimento prévio (proporção estimada = 50%a), com uma população de 100 bolinhas, níveis de confiança de 95% e uma margem aceitável de 5 pontos percentuais. O valor pode ser calculado usando softwares específicos e livres, como o WinPepi ou sites gratuitos.

Sorteando 80 bolinhas, vamos supor que obtive 48 (60%) bolinhas azuis e 32 (40%) vermelhas. Posso estimar que a proporção real é de 60%, com uma margem de erro de 5%. Minha estimativa está entre 55% e 65%.

E o intervalo de confiança de 95%? Isso significa que, se eu repetisse o procedimento outras vezes, o valor real estaria nesse intervalo em 95% das vezes. 1

Em outras palavras, se eu fizer isso com 100 sacos, erraria, em média, em apenas 5 deles.

Com amostragem, não é necessário conhecer toda a população para ter uma estimativa razoável de valores dela. Esta técnica é usada em diversos campos. Em medicina, se eu quero saber os níveis de pressão arterial numa população, não medirei em todos os indivíduos. Basta calcular uma amostra adequada e obter uma estimativa precisa.

É com base neste princípio que o IBOPE entrevista 3.000 pessoas e faz estimativas para um eleitorado de 140.000.000.

Simplificando um bocado as coisas para ilustração e imaginando a candidatura à presidência sem os votos nulos e brancos, podemos repetir o cálculo das bolinhas usando as ferramentas que descrevemos. Aceitando uma margem de erro de 2 pontos,  uma proporção prévia estimada de 50%, uma população 140.000.000 e níveis de confiança de 95%, seria necessário entrevistar apenas 2401 pessoas.
  • Porque elas erram: Amostras não probabilísticas.

Agora vem o pulo do gato. Tudo que descrevemos acima serve para amostras probabilísticas. Todos os indivíduos da população devem ter uma probabilidade de inclusão na amostra e essa probabilidade deve ser conhecida.

No exemplo das bolinhas, quando sorteamos nossa amostra de 80, todas as 100 tinham probabilidade de inclusão na amostra. Acontece que, num eleitorado de 140.000.000 é quase impossível fazer isso.

Uma possibilidade seria listar os números do título de eleitor de cada um e sortear aqueles que seriam incluídos. Daí, enviar entrevistadores para os 4 cantos do Brasil, “do Oiapoque ao Chuí”, para encontrar essa amostra. Só que ainda temos a possibilidade de muitos optarem por não responder a pesquisa. Desnecessário dizer que os institutos de pesquisa não têm acesso a esses dados (nº do título e endereço de cada eleitor) e recursos.

Assim, os institutos usam outras técnicas de amostragem e a seleção dos indivíduos não é aleatória. Duas técnicas principais são empregadas.

Amostragem probabilística com cotas (Probability Sampling with Quotas)

Nesse método, setores censitários (unidade territorial) são sorteados. A partir daí, são feitas entrevistas pessoais e domiciliares. As entrevistas são feitas respeitando cotas de características que interferem na opinião, segundo os pesquisadores. Classicamente, fatores como idade, gênero, escolaridade e renda familiar. Apesar do nome, não é probabilística.

Amostragem por cotas (Quota Sampling)

Nesse tipo de amostragem, as entrevistas são realizadas em “pontos de fluxo”: aglomerações como ruas movimentadas, metrôs e shopping centers, onde as cotas podem ser preenchidas facilmente.

Comparados com uma amostra probabilística, fica claro que os métodos sofrem uma influência maior dos pesquisadores que criaram o desenho e escolheram as cotas, assim como dos entrevistadores que escolhem os participantes (mais grave no uso de pontos de fluxo).

Essas técnicas de amostragem não permitem calcular intervalos de confiança. As margens de erro divulgadas são estimativas supondo que as cotas podem anular grande parte dos defeitos da técnica não-probabilística.

Entretanto, estudos empíricos em que uma mesma população foi examinada através de amostragem probabilística e por cotas mostram que a margem de erro da amostragem por cotas tende a flutuar.2,3

Por fim, já que influenciam na opinião dos eleitores, especula-se que pesquisas possam sofrer influências extra científicas. Num país onde a corrupção é algo comum e escândalos de todos os tipos já ocorreram, essa possibilidade não pode ser descartada (e nem confirmada por enquanto).

ResearchBlogging.org






a Na ausência de conhecimento prévio, estimamos a proporção em 50% por um motivo: esta é a proporção para a qual será necessário o maior tamanho amostral.
1 Cox D.R., Hinkley D.V.  Theoretical Statistics, Chapman & Hall, p49, p209.1974
2 Stephenson, B.C. Probability SampIing with Quotas: An Experiment. Public Opinior Quarterly. 1979
3  Moser, C., & Stuart, A. (1953). An Experimental Study of Quota Sampling Journal of the Royal Statistical Society. Series A (General), 116 (4) DOI: 10.2307/2343021

Para saber mais:

Sleek Data – Blog do estatístico Neale Ahmend El-Dash, especialista em amostragem.

Artigo de José Ferreira de Carvalho na Folha de São Paulo sobre pesquisas eleitorais.

Por Felipe C. Argolo

Um comentário sobre “Porque as pesquisas eleitorais erram (e acertam)

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s