Por Cléber da Costa Figueiredo
A cada dois anos, somos bombardeados, durante as pesquisas de intenção de voto, com os termos técnicos da inferência estatística clássica. Quanto mais se aproxima o dia das eleições, mais palavras como margem de erro, confiança e empate técnico aparecem nas diferentes mídias.
Contudo, embora sejam termos emprestados da inferência estatística clássica, a condução dos experimentos é frequentista, também chamada de frequecista. Nesse sentido, o que seriam essas duas formas de inferência?
De modo muito simplório, no primeiro caso, seria definir a inferência clássica como a inferência teórica. Aquela que considera as “condições normais”. Seria dizer que a chance de ocorrer uma das faces de uma moeda não viciada é ½.
Já no segundo caso, a inferência frequentista, estaria baseada na experimentação que ocorre no mundo real. Dentro dessa abordagem, a chance de sair cara ou coroa, seria descoberta pela experimentação. A moeda deveria ser lançada várias vezes, até que a chance de ocorrer cara ou coroa convergisse para algum valor determinado. Muito provavelmente para ½.
O que muda nesses dois cenários é a forma de se chegar ao valor ½.
Há ainda uma terceira abordagem: a inferência bayesiana ou subjetiva que não está alicerçada na teoria clássica, nem apenas na experimentação, mas na crença de que moeda e lançador sejam honestos, por exemplo, e se não houver nenhum ponto de vista distinto, muito provavelmente a chance de ocorrer cara ou coroa convirja para ½.
Parece maluco, não é? No entato, quando se definem margem de erro e empate técnico nas pesquisas, são utilizadas as definições da estatística clássica, mesmo que a estimativa da intenção de voto seja calculada dentro da prática frequentista.
É aqui que reside a confusão. Isso acontece, porque, no Brasil, existe uma lei eleitoral (BRASIL, 1997) que exige que o plano amostral, estratificação quanto a sexo, idade, grau de instrução, classe econômica, local de realização da pesquisa, bem como confiança e margem de erro sejam definidas à priori.
É a chamada lei das eleições. Por esse motivo, os pesquisadores precisam registrar no
Tribunal Superior Eleitoral (TSE) todas essas informações antes que a pesquisa seja realizada. É por esse motivo, que os cálculos de tamanho de amostra e margem de erro são definidos dentro do pior cenário.
O pior cenário, ou cenário conservador, é a maior margem de erro possível para um determinado tamanho de amostra e confiança fixados. Nele, é conjecurado que 50% dos eleitores votariam em um determinado candidato. Esse pior cenário se enquadra muito bem dentro da ideia da inferência clássica, porque é um cenário teórico.
Na pior das hipóteses a margem será de dois pontos percentuais para mais ou para menos do valor médio declarado.
Vale lembrar que a porcentagem de intenção de voto inferida na pesquisa é uma intenção média e quanto mais nos distanciamos dela para mais ou para menos, o cenário se torna menos provável, porém não impossível.
Como funciona uma pesquisa de intenção de voto? Os pesquisadores vão a campo e coletam as informações de modo experimental, ou seja, de modo frequentista, por conseguinte, é pouco provável que a margem de erro da pesquisa seja aquela registrada no TSE.
Os cenários, após a coleta dos dados, deixam de ser teóricos e passam a pertencer ao mundo real. As margens de erro são menores do que as que foram registradas no TSE, quando se consideram todos os respondentes.
Contudo, serão maiores quando analisarmos os dados dentro dos estratos de sexo, idade, grau de instrução, classe econômica, ou por região, já que a quantidade de pessoas diminui nos estratos e, consequentemente, a margem tende a aumentar.
Até porque margem de erro e quantidade de respondentes em uma pesquisa são grandezas inversamente relacionadas.
Por esse motivo, devemos olhar as análises de empate técnico com certa ressalva, principalmente, quando o jornalista, ou seja lá quem for, declara que dois candidatos estão empatados no limite da margem de erro.
Quando isso é afirmado, é pouquíssmo provável que esteja correto. A menos que a intenção de voto de algum dos canditados seja exatamente igual a 50%, que é o ponto de total incerteza para os cálculos de tamanho de amostra e margem de erro.
Por fim, se fôssemos considerar a abordagem subjetiva da inferência estatística, o
imbrólio seria ainda maior. Isso porque não conseguiríamos definir uma margem de erro fixa para todos os candidatos.
Na abordagem subjetiva, precisaríamos que todos os agentes do processo de coleta de dados fossem considerados “éticos” e “imparciais”. Todos os pontos de vista e intenções anteriores de votos de outras pesquisas não poderiam influenciar a intenção de voto da pesquisa atual, nem por pesquisas anteriores ou revelações midiáticas verdadeiras ou fakes.
Grosso modo, margem de erro fixa, só existe na teoria clássica.
Referências bibliográficas
BRASIL. Lei nº 9.504, de 30 de setembro de 1997. Lei das eleições, Brasília, DF, set. 1997.