quarta-feira, março 07, 2007

Da selecção amostral

O “tipo” de leitor que, em geral, não gosta de responder a inquéritos dificilmente responderá a um que seja.


Imagine que um jornal pede aos seus leitores que respondam, por correio normal, a esta pergunta: gosta de responder a inquéritos publicados em jornais? Assumindo que não há electrodomésticos em sorteio, o que espera o (meu) leitor que aconteça? Seguramente, que todas as respostas sejam afirmativas: o “tipo” de leitor que, em geral, não gosta de responder a inquéritos dificilmente responderá a um que seja.

É o exemplo clássico de “selecção amostral” – o problema de obter uma amostra não representativa da população em estudo. Outro exemplo: os inquéritos de Kinsey sobre sexualidade. Como não suspeitar que, nos indivíduos voluntariamente entrevistados, exista uma sobrerepresentação de libertinos e exibicionistas e uma subrepresentação de conservadores e pudicos? A causa do problema reside na diferença de incentivos que distintos “tipos” de indivíduos têm para participar no mecanismo de extracção de informação proposto.

Os resultados do programa “Os Grandes Portugueses” 
nunca serão estatisticamente representativos.

Os resultados do programa “Os Grandes Portugueses” não são necessariamente representativos das preferências dos portugueses porque (I) pode haver voto estratégico dos que votam – como vimos há 15 dias; (II) os que decidem votar podem não constituir uma amostra representativa da população. Não custa a entender que algumas franjas extremistas – e uso a palavra num sentido “descritivo”, e não de “crítica” – sintam uma pulsão maior que as franjas moderadas para empurrar os seus ídolos para uma liderança inicial, mais ainda quando se antecipa que a disputa final do primeiro lugar acontecerá entre os dois candidatos que consigam essa vantagem inicial. Acresce que a capacidade de mobilização de organizações extremistas é, também ela, desproporcional. Por tudo isto, ter Cunhal e Salazar como possíveis vencedores deste “jogo” não é assim tão surpreendente.

As duas ideias a reter deste texto sobrevivem para lá dos exemplos oferecidos. Primeiro, sempre que a recolha de informação dependa da vontade em participar, por parte dos elementos da população em estudo, devemos ter em conta os incentivos que os vários “tipos” de indivíduos têm nessa “auto-selecção” amostral. Segundo, se esses incentivos forem assimétricos, os resultados obtidos poderão ser muita coisa – interessantes, um convite à reflexão, até uma boa aproximação à realidade –, mas nunca serão estatisticamente representativos.