quinta-feira, 26 de agosto de 2010

Um problema interessante

Hoje tive de acompanhar dois membros do IEEE em uma maratona de reuniões. Neste caso meu papel foi essencialmente o de guia/motorista. Não foi ruim e os dois eram pessoas bastante simpáticas e agradáveis.

Mas em um dos momentos de espera eu comecei a pensar em um problema interessante.

Via de regra, dado um conjunto de medidas tentamos montar um modelo que relacione variáveis de entrada com variáveis de saída. Este é um problema de regressão linear. Na sua forma mais simples temos a equação:

Y=aX+b

E esta equação irá descrever um conjunto de pontos. Podemos fazer isto para mais de uma variável, como por exemplo:

Y=a1X1+a2X2+b

E o problema é praticamente o mesmo. Em geral temos um conjunto grande de X e Y para montar o sistema:

[X 1]*[a;b]=[Y]

Ou seja temos uma matriz N x 2 multiplicada por uma 2 x 1 resultando em um vetor N x 1.

A solução normalmente envolve o uso de pseudo-inversa (ou inversa generalizada). No fundo é encontrar a reta que tem menor variância em relação aos pontos existentes. Esta variância é calculada pelo somatório de:

(Yk-a*Xk-b)^2

Mas comecei a pensar

Por que uma reta? Por que não um conjunto de retas? Ou seja, por que não resolver o problema por partes?

No caso de duas retas usaríamos N1 pontos para primeira reta e N-N1 para segunda reta. O valor de N1 deveria ser determinado de modo a que a variância fosse a menor possível. Este tipo de problema tem algumas diferenças.

Primeiro a variância é calculada pelo somatório até N1 de

(Yk-a1*Xk-b1)^2

Adicionado ao somatório de N1 até N de

(Yk-a2*Xk-b2)^2

A vantagem desta representação é que pode-se avaliar possíveis pontos de ruptura ou de mudança de derivada (apesar de que possivelmente o processo deve ser contínuo). No fundo temos o problema original:

int (f(x)-a*x-b)^2 de 0 até cf

por

int (f(x)-a1*x-b1)^2 de 0 até c1 e int (f(x)-a2*x-b2)^2 de c1 até cf

Este é o problema original. Vamos ver o que podemos fazer a respeito...

sábado, 21 de agosto de 2010

Composição do Eleitorado - parte 5

Vamos agora analisar outra categoria de composição do eleitorado: o gênero (masculino & feminino).
Serra
  • Em 24/05/2010 - 47% masculino e 53% feminino
  • Em 30/06/2010 - 41% masculino e 59% feminino
  • Em 23/07/2010 - 46% masculino e 54% feminino
  • Em 16/08/2010 - 45% masculino e 55% feminino
O valor médio é de 45% do eleitorado de Serra é masculino e 55% feminino. Há uma variação de -2% do eleitorado masculino e +2% no eleitorado feminino, ao compararmos as pesquisas de 24/05 às de 16/08. No caso da pontuação de eleitores temos:
Serra
  • Em 24/05/2010 - 17% masculino e 19% feminino (total 36%)
  • Em 30/06/2010 - 16% masculino e 23% feminino (total 39%)
  • Em 23/07/2010 - 17% masculino e 20% feminino (total 37%)
  • Em 16/08/2010 - 15% masculino e 18% feminino (total 33%)
O valor médio é de 16% dos eleitores masculinos e 20% das eleitoras (36%). A diferença entre os dados da pesquisa de 24/05 e 16/08 é de -2% masculino, 0% que acham o governo Lula neutro e -1% feminino. Isto indica que os 3% de queda de Serra ocorreram nas duas categorias, mas com ênfase no eleitorado masculino.
Dilma
  • Em 24/05/2010 - 54% masculino e 46% feminino
  • Em 30/06/2010 - 58% masculino e 42% feminino
  • Em 23/07/2010 - 56% masculino e 44% feminino
  • Em 16/08/2010 - 55% masculino e 45% feminino
O valor médio é de 56% do eleitorado de Dilma é masculino e 44% feminino. Há uma variação de +1% do eleitorado masculino e -1% no eleitorado feminino, ao compararmos as pesquisas de 24/05 às de 16/08. No caso da pontuação de eleitores temos:
Dilma
  • Em 24/05/2010 - 20% masculino e 17% feminino (total 37%)
  • Em 30/06/2010 - 21% masculino e 15% feminino (total 36%)
  • Em 23/07/2010 - 20% masculino e 16% feminino (total 36%)
  • Em 16/08/2010 - 22% masculino e 18% feminino (total 40%)
O valor médio é de 21% dos eleitores masculinos e 17% das eleitoras (38%). A diferença entre os dados da pesquisa de 24/05 e 16/08 é de +2% masculino, 0% que acham o governo Lula neutro e +1% feminino. Isto é consistente com a queda de 3% de Serra, mas com ênfase no eleitorado masculino.


Então a chance é mesmo que 2% dos eleitores de Serra tenha passado para Dilma e 1% das eleitoras de Serra tenha feito o mesmo. Claro que com as incertezas associadas aos erros amostrais está afirmação não pode ser inteiramente comprovada.

Composição do Eleitorado - parte 4

Apesar de ter saído a mais nova pesquisa DATAFOLHA com Dilma a 47% das intenções de voto, acredito que tenho de ver a evolução da composição do eleitorado para ter uma idéia mais clara do que acontece.

Então vamos aos candidatos. Os dados estão um pouco distintos dos posts anteriores devido ao arredondamento e ao uso dos percentuais atualizados segundo o número de pesquisados.
Serra
  • Em 24/05/2010 - 66% acham o governo Lula positivo, 27% acham o governo Lula neutro e 7% acham o  governo Lula ruim
  • Em 30/06/2010 - 69% acham o governo Lula positivo, 25% acham o governo Lula neutro e 6% acham o  governo Lula ruim
  • Em 23/07/2010 - 64% acham o governo Lula positivo, 29% acham o governo Lula neutro e 7% acham o  governo Lula ruim
  • Em 16/08/2010 - 62% acham o governo Lula positivo, 30% acham o governo Lula neutro e 8% acham o  governo Lula ruim
O valor médio é de 65% acham o governo Lula positivo, 28% acham neutro e 7% acham ruim. A diferença entre os dados da pesquisa de 24/05 e 16/08 é de -4% que acham o governo Lula positivo, 3% que acham o governo Lula neutro e 1% que acham o governo Lula ruim. Notem que a soma dá zero, pois está analise considerar a totalidade dos eleitores de Serra e não a totalidade dos eleitores. Ainda assim dá para dizer que 2/3 dos eleitores de Serra acham o governo Lula bom.

Já a análise com relação aos pontos percentuais totais mostra um quadro diferente. Esta análise permite indicar aonde foi a perda de Serra.
Serra
  • Em 24/05/2010 - 24% acham o governo Lula positivo, 10% acham o governo Lula neutro e 3% acham o  governo Lula ruim (total 37%)
  • Em 30/06/2010 - 27% acham o governo Lula positivo, 10% acham o governo Lula neutro e 2% acham o  governo Lula ruim (total 39%)
  • Em 23/07/2010 - 24% acham o governo Lula positivo, 11% acham o governo Lula neutro e 3% acham o  governo Lula ruim (total 38%)
  • Em 16/08/2010 - 21% acham o governo Lula positivo, 10% acham o governo Lula neutro e 3% acham o  governo Lula ruim (total 34%)
O valor médio é de 24% acham o governo Lula bom, 10% acham o governo Lula neutro e 3% acham o governo Lula ruim (37%). A diferença entre os dados da pesquisa de 24/05 e 16/08 é de -3% que acham o governo Lula positivo, 0% que acham o governo Lula neutro e 0% que acham o governo Lula ruim. Isto indica que os 3% de queda de Serra ocorreram no percentual do eleitorado que acha o governo Lula bom. Para ver aonde estes 3% foram é necessário olharmos os outros candidatos.
Dilma

  • Em 24/05/2010 - 92% acham o governo Lula positivo, 7% acham o governo Lula neutro e 0% acham o  governo Lula ruim
  • Em 30/06/2010 - 95% acham o governo Lula positivo, 5% acham o governo Lula neutro e 1% acham o  governo Lula ruim
  • Em 23/07/2010 - 92% acham o governo Lula positivo, 7% acham o governo Lula neutro e 0% acham o  governo Lula ruim
  • Em 16/08/2010 - 92% acham o governo Lula positivo, 8% acham o governo Lula neutro e 1% acham o  governo Lula ruim
O valor médio é de 93% acham o governo Lula positivo, 7% acham neutro e 1% acham ruim. A diferença entre os dados da pesquisa de 24/05 e 16/08 é de -1% que acham o governo Lula positivo, 0% que acham o governo Lula neutro e 0% que acham o governo Lula ruim. Notem que a soma não dá zero, a razão está nos erros de arredondamento. Mas vamos à análise com os pontos percentuais
Dilma
  • Em 24/05/2010 - 34% acham o governo Lula positivo, 3% acham o governo Lula neutro e 0% acham o  governo Lula ruim (total 37%)
  • Em 30/06/2010 - 34% acham o governo Lula positivo, 2% acham o governo Lula neutro e 0% acham o  governo Lula ruim (total 36%)
  • Em 23/07/2010 - 32% acham o governo Lula positivo, 3% acham o governo Lula neutro e 0% acham o  governo Lula ruim (total 35%)
  • Em 16/08/2010 - 37% acham o governo Lula positivo, 3% acham o governo Lula neutro e 0% acham o  governo Lula ruim (total 40%)
O valor médio é de 34% acham o governo Lula bom, 3% acham o governo Lula neutro e 0% acham o governo Lula ruim (total é de 37%). A diferença entre os dados da pesquisa de 24/05 e 16/08 é de +3% que acham o governo Lula positivo, 0% que acham o governo Lula neutro e 0% que acham o governo Lula ruim. Isto indica que Dilma teve um ganho de 3% no percentual do eleitorado que acha o governo Lula bom (dos quais 3% podem ser reportados a Serra).

A verdade é que este tipo de análise só mostra as variações ocorridas dentro de uma categoria: popularidade do presidente. Para uma análise melhor é necessário ver outras categorias.

Isto fica para um próximo post

quinta-feira, 19 de agosto de 2010

Equação de Price

Acho que encontrei o equivalente de uma das Leis do Eletromagnetismo na biologia evolutiva


w\,\Delta{z}=\operatorname{cov}(w_i,z_i)+\operatorname{E}(w_i\,\Delta z_i) , \,\!

Esta é a chamada equação de Price. Parecem existir muitas ramificações além da biologia.

Suspeito que esta equação pode ser utilizada para explicar e possivelmente quantificar processos similares aos efeitos da evolução e seleção natural. Em outras palavras: talvez seja possível aplicá-la para fenômenos sociais.

Percebo, ao olhar para ela, que algo que sempre me escapou na descrição matemática de populações foi a interação entre o comportamento individual e o coletivo. Agora vejo que o comportamento coletivo estará ligado às médias e o individual ao agrupamento dos mesmos.

No caso da equação acima:


\Delta{z_i} \ \stackrel{\mathrm{def}}{=}\  z_i' - z_i

é a variação da característica no grupo i da geração k para k+1


\Delta{z} \ \stackrel{\mathrm{def}}{=}\  z' - z

é a variação média da característica na população da geração k para k+1. E claro que wé a aptidão associada a característica zi .

Outro ponto interessante da equação é que sua derivação é exata (matematicamente). A covariância entre a aptidão e característica no grupo i é dado por:


\operatorname{cov}(w_i,z_i)=\operatorname{E}(w_iz_i)-wz

Já o valor esperado para taxa de alteração da característica no grupo i é dado por:


\operatorname{E}(w_i\,\Delta z_i)=\operatorname{E}(w_iz'_i)-\operatorname{E}(w_iz_i)

Somando os dois termos temos:

\operatorname{cov}(w_i,z_i)+\operatorname{E}(w_i\,\Delta z_i)=wz'-wz=w\,\Delta z\,

Sinto que um modelo baseado no relacionamento entre médias e indivíduos é chave para o entendimento de um comportamento social. Mas descobrir isto é um senhor problema

segunda-feira, 16 de agosto de 2010

Composição do eleitorado - parte 3

Sairam os novos dados do DATAFOLHA. E eles são muito completos...

Para adiantar, vou colocar um primeiro post sobre estes novos dados e depois trago mais detalhes.

Serra

  • Em 14/04/2010 - 67% acham o governo Lula positivo, 26% acham o governo Lula neutro e 8% acham o governo Lula ruim
  • Em 20/05/2010 - 65% acham o governo Lula positivo, 27% acham o governo Lula neutro e 8% acham o  governo Lula ruim
  • Em 30/06/2010 - 68% acham o governo Lula positivo, 26% acham o governo Lula neutro e 6% acham o  governo Lula ruim
  • Em 26/07/2010 - 66% acham o governo Lula positivo, 28% acham o governo Lula neutro e 6% acham o  governo Lula ruim
  • Em 16/08/2010 - 63% acham o governo Lula positivo, 28% acham o governo Lula neutro e 8% acham o  governo Lula ruim

Dilma

  • Em 14/04/2010 - 93% acham o governo Lula positivo, 7% acham o governo Lula neutro e 0% acham o  governo Lula ruim
  • Em 20/05/2010 - 92% acham o governo Lula positivo, 7% acham o governo Lula neutro e 1% acham o  governo Lula ruim
  • Em 30/06/2010 - 94% acham o governo Lula positivo, 4% acham o governo Lula neutro e 0.4% acham o  governo Lula ruim
  • Em 26/07/2010 - 93% acham o governo Lula positivo, 7% acham o governo Lula neutro e 0% acham o  governo Lula ruim
  • Em 16/08/2010 - 92% acham o governo Lula positivo, 7% acham o governo Lula neutro e 1% acham o  governo Lula ruim

Marina

  • Em 14/04/2010 - 70% acham o governo Lula positivo, 24% acham o governo Lula neutro e 6% acham o  governo Lula ruim
  • Em 20/05/2010 - 67% acham o governo Lula positivo, 25% acham o governo Lula neutro e 8% acham o  governo Lula ruim
  • Em 30/06/2010 - 70% acham o governo Lula positivo, 27% acham o governo Lula neutro e 6% acham o  governo Lula ruim
  • Em 26/07/2010 - 71% acham o governo Lula positivo, 21% acham o governo Lula neutro e 2% acham o  governo Lula ruim
  • Em 16/08/2010 - 77% acham o governo Lula positivo, 22% acham o governo Lula neutro e 4% acham o  governo Lula ruim

Brancos

  • Em 14/04/2010 - 69% acham o governo Lula positivo, 22% acham o governo Lula neutro e 8% acham o  governo Lula ruim
  • Em 20/05/2010 - 57% acham o governo Lula positivo, 28% acham o governo Lula neutro e 15% acham o  governo Lula ruim
  • Em 30/06/2010 - 58% acham o governo Lula positivo, 30% acham o governo Lula neutro e 18% acham o  governo Lula ruim
  • Em 26/07/2010 - 54% acham o governo Lula positivo, 31% acham o governo Lula neutro e 14% acham o  governo Lula ruim
  • Em 16/08/2010 - 46% acham o governo Lula positivo, 29% acham o governo Lula neutro e 9% acham o  governo Lula ruim

Não sabe

  • Em 14/04/2010 - 73% acham o governo Lula positivo, 23% acham o governo Lula neutro e 5% acham o  governo Lula ruim
  • Em 20/05/2010 - 76% acham o governo Lula positivo, 23% acham o governo Lula neutro e 1% acham o  governo Lula ruim
  • Em 30/06/2010 - 78% acham o governo Lula positivo, 17% acham o governo Lula neutro e 0.5% acham o  governo Lula ruim
  • Em 26/07/2010 - 77% acham o governo Lula positivo, 21% acham o governo Lula neutro e 2% acham o  governo Lula ruim
  • Em 16/08/2010 - 77% acham o governo Lula positivo, 22% acham o governo Lula neutro e 2% acham o  governo Lula ruim

Então é possível ver algumas mudanças interessantes a partir destes dados. Eu vou a estes pontos mais tarde

Esperando os dados do DATAFOLHA

Ainda não postei nenhuma análise sobre os últimos dados da pesquisa para presidente de 2010 pois estou esperando os dados de tabela ficarem disponíveis.

Estou bastante curioso sobre as possíveis alterações nos percentuais dos candidatos - em particular da Dilma e do Serra. Não nos percentuais divulgados, mas nos calculados utilizando Bayes.

domingo, 15 de agosto de 2010

Se havia alguma dúvida...

Depois das declarações de Roriz no blog da Ana Maria Campos:
"...

Eu - O senhor acredita que tudo o que Durval contou sobre o governo Arruda aconteceu também no seu?
Roriz - Não, no meu não. Ele foi nomeado por mim. Agora eu acho que o Durval, vocês me desculpem dizer, acho que ele prestou um relevante serviço ao meu país. Ter a coragem de denunciar as falcatruas de um governo... Isso um dia vai ser reconhecido. Eu acho que ele prestou um trabalho extraordinário para o Brasil, não só para Brasília, para o Brasil. Qual é o homem que tem coragem de ser governo e denunciar o seu próprio governo? Precisa pensar nisso. Porque hoje qualquer governante tem receio, a partir da denúncia do Durval. Vamos respeitar o homem. O homem que vai moralizar a coisa pública desse país. Não foi só de Brasília, não. Mas em Brasília ele erradicou. Depôs governador, depôs vice-governador, depôs tudo.
..."

Agora não resta dúvida nenhuma: Roriz orquestrou a motivação do Fora Arruda.

Eu sempre suspeitei, mas nunca consegui nada para corroborar esta suspeita. Até esta declaração...

Só posso imaginar a sensação de ter sido uma marionete dos que participaram do movimento. Mas nem tudo está perdido: o ficha limpa foi algo que estava totalmente fora do script.

Pena que haja dúvidas sobre sua constitucionalidade.

quinta-feira, 12 de agosto de 2010

Eleições - Histórico da cotação do Real

Em mais um esforço para detonar a propaganda, estou colocando aqui a série temporal de cotação do Real com o Dólar. Os dados são do IPEA.

Espero que isto ajude a diminuir os erros que surgem quando as pessoas acreditam em propaganda enganosa.
O fato é que olhando gráfico ficam claros os momentos da flutuação do câmbio, no governo FHC, a eleição de Lula e a nova crise financeira.

Como ponto positivo do governo Lula, notem que a cotação diminuiu de modo consistente durante boa parte do seu mandato (com exceção da crise de 2008).

Já durante o governo FHC, após a flutuação do câmbio, a cotação subiu de modo consistente durante todo mandato

Tentativa para twitter

Vamos ver se este post vai funcionar como teste do twitterfeed!

terça-feira, 10 de agosto de 2010

Época de Eleições - Spin a mil

De novo surge a história de "FHC faliu o país" e "Itamar não é o pai do Real". Como isso é mentira mesmo, resolvi colocar aqui um gráfico com a série história de inflação de 1980 a 2009.

Para facilitar ainda coloquei de modo destacado a intervenção de cada governante do respectivo período de modo destacado (como um traço vertical).

Notem a eleição de 2002 - e o efeito que teve na inflação

domingo, 8 de agosto de 2010

Época de Eleições

E como já disse começa o spin:
O presidente estadual do Partido Verde no Rio, Alfredo Sirkis, ironizou hoje Plínio de Arruda, candidato à Presidência pelo PSOL.
"Ele é um burguês quatrocentão que mora em um apartamento de R$ 1 milhão falando de uma menina pobre, nascida na floresta, que se alfabetizou aos 16 anos e passou fome", disse, em referência ao apelido de "ecocapitalista" dado por Plínio à candidata do PV à Presidência, Marina Silva, durante o debate televisivo de quinta-feira.
Não deixa de ser moderadamente curioso

Pesquisas influenciam o eleitorado?

Este pergunta é tema de muitos trabalhos acadêmicos. Podemos mencionar este, este e este.

Mas o fator é que há uma grande incerteza sobre o potencial de influência de uma pesquisa.

No caso das eleições do Brasil há diversos pontos que se destacam. Um dele é como uma pesquisa pode influenciar eleições se sua divulgação é primariamente em meio impresso. No Brasil, a circulação de meio impresso é cerca de 5% da população total. Se considerarmos também a internet, talvez este número suba até 20%. Mas de qualquer modo ainda restam 80% da população para ser influenciada.

Há também a questão de pesquisas divulgadas pela televisão tem uma abrangência ainda maior. Mas o fato é que se vários institutos divulgarem, fica difícil forçar algum tipo de manipulação. O máximo efeito seria que a pesquisa talvez reforçasse os dados da população (ou seja, a pesquisa é o espelho da opinião da população, e este espelho faria a população tentar se parecer com a pesquisa).

Mas acredito que a pesquisa poderá somente influenciar o percentual de eleitores que podem mudar de voto (o que não significa indecisos). Em um post anterior eu disse:

Este valor é de cerca de 27%. A sua divisão é a seguinte: 11,44% em Serra, 7,45% em Dilma, 3,91% em Marina e 4,31% em Brancos e Nulos. O pessoal que não sabe chega a um total de 5%. 

Este resultado diz que 27% dos eleitores pode mudar o voto. Podemos imaginar que este percentual é o que potencialmente pode ser influenciado por pesquisas. E desta influência, temos que alguns podem ser sofrer efeitos positivos (p), negativos (n) ou indiferentes (i). Ou seja, os 11,4% de Serra seriam multiplicados por a soma dos efeitos positivos, negativos e indiferentes. O efeito negativo teria a ter influência contrária a da pesquisa (se Serra aumenta ele tende a diminuir, se Serra diminui ele tende a aumentar).

O fato é que mesmo estes 11,4% tem de ser categorizados sobre o grau de influência que a pesquisa tem sobre a sociedade. Nisto o primeiro passo é determinar qual é a penetração de uma pesquisa. Dado situações anteriores, eu iria longe o suficiente para afirmar que um pesquisa divulgada em televisão terá no máximo 50% de penetração. Isto é baseado em dados de pesquisa anteriores com relação a audiência de programas televisivos (o Jornal Nacional tem tido audiência na casa dos 38 pontos).

Então o potencial de mudança devido a pesquisas pode ser algo perto de 27*0.5 ou cerca de 14%. Provavelmente este percentual pode ser maior em relação ao pessoal que não sabe, mas para simplificar temos algo como potencial para mudança devido a pesquisa de 6 pontos em Serra, 4 pontos em Dilma, 2 pontos em Marina, 2 pontos em Nulos e Brancos e 2 pontos em não sabe.

Mas por enquanto só pode-se especular

quarta-feira, 4 de agosto de 2010

Ficha Limpa e Roriz

Acaba e sair a notícia que Roriz teve seu pedido de candidatura negado pelo TRE-DF.

Eu não sou eleitor dele e tenho muitas divergência com os setores que o apoiam. Então, não estou nada triste com isto.

Mas cabe um alerta de sobriedade: o resultado ainda cabe recurso no TSE (e caso seja no STF). E o problema é justamente a questão de porque o ficha limpa está sendo aplicado. Eu explico: neste caso não é nem a questão temporal do problema, mas o fato que ele está sendo enquadrado por ter renunciado.

A renúncia teve como causa provável a estratégia para escapar de uma possível cassação. Isto até as folhas das árvores já estão sabendo.

Mas causa provável não é causa certa. E mais ainda: renunciar é um direito e não há uma necessidade de provar nexo causal (por mais óbvio que ele pareça) para justificar a renúncia.

Ou seja, como não existiu um processo real contra ele a renúncia PODE ser interpretada como tentativa de escapar da cassação. Mas ao mesmo tempo PODE ser interpretada de outra forma. Não há como provar conclusivamente um caso ou outro (a não ser que exista um vídeo do Roriz explicando que renunciou para escapar da cassação).

Mas vamos como as coisas andam

terça-feira, 3 de agosto de 2010

Theodor Adorno

Estou lendo Introdução a Sociologia de Theodor Adorno.

Estou na segunda aula - o livro é organizado desta forma: cada aula é um capítulo.

Devo dizer que não estou muito contente com o que li até agora. Até o momento ele desviou de definir o que é Sociologia (se bem que de vez em quando escapou uma ou outra frase com cheiro de definição), incutiu a tradicional centelha de teoria da conspiração (o orçamento da exploração espacial é o provável responsável por não termos curado o câncer) e lançou uma ou outra idéia aqui e acolá.

Talvez seja o velho problema da dialética - que criticamente não permite conhecer nada, apenas defini-lo pelo que ele não é...

Eu tendo a desconfiar que a origem da pessoa está intimamente ligada ao seu desenvolvimento. Adorno era alemão e viveu a primeira guerra como adolescente e a segunda como adulto. Isto certamente isto foi um fator importante na construção de seu pensamento.

Quando ele menciona Auschwitz, não posso deixar de pensar que o campo de concentração (ou de trabalhos forçados, ou de contenção, ou de prisioneiros) não é um fenômeno nazista. É algo cruelmente mais abrangente e comum (mesmo os Estados Unidos e o Brasil tiveram os seus). Suspeito que eles seguem na linha de "Longe dos olhos..."

Mas vou continuar lendo e tentar extrair mais informações

segunda-feira, 2 de agosto de 2010

Mais formas de ver a diferença entre IBOPE e DATAFOLHA

Acredito que a melhor forma de ver as diferenças entre as pesquisas é mostrar os números do eleitorado em categorias
Percentuais de Serra com relação ao nível educacional:
  • DATAFOLHA - 18,18% com ensino fundamental, 14,01% com ensino médio e 4,29% com ensino superior
  • IBOPE - 16,40% com ensino fundamental, 12,25% com ensino médio e 5,18% com ensino superior
Percentuais de Dilma com relação ao nível educacional: 
  • DATAFOLHA - 16,70% com ensino fundamental, 14,77% com ensino médio e 4,68% com ensino superior
  • IBOPE - 20,90% com ensino fundamental, 14,35% com ensino médio e 4,48% com ensino superior
Percentuais de Marina com relação ao nível educacional: 
  • DATAFOLHA - 3,44% com ensino fundamental, 4,16% com ensino médio e 2,47% com ensino superior
  • IBOPE - 2,49% com ensino fundamental, 12,45% com ensino médio e 2,24% com ensino superior
Percentuais de Brancos/Nulos com relação ao nível educacional: 
  • DATAFOLHA - 1,96% com ensino fundamental, 1,89% com ensino médio e 0,65% com ensino superior
  • IBOPE - 2,49% com ensino fundamental, 2,80% com ensino médio e 1,26% com ensino superior
Percentuais de Não sabe com relação ao nível educacional: 
  • DATAFOLHA - 7,37% com ensino fundamental, 2,27% com ensino médio e 0,65% com ensino superior
  • IBOPE - 8,20% com ensino fundamental, 2,80% com ensino médio e 0,84% com ensino superior
Diferenças:
  • 4,2% a mais na contagem do IBOPE para o percentual de eleitores de Dilma com ensino médio. O resultado é um total de 3.58% a mais do que o valor do DATAFOLHA para Dilma. Para Serra há um aumento de 2,65% no DATAFOLHA. Para Marina há um aumento de 2,80% no DATAFOLHA. Os demais índices encontram-se dentro da margem de 2% esperada.
Percentuais de Serra quanto ao gênero:
  • DATAFOLHA - 17,32% são homens e 19,72% são mulheres
  • IBOPE - 15,64% são homens e 18,41% são mulheres
Percentuais de Dilma quanto ao gênero:
  • DATAFOLHA - 20,21% são homens e 15,57% são mulheres
  • IBOPE - 20,86% são homens e 18,41% são mulheres
Percentuais de Marina quanto ao gênero:
  • DATAFOLHA - 4,33% são homens e 5,71% são mulheres
  • IBOPE - 3,32% são homens e 3,68% são mulheres
Percentuais de Brancos/Nulos quanto ao gênero:
  • DATAFOLHA - 1,92% são homens e 2,59% são mulheres
  • IBOPE - 3,32% são homens e 3,16% são mulheres
Percentuais de Não Sabe quanto ao gênero:
  • DATAFOLHA - 3,37% são homens e 6,74% são mulheres
  • IBOPE - 3,79% são homens e 7,89% são mulheres
Diferenças:
  • 2,83% a mais na contagem do IBOPE para o percentual feminino de eleitores de Dilma (e 0,65% para o eleitorado masculino). O resultado é um total de 3,48% a mais do que o valor do DATAFOLHA para Dilma. Para Serra há um aumento de 2,98% no DATAFOLHA. Para Marina há um aumento de 3,04% no DATAFOLHA. Os demais índices encontram-se dentro da margem de 2% esperada.
Assim fica parecendo que a maior diferença em Dilma se concentra em um número maior de eleitores com ensino fundamental e número maior de eleitoras. Já em Serra, a diferença positiva para o DATAFOLHA é mais distribuída nas diversas categorias. Acredito que vale a pena fazer uma comparação entre as duas pesquisas do IBOPE (atual e anterior).

domingo, 1 de agosto de 2010

Alguma comparação entre o IBOPE e DATAFOLHA

Com a saída da pesquisa IBOPE e seu relatório, tenho finalmente algum parâmetro de comparação para ligar esta pesquisa a do DATAFOLHA (já comentada anteriormente).

Eu estou interessado na composição do eleitorado. Em outras palavras, quero ver se a composição é consistente.

Agora eu tenho dos dados do relatório do DATAFOLHA e do IBOPE:

Serra:
  • DATAFOLHA:  46,8% dos eleitorado é masculino e 53,2% do eleitorado é feminino
  • IBOPE:  45,9% do eleitorado é masculino e 54,1% do eleitorado é feminino
  • DATAFOLHA:  49,8% dos eleitorado tem ensino fundamental, 38,4% do eleitorado tem ensino médio e 11,8% do eleitorado tem ensino superior
  • IBOPE:  27,5% dos eleitorado tem ensino fundamental nível 1, 20,9% dos eleitorado tem ensino fundamental nível 2, 36,2% do eleitorado tem ensino médio e 15,3% do eleitorado tem ensino superior
Dilma:
  • DATAFOLHA:  56,5% dos eleitorado é masculino e 43,5% do eleitorado é feminino
  • IBOPE:  53,1% do eleitorado é masculino e 46,9% do eleitorado é feminino
  • DATAFOLHA:  46,2% dos eleitorado tem ensino fundamental, 40,8% do eleitorado tem ensino médio e 13,0% do eleitorado tem ensino superior
  • IBOPE:  31,0% dos eleitorado tem ensino fundamental nível 1, 21,6% dos eleitorado tem ensino fundamental nível 2, 36,1% do eleitorado tem ensino médio e 11,3% do eleitorado tem ensino superior
O que isto significa? Comparando os dados vemos que:
  • DATAFOLHA - 48,1% dos pesquisados são homens, 51,9% são mulheres; 49,1% estão na categoria ensino fundamental, 37,9% na categoria ensino médio e 13,0% na categoria ensino superior
  • IBOPE - 47,4% dos pesquisados são homens, 52,6% são mulheres; 30,0% estão na categoria ensino fundamental 1, 21,5% na categoria ensino fundamental 2, 34,6% na categoria ensino médio e 14,0% na categoria ensino superior
A primeira vista temos uma diferença de 0,7% entre o peso do eleitorado masculino do DATAFOLHA sobre o IBOPE (+) e 0,7% entre o peso do eleitorado feminino do DATAFOLHA sobre o IBOPE (-). Mas além disto vemos que existem 3,3% (+) do DATAFOLHA sobre o IBOPE na categoria ensino médio e 1% (-) do DATAFOLHA sobre o IBOPE na categoria ensino superior. Como a soma tem de dar 100% então existe uma diferença de 2,3% (-) do DATAFOLHA em relação ao IBOPE na categoria ensino fundamental. Isto quer dizer que o peso do IBOPE dados aos eleitores de nível fundamental é MAIOR que o peso dado pelo DATAFOLHA a mesma classe de eleitores. Isto certamente é uma fonte de desacordo, mas pode ser responsável pela diferença observada?

Comparando os dois casos no ensino médio e superior vemos que:
  • Para Serra, o DATAFOLHA estima a composição do eleitorado em 38,4% com ensino médio e 11,8% com ensino superior. Já o IBOPE estima a composição do eleitorado em 36,2% de ensino médio e 15,3% de ensino superior. Isto dá + 1,8% para DATAFOLHA na categoria ensino médio e + 3,7% para o IBOPE na categoria ensino superior. Indiretamente vemos que o IBOPE estima que o percentual do eleitorado com ensino fundamental é 48,5% e o DATAFOLHA estima que este percentual é de 49,8%.
  • Para Dilma, o DATAFOLHA estima a composição do eleitorado em 40,8% com ensino médio e 13,0% com ensino superior. Já o IBOPE estima a composição do eleitorado em 36,1% de ensino médio e 11,3% de ensino superior. Isto dá + 4,7% para DATAFOLHA na categoria ensino médio e - 1,7% para o IBOPE na categoria ensino superior. Indiretamente vemos que o IBOPE estima que o percentual do eleitorado com ensino fundamental é 52,6% e o DATAFOLHA estima que este percentual é de 46,2%.
Isto é uma indicação que a diferença é dada precisamente pelo tamanho da base considerada como ensino fundamental. Ou no DATAFOLHA ela é subestimada, ou no IBOPE ela é superestimada.

Adendo: Claro que há a possibilidade de um deles estar certo. Afinal as estimativas de categorias de população são complicadas (ex: 49,5% são homens e 50,5% são mulheres)