sexta-feira, 21 de outubro de 2011

Da Terra à Lua?


Estou lendo um compêndio com várias obras de Júlio Verne. Terminei a pouco tempo A Ilha Misteriosa, finalizei Da Terra a Lua e estou lendo Ao Redor da Lua.

A leitura está sendo feito em um Kindle aonde o e-book é este aqui.

Um fato que me chamou a atenção foi a diferença entre o conhecimento que temos hoje e o da época. Diferente do que a maioria das pessoas pensa, o que Verne escreveu tinha relação direta com o embasamento científico da época. Então algumas coincidências, tais como o local de partida são na realidade deduções bem educadas.

Mas existem alguns problemas. E alguns deles são perfeitamente deduzíveis com o conhecimento científico da época. Um erro claro é no cálculo da velocidade de escape da bala. Outro erro visível trata do efeito do vácuo na pressão e na temperatura. E nem vou falar do que eles falam a respeito do sol, da terra e mesmo da lua.

Isto me levanta a questão de que se a ciência descrita no livro deveria ser "editada" como se propõe a fazer com outras obras. Sempre surgem os interessados em uma forma ou outra de revisionismo cultural. Fico imaginando se não vira também uma onda de revisionismo científico junto...

Mas um ponto que me interessou bastante no livro foi sobre o cálculo da distância da Terra à Lua. No livro este cálculo é descrito usando o conceito de paralaxe lunar.

Until then, many people had no idea how one could calculate the distance separating the Moon from the Earth. The circumstance was exploited to teach them that this distance was obtained by measuring the parallax of the Moon. If the word parallax appeared to amaze them, they were told that it was the angle subtended by two straight lines running from both ends of the Earth's radius to the Moon. If they had doubts on the perfection of this method, they were immediately shown that not only did this mean distance amount to a whole two hundred thirty-four thousand three hundred and forty-seven miles (94,330 leagues), but also that the astronomers were not in error by more than seventy miles (≈ 30 leagues).

Isto me levou a pensar se não há um modo mais fácil.

E realmente há: basta equacionar o problema como o equilíbrio da força centrípeta com a atração gravitacional. E o melhor é que não é necessário conhecer a massa da terra ou da lua, mas apenas o período da lua T (28 dias - 2419200 segundos), o raio da terra R0 (6373 km = 6.373e3 m) e a aceleração da gravidade na terra g (10 m/s^2). Com estes dados chegamos a conclusão que a distância da terra a lua é:
1/2*(2*g*R0^2*T^2*Pi)^(1/3) = 391943 km (compare com a distância média da lua à terra de 384405 km ou 377144 km segundo o cálculo de Verne). E se usarmos os valores mais corretos do período, do raio da terra e da aceleração da gravidade chegaríamos a 382999.1251 km

E estes dados estavam a disposição na época de Verne (aliás, olhando a fórmula acima, dá para ver que ela dá para ser reescrita como R^3/T^2 = Pi*g*R0^2/4 - que lembra a terceira lei de Kepler - o que não é totalmente estranho, já que um círculo é um caso especial de uma elipse).

quarta-feira, 19 de outubro de 2011

Horário de Verão

Estamos no horário de verão. Ele começou no dia 16 de outubro e deve ir até 26 de fevereiro do ano que vem. Estima-se grande economia, mas ao mesmo tempo as pessoas reclamam sobre o assunto.

Mas afinal, para que serve o horário de verão? Bem vamos clarificar: no equador o horário de verão não tem utilidade nenhuma. Mas fora dele a coisa passa a ser diferente. A primeira coisa que é preciso compreender é que relação entre a duração do dia e da noite variam durante o ano. E esta relação dependerá da latitude em que nos encontramos.

A duração do dia é dada pela equação:
T_d = {2 \over 15} \cdot arccos (min(max(-tan \phi \cdot tan \delta, -1), 1))
Aonde, o primeiro ângulo é a latitude local e o segundo é dado por:
\delta = 23,45 \cdot sen ({360 \over 365} \cdot {(284 + n)})
O que isto quer dizer? Em um exemplo:
Local: São Paulo
Latitude: -23° 32' 36" (-23,543333)
Longitude: 46° 37' 59" (46,633056)
Cálculo para o dia 29 de abril (n=119)


O número de horas de sol neste dia é 11,15174 ou 11h 9min 6 seg.

Passando 6,424129 para horas/minutos/segundos:

Passando 17,57587 para horas/minutos/segundos:

Nascer: 6h 25min 26s
Pôr: 17h 34min 33s

Bem, assim como o equinócio de primavera no Brasil é por volta de 20 de setembro e o de outono é por volta de 20 de março, então entre estas duas datas a duração do dia médio no Brasil será maior que 12 horas.

Em termos de economia de de energia isto significa menos horas para iluminação e também se torna possível evitar coincidir demandas energéticas mais sérias (por exemplo: acender todas as luzes e tomar banho quente). Então a idéia é aproveitar a luminosidade adicional para diminuir o consumo de energia e também melhorar um pouco mais a qualidade de vida. Como o sol irá nascer mais cedo, para aproveitar melhor o dia torna-se o caso de iniciar o dia mais cedo (adiantar 1 hora).

Mas, há alguns problemas. Primeiro, para que seja adiantado de uma hora então é necessário que o sol já tenha nascido naquele horário. E o Brasil não é apenas uma cidade. Então como fazer para minimizar o desconforto das pessoas? 
  • Em Brasília: No dia 16 de outubro a duração do dia é de 12 horas e 27 minutos (nascer do sol às 5:43). Já no dia 21 de dezembro a duração é de 13 horas e 4 minutos (nascer do sol às 5:37). Já no dia 26 de fevereiro, a duração é de 12 horas e 25 minutos (nascer do sol às 6:11).
  • Em Rio Grande: No dia 16 de outubro a duração do dia é de 12 horas e 54 minutos (nascer do sol às 5:46). Já no dia 21 de dezembro a duração é de 14 horas e 15 minutos (nascer do sol às 5:19). Já no dia 26 de fevereiro, a duração é de 12 horas e 51 minutos (nascer do sol às 6:15).
  • Em Boa Vista: No dia 16 de outubro a duração do dia é de 12 horas e 3 minutos (nascer do sol às 5:46). Já no dia 21 de dezembro a duração é de 11 horas e 59 minutos (nascer do sol às 6:01). Já no dia 26 de fevereiro, a duração é de 12 horas e 03 minutos (nascer do sol às 6:13).
Então a duração realmente varia com a posição geográfica (os horários acima são do nascer do sol sem o horário de verão). Então temos durante quase 1 hora de variação nas datas de início e fim do horário de verão e cerca de 2 horas no dia 21 de dezembro. O resumo: quanto mais ao norte, menos eficiente é o horário de verão.

Segundo: o Brasil não é uma linha. Estados mais a leste tem nascer do sol antes de estados mais ao oeste. Exemplo: no dia 16 de outubro, o nascer do sol em Natal é às 4:59 (o dia tem 12 horas e 14 minutos). Já em Rio Branco o mesmo nascer do sol ocorre 6:05 na hora local (e 7:05 na hora de Brasilia - sendo que o dia tem 12 horas e 19 minutos). Assim, mesmo que acordar mais cedo faça mais sentido para estados do leste, naquelas cidades anoitece também mais cedo.

Ou seja, não dá para desconsiderar os fusos horários pura e simplesmente. O que faria sentido? Podemos considerar como passível do horário de verão as regiões de longitude entre 37.5 graus oeste e 52.5 graus oeste. Esta configuração exclui parte de algumas regiões cuja adoção do horário de verão traria poucos benefícios.

Alternativamente, podemos também excluir tudo abaixo de 15 graus sul. Mas isto é puramente arbitrário.

No final, como as regiões que sobram são as mais populosas e com maior consumo de energia, então o sistema ainda pode sair no ganho. E como pode ser visto na figura abaixo, a coisa realmente funciona.

terça-feira, 18 de outubro de 2011

Censurar o passado?

Com certeza o leitor já fez algo no passado de qual se arrepende. Mas peço que note que mesmo quando fazemos algo que depois sentimos vergonha ou remorso, que esta ação faz parte da nossa vida e tem uma parcela na definição de quem somos.

Em suma, não dá para ser como somos sem enxergar as nossas qualidades e defeitos. Esta é uma lição difícil de ser aprendida, e por vezes só entra na cabeça depois de muito tempo.

Muito bem, vamos a doideira: as atitudes que estão sendo tomadas a respeito dos quadrinhos Tintim na África.

A reportagem é bem feita e até bastante equilibrada. Só derrapa mesmo no finalzinho:

"O caso exemplar em que a difusão de clichês ao grande público demonstra que o racismo é um produto da história e de certas relações sociais e econômicas, internacionais e interiores, se atualiza. O alerta sobre o teor racista colonialista do material, mais recentemente levou a atitudes como a da cadeia de livrarias Borders, na Grã-Bretanha e Estados Unidos,que transferiu da seção infantil para a de HQ adulta tornando mais difícil a sua consulta, considerando que “o livro é racialmente ofensivo para as pessoas negras”. A decisão se vincula a outra, a da Comissão pela Igualdade Racial da Grã-Bretanha, órgão britânico que exigiu (2007) a retirada do álbum das prateleiras afirmando ser “triste saber que haja ainda hoje livreiros que aceitem vender e divulgar Tintim no Congo”. O teor impróprio da obra passou a ser vendido com uma advertência aos consumidores. A editora Little Brown, do grupo francês Hachette, também decidiu evitar a polêmica e não publicar o álbum em sua coleção.
...

A atitude do estudante de Ciências Políticas da Université Libre de Bruxelles está baseada numa legislação, o artigo 444 do Código Penal belga, que proíbe propostas racistas e difamatórias contra os cidadãos. A iniciativa vem recebendo adesões institucionais. A organização francesa Conselho Representativo das Associações Negras apoia o processo de Mondondo solicitando que o livro seja retirado das vistas das crianças, ou pelo menos que lhe seja colocada na capa uma tarja alertando para o conteúdo preconceituoso.
Certamente, a obra deve ser vista no contexto de sua realização. Todavia, deve ser considerado o fato da Moulinsart, a Fundação Hergé, que gera os direitos comerciais além do livro, produzir games, brinquedos e inúmeros produtos entre os quais o filme que dará novo fôlego à marca. Mesmo sendo certo que a produção deverá tomar medidas cautelares para não reproduzir a principal marca da produção do Hergé, o pensamento colonialista e racista a produzir estereotipias e segregação fazendo a apologia da hierarquia entre os humanos. Tintim representa o que ele representou.
...

Fiquemos atentos aos argumentos culturais pesados em racismos de muitas ordens criados por outros tempos, pois eles não ficam sitiados no passado. Podem ainda frequentar a atualidade em brinquedos, brincadeiras, fantasias de carnaval, textos piadísticos, enfim, como camadas assentadas no imaginário a exigir alertas do setor educacional.
É a criança e o jovem expostos a correntes racistas o ponto a ser ressaltado. Embora algumas teorias racistas tenham sido banidas do mundo adulto e refutadas por acadêmicos maduros, veja que podem adquirir, nos aparentemente ingênuos formatos, canais para fixar preconceitos, estimular estereotipias e evocar atitudes discriminatórias.
Finalmente, quando o livro Tintin au Congo estiver disponibilizado nas bibliotecas, mas não para qualquer idade, é a impunidade do racismo que passa a ser restringida. Quando aquelas imagens de africanos e sua descendência foram produzidas, a autoria não deveria ter crianças africanas ou afro-descendentes em sua mira ou alguma reflexão que as considerasse. Oitenta anos depois, a indignação de um congolês atribui novos sentidos à relação com a obra. De olho nas novas gerações de seu país, como naturalizar a situação de ver uma criança africana ou em processo de construir e valorizar identidades nessa descendência sendo expostas a estereotipias dessa ordem? Da fato, todo jovenzinho, tenha ele origem asiática, europeia, americana ou outra, à mercê de um material como TinTin au Congo, por meio da veiculação de imagens negativas a inspirar xenofobia e promotora de constrangimento, está a formar o olhar sobre pessoas discriminadas. É a oportunidade para a internalização do racismo que ocorreu nos acervos da infância de gerações anteriores reproduzida para as atuais.
Se a produção é do passado, a atitude presente perante ela não pode repetir a condição desigual. O fato do Tribunal Cível de Bruxelas aceitar a denúncia e ouvir as partes, a indignação de Bienvenu, a defesa da editora Casterman e da Moulinsartreflete uma democracia. Cabe limitar a liberdade de expressão, no viés dos direitos da criança, imbricado às resoluções relacionadas ao racismo em sintonia com o compromisso acordado internacionalmente. O debate sobre caricaturas envolvendo identidades sociais é bem-vindo (bienvenu)."

E aí é que é o cerne do problema: reescrever a história. Os quadrinhos de Hergé são bem característicos como retrato da época. Não era apenas ele que pensava assim: todos pensavam assim. Ele é o cronista de uma era que, com todos os seus defeitos, não pode ser apagada e esquecida como se não tivesse existido. Mas, mais sério do que Hergé, há o problema que são inúmeros os autores que sofrem a direta influência da sua época na sua obra.

A diferença é que Hergé fazia quadrinhos, enquanto outros faziam livros ou textos mais elaborados. Mas como os quadrinho tem maior penetração juvenil, cria-se um padrão que é virtualmente impossível de ser cumprido: presciência no que será considerado certo ou errado no futuro.

Uma dica? Nacionalismo pode vir a se tornar anátema. O que vamos então fazer com os milhares de textos, ilustrações ou mesmo histórias em quadrinhos que louvam as virtudes do nacionalismo (ou mesmo denigrem qualquer um que não faz parte da "pátria")?

É mesmo o caso de proibir tudo?

Na minha opinião não é. Não é nem mesmo o caso de restringir a circulação. É o caso apenas de ensinar que o que está dito ali é parte do pensamento de uma época, e o que somos hoje é fruto de termos passado por aquilo.

sexta-feira, 14 de outubro de 2011

Mais uma questão de percepção estatística

Há uma tendência a se confundir eventos pouco frequentes com eventos frequentes. Mas como evitar esta armadilha?

A resposta simples é que é bem difícil. Mesmo com todas as ferramentas da estatística, de vez em quando caímos na armadilha de mala e cuia.

Por vezes os dados ficam tão mascarados dentro do ruído, ou mesmo dos interesses, que fica difícil saber o que realmente aconteceu ou não. No correio braziliense de hoje, fala-se em um aumento de 18% nos atropelamentos.

Como saber se isto realmente constitui em um aumento ou não? Bem se tivermos uma série de dados suficientemente longa com média constante então é possível estimar a probabilidade de um aumento estar ocorrendo ou não. Neste ponto, o quesito chave é a variância.

Mas há outra questão envolvida: frequentemente estes números são apresentados na forma de taxas. No caso deste site, é apresentado uma taxa de 1 atropelamento a cada 7 minutos. Isto quer dizer que há 2 atropelamentos a cada 14 minutos? Não... O que isto quer dizer é que o recíproco do número total de atropelamentos (cerca de 75 mil) anual dividido pelo número de minutos no ano (525600). Claro que aí há diversas suposições que são realizadas para fazer isto, uma delas é que a média temporal é constante.

Infelizmente muitas destas suposições são baseadas em achismos e algumas simplificações bem-intencionadas. Para começar, os dados são conflitantes (quantas mortes no trânsito ocorreram em 2006? 19 mil, 36 mil ou 63 mil?). Mas além disso há fatores geográficos e mesmo metodológicos em questão (dividir número de mortos no trânsito por carros ou habitantes nem sempre dá uma noção razoável do que acontece).
Então o melhor é usar uma base de dados que possua o maior número de informações. Temos aqui a base de dados do Detran-DF, o que permite um pouco mais de clareza. Uma rápida olhada no gráfico das vítimas do trânsito de Brasília permite uma série de deduções.

A primeira delas é que a redução no número de acidentes pode ser ligada a três fatores: uso do cinto de segurança, redutores eletrônicos de velocidade e a campanha paz no trânsito. De 1997 para cá, as médias tendem a ser praticamente constantes. A segunda é que ainda existe uma certa variação nos totais anuais.

Se considerarmos o ano de 1996, teremos as médias mensais variando entre 30.42 e 45.42. Desconsiderando 1996, as médias variam entre 30.42 e 35.92. Ao considerarmos todos os meses (exceto os do ano de 1996), chegamos a uma média de 33.95.

Mas com o uso da desigualdade de Chebysheff, é possível afirmar detalhes muito interessantes. Segundo a desigualdade, a probabilidade de média não estar em um intervalo de k desvios padrões é 1/k^2. Assim, se usarmos 2 desvios, a probabilidade da média estar fora é 1/4 ou 25%. No caso das taxas diárias calculadas sobre as mortes no trânsito de 1997 a 2006 temos que há 75% de chance de termos a média entre 0.68 e 1.55. Isto quer dizer que em um ano seriam esperados cerca de 3 ocorrências aonde isto não ocorresse. No caso de 1996, verificam-se 7 destas ocorrências. Caso seja considerada a média mensal, temos em 1996 exatamente 5 destas ocorrências.

Sem considerar muitas complexidades, podemos calcular a chance que um evento com probabilidade de 1/4 ocorra 5 vezes em 12 repetições. Nesse caso a chance de ocorrerem exatamente 5 é de cerca de 10%. Se considerarmos 7 então o número caí para pouco menos de 2%.

Qual a conclusão? Que há razoável indicação que houve redução de 1996 para 1997.

Mas e o restante dos dados? Bom, vemos que 170 dos 174 meses, a média mensal está entre 18.74 e 49.15 (98%) e 168 de 174 a média está entre 20.35 e 47.55 (97%).

Eu volto depois a este ponto, talvez até com a Transformada da incerteza....

quinta-feira, 13 de outubro de 2011

Quando a verdade não é toda a verdade

Xerox versus Apple - como realmente aconteceu? Tive a sorte de encontrar quase que por acaso uma reportagem do New Yorker descrevendo a interação do Palo Alto Research Center (PARC) da Xerox e Steve Jobs da Apple.

A história vale por si só, mas permite vislumbrar algo muito relevante: não é porque alguém inventou algo que vai conseguir lucrar com ele. Já mencionei aqui que existe uma diferença entre o conceito original e o que é efetivamente divulgado e usado por outras pessoas. A idéia pode ser a mesma, mas transformar um conceito em produto é uma tarefa nada simples.

Para começar, o mouse da Xerox era uma realização da idéia de Douglas Engelbart e não da própria Xerox. Mais ainda, o mouse da Xerox custava trezentos dólares e tinha vários botões. Já o mouse da Apple tinha apenas 1 botão e custava quinze dólares. Então, tecnicamente, o que a Apple fez foi adaptar a idéia de modo a torna-la mais barata, simples e comercializável.

E a interface gráfica? Pois é, a história também é parecida: a Xerox construiu em cima de outras criações. E Jobs construiu em cima da Xerox. Bem, e não podemos esquecer que Jobs ofereceu a oportunidade de a Xerox comprar cem mil ações da Apple por um milhão de dólares - que logo valeriam vários milhões. Isto em troca que a Xerox divulgasse sua tecnologia.

Não estou inventando:
"...in 1979, when Jobs gave Xerox a deal on pre-IPO Apple stock (one hundred thousand shares for one million dollars) just to get a peek inside their advanced research center, in Palo Alto (known as PARC)."

E quanto valeriam 100.000 ações depois do IPO?
"Apple was about to go public and Xerox's investment branch, Xerox Development Corporation, sensed an opportunity to turn a quick profit. Xerox invested $1 million in Apple by purchasing 100,000 shares at $10 each. Furthermore, Xerox signed an agreement with Apple to never purchase more than 5 percent of Apple's outstanding shares. Within a year, these shares split into 800,000 worth $17.6 million when Apple went public."

Pois é, então porque a Xerox não viu a importância que Jobs estava dando ao assunto? Bem, a resposta é que eventualmente a Xerox viu esta oportunidade. Mas infelizmente, o produto era muito caro e tinha outras desvantagens.

O fato é que neste ponto a Apple conseguiu fazer melhor e mais barato. Mas cabe um pequeno adendo sobre esta história: a Xerox quase não conseguiu ver o valor do trabalho de Gary Starkweather.

E esse é o cara que inventou a impressora laser.

Mas tudo bem, mesmo Steve Jobs não reconheceu por vezes o valor de Starweather.

quarta-feira, 12 de outubro de 2011

Mais de mercados

Segundo o post anterior podemos sumarizar os dados que encontramos:
  • 1 padaria para cada 4 mil habitantes @ R$ 21,00/habitante a cada mês
  • 1 farmácia para cada 3 mil habitantes @ R$ 12,00/habitante a cada mês
  • 1 posto de gasolina para cada 5500 habitantes @ R$ 8,00/habitante a cada mês
Fica claro que desta forma temos uma estimativa do mercado de modo bastante interessante. Note que se colocarmos a conta em termos de famílias (ou carros no caso do posto de gasolina) temos:
  • 1 padaria para cada 1428 famílias @ R$ 73,50/família a cada mês
  • 1 farmácia para cada 857 famílias @ R$ 42,00/família a cada mês
  • 1 posto de gasolina para cada 1000 carros @ R$ 44,00/carro a cada mês
Estes valores foram calculados com uma família de tamanho médio de 3.5 pessoas, e um carro para cada 5.5 habitantes. Vamos arredondar que isto tornará as contas mais simples
  • 1 padaria para cada 4 mil habitantes @ R$ 21,00/habitante a cada mês
  • 1 farmácia para cada 3 mil habitantes @ R$ 12,00/habitante a cada mês
  • 1 posto de gasolina para cada 6 mil habitantes @ R$ 8,00/habitante a cada mês
Um ponto interessante para estes dados é que com eles é possível estimar número de padarias, postos e farmácias em uma determinada região (cidade, bairro, etc...). E se mais dados de renda estiverem disponíveis é possível também estimar o peso relativo no orçamento destes itens. Por exemplo: é de se imaginar que uma cidade com 12 mil habitantes possua 3 padarias, 4 farmácias e 2 postos de gasolina.

A mesma conta pode ser feita com supermercados. Há cerca de 80 mil lojas no Brasil. Com uma população de 200 milhões temos 1 supermercado a cada 2500 habitantes.Naturalmente, os supermercados podem ou não ser concorrentes diretos das farmácias, dos postos ou das padarias. Como o faturamento dos supermercados é de cerca de R$ 200 bilhões, podemos dizer que isto resulta em mil reais por habitante por ano ou R$ 80,00 por habitante por mês. No caso de Brasília, a coisa é um pouco maior. Com um faturamento de R$ 4,2 bilhões por ano e uma população de 2.5 milhões temos um gasto de cerca de R$ 140,00 por habitante por mês (quase o dobro da média nacional).

Sumarizando: 1 supermercado a cada 2500 habitantes @ R$ 80,00/habitante a cada mês. A nossa cidade de 12 mil habitantes poderia ter 4 supermercados (quase 5).

Mas há mais analises que podem ser feitas... Uma notícia no Correio Braziliense afirma:

Os trabalhadores das padarias e confeitarias do Distrito Federal ganharam o direito de aumento de 8% no salários. A categoria vinha lutando pelo reajuste e na quinta-feira (16/6) foi assinado a Convenção Coletiva de Trabalho com o Sindicato dos Trabalhadores das Indústrias da Alimentação de Brasília (SIAB). O acordo aumenta o piso salarial para R$ 610.


Com a decisão, como informado pelo sindicato, os padeiros e confeiteiros passam a ganhar R$ 800, o salário antes era de R$ 636. Os caixas também terão reajuste, eles passam a receber R$ 629,64, enquanto recebiam R$ 538. Já os doceiros sobem de R$ 570,44 para R$ 616,07.


Segundo o sindicato, a mudança deve beneficiar 12 mil trabalhadores das 1.200 padarias filiadas ao SIAB que produzem, em média, 5 milhões de diferentes pães diariamente no DF.

Com isto temos a informação do número médio de trabalhadores nas padarias (10 trabalhadores por padaria @ R$ 800,00 por trabalhador por mês). E também temos o número de padarias do DF (1200 comparada com  640 do cálculo). Também é possível ver que o custo dos funcionários corresponde a 20% (10% do salário + 10% da previdência) do faturamento.

Eu volto a este ponto em posts futuros

terça-feira, 11 de outubro de 2011

Cicatrizes Coloniais e o Desejo de Vingança do Oprimido

Eu adoraria ter inventado o título, mas ele é retirado de um post do Blog do Alon Feuerwerker (numa daquelas ironias feuerwerker é o equivalente alemão de fogueteiro).

Mas ao post em si...

Já mencionei um pouco sobre o culto a carga aqui no blog, mas existe algo similar nas psique de países que foram colonizados: os colonizadores são transformados em culpados de todas as mazelas do país.

E às vezes esta atribuição nem só se limita ao país originalmente colonizador, às vezes outro país que assumiu o papel dominante após o ocaso do colonizador toma o podium de sanguessuga.

No caso do Brasil temos claramente como vilões causadores das nossas mazelas: Portugal, Inglaterra, França, e Estados Unidos da América.

Devido aos "crimes" desses países, reais ou imaginários, o brasileiro teima em culpa-los pelos problemas do país e sonhar com o dia em que irá "passar na cara" deles toda superioridade da nação.

A verdade é que isto não é exclusivo do Brasil, mas parece ser comum a diversas (se não forem todas) ex-colônias mundo afora.

O problema maior deste tipo de raciocínio nem é que pessoas inescrupulosas ou ignorantes podem se valer deste para se manter no poder, ou avançar agendas ou mesmo para incitar novos posicionamentos. O maior problema é que este raciocínio esconde a verdade e com isso impossibilita de se mudar alguma coisa de modo efetivo dentro da nação.

Ao culpar outros, deixa-se a descoberto os problemas reais e não se faz praticamente nada pois "é culpa dos gringos". Assim, fica-se em um conveniente círculo vicioso (conveniente para determinadas pessoas da classe política, empresarial e mesmo de servidores). Reduz-se o histórico de problemas a uma estorinha de dominador-dominado, opressor-oprimido, mau-bom, e errado-certo.

Quando não é nada disso...

Mais ou menos como jogar fora o sofá ao descobrir que seu cônjuge utilizou-o no ato de traição.

Não resolve absolutamente nada.

sexta-feira, 7 de outubro de 2011

E qual é o tamanho do mercado?

Algo que sempre me deixou intrigado é a falta de estimativas de mercado em análise que tenho encontrado. No fundo é sempre a determinação de estabelecimentos/população. Como o número de estabelecimentos é sempre menor do que a população, cabe então usar o cálculo de estabelecimentos por mil habitantes (ou por 10 mil ou 100 mil habitantes se for o caso).

Parte destas questões podem ser analisadas como problemas de Fermi. Para tanto vale alguns arredondamentos. Primeiro, vamos considerar que o Brasil tem 200 milhões de pessoas - as contas ficam mais fáceis.

O caso da Padaria.
Quantas pessoas uma padaria atende por mês? Com 100 pessoas por mês, teríamos pouco mais de 3 pessoas por dia. O número certamento é maior do que esse. Com 1000 pessoas por mês teríamos cerca de 33 pessoas por dia (o que dá cerca de 1.375 pessoas por hora). Como 10.000 pessoas por mês teríamos cerca de 333 pessoas por dia e algo como 13.75 pessoas por hora. Parece mais razoável, mas ainda assim está bem grande. Vamos supor então que é um número entre 1.000 e 10.000. Sejam por exemplo 1 padaria a cada 5.000 habitantes. Assim temos cerca de 40.000 padarias no Brasil (Há cerca de 25 padarias por cem mil habitantes (48 mil)).

Muito bem, e o mercado consumidor? A princípio basta multiplicar o faturamento anual de uma padaria pelo número de padarias. O problema é que este faturamento é muito mais difícil de determinar.

Podemos pensar do lado do consumidor: Quanto é o gasto médio na padaria? Posso pensar no meu caso, no caso de uma família... Eu chutaria que uma ida a padaria iria gastar vez algo entre 1 e 5 reais por dia em uma padaria. Vamos arredondar para R$ 2,00. Em um mês isto é R$ 60,00 e em 1 ano é cerca de R$ 720,00. Multiplicando este número pelo número de famílias (200/3) milhões dá cerca de R$ 48 bilhões anuais.

Por padaria temos R$ 120.000,00 por mês.

Na realidade, o mercado de padarias gira cerca de R$ 50 bilhões por ano (cerca de R$ 4 bi/mês), então temos cerca de R$ 83 mil por padaria e R$ 2.083.333,33 por cem mil habitantes (R$ 21,00/habitante a cada mês).

Então temos finalmente uma estimativa do mercado consumidor: nas contas anteriores R$ 60,00/habitante a cada mês. Na conta com os dados reais R$ 21,00/habitante a cada mês.

O caso da Farmácia
A conta da farmácia também segue os mesmos parâmetros do estudo da padaria. 100 pessoas é pouco e 10.000 é muito. O número aproximado seria o mesmo 1 farmácia a cada 5000 habitantes. Isto daria 40 mil farmácias. Na realidade, olhando os dados do Brasil vemos que há cerca de 33 farmácias por cem mil habitantes (60 mil no Brasil).

Já estimar o mercado consumidor é bem mais difícil. Neste caso quanto cada um gasta com isso por mês? Eu gasto muito pouco, mas dentro da minha família o gasto médio é bem alto. Eu chutaria que pelos menos R$ 42,00/mês por habitante seria gasto (mas só baseado em experiência pessoal - 3 pessoas R$ 1500,00/ano no total). Isto dá um mercado de R$ 210.000,00 por mês por farmácia. Isto dá um mercado de cerca de R$ 100 bilhões anual.

Na realidade o mercado de farmácia gira cerca de R$ 26 bilhões por ano (cerca de R$ 2.2 bi/mês), então temos R$ 37 mil por farmácia e R$ 1.210.000,00 por cem mil habitantes (R$ 12,00/habitante a cada mês).

Então temos finalmente uma estimativa do mercado consumidor: nas contas anteriores R$ 42,00/habitante a cada mês. Na conta com os dados reais R$ 12,00/habitante a cada mês.

O caso do Posto de Gasolina
Já o posto é meio problemático, pois não é simplesmente o número de habitantes. O que conta é o número de carros. Carros vem de todos os tamanhos, modelos e diferentes tanques de combustível. A chave para analisar o problema de Fermi no caso dos postos é pensar na logística dos postos.

Quanta gasolina um posto recebe por mês? Eu desconfio que deve ser algo entre 1.000 e 100.000 litros. Supondo que cada consumidor leve 100 litros por mês, então 1.000 litros são 10 consumidores e 100.000 litros são 10.000 consumidores. Eu diria que é algo menor que 5000 consumidores/mês.

Com 5000 consumidores/mês e 100 litros por consumidor a R$ 2,00 o litro temos cerca de R$ 1.000.000,00 por mês para cada posto. Como o Brasil tem perto de 1 carro para cada 5 habitantes, teríamos algo na vizinhança de 40 milhões de carros e 8 mil postos de gasolina (e R$ 8 bilhões de mercado). Na realidade, este número é de 18 postos por cem mil habitantes (35 mil). O mercado de postos de gasolina gira cerca de R$ 19 bilhões por ano (vide aqui também) (cerca de R$ 1.6 bi/mês), então temos R$ 45 mil por posto e R$ 810.000,00 por mil habitantes (R$ 8,10/habitante a cada mês).

De todos os problemas resolvidos, o do posto de gasolina é que dá a maior discrepância...

A lição é que podemos fazer estimativas de mercado consumidor utilizando técnicas de problemas de Fermi.

quarta-feira, 5 de outubro de 2011

Como todos sabem...

Frase padrão para convencimento de idéias. Não, nem todos sabem... Não não é de amplo conhecimento... Não, não é sequer óbvio...

Em um discurso padrão existem "receitas de bolo" para forçar teses ou idéias nos ouvintes. Por vezes estas formas sequer tem o objetivo de contrapor o adversário, mas apenas convencer a platéia. A maioria destas está adequadamente exposta em uma obra de Shopenhauer.

Elas estão presentes nos mais variados debates (podemos citar sobre o aborto, sobre drogas, sobre violência). Mas o texto original de Shopenhauer praticamente descreve vários exemplos: vide o texto em alemão e inglês aqui.

Mas há toda uma categoria de falsas verdades que costuma aparecer em textos dos mais diversos. São estas as baseadas em achismos estatísticos. Neste temos o problema de dados insuficiente, da confusão de correlação com causalidade e extensão de resultados a um público mais amplo.

Eu entendo parte da lógica. No fundo os dados são distorcidos para tentar "dar voz" ao lado oprimido. Eu entendo que o motivo é nobre, mas o problema é que vira um samba de doido...

Vamos aos exemplos:

Caso da violência contra a mulher.

1) No Brasil, uma entre quatro mulheres é vítima de violência doméstica. Mesmo assim, apenas 2% das queixas desse tipo de violência resultam em punição.
2) A Lei Maria da Penha (nº 11.340/2006) acaba de completar três anos de existência. De acordo com a Fundação Perseu Abramo, mais de dois milhões de mulheres sofrem violência a cada ano e apenas 28% denunciam o agressor. Dados da Secretaria Especial de Políticas para Mulheres (SPM), órgão vinculado ao Governo Federal, apontam que no primeiro semestre deste ano foram realizados cerca de 162 mil atendimentos pelo Ligue 180 – serviço que atende relatos de agressões ou ameaças contra mulheres.
3)  No Brasil, a cada 15 segundo uma mulher é vítima de violência e existe uma taxa de 3,9 mulheres assassinadas por cada 100 mil habitantes

Note que estas afirmações estão em contradição. O número de mulheres é perto de 50% da população. 1 em cada 4 mulheres significa algo na vizinhança de 12.5% do total. Isto dá perto de 25 milhões de mulheres (como relacionar este número com os 2 milhões mencionados no item 2?). Dois milhões de mulheres a cada ano, com apenas 28% denunciando o agressor significam 560 mil denúncias por ano. Ao relatar que cerca de 162 mil atendimentos foram realizados temos uma discrepância significativa entre este valor e o esperado (280 mil). E claro uma violência a cada 15 segundos corresponde a 2.1 milhões de atos de violência contra mulher. A taxa de 3.9 mulheres assassinadas a cada 100 mil habitantes corresponde a cerca de 7800 homicídios por ano, já a taxa para os homens é de 47.7 por 100 mil habitantes (cerca de 95 mil homicídios por ano).

Todas estas dúvidas podem ser explicadas ao se conhecer a fonte original da pesquisa. Estes dados são de uma pesquisa realizada com 2502 entrevistas (o número é suficiente estatisticamente para 2% de margem de erro a 95%, mas há um porém explicado na mesma pesquisa). Então fica claro de onde veio o "uma mulher é vítima de violência a cada 15 segundos":


A projeção da taxa de espancamento (11%) para o universo investigado (61,5 milhões) indica que pelo menos 6,8 milhões, dentre as brasileiras vivas, já foram espancadas ao menos uma vez. Considerando-se que entre as que admitiram terem sido espancadas, 31% declararam que a última vez em que isso ocorreu foi no período  dos 12 meses anteriores, projeta-se cerca de, no mínimo, 2,1 milhões de mulheres espancadas por ano no país (ou em 2001, pois não se sabe se estariam aumentando ou diminuindo), 175 mil/mês, 5,8 mil/dia, 243/hora ou 4/minuto - uma a cada 15 segundos.


Qual é a conclusão que é importante nesta pesquisa? Que as agressões são primariamente domésticas, que o agressor é conhecido, que apesar do grande número de agressões são poucas as que se transformam em tragédia. E a mais importante de todas: este tipo de pesquisa NECESSITA ser realizada periodicamente e com populações maiores. Tudo que se fala nestas 3 afirmações se refere a uma pesquisa realizada há cerca de 10 anos.

O caso do aborto é similar.

A pesquisa da fundação Perseu Abramo fez o estudo com 2365 entrevistas, tendo encontrado o número que 1 em cada 4 mulheres abortou (mas dessas quase 90% foi espontâneo e 10% induzido). Já a pesquisa da UnB afirma que até os 40 anos, 1 em cada 4 mulheres realizou o aborto. Lendo o texto da pesquisa o que se pode dizer mesmo é das 2002 entrevistadas, 296 realizaram aborto. Este é o fato, o que dá cerca de 14.3% do total ou cerca de 1/7 (1 de cada 7 mulheres ao invés de 1 em cada 4). O que pode realmente ser dito a respeito destes dados?  Como temos cerca de 17.8 nascimentos por mil habitantes teremos 3.1 abortos por mil habitantes (que dá um total de 630 mil abortos/ano). Vale a pena dizer que estas pesquisas também permitem uma magnitude das mortes de mulheres provocadas pelo aborto (250 por ano).

Qual é a conclusão importante destas pesquisas? Que 15% das mulheres gravidas aborta anualmente (ou que 85% NÃO ABORTA). Que destes 630 mil operações, cerca de 250 terminam em óbito da mulher. É verdade que o aborto é uma questão de saúde pública relevante - 630 mil é um número grande, mas o argumento é exagerado propositalmente para reforçar um ponto de vista.

Ou seja, as pessoas na realidade não se importam com os números - exceto aqueles que favorecem a argumentação desejada.

terça-feira, 4 de outubro de 2011

Decisões e Probabilidades

Por vezes vejo as mais diversas decisões baseadas em achismos. A verdade é que existem instrumentos mais rigorosos e menos sujeitos a polarizações pessoais a disposição.

Um destes instrumentos é o uso do teorema de Bayes (que já mencionei diversas vezes neste blog). A idéia é encontrar a probabilidade condicional na aplicação de uma determinada ação/política/etc. Em termos simples pode ser descrita em probabilidades como p(evento | ação). Com um pouco de matemática simples chega-se também na probabilidade de p(evento | não ação), e mesmo na p(evento) sozinho por si só.

Existem vários exemplos que podem ser utilizados e servem para definir possíveis ações e mesmo caminhos a serem evitados na definição de escolhas.

Exemplos? p(reincidência | aplicação de pena forte) e p(reincidência | aplicação de pena fraca). Sabendo qual dos dois é mais efetivo pode ajudar a definir políticas de punição efetiva. Outros exemplos p(abuso | anonimidade) e p(abuso | não anonimidade).

No caso da aplicação de penas fortes ou fracas e reincidência verifica-se que p(reincidência | aplicação de pena forte) = 0.5 e p(reincidência | aplicação de pena fraca) = 0.2. Caso fosse 0.5 para cada um, então tanto faria aplicar penas fortes quando fracas. Mas o resultado indica que vale mais a pena aplicar penas fracas para evitar reincidência.

No entanto, um dos problemas maiores que praticamente impedem o uso de uma ferramenta mais racional como esta é a falta de dados confiáveis. Estes dados são de tal maneira imprecisos, manipulados, ou mesmo obtidos sem nenhuma metodologia que fica difícil de crer nos mesmos. E aí tem-se que recorrer a dados externos que podem ou não ser representativos do comportamento local.

O fato é que para se tomar decisões racionais utilizando ferramentas como o teorema de Bayes é fundamental a existência e o acesso a dados confiáveis. A escolha de políticas de ação baseadas em probabilidades do tipo p(evento | política de ação) é muito confiável do que o simples achismo (e ainda pode se estimar o impacto das mesmas).