Um dos grandes avanços na engenharia foi a inclusão da incerteza nos cálculos e projetos de sistemas. E aqui vou mostrar para vocês uma forma de minimizar o erro quando temos duas fontes de medição com erros intrínsecos diferentes.
A princípio vamos considerar duas medições que podem ou
não ser correlacionadas, mas depois vamos ver somente o caso sem correlação. O
erro em questão é dado pela variância da medida, ou pelo desvio padrão da
medida. Um exemplo é que podemos ter duas medições de distância: uma usando uma
trena e outra usando um laser.
Então temos:
Medida 1: vamos chamar de x com valor esperado com desvio
Medida 2: vamos chamar de y com valor esperado com desvio
Estamos medindo a mesma grandeza, e
devido à natureza da medida os dois valores não são iguais. Então podemos fazer
uma estimativa do valor baseado em uma combinação linear das duas medidas:
A equação tem essa forma porque é uma
média ponderada das duas medidas.
O que queremos é minimizar o erro de
medição, o que pode ser traduzido como escolher
de modo a minimizar a variância de z. Felizmente
tudo isso pode ser encontrado matematicamente: minimizar uma variável significa
igualar sua derivada a zero.
Então vamos partir do valor esperado da
média ponderada:
E o segundo momento da média ponderada:
A expressão do segundo momento pode ser
simplificada para:
Para chegarmos na expressão em função da
variância usamos as identidades:
Fazendo a substituição temos:
Mas note que:
Assim podemos simplificar a expressão
anterior para:
Portanto temos o conjunto com duas
equações com :
Para encontramos o valor de que minimiza o desvio padrão fazemos:
A solução é:
Assim a estimativa de variância mínima é:
No caso sem correlação (correlação nula)
temos:
Um ponto importante: esta combinação é
independente do tipo de distribuição de probabilidade das variáveis. E com
isso vamos a um exemplo:
Pergunta: Considere duas medições de uma
distância: 0.95 e 0.98, sendo a primeira com um desvio padrão de 0.2 e a
segunda com um desvio de 0.3. As duas medidas são descorrelacionadas. Qual é a
melhor estimativa para distância?
Resposta: Usando os valores temos 0.96
(0.9592) com desvio de 0.17 (0.1664). O peso calculado nesse exemplo foi 0.69 e
0.31. Vamos ver como a média e o desvio se comportam nesse exemplo simples variando
o valor de w (de 0 a 1):
|
|
|
|
Média |
Desvio |
Podemos ver que o ponto que temos o
desvio padrão mínimo é justamente o ponto calculado pela equação.
Muito bem e daí?
Bom, vamos supor que você esteja investindo.
Você tem dois investimentos: um com menos risco e outro com mais risco. O investimento
de menos risco te retorna menos dinheiro (média menor), mas é mais seguro (desvio
menor); enquanto o de mais risco te retorna mais dinheiro (média maior), mas é
menos seguro (desvio maior). Como você deve alocar os recursos de modo a
minimizar o risco? E qual será o retorno esperado?
Creio que agora fica claro o potencial
dessa equação. Vamos colocar números:
Investimento 1: Retorno anual 12% (1.12) e
desvio de 1% (0.01)
Investimento 2: Retorno anual 16% (1.16) e
desvio de 5% (0.05)
Colocando nas equações temos os pesos de
0.96 (0.9615) e 0.04 (0.0385), que resulta em um valor esperado de 12.15%. Pode
não parecer muito, mas o desvio (0.981%) é menor do que o do investimento 1 (1%) sozinho.
Isto quer dizer que esta mistura é mais
segura! Parece mágica, mas não é!