sexta-feira, 7 de novembro de 2025

Sobre o retorno no investimento - relações entre média e variância

Um ponto um pouco menos implícito na última análise é que na realidade o retorno depende da variância. Idealmente temos um nível de referência de retorno ( – que é a taxa de menor risco – geralmente o valor de títulos da dívida pública do tesouro). Para que outro investimento seja atrativo é necessário que seu retorno seja maior que o nível de referência de retorno (), mas ao mesmo tempo este investimento não pode ter variância menor que do nível de referência (do contrário este seria o novo nível de referência).

Assim, associado a este retorno temos de ter uma variância maior e com isso o retorno e variância estão ligados entre si. Podemos pensar em um investimento como uma equação do tipo:

Onde  é o valor do investimento no tempo k-1 e   é a taxa de crescimento do investimento.  Esta equação é diretamente relacionada com o modelo de passeio aleatório (Random Walk) usado em diversas áreas da ciência, e no caso de ações temos o modelo:

Onde  equivale a uma média de retorno e  é uma variável aleatória de média zero e variância determinada. Podemos relacionar as duas expressões fazendo:

Ainda há muita discussão sobre a aderência desse modelo ao mercado real de ações, e sobre qual distribuição de variável aleatória é mais adequada. O fato é que além das questões do modelo, ainda há o fator que provavelmente a média e variância da variável aleatória não são constantes no tempo (o que complica significativamente o problema). Mas ainda assim o modelo tem suas vantagens:

Nele a taxa de crescimento  é uma variável aleatória com uma média e variância que podem ser independentes ou não do tempo. Mas, mesmo com essa incerteza podemos escrever esta mesma expressão em termos do investimento inicial x0:

Isso mesmo sem sabermos a respeito da invariância da variável aleatória. Podemos reescrever o problema usando:

Chamando:

Temos:

Aqui podemos aplicar alguns teoremas da estatística para tentarmos obter mais profundidade na solução mesmo com alguns problemas (correlação entre variáveis e distribuições diferentes). Mas em uma primeira aproximação podemos aproximar a soma das variáveis aleatórias por uma distribuição gaussiana:

Essa característica é relevante: uma forma de ver isso é rearranjando a equação novamente:

Então em uma primeira aproximação, os retornos são distribuídos segundo uma log-normal. Algumas das características da log-normal são:

Já a variância é dada por:

Onde  e  são a média e o desvio padrão da distribuição normal . Esse resultado pode ser visto como uma primeira aproximação (sem correlações e mudanças pequenas na variância das distribuições que formam a série temporal).

A priori para utilizar essas informações em um caso prático temos de considerar intervalos sem grandes mudanças (tempos calmos – ou seja, média e variância constante). Em princípio, já que temos:

Podemos usar:

Com estas estimativas podemos encontrar os dados para montar carteiras de investimento. Num exemplo da ação da Microsoft (de Abril a Outubro de 2025) temos:

Mas esta não é a única forma. Podemos também usar:

Considerando um ponto de partida:

Daqui podemos estimar a média e variância da variável aleatória:

Com estas estimativas podemos finalmente encontrar os dados para montar carteiras de investimento usando os dados do exemplo anterior:

Esta segunda forma é bem utilizada em diversos modelos de aplicação. Mas fica claro que a despeito das diferenças na formulação, os resultados de média e desvio padrão são muito próximos.

Mas como decidir qual das formas utilizar? Com relação aos valores calculados, as duas são equivalentes. Isso pode ser visto olhando os dados da variação diária considerando as barras de três desvios padrões.

Variação do preço da ação segundo modelo exponencial

Variação do preço da ação segundo modelo simplificado

Ambos se comportam essencialmente da mesma forma, mas há um ponto que foge dos três desvios padrões, chegando a quase cinco desvios padrões. Isso é uma indicação que a suposição de que a taxa é invariante no tempo não é estritamente verdade, mas para maior parte dos dados a suposição é razoável (o que pode ou não ser aceitável dependendo da natureza do uso do modelo). Dada a similaridade até nos valores da média e desvio padrão, podemos usar o modelo simplificado para fazer previsões de curto prazo:

Simulação: dados reais são a linha mais grossa

A razão da similaridade é explicada considerando que a taxa é pequena, assim:

Note que se o intervalo fosse escolhido de forma a excluir os primeiros dados teríamos um resultado substancialmente melhor de aderência do modelo. Isso indica claramente que a média e a variância não são realmente constantes na análise. Mesmo assim, a análise usando o retorno logarítmico permite ver a densidade de probabilidade (mesmo sabendo que está é uma aproximação). No entanto temos que lembrar que esta curva é obtida após a k-ésima operação, o que significa que:

Isto pode ser verificado usando a equação de valor esperado da mediana:

Densidade de Probabilidade de retorno

O que tiramos desta análise? A principal informação é que o retorno no caso de variáveis aleatórias não depende apenas da média das variações, mas também da variância. Este tipo de análise também pode ser usado para obter os intervalos de confiança, o que permitiria determinar retornos mínimos e máximos dentro de uma dada probabilidade. Mas nesse ponto temos que lembrar das aproximações realizadas aqui:

1)      Média e variância constantes no tempo (tempos calmos)

2)      Independência (fraca) entre amostras

3)      Número adequado de amostras para estimar média e variância

Mesmo com isso, ainda é possível usar o modelo para fazer estimativas razoáveis. Por exemplo, intervalos do valor da ação

- 90% - US$ 418,92 e US$ 646,80

- 95% - US$ 401,85 e US$ 674,29

- 99% - US$ 370,47 e US$ 731,41

É interessante observar que esse modelo permite fazer estimativas futuras com intervalos de confiança. Mas isso vamos ver em mais detalhes em um post futuro.