Lucas Leme - Blog – Lucas Leme

Utilizando a variância explicada da análise de componentes principais para estimar o aumento do risco sistêmico de ativos.

Introdução

No mundo das finanças, é importante avaliar como diferentes ativos se relacionam entre si, a fim de entender melhor os riscos e oportunidades de investimento. Existem várias ferramentas estatísticas disponíveis para isso, incluindo a análise de componentes principais, que pode ser usada para estimar os principais fatores de risco do mercado. Neste texto, vamos explorar como identificar quebra de correlações na Bolsa de Valores utilizando a análise de componentes principais (PCA).

A correlação é uma medida estatística que indica a relação entre dois conjuntos de dados. Em finanças, a correlação é frequentemente usada para avaliar a relação entre diferentes ativos, como ações, títulos, moedas e commodities. Por exemplo, se duas ações têm uma correlação positiva elevada, isso significa que elas tendem a se mover na mesma direção — se uma ação sobe, a outra também tende a subir.

A quebra de correlação ocorre quando a relação entre dois ativos muda significativamente. Isso pode ser um sinal de que algo está mudando no mercado, e pode ser uma oportunidade ou um fator de atenção para os investidores. Por exemplo, se duas ações que normalmente têm uma correlação positiva elevada de repente começam a se mover em direções opostas, isso pode ser um sinal de que o mercado está mudando e que os investidores precisam reavaliar suas estratégias.

Como identificar a quebra de correlação?

Uma técnica útil para identificar essa quebra de correlação é o PCA. Que é uma técnica matemática que ajuda a simplificar e analisar grandes conjuntos de dados (redução de dimensionalidade). Ele encontra combinações de variáveis que não se correlacionam entre si, e é possível medir o quanto cada combinação de variáveis explica da variância dos dados originais.

O primeiro componente principal é a combinação de variáveis que explica a maior parte da variância dos dados originais. Portanto, se a variância explicada do primeiro componente principal aumentar, isso significa que a correlação entre as variáveis originais aumentou. Ou seja, grande parte da variação dos dados pode ser explicada por uma única variável, portanto as variáveis estão apresentando um comportamento semelhante. Isso pode ser muito útil para detectar mudanças na relação entre ativos financeiros, especialmente em momentos de crise ou mudanças bruscas no mercado.

Tal técnica pode ser utilizada para estimar o aumento do risco sistêmico dos ativos. O risco sistêmico é o risco associado a eventos que afetam todo o sistema financeiro, ou seja, é um evento que explica o movimento de todos os ativos. Portanto, quando há um aumento significativo na variância explicada do primeiro componente do PCA, isso pode indicar um aumento no risco sistêmico.

Análise de quebra de correlação na Bolsa de Valores

A seguir, analisaremos as quebras de correlação na Bolsa de Valores Brasileira. Para isso, utilizaremos os dados de fechamento dos ativos da B3, que estão disponíveis no Yahoo Finance. Os dados foram coletados de 01/01/2010 a 11/05/2023.

A ideia desse estudo é analisar o comportamento da variância explicada pelo primeiro componente principal ao longo do tempo. Para isso, calcularemos a variância explicada da matriz de correlação dos retornos dos últimos 252 dias (um ano) e vamos visualizar a variância explicada ao longo do tempo.

Analisando o gráfico, destaca-se os 3 períodos em que a variância explicada do primeiro componente principal apresentou os maiores aumentos. Esses períodos são:

Agosto de 2011: Redução da nota de crédito do EUA pela Standard & Poor’s;
Maio de 2017: Joesley Day;
Março de 2020: Pandemia do COVID-19.

Agosto de 2011: Redução da nota de crédito do EUA pela Standard & Poor’s

A redução da nota de crédito do EUA pela Standard & Poor’s ocorreu em 5 de agosto de 2011. A agência de classificação de risco reduziu a nota de crédito do país de AAA para AA+, significando um maior risco. Visto que o EUA é a maior economia do mundo, essa redução de nota de crédito teve um impacto em cascata em todo o mundo, o que levou a uma queda nos mercados de acionários. Impactando também o mercado brasileiro, que teve uma queda de mais de 8% no Ibovespa.

Visto que a redução da nota de crédito do EUA pela Standard & Poor’s foi um evento de risco sistêmico, todos os ativos foram afetados, o que significa que a correlação entre os ativos aumentou — todos foram precificados negativamente ao mesmo tempo.

Maio de 2017: Joesley Day

O Joesley Day ocorreu em 17 de maio de 2017. O evento foi marcado pela divulgação de áudios de compra de silêncio de políticos envolvendo o Presidente Michel Temer e o executivo Joesley Batista da JBS. Dado que o presidente da república estava relacionado com um possível caso de corrupção, sugiram diversas incertezas no mercado, o que levou a uma queda relevante no Ibovespa, aumentando novamente o risco sistêmico.

Março de 2020: Pandemia do COVID-19

A pandemia do COVID-19 começou em dezembro de 2019, mas foi em março de 2020 que o vírus se espalhou pelo mundo, o que levou a uma crise sanitária e econômica. O mercado de ações foi fortemente afetado, com quedas de mais de 30% no Ibovespa. E dentre os fatos relevantes aqui apresentados, o risco sistêmico da pandemia do COVID-19 foi o mais relevante, visto que todos os ativos foram afetados, o que significa que a correlação entre os ativos aumentou e a maioria dos ativos apresentou o mesmo comportamento.

Conclusão

A análise de quebra de correlação é uma ferramenta importante para identificar eventos de risco sistêmico, e é possível identificar a quebra de correlação por meio da variação da variância explicada do primeiro componente principal. Se a variância explicada do primeiro componente principal aumentar, isso significa que boa parte dos retornos dos ativos está sendo explicada por um único fator de risco, o que significa que a correlação entre os ativos aumentou.

A seguir, no apêndice há uma explicação sobre o cálculo da variância explicada do PCA. E logo após, há uma seção de referências com as notícias sobre os eventos apontados no gráfico, e uma explicação gráfica sobre autovalores e autovetores.

Apêndice

Explicação do cálculo da variância explicada.

Para calcular a variância explicada pelo primeiro componente principal do PCA, é necessário obter os autovalores associados a matriz de correlações das variáveis, no caso apresentado no texto: os retornos dos ativos.

import numpy as np

# Matriz de correlação
matriz = np.array([[1, 0.9],
                   [0.9, 1]])

# Calcula autovalores e autovetores
autovalores, autovetores = np.linalg.eigh(matriz)
# Ordena os autovalores e autovetores
autovalores, autovetores  = autovalores[::-1], autovetores[:, ::-1]

# Calcula a variância explicada
varianca_explicada = autovalores[0] / autovalores.sum()

Para calcular a variância explicada pelo primeiro componente principal, basta obter o primeiro autovalor e dividir pela soma de todos os autovalores. Isso indica a proporção da variação dos dados explicada pelo primeiro componente principal.

No código fornecido, os autovalores são ordenados do maior para o menor. Para calcular a variância explicada pelo primeiro componente principal, basta dividir o primeiro autovalor pela soma de todos os autovalores.

Isso retornará um valor entre 0 e 1, indicando a proporção da variação dos dados explicada pelo primeiro componente principal.

No caso de dois ativos com uma correlação de 0,9 a variância explicada é de 95%, quando reduzimos a correlação para 0,2 o valor é de 60%. Portanto, quanto maior a correlação maior a variância explicada, visto que com apenas um principal componente é possível explicar boa parte do comportamento dos dados