top of page

Modelos Autorregressivos – Parte I (Definições 😞 e um Exemplo Prático😊!)

  • Foto do escritor: dadoaentender
    dadoaentender
  • 28 de out.
  • 5 min de leitura

Atualizado: 1 de nov.


Definições: 

Modelos autorregressivos utilizam os valores anteriores de uma determinada variável para prever seus valores futuros. Em outras palavras, a "matéria-prima" de um modelo autorregressivo é uma série temporal (assunto abordado na edição 1 do “Dado a Entender”). Nesse tipo de modelo, a variável de interesse é explicada com base em seus próprios valores passados (daí o prefixo “auto” do termo autorregressivo). Assim, o objetivo é estimar os valores futuros dessa variável com base em padrões de dependência temporal presentes nos dados.


Antes de continuarmos, vale explicar o conceito de regressão (afinal estamos falando de modelos auto-regressivos). Regressão é um método estatístico usado para modelar numericamente a relação entre uma variável dependente (o que queremos prever) e uma ou mais variáveis independentes (os fatores que acreditamos influenciar essa variável). Nos modelos autorregressivos, a diferença está no fato de que os valores anteriores da própria variável são utilizados como "fatores explicativos". Por exemplo, ao tentar prever o consumo de gasolina ou etanol combustível com base nos valores de consumo dos meses anteriores, estamos usando um modelo autorregressivo.


Os modelos autorregressivos devem avaliar os componentes de uma série temporal. Falamos sobre tais componentes na edição anterior (já assinou o “Dado a Entender”? Eu acho que você deveria... 😉). Um dos modelos mais simples que atende a esse requisito é o ETS (Exponential Triple Smoothing), também conhecido como modelo de Holt-Winters.


O ETS é um modelo estatístico / matemático que combina três componentes principais:


  1. Erro (E): Mede a discrepância entre os valores reais e os previstos. Pode ser aditivo (simples) ou multiplicativo (proporcional).

  2. Tendência (T): Captura a direção (crescimento ou declínio) dos dados ao longo do tempo. Também pode ser aditiva ou multiplicativa.

  3. Sazonalidade (S): Reflete padrões recorrentes nos dados em intervalos regulares (ex.: mensais, trimestrais). Pode ser aditiva, multiplicativa ou inexistente.


O ETS ajusta esses componentes para minimizar a soma dos erros quadráticos (MSE) da predição, por meio de algoritmos de otimização, como o método de gradiente descendente. 😨?😨?😨? 


Ok... Vamos com calma! Em edições futuras falaremos melhor sobre MSE e gradiente descendente. Por enquanto, aceite que o MSE é uma métrica de avaliação de desempenho do modelo e que o gradiente descendente é um método para ajustar o modelo, reduzindo o MSE. Essa otimização utiliza a maior parte contígua da série temporal (dados de treinamento) a partir do seu início cronológico. Para avaliar se o modelo treinado lida bem com dados “inéditos”, é importante reservar uma parte do final da série temporal (não utilizada no treinamento) e verificar se as previsões do modelo se aproximam satisfatoriamente dos dados reais. Essa etapa é chamada de “teste do modelo”.


O ETS está disponível para uso em linguagens de programação como o Phyton e R. Além disso o ETS também está disponível no Excel, tornando-o amplamente acessível, mesmo para quem não tem prática em programação.


Exemplo Prático: 

Escolhi apresentar um exemplo baseado no ETS do Excel para atender a um público mais amplo. Entretanto, recomendo fortemente a utilização das linguagens de programação citadas anteriormente caso o leitor tenha interesse em modelagens preditivas de séries temporais menos “comportadas”, utilizando algoritmos mais sofisticados que o ETS.


Para o exemplo a seguir, utilizei a série temporal de vendas de gasolina, disponibilizada pela ANP (Agência Nacional do Petróleo, Gás Natural e Biocombustíveis). Essa série temporal iniciou em janeiro de 2012 e terminava em outubro de 2024 quando publiquei esse artigo. Ela apresenta o volume mensal (em m³) de gasolina vendido por estado brasileiro. No exemplo, utilizei apenas os dados de venda de gasolina no estado de São Paulo.


A Figura 1 ilustra a utilização do ETS no Excel. As colunas “A” e “B” da planilha contêm, respectivamente, o mês/ano de cada dado e o volume de gasolina vendido no período correspondente (dados extraídos da série temporal da ANP). Para seguir com a parametrização, basta clicar em qualquer célula não vazia das colunas “A” ou “B” e, em seguida, escolher Dados -> Planilha de Previsão. O Excel tenta identificar automaticamente a sazonalidade, mas também é possível definir tal informação manualmente.


No exemplo, defini o início da previsão como novembro de 2022 e o término como novembro de 2024. Assim, o modelo foi treinado com dados de janeiro de 2012 até outubro de 2022 e testado com dados de novembro de 2022 até outubro de 2024. Durante a etapa de parametrização o Excel apresenta um gráfico com uma prévia da predição (linha laranja em negrito com a predição e linhas laranja simples indicando o intervalo de confiança).


Figura 1: Utilizando o Modelo ETS no Excel
Figura 1: Utilizando o Modelo ETS no Excel

Após clicar no botão "Criar" o Excel monta uma tabela de dados com os dados da série temporal e as predições realizadas, incluindo os intervalos de confiança (que vão se tornando mais amplos, indicando a possibilidade de erros maiores para predições mais distantes no futuro). Além disso é gerado um gráfico com tais informações, apresentado na Figura 2.


Figura 2: Série Temporal + Predição com Intervalo de Confiança
Figura 2: Série Temporal + Predição com Intervalo de Confiança

A Figura 3 apresenta a análise do desempenho do modelo ao ser submetido a dados inéditos (dados de teste). A tabela exibe:

  • Venda de Gasolina (m³): valores reais do trecho de teste;

  • Previsão (Venda de Gasolina (m³)): valores previstos pelo modelo;

  • Erro Percentual Absoluto: diferença percentual entre os valores reais e previstos.


Figura 3: Avaliação dos Resultados
Figura 3: Avaliação dos Resultados

A média do erro percentual absoluto foi de 6,98%, indicando um desempenho bastante razoável para um modelo simples como o ETS. Apesar disso, algumas observações são importantes:

  • O erro foi maior em determinados meses, como maio de 2023 (12,35%) e abril de 2024 (11,98%). Isso pode refletir oscilações reais ou limitações do modelo em capturar padrões mais complexos.

  • A natureza bem-comportada da série (sem grandes oscilações ou rupturas) favoreceu o desempenho do ETS.


Conclusão: 

Nesse artigo abordei os conceitos e utilização de modelos autorregressivos na predição de séries temporais. Apresentei ainda um exemplo de aplicação do modelo autorregressivo ETS para predições em uma série temporal real.

Embora o ETS tenha se mostrado adequado no exemplo, é importante lembrar que modelos mais sofisticados podem ser necessários para séries temporais mais complexas ou instáveis. Mas isso já é assunto para outras publicações 😉!


Referências: 


  • Dritsaki, C., Niklis, D., and Stamatiou, P. Oil consumption forecasting using arima models: an empirical study for greece. International Journal of Energy Economics and Policy, 11(4):214–224, 2021.

  • Hyndman, R. J. and Athanasopoulos, G. Forecasting: Principles and practice. OTexts, 2018.

  • Barros, A. C., Ferreira, Pedro Guilherme Costa ans Mattos, D. M. d., Oliveira, I. C. d., and Duca, V. E. l. d. A. Análise de Séries Temporais em R: Curso Introdutório. FGV IBRE, 2018.

  • ANP. Vendas de derivados de petróleo e biocombustíveis. Technical report, https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/vendas-de-derivados-de-petroleo-e-biocombustiveis, 2024.


Comentários

Avaliado com 0 de 5 estrelas.
Ainda sem avaliações

Adicione uma avaliação

Conectando Conhecimento e Prática

© 2035 by "Dado" a Entender. Powered and secured by Wix 

bottom of page