top of page

Modelos Autorregressivos – Parte II (Apresentando os modelos ARIMA e SARIMA)

  • Foto do escritor: dadoaentender
    dadoaentender
  • 1 de nov.
  • 4 min de leitura
ree

Introdução

Até agora apresentei o modelo autorregressivo ETS como uma alternativa simples para a realização de previsões baseadas em séries temporais. Se a série temporal exibe padrões regulares de tendência ou sazonalidade, o ETS pode ser uma escolha adequada, pois modela esses componentes de forma explícita (para rever os componentes de uma série temporal, clique aqui).


Para séries temporais que não apresentam padrões tão regulares de tendência e sazonalidade, os modelos ARIMA (AutoRegressive Integrated Moving Average) e SARIMA (Seasonal AutoRegressive Integrated Moving Average) podem ser alternativas mais adequadas. Mas afinal, quais as diferenças entre os modelos ETS, ARIMA e SARIMA?


Diferenças entre modelos ETS e ARIMA

Modelos ETS (Erro, Tendência e Sazonalidade) são baseados em decomposição de séries temporais e modelam explicitamente componentes de tendência e sazonalidade de forma aditiva ou multiplicativa. Eles são ideais para séries com padrões claros e predefinidos. Já os modelos ARIMA se concentram na modelagem de dependências temporais ao transformar a série em estacionária e explorar padrões autorregressivos e de médias móveis, sem pressupor uma estrutura sazonal fixa.


Nota: Uma série estacionária é aquela cujas propriedades estatísticas (média, variância, autocorrelação) permanecem constantes ao longo do tempo. Isso significa que ela não apresenta tendências ou sazonalidades marcantes e que as flutuações ao redor da média são consistentes e previsíveis. Em termos práticos, uma série estacionária facilita a modelagem e previsão em análises de séries temporais, pois assume-se que os padrões observados no passado continuarão válidos no futuro. Caso a série não seja estacionária, transformações podem ser aplicadas para torná-la estacionária.

Os modelos ARIMA funcionam realizando as etapas a seguir:


  1. Transformação da Série em Estacionária: Os modelos ARIMA assumem que a série temporal é estacionária, no entanto, muitas séries temporais do mundo real não são naturalmente estacionárias. Para lidar com isso, o componente "Integrated" (a letra I do ARIMA) se refere ao uso da diferenciação da série (subtração consecutiva de cada valor pelo seu respectivo valor anterior). Esse processo de diferenciação pode ser aplicado uma ou mais vezes para remover tendências e tornar os dados estacionários antes de modelá-los;

  2. Exploração de Padrões Autorregressivos: A parte AR (AutoRegressive) do modelo representa a relação entre os valores passados da série e o valor atual. Isso significa que o modelo tenta prever um valor futuro com base em combinações lineares de valores passados. Essa relação é capturada por meio da autocorrelação, ou seja, da influência que os valores anteriores exercem sobre os valores futuros;

  3. Uso de Médias Móveis: A parte MA (Moving Average) do modelo representa a relação entre os erros passados da previsão e o valor atual. Em outras palavras, ele modela os padrões dos erros cometidos ao prever valores anteriores para ajustar melhor as previsões futuras. O modelo utiliza uma combinação linear desses erros para reduzir a variabilidade da série.


Normalmente representamos de forma simplificada um modelo ARIMA já treinado como ARIMA(p,d,q), onde pd e q indicam respectivamente quantos períodos anteriores foram considerados no componente AR; Quantas diferenciações foram realizadas pelo componente I e quantos erros passados foram considerados pelo componente MA. A determinação dos parâmetros pd e q do modelo ARIMA(p,d,q) pode ocorrer de forma manual, entretanto, existem métodos para automatizar tais ajustes, sendo o auto-arima() do pacote forecast (linguagem R) o mais conhecido.


Diferente dos modelos ETS, os modelos ARIMA padrão não incluem explicitamente um componente sazonal. Eles são mais flexíveis ao se ajustarem a padrões de curto prazo e podem capturar sazonalidades implícitas ao aumentar a ordem do modelo, mas não possuem termos sazonais específicos que tratem ciclos regulares. Se a série possui um padrão sazonal evidente, um modelo SARIMA (ARIMA Sazonal) pode ser mais adequado, pois adiciona termos que capturam sazonalidades recorrentes de forma explícita. O que nos leva ao próximo item...


Diferenças entre ARIMA e SARIMA

Enquanto os modelos ARIMA lidam com séries temporais estacionárias (ou transformadas em estacionárias), os modelos SARIMA estendem a abordagem incorporando componentes sazonais explícitos. Eles introduzem parâmetros adicionais para capturar padrões repetitivos em intervalos regulares, como sazonalidade mensal ou anual, tornando-se mais adequados para séries com flutuações periódicas bem definidas.


Modelos SARIMA são representados como SARIMA(p,d,q)(P,D,Q)m, onde os termos (P,D,Q) representam os equivalentes sazonais de (p,d,q), e m indica a periodicidade da sazonalidade (por exemplo, m = 12 para dados mensais com sazonalidade anual). Assim como o ARIMA, o SARIMA pode ser ajustado manualmente ou de forma automatizada, utilizando métodos como o auto.arima()que pode identificar tanto os componentes não sazonais quanto os sazonais do modelo. Essa abordagem permite capturar padrões sazonais de maneira mais eficiente, tornando o SARIMA uma opção poderosa para séries temporais que exibem ciclos repetitivos bem definidos.


Exemplo prático

Gostaria de ver um exemplo prático, comentado e com dados reais de aplicação de modelos ARIMA e SARIMA? Acesse este notebook exemplo, desenvolvido no Google Colab (clique aqui para ver artigo anterior em que apresentei o Google Colab). 

Note que, no exemplo apresentado (predição de vendas de gasolina no estado de São Paulo), o modelo SARIMA apresentou um desempenho consideravelmente superior ao modelo ARIMA (SMAPE de 3,81% e 10.58% respectivamente). Isso indica que, para essa série temporal, existe vantagem em considerar a presença de um componente sazonal explícito.


Nota: A métrica SMAPE (Symmetric Mean Absolute Percentage Error), utilizada para avaliar os modelos acima, é uma variação do erro percentual médio absoluto (MAPE) que corrige problemas de assimetria (compara previsões que estão acima e abaixo do resultado real). SMAPE é calculada conforme a fórmula abaixo:

ree

Referências


  • Hyndman, R. J. and Athanasopoulos, G. Forecasting: Principles and practice. OTexts, 2018.

  • Hyndman, R. J. and Khandakar, Y. (2008). Automatic time series forecasting: The forecast package for R. Journal of Statistical Software, 27(3):1 – 22.

  • Dritsaki, C., Niklis, D., and Stamatiou, P. Oil consumption forecasting using arima models: an empirical study for greece. International Journal of Energy Economics and Policy, 11(4):214–224, 2021.

  • Nielsen, A. (2019). Practical Time Series Analysis: Prediction with Statistics and Machine Learning. O’Reilly Media, Inc.




Comentários

Avaliado com 0 de 5 estrelas.
Ainda sem avaliações

Adicione uma avaliação

Conectando Conhecimento e Prática

© 2035 by "Dado" a Entender. Powered and secured by Wix 

bottom of page