Autorregressão vetorial - Vector autoregression

Vector autoregression ( VAR ) é um modelo estatístico usado para capturar a relação entre múltiplas quantidades conforme elas mudam ao longo do tempo. VAR é um tipo de modelo de processo estocástico . Os modelos VAR generalizam o modelo autoregressivo de variável única (univariada) , permitindo séries temporais multivariadas . Os modelos VAR são freqüentemente usados ​​em economia e ciências naturais .

Assim como o modelo autoregressivo, cada variável possui uma equação que modela sua evolução ao longo do tempo. Essa equação inclui os valores defasados (passados) da variável , os valores defasados ​​das outras variáveis ​​no modelo e um termo de erro . Os modelos VAR não requerem tanto conhecimento sobre as forças que influenciam uma variável quanto os modelos estruturais com equações simultâneas . O único conhecimento prévio necessário é uma lista de variáveis ​​que podem ser supostamente afetadas umas às outras ao longo do tempo.

Especificação

Definição

Um modelo VAR descreve a evolução de um conjunto de k variáveis, chamadas de variáveis endógenas , ao longo do tempo. Cada período de tempo é numerada, t = 1, ..., T . As variáveis ​​são coletadas em um vetor , y t , que tem comprimento k. (Equivalentemente, esse vetor pode ser descrito como uma ( k  × 1) - matriz. ) O vetor é modelado como uma função linear de seu valor anterior. Os componentes do vetor são referidos como y i , t , significando a observação no tempo t da i- ésima variável. Por exemplo, se a primeira variável no modelo mede o preço do trigo ao longo do tempo, y 1,1998 indicaria o preço do trigo no ano de 1998.

Os modelos VAR são caracterizados por sua ordem , que se refere ao número de períodos anteriores que o modelo usará. Continuando o exemplo acima, um VAR de 5a ordem modelaria o preço do trigo de cada ano como uma combinação linear dos preços do trigo dos últimos cinco anos. Um atraso é o valor de uma variável em um período de tempo anterior. Portanto, em geral, um VAR de ordem p refere-se a um modelo VAR que inclui defasagens para os últimos p períodos de tempo. Um VAR de ordem p é denotado "VAR ( p )" e às vezes chamado de "um VAR com defasagens p ". A p modelo VAR th-fim é escrito como

As variáveis ​​da forma y t −i indicam o valor dessa variável i períodos de tempo anteriores e são chamadas de "i ésimo atraso" de y t . A variável c é um k -vetor de constantes servindo como a interceptação do modelo. A i é uma matriz invariante no tempo ( k  ×  k ) e e t é um vetor k de termos de erro . Os termos de erro devem satisfazer três condições:

  1. . Todo termo de erro tem média zero.
  2. . A matriz de covariância contemporânea de termos de erro é uma matriz k  ×  k semidefinida positiva denotada por Ω.
  3. para qualquer k diferente de zero . Não há correlação ao longo do tempo. Em particular, não há correlação serial em termos de erro individuais.

O processo de escolha da defasagem máxima p no modelo VAR requer atenção especial porque a inferência depende da correção da ordem de defasagem selecionada.

Ordem de integração das variáveis

Observe que todas as variáveis ​​devem ser da mesma ordem de integração . Os seguintes casos são distintos:

  • Todas as variáveis ​​são I (0) (estacionárias): este é o caso padrão, ou seja, um VAR no nível
  • Todas as variáveis ​​são I ( d ) (não estacionárias) com d  > 0:
    • As variáveis ​​são cointegradas : o termo de correção de erro deve ser incluído no VAR. O modelo se torna um modelo de correção de erro vetorial (VECM), que pode ser visto como um VAR restrito.
    • As variáveis ​​não são cointegradas : primeiro, as variáveis ​​devem ser diferenciadas d vezes e uma delas tem um VAR na diferença.

Notação de matriz concisa

Pode-se empilhar os vetores para escrever um VAR ( p ) como uma equação de diferença de matriz estocástica , com uma notação de matriz concisa:

Os detalhes das matrizes estão em uma página separada .

Exemplo

Para obter um exemplo geral de um VAR ( p ) com k variáveis, consulte Notação matricial geral de um VAR (p) .

Um VAR (1) em duas variáveis ​​pode ser escrito em forma de matriz (notação mais compacta) como

(em que apenas uma única matriz A aparece porque este exemplo tem uma defasagem máxima p igual a 1), ou, equivalentemente, como o seguinte sistema de duas equações

Cada variável do modelo possui uma equação. A observação atual (tempo t ) de cada variável depende de seus próprios valores defasados, bem como dos valores defasados ​​de cada variável no VAR.

Escrevendo VAR ( p ) como VAR (1)

Um VAR com p lags pode sempre ser reescrito equivalentemente como um VAR com apenas um lag, redefinindo apropriadamente a variável dependente. A transformação equivale ao empilhamento das defasagens da variável VAR ( p ) na nova variável dependente VAR (1) e identidades anexas para completar o número de equações.

Por exemplo, o modelo VAR (2)

pode ser reformulado como o modelo VAR (1)

onde I é a matriz de identidade .

A forma VAR (1) equivalente é mais conveniente para derivações analíticas e permite declarações mais compactas.

Forma estrutural vs. forma reduzida

VAR estrutural

Um VAR estrutural com p lags (às vezes abreviado como SVAR ) é

onde c 0 é um k  × um vector de constantes, B i é um k  x  k matriz (para cada i = 0, ..., p ) e ε t é um k  × um vector de erro termos. Os principais termos diagonais da matriz B 0 (os coeficientes na i ésima variável na i ésima equação) são reduzidos a 1.

Os termos de erro ε t ( choques estruturais ) satisfazem as condições (1) - (3) na definição acima, com a particularidade de que todos os elementos fora da diagonal da matriz de covariância são zero. Ou seja, os choques estruturais não estão correlacionados.

Por exemplo, um VAR estrutural de duas variáveis ​​(1) é:

Onde

isto é, as variâncias dos choques estruturais são denotadas ( i = 1, 2) e a covariância é .

Escrevendo a primeira equação explicitamente e passando y 2, t para o lado direito obtém-se

Observe que y 2, t pode ter um efeito contemporâneo em y 1, t se B 0; 1,2 não for zero. Isso é diferente do caso quando B 0 é a matriz de identidade (todos os elementos fora da diagonal são zero - o caso na definição inicial), quando y 2, t pode impactar diretamente y 1, t +1 e valores futuros subsequentes, mas não y 1, t .

Por causa do problema de identificação de parâmetros , a estimativa de mínimos quadrados ordinários do VAR estrutural resultaria em estimativas de parâmetros inconsistentes . Esse problema pode ser superado reescrevendo o VAR de forma reduzida.

Do ponto de vista econômico, se a dinâmica conjunta de um conjunto de variáveis ​​pode ser representada por um modelo VAR, então a forma estrutural é uma representação das relações econômicas subjacentes, "estruturais". Duas características da forma estrutural o tornam o candidato preferido para representar as relações subjacentes:

1. Os termos de erro não estão correlacionados . Os choques estruturais e econômicos que impulsionam a dinâmica das variáveis ​​econômicas são considerados independentes , o que implica correlação zero entre os termos de erro como uma propriedade desejada. Isso é útil para separar os efeitos de influências economicamente não relacionadas no VAR. Por exemplo, não há razão para que um choque no preço do petróleo (como um exemplo de choque de oferta ) deva estar relacionado a uma mudança nas preferências dos consumidores em relação a um estilo de roupa (como um exemplo de choque de demanda ); portanto, seria de se esperar que esses fatores fossem estatisticamente independentes.
2. As variáveis ​​podem ter um impacto contemporâneo sobre outras variáveis . Este é um recurso desejável, especialmente ao usar dados de baixa frequência. Por exemplo, um aumento da alíquota de imposto indireto não afetaria as receitas fiscais no dia em que a decisão for anunciada, mas pode-se encontrar um efeito nos dados daquele trimestre.

VAR de forma reduzida

Ao pré-multiplicar o VAR estrutural com o inverso de B 0

e denotando

obtém-se o VAR reduzido da ordem p

Observe que na forma reduzida todas as variáveis ​​do lado direito são predeterminadas no tempo t . Como não há variáveis ​​endógenas de tempo t do lado direito, nenhuma variável tem efeito contemporâneo direto sobre as demais variáveis ​​do modelo.

No entanto, os termos de erro no VAR reduzido são compostos dos choques estruturais e t = B 0 −1 ε t . Assim, a ocorrência de um choque estrutural ε i, t pode potencialmente levar à ocorrência de choques em todos os termos de erro e j, t , criando movimento contemporâneo em todas as variáveis ​​endógenas. Consequentemente, a matriz de covariância do VAR reduzido

pode ter elementos diferentes de zero fora da diagonal, permitindo assim a correlação diferente de zero entre os termos de erro.

Estimativa

Estimativa dos parâmetros de regressão

A partir da notação de matriz concisa (para obter detalhes, consulte este anexo ):

Isso pode ser escrito alternativamente como:

onde denota o produto Kronecker e Vec a vetorização da matriz indicada.

Este estimador é consistente e assintoticamente eficiente . Além disso, é igual ao estimador de máxima verossimilhança condicional .

  • Como as variáveis ​​explicativas são as mesmas em cada equação, o estimador de mínimos quadrados multivariado é equivalente ao estimador de mínimos quadrados ordinários aplicado a cada equação separadamente.

Estimativa da matriz de covariância dos erros

Como no caso padrão, o estimador de máxima verossimilhança (MLE) da matriz de covariância difere do estimador de mínimos quadrados ordinários (OLS).

Estimador MLE:

Estimador OLS: para um modelo com uma constante, k variáveis ep defasagens.

Em uma notação de matriz, isso dá:

Estimativa da matriz de covariância do estimador

A matriz de covariância dos parâmetros pode ser estimada como

Graus de liberdade

Os modelos de autorregressão vetorial frequentemente envolvem a estimativa de muitos parâmetros. Por exemplo, com sete variáveis ​​e quatro defasagens, cada matriz de coeficientes para um determinado comprimento de defasagem é 7 por 7, e o vetor de constantes tem 7 elementos, então um total de 49 × 4 + 7 = 203 parâmetros são estimados, reduzindo substancialmente os graus de liberdade da regressão (o número de pontos de dados menos o número de parâmetros a serem estimados). Isso pode prejudicar a precisão das estimativas dos parâmetros e, portanto, das previsões fornecidas pelo modelo.

Interpretação do modelo estimado

Propriedades do modelo VAR são geralmente resumidas usando análise estrutural usando causalidade de Granger , respostas de impulso e decomposições de variância de erro de previsão .

Resposta de impulso

Considere o caso de primeira ordem (ou seja, com apenas uma defasagem), com equação de evolução

para o vetor em evolução (estado) e vetor de choques. Para encontrar, digamos, o efeito do j -ésimo elemento do vetor de choques sobre o i- ésimo elemento do vetor de estado 2 períodos depois, que é uma resposta de impulso particular, primeiro escreva a equação de evolução acima um período atrasado:

Use isso na equação original de evolução para obter

em seguida, repita usando a equação de evolução duas vezes defasada, para obter

A partir disso, o efeito do j -ésimo componente de sobre o i -ésimo componente de é o elemento i, j da matriz

Pode ser visto a partir deste processo de indução que qualquer choque terá um efeito sobre os elementos de y infinitamente à frente no tempo, embora o efeito se torne cada vez menor ao longo do tempo, assumindo que o processo de AR é estável - isto é, que todos os os valores próprios da matriz A são menores que 1 em valor absoluto .

Previsão usando um modelo VAR estimado

Um modelo VAR estimado pode ser usado para previsões , e a qualidade das previsões pode ser julgada de maneiras que são completamente análogas aos métodos usados ​​na modelagem autorregressiva univariada.

Formulários

Christopher Sims defendeu os modelos VAR, criticando as afirmações e o desempenho da modelagem anterior em econometria macroeconômica . Ele recomendou modelos VAR, que já haviam aparecido em estatísticas de séries temporais e na identificação de sistemas , uma especialidade estatística em teoria de controle . Sims defendeu os modelos VAR como um método livre de teoria para estimar as relações econômicas, sendo assim uma alternativa às "incríveis restrições de identificação" nos modelos estruturais. Os modelos VAR também são cada vez mais usados ​​na pesquisa em saúde para análises automáticas de dados diários ou dados de sensores.

Programas

Veja também

Notas

Leitura adicional

  • Asteriou, Dimitrios; Hall, Stephen G. (2011). "Modelos de vetores auto-regressivos (VAR) e testes de causalidade". Econometria aplicada (segunda edição). Londres: Palgrave MacMillan. pp. 319–333.
  • Enders, Walter (2010). Applied Economometric Time Series (Terceira ed.). Nova York: John Wiley & Sons. pp. 272–355. ISBN 978-0-470-50539-7.
  • Favero, Carlo A. (2001). Macroeconometria aplicada . Nova York: Oxford University Press. pp. 162–213. ISBN 0-19-829685-1.
  • Lütkepohl, Helmut (2005). Nova introdução à análise de múltiplas séries temporais . Berlim: Springer. ISBN 3-540-40172-5.
  • Qin, Duo (2011). "Ascensão da abordagem de modelagem VAR". Journal of Economic Surveys . 25 (1): 156–174. doi : 10.1111 / j.1467-6419.2010.00637.x .