Linear Autoregressive Moving Average Models
8.3 Autoregressive Modelle In einem multiplen Regressionsmodell prognostizieren wir die Variable von Interesse mit einer linearen Kombination von Prädiktoren. In einem Autoregressionsmodell prognostizieren wir die Variable von Interesse unter Verwendung einer linearen Kombination von vergangenen Werten der Variablen. Der Ausdruck auto regression weist darauf hin, dass es sich um eine Regression der Variablen gegen sich selbst handelt. Somit kann ein autoregressives Modell der Ordnung p geschrieben werden, wobei c eine Konstante ist und et ein weißes Rauschen ist. Dies ist wie eine multiple Regression, aber mit verzögerten Werten von yt als Prädiktoren. Wir bezeichnen dies als AR (p) - Modell. Autoregressive Modelle sind bemerkenswert flexibel bei der Handhabung einer breiten Palette von verschiedenen Zeitreihen Muster. Die beiden Serien in Abbildung 8.5 zeigen Serien aus einem AR (1) - Modell und einem AR (2) - Modell. Das Ändern der Parameter phi1, dots, phip führt zu unterschiedlichen Zeitreihen. Die Varianz des Fehlerbegriffs et wird nur die Skala der Reihe ändern, nicht die Muster. Abbildung 8.5: Zwei Beispiele für Daten aus autoregressiven Modellen mit unterschiedlichen Parametern. Links: AR (1) mit yt 18 -0,8y et. Rechts: AR (2) mit yt 8 1,3y-0,7y et. In beiden Fällen ist et normal verteiltes weißes Rauschen mit mittlerem Nullwert und Varianz eins. Für ein AR (1) - Modell: Bei phi10 entspricht yt dem weißen Rauschen. Wenn phi11 und c0, yt äquivalent zu einem zufälligen Weg ist. Wenn phi11 und cne0, ist yt äquivalent zu einem zufälligen Weg mit Drift Wenn phi1lt0, yt dazu neigt, zwischen positiven und negativen Werten oszillieren. Normalerweise beschränken wir autoregressive Modelle auf stationäre Daten, und dann sind einige Einschränkungen für die Werte der Parameter erforderlich. Für ein AR (1) - Modell: -1 lt phi1 lt 1. Für ein AR (2) - Modell: -1 lt phi2 lt 1, phi1phi2 lt 1, phi2-phi1 lt 1. Bei pge3 sind die Einschränkungen viel komplizierter. R kümmert sich um diese Einschränkungen bei der Schätzung eines Modells. Dokumentation a ist ein konstanter Vektor von Offsets mit n Elementen. A i sind n - by-n Matrizen für jedes i. Die A i sind autoregressive Matrizen. Es gibt p autoregressive Matrizen. 949 t ist ein Vektor von seriell unkorrelierten Innovationen. Vektoren der Länge n. Die 949 t sind multivariate normale Zufallsvektoren mit einer Kovarianzmatrix Q. Wobei Q eine Identitätsmatrix ist, sofern nichts anderes angegeben ist. B j sind n - by-n Matrizen für jedes j. Die B j sind gleitende Mittelmatrizen. Es gibt q gleitende Mittelmatrizen. Xt ist eine n-by-r-Matrix, die exogene Terme zu jedem Zeitpunkt t darstellt. R die Zahl der exogenen Reihen. Exogene Terme sind Daten (oder andere nicht modellierte Eingaben) zusätzlich zur Reaktionszeitreihe y t. B ist ein konstanter Vektor von Regressionskoeffizienten der Größe r. Das Produkt X t middotb ist also ein Vektor der Größe n. Im allgemeinen sind die Zeitreihen y t und X t zu beobachten. Mit anderen Worten, wenn Sie Daten haben, repräsentiert es eine oder beide dieser Serien. Sie kennen nicht immer den Versatz a. Koeffizient b. Autoregressive Matrizen A i. Und gleitende Mittelmatrizen B j. Normalerweise möchten Sie diese Parameter auf Ihre Daten anpassen. Siehe die Referenzseite der vgxvarx-Funktion zum Schätzen von unbekannten Parametern. Die Innovationen 949 t sind zumindest in den Daten nicht zu beobachten, obwohl sie in Simulationen beobachtbar sind. Lag-Operator-Darstellung Es gibt eine äquivalente Darstellung der linearen autoregressiven Gleichungen in Hinsicht auf Lag-Operatoren. Der Lag-Operator L bewegt den Zeitindex um eins zurück: L y t y t 82111. Der Operator L m bewegt den Zeitindex um m zurück. L m y t y t 8211 m. In der Verzögerungsoperatorform wird die Gleichung für ein SVARMAX (p. q.r) - Modell (A 0 × 2212 × 2211 i 1 p A i L i) y t a X t b (B 0 × 2211 j 1 q B j L j) x03B5 t. Diese Gleichung kann als A (L) y t a X t b B (L) x03B5 t geschrieben werden. Ein VAR-Modell ist stabil, wenn det (I n × 2212 A 1 z × 2212 A 2 z 2 x 2212 x 2212 A pzp) x2260 0 x00A0x00A0forx00A0x00A0 z x2264 1. Diese Bedingung bedeutet, dass bei allen Neuerungen gleich Null der VAR-Prozess zu a konvergiert wie die Zeit vergeht. Siehe Luumltkepohl 74 Kapitel 2 für eine Diskussion. Ein VMA-Modell ist invertierbar, wenn det (I n B 1 z B 2 z 2. B q z q) x2260 0 x00A0x00A0forx00A0x00A0 z x2264 1. Diese Bedingung bedeutet, dass die reine VAR-Darstellung des Prozesses stabil ist. Eine Erläuterung zur Konvertierung zwischen VAR - und VMA-Modellen finden Sie unter Ändern von Modelldarstellungen. Siehe Luumltkepohl 74 Kapitel 11 für eine Diskussion von invertierbaren VMA-Modellen. Ein VARMA-Modell ist stabil, wenn sein VAR-Teil stabil ist. Ähnlich ist ein VARMA-Modell invertierbar, wenn sein VMA-Teil invertierbar ist. Es gibt keinen klar definierten Begriff der Stabilität oder Invertierbarkeit für Modelle mit exogenen Eingaben (z. B. VARMAX-Modellen). Ein exogener Eingang kann ein Modell destabilisieren. Erstellen von VAR-Modellen Um ein Mehrfach-Zeitreihenmodell oder mehrere Zeitreihendaten zu verstehen, führen Sie im Allgemeinen die folgenden Schritte aus: Importieren und Verarbeiten von Daten. Geben Sie ein Modell an. Spezifikation Structures mit keinen Parameterwerten, um ein Modell anzugeben, wenn MATLAB x00AE die Parameter Specification Structures mit ausgewählten Parameterwerten schätzen soll, um ein Modell anzugeben, in dem Sie einige Parameter kennen und möchten, dass MATLAB die anderen Schätzwerte ermittelt Eine passende Anzahl von Verzögerungen für Ihr Modell Passen Sie das Modell an Daten an. Anpassen von Modellen an Daten, um vgxvarx zu verwenden, um die unbekannten Parameter in Ihren Modellen abzuschätzen. Dies kann Folgendes mit sich bringen: Modell-Repräsentationen ändern, um Ihr Modell auf einen Typ zu ändern, den vgxvarx behandelt. Analysieren und prognostizieren Sie das Modell. Dies kann Folgendes beinhalten: Untersuchen der Stabilität eines angepassten Modells, um zu bestimmen, ob Ihr Modell stabil und invertierbar ist. VAR Model Forecasting zur Prognose direkt von Modellen oder zur Prognose einer Monte-Carlo-Simulation. Berechnen von Impulsantworten, um Impulsantworten zu berechnen, die Prognosen basierend auf einer angenommenen Änderung einer Eingabe in eine Zeitreihe liefern. Vergleichen Sie die Ergebnisse Ihrer Modelle Prognosen, um Daten für die Prognose gehalten. Ein Beispiel finden Sie in der VAR-Modell-Fallstudie. Ihre Bewerbung muss nicht alle Schritte in diesem Workflow beinhalten. Beispielsweise können Sie keine Daten haben, sondern ein parametrisiertes Modell simulieren. In diesem Fall würden Sie nur die Schritte 2 und 4 des generischen Workflows durchführen. Sie können durch einige dieser Schritte iterieren. Verwandte Beispiele Wählen Sie Ihr CountryHome CRAN glarma. Generalisierte Lineare Autoregressive Moving Average Modelle glarma. Generalisierte Lineare Autoregressive Moving Average Modelle mit. Verallgemeinerte lineare Autoregressive Moving Average Modelle mit verschiedenen Verteilungen Beschreibung Die Funktion glarma wird verwendet, um generalisierte lineare autoregressive gleitende Durchschnittsmodelle mit verschiedenen Verteilungen (Poisson, binomial, negatives Binomial) unter Verwendung von Pearson-Residuen oder Score-Residuen und für die Binomialverteilung Identitätsresiduen zu platzieren . Es schätzt auch die Parameter des GLARMA-Modells mit verschiedenen Verteilungen unter Verwendung von Fisher Scoring oder Newton-Raphson Iteration. Für Poisson - und negative Binomial-Response-Distributionen wird derzeit der Log-Link verwendet. Für Binomialantworten wird derzeit die Logit-Verknüpfung verwendet. Numerischer Vektor die Antwortvariable. Wenn die Antwortvariable für das Modell mit der Binomialverteilung ist, sollte es eine n durch 2 Matrix sein, eine Spalte ist die Anzahl der Erfolge und eine andere die Anzahl der Ausfälle. Matrix die erklärenden Variablen. Ein Vektor von Eins sollte der Datenmatrix als erste Spalte für das Beta des Intercept hinzugefügt werden. Entweder NULL oder ein numerischer Vektor mit der Länge gleich der Anzahl der Fälle. Wird verwendet, um eine a priori bekannte Komponente anzugeben, die bei der Montage in den linearen Prädiktor einzubeziehen ist. Numerisch die Toleranz für die Erkennung von Zahlen, die kleiner als die angegebene Toleranz sind, als Null. Modelle für glarma werden symbolisch spezifiziert. Ein typisches Modell hat die Form y (Antwort), X (Terme), wobei y der Zähl - oder Faktorreaktionsvektor ist, X eine Folge von Termen ist, die einen linearen Prädiktor für die Antwort spezifiziert. Es sollte beachtet werden, dass die erste Spalte von X ein Vektor von 1s als der Schnittpunkt in dem Modell sein sollte. Vier Anfangsparameter, die geschätzt werden müssen, werden zu Delta (Beta, Phi, Theta, Alpha) kombiniert. Wobei alpha ein optionaler Parameter ist, um das negative Binomialmodell aufzunehmen. Beachten Sie, dass in der Funktion glm. nb aus dem Paket MASS. Dieser Parameter heißt theta. Für Poisson - und negative Binomial-Response-Distributionen wird derzeit der Log-Link verwendet. Für Binomialantworten wird derzeit die Logit-Verknüpfung verwendet. Die verallgemeinerten linearen autoregressiven gleitenden Durchschnittsmodelle werden wie folgt berechnet. Der lineare Prädiktor für die Antwort ist log (mut) Wt transpose (Xt) beta-Offset Zt. Der unendliche gleitende Durchschnitt aus dem linearen Prädiktor ist Zt sum (gammai Residuen (t-i)). Dieser unendliche gleitende Durchschnitt wird unter Verwendung der autoregressiven gleitenden Durchschnittsrekursionen Zt phi1 (Z (t-1) e (t-1)) berechnet. Phip (Z e (t-p)) theta1 e. Thetaq e wobei p und q die Ordnungen von phi und theta sind und die Nicht-Null-Verzögerungen der Vektoren phi und theta durch den Benutzer über die Argumente phiLag und thetaLag spezifiziert werden können. Es gibt zwei Arten von Resten, die in jeder Rekursion verwendet werden können, Pearson-Residuen oder Score-Residuen, und zusätzlich können für die binomische Verteilung Identitätsreste verwendet werden. Der unendliche gleitende Durchschnitt, Zt. Abhängig von der Art der verwendeten Rückstände, sowie die endgültigen Parameter, die aus dem Filter erhalten werden. Zur Vermeidung von Instabilität ist eine Vereinheitlichung der vergangenen Beobachtungen notwendig, daher sollte der Anwender je nach Situation die geeignete Residualart wählen. Das Verfahren der Schätzung von Parametern, die in der Funktion implementiert werden, zielt darauf ab, die Protokollwahrscheinlichkeit durch ein iteratives Verfahren zu maximieren, das aus geeignet gewählten Anfangswerten für die Parameter beginnt. Ausgehend von den Anfangswerten wird delta Hut (0) für den Vektor der Aktualisierungen der Parameter unter Verwendung der Iterationen delta (k1) delta (k) Omega (deltak) erste Ableitung von log (deltak) erhalten, wobei Omega (delta hat (k)) einige ist Geeignet gewählten Matrix. Iterationen werden für k gt 1 fortgesetzt, bis die Konvergenz erreicht ist oder die Anzahl der Iterationen k eine benutzerdefinierte obere Grenze für maximale Iterationen erreicht, in welchem Fall sie stoppen. Das in unserer Umsetzung verwendete Konvergenzkriterium basiert auf eta. Das Maximum der Absolutwerte der ersten Ableitungen. Wenn eta kleiner als ein benutzerdefinierter Wert ist, stoppen die Iterationen. Es gibt zwei Methoden der Optimierung der Wahrscheinlichkeit, Newton-Raphson und Fisher Scoring. Die verwendete Methode wird durch die Argumentmethode angegeben. Es sollte beachtet werden, dass, wenn der Anfangswert für Parameter nicht gut gewählt wird, die Optimierung der Wahrscheinlichkeit nicht konvergieren kann. Bei der Anpassung gemischter ARMA-Spezifikationen ist Vorsicht geboten, da es möglich ist, daß die AR - und MA-Parameter nicht identifizierbar sind, wenn die Aufträge p und q zu groß sind. Fehlende Identifizierbarkeit manifestiert sich in dem Algorithmus, um die Wahrscheinlichkeit zu optimieren, die nicht konvergiert, und / oder das Hessische, das singulär ist, die Warnmeldungen und Konvergenzfehlercodes zu prüfen. Die Funktionszusammenfassung (d. H. Summary. glarma) kann verwendet werden, um eine Zusammenfassung der Ergebnisse zu erhalten oder zu drucken. Die generischen Accessor-Funktionen coef (dh coef. glarma), logLik (dh logLik. glarma), angepasst (dh fit. glarma), Residuen (dh residuals. glarma), nobs (dh nobs. glarma), model. frame (dh Modell. frame. glarma) und extractAIC (dh extractAIC. glarma) können verwendet werden, um verschiedene nützliche Eigenschaften des von glarma zurückgegebenen Wertes zu extrahieren. Glarma liefert ein Objekt der Klasse glarma mit Komponenten:
Comments
Post a Comment