Analyse des séries chronologiques tsa statsmodels. tsa contient des classes de modèles et des fonctions qui sont utiles pour l'analyse de séries chronologiques. Il comprend actuellement des modèles autorégressifs univariés (AR), des modèles vectoriels autorégressifs (VAR) et des modèles à moyenne mobile autorégressive univariée (ARMA). Il comprend également des statistiques descriptives pour les séries temporelles, par exemple l'autocorrélation, la fonction d'autocorrélation partielle et le périodogramme, ainsi que les propriétés théoriques correspondantes de l'ARMA ou des processus connexes. Il inclut également des méthodes pour travailler avec des polynômes de retard moyens autorégressifs et mobiles. De plus, des tests statistiques connexes et certaines fonctions d'assistance utiles sont disponibles. L'estimation est effectuée soit par une vraisemblance maximale, soit par une conditionnelle, soit par des moindres carrés conditionnels, en utilisant le filtre de Kalman ou les filtres directs. Actuellement, les fonctions et les classes doivent être importées du module correspondant, mais les classes principales seront disponibles dans l'espace de noms statsmodels. tsa. La structure du module se trouve dans statsmodels. tsa est stattools. Propriétés empiriques et tests, acf, pacf, granger-causalité, adf test racine unitaire, test ljung-box et autres. Armodel. Le processus autorégressif univarié, l'estimation avec la vraisemblance maximale conditionnelle et exacte et l'arimamodel des moindres carrés conditionnels. Processus ARMA univarié, estimation avec probabilité maximale conditionnelle et exacte et vecteur vectoriel par moindres carrés conditionnel, var. Modèles d 'estimation du processus autorégressif vectoriel (VAR), analyse de la réponse impulsionnelle, décomposition des variances de l' erreur de prévision et outils de visualisation des données kalmanf. Les classes d'estimation pour ARMA et d'autres modèles avec MLE exacte en utilisant Kalman Filter armaprocess. Propriétés des procédés arma avec des paramètres donnés, ceci inclut des outils pour convertir entre ARMA, MA et AR représentation ainsi que acf, pacf, densité spectrale, fonction de réponse impulsionnelle et similaires sandbox. tsa. fftarma. Similaire à armaprocess mais travaillant dans le domaine de fréquences tsatools. D'autres fonctions auxiliaires, de créer des tableaux de variables retardées, de construire des régresseurs pour les tendances, les tendances et autres. Filtres. Fonction auxiliaire pour le filtrage des séries temporelles Certaines fonctions supplémentaires qui sont également utiles pour l'analyse de séries chronologiques sont dans d'autres parties de statsmodels, par exemple des tests statistiques supplémentaires. Certaines fonctions connexes sont également disponibles dans matplotlib, nitime et scikits. talkbox. Ces fonctions sont conçues plus pour l'utilisation dans le traitement du signal où des séries chronologiques plus longues sont disponibles et travaillent plus souvent dans le domaine fréquentiel. (P, q) Modèles pour l'analyse des séries chronologiques - 3e partie Il s'agit du troisième et dernier post de la mini-série sur la moyenne mobile autorégressive (p. ARMA) pour l'analyse des séries temporelles. Nous avons introduit les modèles autorégressifs et les modèles Moyenne mobile dans les deux articles précédents. Maintenant, il est temps de les combiner pour produire un modèle plus sophistiqué. En fin de compte, cela nous amènera aux modèles ARIMA et GARCH qui nous permettront de prévoir les rendements des actifs et de prévoir la volatilité. Ces modèles constitueront la base des signaux commerciaux et des techniques de gestion des risques. Si vous avez lu la partie 1 et la partie 2, vous aurez vu que nous avons tendance à suivre un modèle pour notre analyse d'un modèle de série chronologique. Ill répéter brièvement ici: Justification - Pourquoi sommes-nous intéressés à ce modèle particulier Définition - Une définition mathématique pour réduire l'ambiguïté. Correlogramme - Tracer un échantillon de corrélogramme pour visualiser le comportement d'un modèle. Simulation et montage - Adapter le modèle à des simulations, afin de s'assurer que nous avons bien compris le modèle. Données financières réelles - Appliquer le modèle aux prix historiques réels des actifs. Prédiction - Prévoir les valeurs suivantes pour générer des signaux commerciaux ou des filtres. Pour suivre cet article, il est conseillé de jeter un coup d'oeil aux articles précédents sur l'analyse des séries chronologiques. Ils peuvent tous être trouvés ici. Critère d'information bayésienne Dans la partie 1 de cette série d'articles, nous avons examiné le critère d'information d'Akaike (AIC) comme moyen de nous aider à choisir entre les meilleurs modèles de séries temporelles. Un outil étroitement lié est le critère bayésien d'information (BIC). Essentiellement, il a un comportement similaire à l'AIC dans la mesure où il pénalise les modèles pour avoir trop de paramètres. Cela peut conduire à une surfaçon. La différence entre le BIC et l'AIC est que le BIC est plus sévère avec sa pénalisation de paramètres supplémentaires. Critère d'information bayésienne Si nous prenons la fonction de vraisemblance pour un modèle statistique, qui a k paramètres, et L maximise la probabilité. Alors le critère d'information bayésien est donné par: où n est le nombre de points de données dans la série temporelle. Nous utiliserons l'AIC et le BIC ci-dessous pour choisir les modèles ARMA (p, q) appropriés. Ljung-Box Test Dans la partie 1 de cet article, Rajan mentionné dans les commentaires Disqus que le test de Ljung-Box était plus approprié que d'utiliser le Critère d'information Akaike du Critère d'information bayésienne pour décider si un modèle ARMA était un bon ajustement à un moment séries. Le test de Ljung-Box est un test d'hypothèse classique qui est conçu pour tester si un ensemble d'autocorrélations d'un modèle de séries chronologiques adaptées diffèrent significativement de zéro. Le test ne teste pas chaque lag individuel pour le hasard, mais teste plutôt le hasard sur un groupe de décalages. Ljung-Box Test Nous définissons l'hypothèse nulle comme: Les données de séries chronologiques à chaque décalage sont i. i.d .. c'est-à-dire que les corrélations entre les valeurs de série de population sont nulles. Nous définissons l'hypothèse alternative comme: Les données de séries chronologiques ne sont pas i. i.d. Et possèdent une corrélation en série. Nous calculons la statistique de test suivante. Q: Où n est la longueur de l'échantillon de séries temporelles, chapeau k est l'autocorrélation de l'échantillon au décalage k et h le nombre de décalages dans le test. La règle de décision pour rejeter l'hypothèse nulle est de vérifier si Q gt chi2, pour une distribution chi-carré avec h degrés de liberté au 100 (1-alpha) percentile. Alors que les détails du test peuvent sembler un peu complexes, nous pouvons en fait utiliser R pour calculer le test pour nous, simplifiant un peu la procédure. Maintenant que nous avons discuté du BIC et du test de Ljung-Box, nous étions prêts à discuter de notre premier modèle mixte, à savoir la moyenne mobile autorégressive d'ordre p, q ou ARMA (p, Q). À ce jour, nous avons considéré les processus autorégressifs et les processus de moyenne mobile. L'ancien modèle considère son propre comportement passé comme des intrants pour le modèle et, en tant que tel, tente de capter les effets des participants sur le marché, tels que l'élan et la réversion moyenne dans le négoce boursier. Ce dernier modèle est utilisé pour caractériser l'information sur les chocs dans une série, comme une annonce de surprise ou un événement imprévu (comme le déversement d'hydrocarbures BP Deepwater Horizon). Par conséquent, un modèle ARMA tente de saisir ces deux aspects lors de la modélisation des séries chronologiques financières. Il est à noter qu'un modèle ARMA ne prend pas en compte le regroupement de la volatilité, un phénomène empirique clé de nombreuses séries chronologiques financières. Ce n'est pas un modèle conditionnellement hétéroscédastique. Pour cela, nous devrons attendre les modèles ARCH et GARCH. Le modèle ARMA (p, q) est une combinaison linéaire de deux modèles linéaires et est donc lui-même linéaire: Moyenne mobile auto-régressive Modèle d'ordre p, q Un modèle de série temporelle, est un modèle de moyenne mobile autorégressif d'ordre p, q . Où est le bruit blanc avec E (wt) 0 et la variance sigma2. Si nous considérons l'opérateur de décalage vers l'arrière. (Voir un article précédent), alors nous pouvons réécrire ce qui précède en tant que fonction theta et phi de: On peut voir directement que, en posant p neq 0 et q0, on récupère le modèle AR (p). De même, si on pose p 0 et q neq 0 on récupère le modèle MA (q). L'une des principales caractéristiques du modèle ARMA est qu'elle est parcimonieuse et redondante dans ses paramètres. Autrement dit, un modèle ARMA nécessitera souvent moins de paramètres qu'un modèle AR (p) ou MA (q) seul. En outre, si nous réécrivons l'équation en termes de BSO, alors les polynômes theta et phi peuvent parfois partager un facteur commun, ce qui conduit à un modèle plus simple. Simulations et corrélogrammes Comme pour les modèles autorégressifs et de moyenne mobile, nous allons maintenant simuler diverses séries ARMA et tenter ensuite d'adapter les modèles ARMA à ces réalisations. Nous le faisons parce que nous voulons nous assurer que nous comprenons la procédure d'ajustement, y compris la façon de calculer les intervalles de confiance pour les modèles, ainsi que de s'assurer que la procédure réellement récupérer des estimations raisonnables pour les paramètres ARMA d'origine. Dans la partie 1 et la partie 2, nous avons construit manuellement les séries AR et MA en dessinant N échantillons à partir d'une distribution normale puis en élaborant le modèle de série temporelle en utilisant des décalages de ces échantillons. Cependant, il existe un moyen plus simple de simuler les données AR, MA, ARMA et ARIMA, simplement en utilisant la méthode arima. sim dans R. Commençons par le modèle ARMA non trivial le plus simple possible, à savoir ARMA (1,1 ) Modèle. C'est-à-dire, un modèle autorégressif d'ordre un combiné avec un modèle de moyenne mobile d'ordre un. Un tel modèle n'a que deux coefficients, alpha et bêta, qui représentent les premiers décalages de la série temporelle elle-même et les termes de bruit blanc de choc. Un tel modèle est donné par: Il faut préciser les coefficients avant la simulation. Prenons alpha 0.5 et beta -0.5: La sortie est la suivante: Laisse aussi tracer le corrélogramme: On voit qu'il n'y a pas d'autocorrélation significative, ce qui est à prévoir d'un modèle ARMA (1,1). Enfin, nous allons essayer de déterminer les coefficients et leurs erreurs standard en utilisant la fonction arima: Nous pouvons calculer les intervalles de confiance pour chaque paramètre à l'aide des erreurs standard: Les intervalles de confiance contiennent les vraies valeurs des paramètres pour les deux cas. 95 intervalles de confiance sont très larges (une conséquence des erreurs standard raisonnablement grandes). Essayons maintenant un modèle ARMA (2,2). C'est-à-dire un modèle AR (2) combiné à un modèle MA (2). Nous avons besoin de spécifier quatre paramètres pour ce modèle: alpha1, alpha2, beta1 et beta2. Prenons alpha1 0.5, alpha2-0.25 beta10.5 et beta2-0.3: La sortie de notre modèle ARMA (2,2) est la suivante: Et l'autocorelation correspondante: Nous pouvons maintenant essayer d'adapter un modèle ARMA (2,2) à Les données: On peut aussi calculer les intervalles de confiance pour chaque paramètre: Noter que les intervalles de confiance pour les coefficients de la composante moyenne mobile (beta1 et beta2) ne contiennent pas réellement la valeur du paramètre d'origine. Cependant, à des fins commerciales, nous avons juste besoin d'avoir un pouvoir prédictif qui dépasse le hasard et produit suffisamment de bénéfice au-dessus des coûts de transaction, afin d'être rentable dans les données. le long terme. Maintenant que nous avons vu quelques exemples de modèles ARMA simulés, nous avons besoin d'un mécanisme pour choisir les valeurs de p et q lors de l'ajustement des modèles aux données financières réelles. Choisir le meilleur modèle ARMA (p, q) Pour déterminer quel ordre p, q du modèle ARMA est approprié pour une série, nous devons utiliser l'AIC (ou BIC) à travers un sous-ensemble de valeurs pour p, q, et Puis appliquez l'essai de Ljung-Box pour déterminer si un bon ajustement a été obtenu, pour des valeurs particulières de p, q. Pour montrer cette méthode, nous allons d'abord simuler un processus ARMA (p, q) particulier. Nous ferons ensuite une boucle sur toutes les valeurs par paires de p dans et q dans et calculons l'AIC. Nous allons sélectionner le modèle avec l'AIC le plus bas et ensuite exécuter un test Ljung-Box sur les résidus pour déterminer si nous avons atteint un bon ajustement. Commençons par simuler une série ARMA (3,2): Nous allons maintenant créer un objet final pour stocker le meilleur ajustement du modèle et la valeur AIC la plus faible. Nous faisons une boucle sur les différentes combinaisons p, q et utilisons l'objet courant pour stocker l'ajustement d'un modèle ARMA (i, j) pour les variables de boucle i et j. Si l'AIC actuel est inférieur à tout AIC calculé précédemment, nous avons défini l'AIC final à cette valeur courante et sélectionnez cet ordre. A la fin de la boucle, nous avons l'ordre du modèle ARMA stocké dans final. order et l'ARIMA (p, d, q) s'ajustent lui-même (avec le composant d intégré à 0) stocké comme final. arma: , De l'ordre et des coefficients ARIMA: on voit que l'ordre initial du modèle ARMA simulé a été récupéré, à savoir avec p3 et q2. Nous pouvons tracer le corelogramme des résidus du modèle pour voir s'ils ressemblent à une réalisation de bruit blanc discret (DWN): Le corelogramme ressemble en effet à une réalisation de DWN. Enfin, nous effectuons l'essai de Ljung-Box pour 20 lags pour confirmer ceci: Notez que la valeur p est supérieure à 0,05, ce qui indique que les résidus sont indépendants au niveau 95 et donc un modèle ARMA (3,2) fournit un Bonne tenue modèle. Il est clair que cela devrait être le cas puisque nous avons simulé les données nous-mêmes. Cependant, c'est précisément la procédure que nous utiliserons lorsque nous allons adapter des modèles ARMA (p, q) à l'index SampP500 dans la section suivante. Données financières Maintenant que nous avons décrit la procédure pour choisir le modèle de série temporelle optimal pour une série simulée, il est assez simple de l'appliquer aux données financières. Pour cet exemple, nous allons de nouveau choisir l'indice SampP500 US Equity. Permet de télécharger les prix quotidiens de clôture à l'aide de quantmod et de créer ensuite le flux de retours de logs: Lets la même procédure d'ajustement que pour la série ARMA (3,2) simulée ci-dessus sur la série logs retour du SampP500 en utilisant l'AIC: A l'ordre ARMA (3,3): Permet de tracer les résidus du modèle ajusté dans le journal logique SampP500 journalier flux: Notez qu'il ya quelques pics significatifs, surtout à des décalages plus élevés. Ceci est indicatif d'un mauvais ajustement. Nous allons effectuer un test de Ljung-Box pour voir si nous avons des preuves statistiques pour cela: Comme nous le soupçonnons, la valeur p est inférieure à 0,05 et en tant que tel nous ne pouvons pas dire que les résidus sont une réalisation de bruit blanc discret. Il existe donc une autocorrélation supplémentaire dans les résidus qui n'est pas expliquée par le modèle ARMA (3, 3). Prochaines étapes Comme nous l'avons vu tout au long dans cette série d'articles, nous avons vu des preuves d'hétéroscédasticité conditionnelle (regroupement de volatilité) dans la série SampP500, en particulier dans les périodes autour de 2007-2008. Lorsque nous utiliserons un modèle GARCH plus tard dans la série d'articles, nous verrons comment éliminer ces autocorrélations. En pratique, les modèles ARMA ne sont jamais en règle générale bons pour les rendements des actions log. Nous devons prendre en compte l'hétéroscédasticité conditionnelle et utiliser une combinaison d'ARIMA et de GARCH. L'article suivant considérera ARIMA et montrera comment le composant intégré diffère du modèle ARMA que nous avons envisagé dans cet article. Cliquez ci-dessous pour en savoir plus. L'information contenue sur ce site web est l'opinion des auteurs individuels basée sur leur observation personnelle, leur recherche et leurs années d'expérience. L'éditeur et ses auteurs ne sont pas des conseillers en placement, des avocats, des CPA ou d'autres professionnels des services financiers enregistrés et ne rendent pas de conseils juridiques, fiscaux, comptables, de placement ou autres services professionnels. L'information offerte par ce site Web est seulement l'éducation générale. Parce que chaque situation factuelle des individus est différente, le lecteur devrait chercher son conseiller personnel. Ni l'auteur ni l'éditeur n'assument aucune responsabilité ou responsabilité pour des erreurs ou omissions et n'a aucune responsabilité ni responsabilité envers une personne ou une entité à l'égard des dommages causés ou prétendument causés directement ou indirectement par les informations contenues sur ce site. À utiliser à vos risques et périls. En outre, ce site Web peut recevoir une compensation financière des sociétés mentionnées par la publicité, les programmes d'affiliation ou autrement. Les tarifs et offres des annonceurs affichés sur ce site Web changent fréquemment, parfois sans préavis. Alors que nous nous efforçons de maintenir des informations exactes et en temps opportun, les détails de l'offre peuvent être périmés. Les visiteurs doivent donc vérifier les modalités de ces offres avant de participer à ces offres. L'auteur et son éditeur déclinent toute responsabilité quant à la mise à jour de l'information et déclinent toute responsabilité concernant le contenu, les produits et les services de tiers, y compris lorsqu'ils sont accessibles par le biais d'hyperliens et / ou d'annonces sur ce site. Introduction à ARIMA: modèles non saisonniers ARIMA (p, d, q) : Les modèles ARIMA sont, en théorie, la classe la plus générale de modèles pour prévoir une série temporelle qui peut être rendue 8220stationnaire8221 par différenciation (si nécessaire), peut-être en conjonction avec des transformations non linéaires telles que l'abattage ou le dégonflage (si nécessaire). Une variable aléatoire qui est une série temporelle est stationnaire si ses propriétés statistiques sont toutes constantes dans le temps. Une série stationnaire n'a pas de tendance, ses variations autour de sa moyenne ont une amplitude constante, et elle se balance d'une manière cohérente. C'est-à-dire que ses schémas de temps aléatoires à court terme ont toujours la même signification statistique. Cette dernière condition signifie que ses autocorrélations (corrélations avec ses propres écarts précédents par rapport à la moyenne) restent constantes dans le temps, ou de manière équivalente, que son spectre de puissance reste constant dans le temps. Une variable aléatoire de cette forme peut être considérée (comme d'habitude) comme une combinaison de signal et de bruit, et le signal (si l'on est apparent) pourrait être un modèle de réversion moyenne rapide ou lente, ou oscillation sinusoïdale, ou alternance rapide de signe , Et il pourrait également avoir une composante saisonnière. Un modèle ARIMA peut être considéré comme un 8220filter8221 qui essaie de séparer le signal du bruit, et le signal est ensuite extrapolé dans l'avenir pour obtenir des prévisions. L'équation de prévision d'ARIMA pour une série temporelle stationnaire est une équation linéaire (c'est-à-dire de type régression) dans laquelle les prédicteurs sont constitués par des décalages de la variable dépendante et / ou des décalages des erreurs de prévision. Valeur prédite de Y une constante et / ou une somme pondérée d'une ou plusieurs valeurs récentes de Y et / ou d'une somme pondérée d'une ou plusieurs valeurs récentes des erreurs. Si les prédicteurs se composent uniquement de valeurs décalées de Y. il s'agit d'un modèle autoregressif pur (8220 auto-régressé8221), qui est juste un cas particulier d'un modèle de régression et qui pourrait être équipé d'un logiciel de régression standard. Par exemple, un modèle autorégressif de premier ordre (8220AR (1) 8221) pour Y est un modèle de régression simple dans lequel la variable indépendante est juste Y retardée d'une période (LAG (Y, 1) dans Statgraphics ou YLAG1 dans RegressIt). Si certains des prédicteurs sont des retards des erreurs, un modèle ARIMA, il n'est pas un modèle de régression linéaire, parce qu'il n'y a aucun moyen de spécifier 8220last période8217s error8221 comme une variable indépendante: les erreurs doivent être calculées sur une période à la période de base Lorsque le modèle est adapté aux données. Du point de vue technique, le problème de l'utilisation d'erreurs retardées comme prédicteurs est que les prédictions du modèle 8217 ne sont pas des fonctions linéaires des coefficients. Même s'ils sont des fonctions linéaires des données passées. Ainsi, les coefficients dans les modèles ARIMA qui incluent des erreurs retardées doivent être estimés par des méthodes d'optimisation non linéaires (8220hill-climbing8221) plutôt que par la simple résolution d'un système d'équations. L'acronyme ARIMA signifie Auto-Regressive Integrated Moving Average. Les Lags de la série stationnaire dans l'équation de prévision sont appelés termes contingentoréducteurs, les retards des erreurs de prévision sont appelés quotmoving averagequot terms et une série chronologique qui doit être différenciée pour être stationnaire est dite être une version quotintegratedquot d'une série stationnaire. Les modèles de Random-Walk et de tendance aléatoire, les modèles autorégressifs et les modèles exponentiels de lissage sont tous des cas particuliers de modèles ARIMA. Un modèle ARIMA non saisonnier est classé comme un modèle quotARIMA (p, d, q), où: p est le nombre de termes autorégressifs, d est le nombre de différences non saisonnières nécessaires pour la stationnarité, et q est le nombre d'erreurs de prévision retardées dans L'équation de prédiction. L'équation de prévision est construite comme suit. En premier lieu, y désigne la différence d ème de Y. ce qui signifie: Notez que la deuxième différence de Y (le cas d2) n'est pas la différence de 2 périodes. Au contraire, c'est la première différence de la première différence. Qui est l'analogue discret d'une seconde dérivée, c'est-à-dire l'accélération locale de la série plutôt que sa tendance locale. En termes de y. L'équation de prévision générale est: Ici, les paramètres de la moyenne mobile (9528217s) sont définis de sorte que leurs signes soient négatifs dans l'équation, suivant la convention introduite par Box et Jenkins. Certains auteurs et logiciels (y compris le langage de programmation R) les définissent de sorte qu'ils ont des signes plus à la place. Lorsque les nombres réels sont branchés dans l'équation, il n'y a pas d'ambiguïté, mais il est important de savoir quelle convention votre logiciel utilise lorsque vous lisez la sortie. Souvent, les paramètres y sont indiqués par AR (1), AR (2), 8230 et MA (1), MA (2), 8230, etc. Pour identifier le modèle ARIMA approprié pour Y. vous commencez par déterminer l'ordre de différenciation D) le besoin de stationner la série et de supprimer les caractéristiques brutes de la saisonnalité, peut-être en conjonction avec une transformation de stabilisation de la variance telle que l'abattage ou le dégonflage. Si vous vous arrêtez à ce stade et que vous prédisez que la série différenciée est constante, vous avez simplement adapté une marche aléatoire ou un modèle de tendance aléatoire. Cependant, la série stationnaire peut toujours avoir des erreurs autocorrélées, ce qui suggère qu'un certain nombre de termes AR (p 8805 1) et / ou certains termes MA (q 8805 1) sont également nécessaires dans l'équation de prévision. Le processus de détermination des valeurs de p, d et q qui sont les meilleurs pour une série temporelle donnée sera discuté dans des sections ultérieures des notes (dont les liens sont en haut de cette page), mais un aperçu de certains des types Des modèles non saisonniers ARIMA qui sont couramment rencontrés est donné ci-dessous. ARIMA (1,0,0) modèle autorégressif de premier ordre: si la série est stationnaire et autocorrélée, peut-être peut-elle être prédite comme un multiple de sa propre valeur précédente, plus une constante. L'équation de prévision dans ce cas est 8230 qui est Y régressée sur elle-même décalée d'une période. Il s'agit d'un 8220ARIMA (1,0,0) constant8221 modèle. Si la moyenne de Y est nulle, alors le terme constant ne sera pas inclus. Si le coefficient de pente 981 1 est positif et inférieur à 1 dans l'amplitude (il doit être inférieur à 1 dans l'amplitude si Y est stationnaire), le modèle décrit le comportement de réverbération moyen dans lequel la valeur de la prochaine période doit être prédite 981 fois Loin de la valeur moyenne de cette période. Si 981 1 est négatif, il prédit un comportement de réversion moyenne avec alternance de signes, c'est-à-dire qu'il prédit également que Y sera inférieur à la moyenne de la période suivante si elle est supérieure à la moyenne de cette période. Dans un modèle autorégressif du second ordre (ARIMA (2,0,0)), il y aurait un terme Y t-2 sur la droite aussi, et ainsi de suite. Selon les signes et les grandeurs des coefficients, un modèle ARIMA (2,0,0) pourrait décrire un système dont la réversion moyenne se fait d'une manière oscillatoire sinusoïdale, comme le mouvement d'une masse sur un ressort soumis à des chocs aléatoires . Randonnée aléatoire ARIMA (0,1,0): Si la série Y n'est pas stationnaire, le modèle le plus simple possible est un modèle de marche aléatoire, qui peut être considéré comme un cas limite d'un modèle AR (1) dans lequel le modèle autorégressif Coefficient est égal à 1, c'est-à-dire une série à réversion moyenne infiniment lente. L'équation de prédiction pour ce modèle peut s'écrire: où le terme constant est le changement moyen de période à période (c'est-à-dire la dérive à long terme) dans Y. Ce modèle pourrait être adapté comme un modèle de régression sans interception dans lequel La première différence de Y est la variable dépendante. Comme il comprend une différence non saisonnière et un terme constant, il est classé en tant que modèle de type ARIMA (0,1,0) avec constant. quot Le modèle aléatoire-sans-dérive serait un ARIMA (0,1, 0) modèle sans modèle constant autorimétrique ARIMA (1,1,0) différencié: Si les erreurs d'un modèle de marche aléatoire sont autocorrélées, peut-être le problème peut-il être fixé en ajoutant un décalage de la variable dépendante à l'équation de prédiction - - c'est à dire En faisant régresser la première différence de Y sur elle-même décalée d'une période. Cela donnerait l'équation de prédiction suivante: qui peut être réarrangée à. Ceci est un modèle autorégressif de premier ordre avec un ordre de différenciation non saisonnière et un terme constant - c'est-à-dire. Un modèle ARIMA (1,1,0). ARIMA (0,1,1) sans lissage exponentiel simple constant: Une autre stratégie pour corriger les erreurs autocorrélées dans un modèle de marche aléatoire est suggérée par le modèle de lissage exponentiel simple. Rappelons que pour certaines séries temporelles non stationnaires (par exemple celles qui présentent des fluctuations bruyantes autour d'une moyenne variable lentement), le modèle de marche aléatoire n'obtient pas une moyenne mobile des valeurs passées. En d'autres termes, plutôt que de prendre l'observation la plus récente comme la prévision de la prochaine observation, il est préférable d'utiliser une moyenne des dernières observations afin de filtrer le bruit et de mieux estimer la moyenne locale. Le modèle de lissage exponentiel simple utilise une moyenne mobile exponentiellement pondérée des valeurs passées pour obtenir cet effet. L'équation de prédiction pour le modèle de lissage exponentiel simple peut être écrite en un certain nombre de formes mathématiquement équivalentes. Dont l'une est la forme dite de correction d'erreur 8221, dans laquelle la prévision précédente est ajustée dans la direction de l'erreur qu'elle a faite: Comme e t-1 Y t-1 - 374 t-1 par définition, ceci peut être réécrit comme : Qui est une équation de prévision ARIMA (0,1,1) sans constante avec 952 1 1 - 945. Cela signifie que vous pouvez ajuster un lissage exponentiel simple en le spécifiant comme un modèle ARIMA (0,1,1) sans Constante, et le coefficient MA (1) estimé correspond à 1-moins-alpha dans la formule SES. Rappelons que dans le modèle SES, l'âge moyen des données dans les prévisions de 1 période à venir est de 1 945. ce qui signifie qu'elles auront tendance à être en retard par rapport aux tendances ou aux points de retournement d'environ 1 945 périodes. Il s'ensuit que l'âge moyen des données dans les prévisions à 1 période d'un modèle ARIMA (0,1,1) sans modèle constant est de 1 (1 - 952 1). Ainsi, par exemple, si 952 1 0.8, l'âge moyen est 5. Alors que 952 1 approche de 1, le modèle ARIMA (0,1,1) sans constante devient une moyenne mobile à très long terme et 952 1 Approche 0, il devient un modèle aléatoire-marche-sans-dérive. Dans les deux modèles précédents décrits ci-dessus, le problème des erreurs autocorrélées dans un modèle de marche aléatoire a été fixé de deux manières différentes: en ajoutant une valeur décalée de la série différenciée À l'équation ou en ajoutant une valeur décalée de l'erreur de prévision. Quelle approche est la meilleure Une règle de base pour cette situation, qui sera discutée plus en détail plus tard, est que l'autocorrélation positive est le mieux traitée en ajoutant un terme AR au modèle et l'autocorrélation négative est généralement mieux traitée en ajoutant un Terme MA. Dans les séries économiques et économiques, l'autocorrélation négative apparaît souvent comme un artefact de différenciation. (En général, la différenciation réduit l'autocorrélation positive et peut même provoquer un basculement de l'autocorrélation positive à négative.) Ainsi, le modèle ARIMA (0,1,1), dans lequel la différenciation est accompagnée d'un terme MA, est plus souvent utilisé qu'un Modèle ARIMA (1,1,0). ARIMA (0,1,1) avec lissage exponentiel simple et constant avec croissance: En implémentant le modèle SES en tant que modèle ARIMA, vous gagnez en fait une certaine souplesse. Tout d'abord, le coefficient estimé de MA (1) peut être négatif. Cela correspond à un facteur de lissage supérieur à 1 dans un modèle SES, ce qui n'est généralement pas autorisé par la procédure de montage du modèle SES. Deuxièmement, vous avez la possibilité d'inclure un terme constant dans le modèle ARIMA si vous le souhaitez, afin d'estimer une tendance moyenne non nulle. Le modèle ARIMA (0,1,1) avec constante a l'équation de prédiction: Les prévisions à une période de ce modèle sont qualitativement similaires à celles du modèle SES, sauf que la trajectoire des prévisions à long terme est typiquement un (Dont la pente est égale à mu) plutôt qu'une ligne horizontale. ARIMA (0,2,1) ou (0,2,2) sans lissage exponentiel linéaire constant: Les modèles de lissage exponentiel linéaire sont des modèles ARIMA qui utilisent deux différences non saisonnières en conjonction avec des termes MA. La seconde différence d'une série Y n'est pas simplement la différence entre Y et elle-même retardée par deux périodes, mais plutôt c'est la première différence de la première différence - i. e. Le changement de la variation de Y à la période t. Ainsi, la deuxième différence de Y à la période t est égale à (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. Une seconde différence d'une fonction discrète est analogue à une dérivée seconde d'une fonction continue: elle mesure la quotation ou la quotcurvature dans la fonction à un moment donné. Le modèle ARIMA (0,2,2) sans constante prédit que la seconde différence de la série est égale à une fonction linéaire des deux dernières erreurs de prévision: qui peuvent être réarrangées comme: où 952 1 et 952 2 sont les MA (1) et MA (2) coefficients. Il s'agit d'un modèle de lissage exponentiel linéaire général. Essentiellement le même que le modèle Holt8217s, et le modèle Brown8217s est un cas spécial. Il utilise des moyennes mobiles exponentiellement pondérées pour estimer à la fois un niveau local et une tendance locale dans la série. Les prévisions à long terme de ce modèle convergent vers une droite dont la pente dépend de la tendance moyenne observée vers la fin de la série. ARIMA (1,1,2) sans lissage exponentiel linéaire à tendance amortie constante. Ce modèle est illustré dans les diapositives accompagnant les modèles ARIMA. Il extrapole la tendance locale à la fin de la série, mais l'aplatit à des horizons de prévision plus longs pour introduire une note de conservatisme, une pratique qui a un soutien empirique. Voir l'article sur Quest pourquoi la Tendance amortie travaille par Gardner et McKenzie et l'article de Golden Rulequot par Armstrong et al. Pour plus de détails. Il est généralement conseillé de s'en tenir à des modèles dans lesquels au moins l'un de p et q n'est pas supérieur à 1, c'est-à-dire ne pas essayer d'adapter un modèle tel que ARIMA (2,1,2), car cela entraînera vraisemblablement un overfitting Et quotcommon-factorquot qui sont discutés plus en détail dans les notes sur la structure mathématique des modèles ARIMA. Implémentation de la feuille de calcul: Les modèles ARIMA tels que ceux décrits ci-dessus sont faciles à mettre en œuvre sur une feuille de calcul. L'équation de prédiction est simplement une équation linéaire qui fait référence aux valeurs passées des séries temporelles originales et des valeurs passées des erreurs. Ainsi, vous pouvez configurer une table de prévision ARIMA en stockant les données dans la colonne A, la formule de prévision dans la colonne B et les erreurs (données moins les prévisions) dans la colonne C. La formule de prévision dans une cellule typique de la colonne B serait tout simplement Une expression linéaire faisant référence à des valeurs dans les lignes précédentes des colonnes A et C multipliées par les coefficients AR ou MA appropriés stockés dans des cellules ailleurs sur la feuille de calcul.
No comments:
Post a Comment