Monday 28 August 2017

Autoregressiva Glidande Medelvärde Arma Modell


Autoregressive Integrated Moving Average - ARIMA. DEFINITION av Autoregressive Integrated Moving Average - ARIMA. A Statistisk analysmodell som använder tidsseriedata för att förutsäga framtida trender Det är en form av regressionsanalys som syftar till att förutsäga framtida rörelser längs den till synes slumpmässiga promenad som lagras Och den finansiella marknaden genom att undersöka skillnaderna mellan värden i serien istället för att använda de faktiska datavärdena. Lags av de olika serierna kallas autoregressiva och lags inom prognostiserad data kallas glidande medelvärde. BREAKA NED Autoregressivt integrerat rörligt medelvärde - ARIMA. Denna modelltyp betecknas generellt ARIMA p, d, q, med heltal som hänvisar till de autogegressiva integrerade och glidande delarna av datasatsen, respektive med ARIMA-modellering kan hänsyn tas till trender, säsongscykler, fel och icke-stationära Aspekter av en dataset när man gör prognoser. Introduktion till ARIMA nonseasonal models. ARIMA p, d, q forec Asting-ekvation ARIMA-modeller är i teorin den mest generella klassen av modeller för prognoser för en tidsserie som kan göras stationär genom differentiering om det behövs, kanske i samband med olinjära transformationer såsom loggning eller avflöde om nödvändigt En slumpmässig variabel som är En tidsserie är stillastående om dess statistiska egenskaper är konstanta över tiden En stationär serie har ingen trend, dess variationer runt dess medelvärde har en konstant amplitud och det vinklar på ett konsekvent sätt dvs dess korta slumpmässiga tidsmönster ser alltid ut I statistisk mening Det sistnämnda tillståndet betyder att dess autokorrelationer korrelationer med sina egna tidigare avvikelser från medelvärdet förblir konstanta över tiden eller likvärdigt att dess effektspektrum förblir konstant över tiden. En slumpmässig variabel i denna form kan ses som vanligt som en kombination Av signal och brus, och signalen om man är uppenbar kan vara ett mönster av snabb eller långsam medelbackning eller sinusformig oscillat Jon eller snabb växling i tecken och det kan också ha en säsongskomponent. En ARIMA-modell kan ses som ett filter som försöker separera signalen från bruset och signalen extrapoleras därefter i framtiden för att få prognoser. ARIMA Prognoser ekvation för en stationär tidsserie är en linjär dvs regressionstypsekvation där prediktorerna består av lags av den beroende variabeln och eller lags av prognosfel som är. Predicted value of Y är en konstant och eller en vägd summa av en eller Senaste värdena på Y och eller en vägd summa av en eller flera nya värden av felen. Om prediktorerna endast består av fördröjda värden på Y är det en ren självregressiv självregresserad modell, vilket bara är ett speciellt fall av en regressionsmodell Och som kan vara utrustad med standard regressionsprogramvara Till exempel är en första-ordningsautoregressiv AR1-modell för Y en enkel regressionsmodell där den oberoende variabeln bara Y är försenad med en period LAG Y, 1 i Statgraphics eller Y LAG1 i RegressIt Om några av prediktorerna är felaktiga, är en ARIMA-modell inte en linjär regressionsmodell, eftersom det inte finns något sätt att ange sista periodens fel som en oberoende variabel, måste felen beräknas under en period till - periodsbasis när modellen är anpassad till data Tekniskt sett är problemet med att använda fördröjda fel som prediktorer att modellens förutsägelser inte är linjära funktioner för koefficienterna trots att de är linjära funktioner i tidigare data. Så koefficienter I ARIMA-modeller som innehåller fördröjda fel måste uppskattas genom olinjära optimeringsmetoder bergsklättring snarare än genom att bara lösa ett system av ekvationer. Akronymet ARIMA står för auto-regressivt integrerat rörligt medelvärde. Lags av den stationära serien i prognosen ekvationen kallas auto-regressiva Villkor, lags av prognosfel kallas glidande medelvärden, och en tidsserie som behöver differentieras för att göras stationär sägs vara en inte Riven version av en stationär serie Slumpmässiga och slumpmässiga modeller, autoregressiva modeller och exponentiella utjämningsmodeller är alla speciella fall av ARIMA-modeller. En icke-sasonlig ARIMA-modell klassificeras som en ARIMA p, d, q modell, where. p är Antalet autoregressiva termer. d är antalet icke-säsongsskillnader som behövs för stationaritet, ochqq är antalet fördröjda prognosfel i prediktionsekvationen. Prognosekvationen är konstruerad enligt följande. Först, låt y beteckna den andra skillnaden i Y Vilket betyder. Notera att den andra skillnaden i Y d2 fallet inte är skillnaden från 2 perioder sedan. Det är snarare den första skillnaden-av-första skillnaden som är den diskreta analogen av ett andra derivat, dvs den lokala Acceleration av serien i stället för den lokala trenden. När det gäller y är den allmänna prognostiseringsekvationen här. De rörliga genomsnittsparametrarna s definieras så att deras tecken är negativa i ekvationen, enligt konventionen införd av Box och Jen Kins Några författare och programvara inklusive R-programmeringsspråket definierar dem så att de har plustecken i stället När faktiska siffror är anslutna till ekvationen finns det ingen tvetydighet, men det är viktigt att veta vilken konvention din programvara använder när du läser utmatningen Ofta betecknas parametrarna där av AR 1, AR 2 och MA 1, MA 2 etc. För att identifiera lämplig ARIMA-modell för Y börjar du genom att bestämma sorteringsordningen d som behöver stationera serien och ta bort bruttoegenskaperna Av säsongsmässighet, kanske i kombination med en variansstabiliserande transformation som loggning eller deflatering Om du slutar vid denna punkt och förutsäger att den olika serien är konstant, har du bara monterat en slumpmässig promenad eller slumpmässig trendmodell. Dock kan den stationära serien fortfarande Har autokorrelerade fel, vilket tyder på att ett antal AR-termer p 1 och eller några nummer MA termer q 1 också behövs i prognosförhållandet. Processen att bestämma th E-värdena p, d och q som är bäst för en given tidsserie kommer att diskuteras i senare avsnitt i anteckningarna vars länkar finns högst upp på den här sidan, men en förhandsgranskning av några av de typer av icke-säsongsbaserade ARIMA-modeller som är Vanligast stöttas nedan. ARIMA 1,0,0 första ordningens autoregressiva modell om serien är stationär och autokorrelerad, kanske det kan förutsägas som ett flertal av sitt eget tidigare värde plus en konstant. Den prognosekvation i detta fall är. Vilken är Y regresserad i sig själv fördröjd med en period Detta är en ARIMA 1,0,0 konstant modell Om medelvärdet av Y är noll, skulle den konstanta termen inte inkluderas. Om lutningskoefficienten 1 är positiv och mindre än 1 i Storleken måste den vara mindre än 1 i storleksordningen om Y är stationär, beskriver modellen medelåterkallande beteende där nästa period s-värde bör förutsägas vara 1 gånger så långt bort från medelvärdet som denna period s-värde Om 1 är negativ, Det förutspår medelåterkallande beteende med teckenförändring S, dvs det förutspår också att Y kommer att ligga under den genomsnittliga nästa perioden om det ligger över medelvärdet i denna period. I en andraordens autregressiv modell ARIMA 2,0,0 skulle det finnas en Y t-2 term till höger Beroende på tecknen och storlekarna på koefficienterna, kan en ARIMA 2,0,0-modell beskriva ett system vars genomsnittliga reversering sker på ett sinusformigt oscillerande sätt, som en massans rörelse på en fjäder som är Utsatt för slumpmässiga shocks. ARIMA 0,1,0 slumpmässig promenad Om serien Y inte är stationär är den enklaste möjliga modellen för den en slumpmässig promenadmodell, vilken kan betraktas som ett begränsande fall av en AR 1-modell där den autoregressiva Koefficienten är lika med 1, dvs en serie med oändligt långsam medelvärde. Förutsägningsekvationen för denna modell kan skrivas as. where den konstanta termen är den genomsnittliga period-to-period-förändringen dvs den långsiktiga driften i Y Denna modell kan monteras Som en icke-intercept regressionsmodell där den första skillnaden i Y är d Ependent variabel Eftersom den endast innehåller en nonseasonal skillnad och en konstant term, klassificeras den som en ARIMA 0,1,0 modell med konstant. Den slumpmässiga walk-without-drift modellen skulle vara en ARIMA 0,1,0 modell utan konstant. ARIMA 1,1,0-differensierad första ordningsautoregressiv modell Om felen i en slumpmässig promenadmodell är autokorrelerad kanske problemet kan lösas genom att lägga en lag av den beroende variabeln i prediksionsekvationen - dvs genom att regressera den första skillnaden i Y i sig fördröjdes med en period. Detta skulle ge följande förutsägelsekvation. Det kan omordnas till. Det här är en första-orders autoregressiv modell med en ordning av icke-säsongsskillnader och en konstant term, dvs en ARIMA 1,1,0-modell. ARIMA 0,1,1 utan konstant enkel exponentiell utjämning En annan strategi för att korrigera autokorrelerade fel i en slumpmässig gångmodell föreslås av den enkla exponentiella utjämningsmodellen. Kom ihåg att för vissa icke-stationära tidsserier, t ex de som uppvisar bullrig fluss Tuations runt ett långsamt varierande medel, slumpmässig promenadmodellen utövar inte lika bra som ett glidande medelvärde av tidigare värden. Med andra ord, snarare än att ta den senaste observationen som prognosen för nästa observation, är det bättre att använda ett genomsnitt Av de sista observationerna för att filtrera bort bullret och mer exakt uppskatta det lokala medelvärdet. Den enkla exponentiella utjämningsmodellen använder ett exponentiellt vägt rörligt medelvärde av tidigare värden för att uppnå denna effekt. Förutsättningsekvationen för den enkla exponentiella utjämningsmodellen kan skrivas in Ett antal matematiskt ekvivalenta former, varav en är den så kallade felkorrigeringsformen, där den föregående prognosen justeras i riktning mot det fel som det gjorde. Eftersom e-1 Y t-1 - t-1 per definition, Detta kan skrivas om som en ARIMA 0,1,1-utan konstant prognosförening med 1 1 - Det betyder att du kan passa en enkel exponentiell utjämning genom att ange den som en ARIMA 0,1,1-modell utan att Stant och den uppskattade MA 1-koefficienten motsvarar 1-minus-alfa i SES-formeln. Kom ihåg att i SES-modellen är den genomsnittliga åldern för data i de 1-framåtprognoser 1 som innebär att de tenderar att ligga kvar Trender eller vändpunkter med cirka 1 period. Det följer att den genomsnittliga åldern för data i de 1-framåtprognoserna för en ARIMA 0,1,1-utan konstant modell är 1 1 - 1 Så, till exempel om 1 0 8, medelåldern är 5 När 1 närmar sig 1 blir ARIMA 0,1,1-utan konstant modell ett mycket långsiktigt rörligt medelvärde, och när 1 närmar sig 0 blir det en slumpmässig promenad utan drift Modell. Vilket är det bästa sättet att korrigera för autokorrelation som lägger till AR-termer eller lägga till MA-termer I de tidigare två modellerna som diskuterats ovan fixades problemet med autokorrelerade fel i en slumpmässig promenadmodell på två olika sätt genom att lägga till ett fördröjt värde av de olika Serie till ekvationen eller lägga till ett fördröjt värde av prognosfelet Vilket tillvägagångssätt är bäst En tumregel för denna s Ituation, som kommer att diskuteras mer i detalj senare, är att positiv autokorrelation vanligtvis behandlas bäst genom att addera en AR-term till modellen och negativ autokorrelation behandlas vanligtvis bäst genom att lägga till en MA-term i affärs - och ekonomiska tidsserier, negativ autokorrelation ofta Uppstår som en artefakt av differentiering I allmänhet minskar differentieringen positiv autokorrelation och kan till och med orsaka en växling från positiv till negativ autokorrelation Således används ARIMA 0,1,1-modellen, i vilken skillnad åtföljs av en MA-term, oftare än En ARIMA 1,1,0 modell. ARIMA 0,1,1 med konstant enkel exponentiell utjämning med tillväxt Genom att implementera SES-modellen som en ARIMA-modell får du viss flexibilitet. För det första får den uppskattade MA 1-koefficienten vara Negativ motsvarar detta en utjämningsfaktor som är större än 1 i en SES-modell, vilket vanligtvis inte är tillåtet med SES-modellproceduren. För det andra har du möjlighet att inkludera en konstant term i t Han ARIMA-modell om du vill, för att uppskatta en genomsnittlig icke-noll-trend. ARIMA 0,1,1-modellen med konstant har förutsägelsesekvationen. Prognoserna för en period framåt från denna modell är kvalitativt lik SES Modell, förutom att banan för de långsiktiga prognoserna typiskt är en sluttande linje vars lutning är lika med mu i stället för en horisontell linje. ARIMA 0,2,1 eller 0,2,2 utan konstant linjär exponentiell utjämning Linjära exponentiella utjämningsmodeller Är ARIMA-modeller som använder två nonseasonal skillnader i samband med MA-termer. Den andra skillnaden i en serie Y är inte bara skillnaden mellan Y och sig självfördröjt med två perioder, men det är snarare den första skillnaden i den första skillnaden - förändringen - in-förändringen av Y vid period t Således är den andra skillnaden hos Y vid period t lika med Y t-Y t-1-Y t-1-Y t-2 Y t-2Y t-1 Y t -2 En andra skillnad av en diskret funktion är analog med ett andra derivat av en kontinuerlig funktion som den mäter Res accelerationen eller krökningen i funktionen vid en given punkt i tiden. ARIMA 0,2,2-modellen utan konstant förutspår att den andra skillnaden i serien motsvarar en linjär funktion av de två sista prognosfelen. Som kan omordnas som. Där 1 och 2 är MA 1 och MA 2-koefficienterna Detta är en generell linjär exponentiell utjämningsmodell som är väsentligen densamma som Holt s-modellen och Brown s-modellen är ett speciellt fall. Det använder exponentiellt vägda glidmedel för att uppskatta både en lokal nivå och en Lokal trend i serien De långsiktiga prognoserna från denna modell konvergerar till en rak linje vars lutning beror på den genomsnittliga trenden som observerats mot slutet av serien. ARIMA 1,1,2 utan konstant dämpad trend linjär exponentiell utjämning. Denna modell Illustreras i de bifogade bilderna på ARIMA-modellerna. Det extrapolerar den lokala trenden i slutet av serien men plattar ut den vid längre prognoshorisonter för att införa en konservatismedel, en övning som har empirisk stöd Se artikeln om Why the Damped Trend fungerar av Gardner och McKenzie och Golden Rule-artikeln från Armstrong et al för detaljer. Det är i allmänhet lämpligt att hålla sig till modeller där minst en av p och q inte är större än 1, det vill säga Försök inte passa in i en modell som ARIMA 2,1,2 eftersom det här sannolikt kommer att leda till överfitting och commonfactorproblem som diskuteras mer i detalj i anteckningarna om den matematiska strukturen för ARIMA-modeller. Som de beskrivna ovan är enkla att implementera på ett kalkylblad. Prediktionsekvationen är helt enkelt en linjär ekvation som refererar till tidigare värden av ursprungliga tidsserier och tidigare värden av felen. Således kan du ställa in ett ARIMA prognosräkningsblad genom att lagra data i kolumn A, prognosformeln i kolumn B och feldata minus prognoser i kolumn C Prognosformeln i en typisk cell i kolumn B skulle helt enkelt vara ett linjärt uttryck som hänvisar till värden i föregående rader av kolumnerna A och C Multipliceras med lämpliga AR - eller MA-koefficienter som lagras i celler på annat håll på kalkylbladet. Utvecklingsrörande medelvärde ARMA p, q Modeller för tidsserieanalys - Del 3.Detta är det tredje och sista inlägget i miniserien på Autoregressive Moving Average ARMA Modeller för tidsserieanalys Vi har introducerat autoregressiva modeller och rörande genomsnittsmodeller i de två tidigare artiklarna Nu är det dags att kombinera dem för att producera en mer sofistikerad modell. Det leder i slutändan till ARIMA - och GARCH-modellerna som gör att vi kan förutsäga Tillgångsavkastning och prognosvolatilitet Dessa modeller kommer att ligga till grund för handelssignaler och riskhanteringstekniker. Om du har läst del 1 och del 2 så kommer du att ha sett att vi tenderar att följa ett mönster för vår analys av en tidsseriemodell som jag ska upprepa Det kortfattat här. Rationale - Varför är vi intresserade av denna speciella modell. Definition - En matematisk definition för att minska tvetydigheten. Korrelogram - Plottar ett provkorrelogram till visuell Är en modell beteende. Simulering och montering - Montera modellen för simuleringar för att säkerställa att vi har förstått modellen korrekt. Riktiga finansiella data - Använd modellen till verkliga historiska tillgångspriser. Redovisning - Prognos efterföljande värden för att bygga handelssignaler eller filter . För att följa denna artikel är det lämpligt att ta en titt på de tidigare artiklarna om tidsserieanalys. De kan alla hittas här. Cayesian Information Criterion. In Del 1 i denna artikel ser vi på Akaike Information Criterion AIC som en Sätt att hjälpa oss att välja mellan separata bästa tidsseriemodeller. Ett nära relaterat verktyg är Bayesian Information Criterion BIC. I huvudsak har det liknande beteende för AIC genom att det bestraffar modeller för att ha för många parametrar. Detta kan leda till överfitting Skillnaden mellan BIC Och AIC är att BIC är strängare med dess bestraffning av ytterligare parametrar. Bayesian Information Criterion. If vi tar sannolikhetsfunktionen för en Statistisk modell som har k parametrar och L maximerar sannolikheten då Bayesian Information Criterion ges av. Där n är antalet datapunkter i tidsserierna. Vi använder AIC och BIC nedan när du väljer lämplig ARMA p, Q-modeller. Ljung-Box Test. In Del 1 i denna artikel berättar serien Rajan som nämns i Disqus att Ljung-Box-testet var mer lämpligt än att använda Akaike Information Criterion i Bayesian Information Criterion för att avgöra om en ARMA-modell var en bra Passar till en tidsserie. Ljung-Box-testet är ett klassiskt hypotesprov som är utformat för att testa om en uppsättning autokorrelationer av en anpassad tidsseriemodell skiljer sig avsevärt från noll. Testet testar inte varje enskild lag för slumpmässighet utan testar snarare Slumpmässigheten över en grupp av lags. Ljung-Box Test. We definierar nollhypotesen eftersom tidsseriedata vid varje lag är iid, det vill säga korrelationerna mellan befolkningsserievärdena är noll. Vi definierar E alternativa hypotesen eftersom tidsseriedata inte är iid och har seriell korrelation. Vi beräknar följande teststatistik Q. Var n är längden på tidsserieprovet, är h k samplingsautokorrelationen vid lag k och h är antalet Beslutsregeln om huruvida nollhypotesen ska avvisas är att kontrollera om Q chi 2, för en chi-kvadrerade fördelning med h grader av frihet vid 100 1 alfa procenten. Närmare detaljer om testet Kan verka lite komplexa, vi kan faktiskt använda R för att beräkna testet för oss, förenkla proceduren något. Utanvändande rörliga genomsnittliga ARMA-modeller av order p, q. Nu när vi har diskuterat BIC och Ljung-Box-testet återkommer vi Redo att diskutera vår första blandade modell, nämligen det autoregressiva rörliga genomsnittsvärdet av order p, q eller ARMA p, q. Till dags dato har vi ansett autogegressiva processer och rörliga genomsnittsprocesser. Den tidigare modellen anser sitt eget tidigare beteende som ingångar för modellen Och som sådana försök För att fånga marknadsaktörseffekter, såsom momentum och medelåtervändning i aktiehandel. Den senare modellen används för att karakterisera chockinformation till en serie, till exempel en överraskningsintäktsmeddelande eller en oväntad händelse som BP Deepwater Horizon oljeutsläpp. En ARMA-modell försöker fånga båda dessa aspekter vid modellering av ekonomiska tidsserier. Notera att en ARMA-modell inte tar hänsyn till volatilitetsgruppering, ett viktigt empiriskt fenomen i många finansiella tidsserier. Det är inte en villkorligt heteroscedastisk modell. För det behöver vi Att vänta på ARCH - och GARCH-modellerna. ARMA p, q-modellen är en linjär kombination av två linjära modeller och är således fortfarande linjär. Autoregressiv rörlig genomsnittsmodell av order p, qA tidsseriemodell, är en autoregressiv rörlig genomsnittsmodell Av ordning p, q ARMA p, q, om. Börja xt alfa1 x alfa2 x ldot wt beta1 w beta2 w ldots betaq w ände. Vart är vitt brus med E wt 0 och varians sigma 2.Om vi ​​betraktar Backward Shift Operator, se en tidigare artikel då kan vi skriva om ovanstående som en funktion Theta och phi of. We kan enkelt se det genom att ställa p neq 0 och q 0 vi återställer AR p-modellen. Om vi ​​ställer in p 0 och q neq 0 återställer vi MA q-modellen. En av huvudfunktionerna i ARMA-modellen Är att den är parsimonisk och redundant i dess parametrar Det är en ARMA-modell som ofta kräver färre parametrar än en AR p eller MA q-modell ensam. Dessutom kan vi skriva om ekvationen när det gäller BSO, då kan theta och phi-polynomerna Dela ibland en gemensam faktor, vilket leder till en enklare modell. Simuleringar och korrelogram. Som med de autogegressiva och rörliga genomsnittsmodellerna kommer vi nu simulera olika ARMA-serier och försök sedan passa ARMA-modeller till dessa realisationer. Vi bär ut det här eftersom vi vill Se till att vi förstår Anpassningsförfarandet, inklusive hur man beräknar konfidensintervaller för modellerna samt säkerställa att förfarandet faktiskt återställer rimliga uppskattningar för de ursprungliga ARMA-parametrarna. I del 1 och del 2 konstruerade vi manuellt AR - och MA-serien genom att dra N-prov Från en normal fördelning och sedan tillverka den specifika tidsseriemodellen med hjälp av lags av dessa prover. Men det finns ett enklare sätt att simulera AR, MA, ARMA och till och med ARIMA-data, helt enkelt genom att använda metoden i R. Låt oss börja med Den enklaste möjliga icke-triviala ARMA-modellen, nämligen ARMA 1,1-modellen Det är en autogegressiv modell av order en kombinerad med en rörlig genomsnittsmodell av order en sådan modell har endast två koefficienter, alfa och beta som representerar den första Lags av tidsserierna själv och de chocka vita ljudvillkoren En sådan modell ges av. Vi måste ange koefficienterna före simuleringen Låt oss ta alfa 0 5 och beta -0 5.Utgången är enligt följande. Realisering o F en ARMA 1,1 modell, med alfa 0 5 och beta 0 5.Let s också plotta correlogram. Correlogram av en ARMA 1,1 modell med alfa 0 5 och beta 0 5.Vi kan se att det inte finns någon signifikant Autokorrelation som kan förväntas från en ARMA 1,1-modell. Låt oss försöka bestämma koefficienterna och deras standardfel med hjälp av arima-funktionen. Vi kan beräkna konfidensintervallerna för varje parameter med hjälp av standardfel. Förtroendeintervallen Innehåller de sanna parametervärdena för båda fallen, men vi bör notera att de 95 konfidensintervallerna är väldigt stora en följd av de rimligt stora standardfel. Det är nu en ARMA 2,2-modell. Det vill säga en AR 2-modell kombinerad med En MA 2-modell Vi måste ange fyra parametrar för denna modell alpha1, alpha2, beta1 och beta2 Låt oss ta alfa1 0 5, alpha2 -0 25 beta1 0 5 och beta2 -0 3.Utgången från vår ARMA 2,2-modell är Som följer. Realisering av en ARMA 2,2-modell, med alfa1 0 5, alfa2 -025, beta1O5 och beta2 - 0 3.And motsvarande autokorrelation. Korrelogram av en ARMA 2,2-modell, med alfa1 0 5, alfa2 -0 25, beta1 05 och beta2 -0 3.Vi kan nu försöka montera en ARMA 2,2-modell på data . Vi kan också beräkna konfidensintervallerna för varje parameter. Notera att konfidensintervallet för koefficienterna för den rörliga genomsnittliga komponenten beta1 och beta2 inte innehåller det ursprungliga parametervärdet. Här beskrivs risken att försöka anpassa modeller till data, även när Vi vet de sanna parametervärdena. För handelsändamål behöver vi bara ha en prediktiv kraft som överstiger chansen och ger tillräckligt med vinst över transaktionskostnaderna för att vara lönsam på lång sikt. Nu har vi sett några exempel på simulerade ARMA-modeller behöver vi mekanism för att välja värdena på p och q när de anpassas till modellerna till verkliga ekonomiska data. Hos den bästa ARMA-p, q-modellen. För att bestämma vilken ordning p, q av ARMA-modellen är lämplig för en serie , Vi måste använda AIC eller BIC över en delmängd av värden för p, q, och använd sedan Ljung-Box-testet för att bestämma om en bra passform har uppnåtts, för speciella värden p, q. För att visa denna metod ska vi först simulera en Särskild ARMA p, q process Vi släpper sedan över alla parvisa värden på p in och q in och beräknar AIC Vi väljer modellen med lägsta AIC och kör sedan ett Ljung-Box-test på rester för att avgöra om vi har uppnått En bra passform. Börja med att simulera en ARMA 3,2-serie. Vi ska nu skapa ett objekt som är slutligt för att lagra den bästa modellens passform och lägsta AIC-värde. Vi slår över de olika p, q-kombinationerna och använder det aktuella objektet för att lagra Passar i en ARMA i j-modell för loopingvariablerna i och j. Om den nuvarande AIC är mindre än någon tidigare beräknad AIC ställer vi den slutliga AIC-en till det aktuella värdet och väljer den ordningen Vid avslutning av slingan har vi ordern Av ARMA-modellen lagrad i och ARIMA p, d, q anpassar sig till den integrerade d-komponenten som är inställd på 0 lagras as. Let s matar ut AIC-, order - och ARIMA-koefficienterna. Vi kan se att den ursprungliga ordningen för den simulerade ARMA-modellen återställdes, nämligen med p 3 och q 2. Vi kan plotta korelogrammet av resterna av modellen för att se Om de ser ut som en realisering av diskret vitt brus DWN. Correlogram av resterna av den bästa passande ARMA p, q-modellen, p 3 och q 2. Körelogrammet ser verkligen ut som en realisering av DWN Slutligen utför vi Ljung-Box Test för 20 lags för att bekräfta detta. Notera att p-värdet är större än 0 05, vilket säger att resterna är oberoende på 95-nivå och sålunda ger en ARMA 3,2-modell en bra modellpassning. Klart bör detta vara Fallet sedan vi har simulerat data själva Men det här är just det procedur vi ska använda när vi kommer att passa ARMA p, q modeller till S P500-indexet i följande avsnitt. Finansiella data. Nu har vi redogjort för proceduren för val Den optimala tidsseriemodellen för en simulerad serie är ganska snäv Ghtforward att tillämpa den på finansiella data För det här exemplet kommer vi återigen att välja S P500 US Equity Index. Vi laddar ner de dagliga slutkurserna med hjälp av quantmod och skapar sedan loggen returnerar strömmen. Gör så att du utför samma passningsförfarande som för Den simulerade ARMA 3,2-serien ovan på loggen returnerar serien av S P500 med hjälp av AIC. Den bästa monteringsmodellen har ordning ARMA 3,3. Låt s plotta resterna av den monterade modellen till S P500-loggen dagliga returströmmen. Korrelogram av resterna av den bästa passande ARMA p, q-modellen, p 3 och q 3, till S P500 dagliga loggen returnerar ström. Notera att det finns några signifikanta toppar, särskilt vid högre lags Detta är en indikation på dålig passform Låt s Utföra ett Ljung-Box-test för att se om vi har statistiska bevis för detta. Som vi misstänkte är p-värdet mindre än 0 05 och som sådan kan vi inte säga att rester är en realisering av diskret vitt brus. Därför finns ytterligare autokorrelation I de rester som inte förklaras av Monterad ARMA 3,3 modell. Som vi har diskuterat hela tiden i den här artikelserien har vi sett bevis på betingad heteroscedasticitetsvolatilitetsklypning i S P500-serien, särskilt under perioderna 2007-2008 När vi använder en GARCH-modell senare i artikeln Serier vi ser hur man eliminerar dessa autokorrelationer. I praktiken är ARMA-modellerna i allmänhet aldrig bra passar för återgången till loggar. Vi måste ta hänsyn till den betingade heteroscedasticiteten och använda en kombination av ARIMA och GARCH. I nästa artikel kommer vi att överväga ARIMA och visa hur Den integrerade komponenten skiljer sig från den ARMA-modell som vi har funderat i denna artikel. Bara att komma igång med kvantitativ handel.

No comments:

Post a Comment