Monday, October 24, 2016

Bewegende gemiddelde glad tydreekse

Vooruitskatting deur gladstrykingstegnieke Hierdie webwerf is 'n deel van die JavaScript E-laboratoriums leer voorwerpe vir besluitneming. Ander JavaScript in hierdie reeks is verdeel onder verskillende gebiede van aansoeke in die menu artikel op hierdie bladsy. 'N tyd-reeks is 'n reeks waarnemings wat bestel betyds. Inherent in die versameling van data geneem met verloop van tyd is 'n vorm van ewekansige variasie. Daar bestaan ​​metodes vir die vermindering van van die kansellasie van die effek as gevolg van ewekansige variasie. Gebruikte tegnieke is glad. Hierdie tegnieke, wanneer dit behoorlik toegepas word, blyk duidelik die onderliggende tendense. Tik die tydreeks Ry-wyse in volgorde, vanaf die linker-boonste hoek, en die parameter (s), dan op die Bereken knoppie vir die verkryging van een tydperk lig vooruitskatting. Leeg bokse is nie ingesluit in die berekeninge, maar nulle is. In die begin van jou data om te beweeg van sel tot sel in die data-oorsig gebruik die Tab-sleutel nie arrow of betree sleutels. Kenmerke van tydreekse, wat geopenbaar kan word deur die ondersoek van die grafiek. met die geskatte waardes, en die residue gedrag, toestand voorspelling modelle. Bewegende gemiddeldes: bewegende gemiddeldes rang onder die gewildste tegnieke vir die preprocessing van tydreekse. Hulle word gebruik om ewekansige wit geraas filter uit die data, om die tydreeks gladder te maak of selfs om sekere inligting komponente vervat in die tydreeks te beklemtoon. Eksponensiële Smoothing: Dit is 'n baie gewilde skema om 'n reëlmatige Tyd Reeks produseer. Terwyl dit in Bewegende Gemiddeldes die afgelope waarnemings word dieselfde gewig, eksponensiële Smoothing ken eksponensieel afneem gewigte as die waarneming ouer. Met ander woorde, is Onlangse waarnemings gegee relatief meer gewig in vooruitskatting as die ouer waarnemings. Double Eksponensiële Smoothing is beter op tendense hantering. Drie Eksponensiële Smoothing beter te hanteer parabool tendense. 'N exponenentially geweeg bewegende gemiddelde met 'n glad konstante a. ooreenstem rofweg 'n eenvoudige bewegende gemiddelde lengte (bv tydperk) n, waar n en N verwant deur: 'n 2 / (N1) of N (2 - a) / n. So, byvoorbeeld, 'n exponenentially geweeg bewegende gemiddelde met 'n glad konstante gelyk aan 0,1 sou rofweg ooreen met 'n 19 dag bewegende gemiddelde. En 'n 40-dag eenvoudig bewegende gemiddelde sou rofweg ooreen met 'n eksponensieel geweeg bewegende gemiddelde met 'n glad konstante gelyk aan 0,04878. Holts Lineêre Eksponensiële Smoothing: Veronderstel dat die tydreeks is nie-seisoenale maar wel vertoon tendens. Holts metode skat beide die huidige vlak en die huidige tendens. Let daarop dat die eenvoudige bewegende gemiddelde is spesiale geval van die eksponensiële gladstryking deur die oprigting van die tydperk van die bewegende gemiddelde van die heelgetal deel van (2-Alpha) / Alpha. Vir die meeste sake-data 'n Alpha parameter kleiner as 0.40 is dikwels doeltreffend. Dit kan egter 'n mens 'n rooster op soek na die parameter ruimte uit te voer, met 0,1-0,9, met inkremente van 0.1. Toe het die beste alfa die kleinste gemiddelde absolute fout (MA Fout). Hoe om 'n paar glad metodes te vergelyk: Alhoewel daar numeriese aanwysers vir die beoordeling van die akkuraatheid van die voorspelling tegniek, die mees benadering is in die gebruik van visuele vergelyking van verskeie voorspellings oor die akkuraatheid daarvan te evalueer en kies tussen die verskillende vooruitskatting metodes. In hierdie benadering, moet 'n mens stip op dieselfde grafiek die oorspronklike waardes van 'n tydreeks veranderlike en die voorspelde waardes van verskillende vooruitskatting metodes (met behulp van, bv Excel), dus 'n visuele vergelyking fasilitering. Jy kan hou die gebruik van die verlede Voorspellings deur gladstrykingstegnieke JavaScript om die verlede voorspel waardes gebaseer op gladstrykingstegnieke dat slegs enkele parameter gebruik te verkry. Holt, en winters metodes gebruik twee en drie parameters, onderskeidelik, dus is dit nie 'n maklike taak om die optimale, of selfs naby optimale waardes kies deur probeer-en foute vir die parameters. Die enkele eksponensiële gladstryking beklemtoon die kort reeks perspektief dit stel die vlak van die laaste waarneming en is gebaseer op die voorwaarde dat daar geen tendens. Die lineêre regressie, wat 'n lyn van kleinste kwadrate op die historiese data (of omskep historiese data) pas, stel die lang reeks, wat gekondisioneer op die basiese tendens. Holts lineêre eksponensiële gladstryking vang inligting oor onlangse tendens. Die parameters in Holts model is vlakke-parameter wat moet verminder word wanneer die hoeveelheid data wat variasie is groot, en tendense-parameter moet verhoog word indien die onlangse tendens rigting word ondersteun deur die oorsaaklike paar faktore. Korttermyn vooruitskatting: Let daarop dat elke JavaScript op hierdie bladsy bied 'n een-stap-ahead skatting. Om 'n twee-stap-ahead voorspelling te kry. eenvoudig die geskatte waarde toevoeg tot die einde van jou tydreeksdata en kliek dan op dieselfde Bereken knoppie. Jy kan hierdie proses herhaal vir 'n paar keer om die nodige kort termyn forecasts. Moving Gemiddelde Hierdie voorbeeld leer jy hoe om die bewegende gemiddelde van 'n tydreeks in Excel bereken verkry. 'N bewegende avearge gebruik te stryk onreëlmatighede (pieke en dale) om maklik tendense herken. 1. In die eerste plek kan 'n blik op ons tyd reeks. 2. Klik op die blad Data, kliek Data-analise. Nota: cant vind die Data-analise knoppie Klik hier om die analise ToolPak add-in te laai. 3. Kies bewegende gemiddelde en klik op OK. 4. Klik op die insette Range boks en kies die reeks B2: M2. 5. Klik op die boks interval en tik 6. 6. Klik in die uitset Range boks en kies sel B3. 8. Teken 'n grafiek van hierdie waardes. Verduideliking: omdat ons die interval stel om 6, die bewegende gemiddelde is die gemiddeld van die vorige 5 datapunte en die huidige data punt. As gevolg hiervan, is pieke en dale stryk uit. Die grafiek toon 'n toenemende tendens. Excel kan nie bereken die bewegende gemiddelde vir die eerste 5 datapunte, want daar is nie genoeg vorige datapunte. 9. Herhaal stappe 2 tot 8 vir interval 2 en interval 4. Gevolgtrekking: Hoe groter die interval, hoe meer die pieke en dale is glad nie. Hoe kleiner die interval, hoe nader die bewegende gemiddeldes is om die werklike data punte. Hou jy van hierdie gratis webwerf Deel asseblief hierdie bladsy op GoogleIn oefen die bewegende gemiddelde sal 'n goeie raming van die gemiddelde van die tydreeks te verskaf indien die gemiddelde konstant of stadig verander. In die geval van 'n konstante gemiddelde, sal die grootste waarde van m die beste raming van die onderliggende gemiddelde gee. 'N langer tydperk waarneming sal gemiddeld uit die gevolge van variasie. Die doel van die verskaffing van 'n kleiner m is om voorsiening te maak die voorspelling om te reageer op 'n verandering in die onderliggende proses. Om te illustreer, stel ons 'n datastel wat veranderinge in die onderliggende gemiddelde van die tydreeks inkorporeer. Die figuur toon die tyd reeks gebruik ter illustrasie saam met die vraag gemiddelde waaruit die reeks was gegenereer. Die gemiddelde begin as 'n konstante by 10. Vanaf die tyd 21, verhoog dit met 'n eenheid in elke tydperk totdat dit die waarde van 20 ten tye 30. bereik Dan weer konstant raak dit. Die data word gesimuleer deur die byvoeging van die gemiddelde, 'n ewekansige geluid van 'n normale verspreiding met 'n nul gemiddelde en standaardafwyking 3. Die resultate van die simulasie is afgerond tot die naaste heelgetal. Die tabel toon die gesimuleerde Waarnemings wat gebruik word vir die voorbeeld. Wanneer ons die tafel gebruik, moet ons onthou dat op enige gegewe tyd, word slegs die afgelope data bekend. Die raming van die model parameter, vir drie verskillende waardes van m word saam met die gemiddelde van die tydreeks in die figuur hieronder. Die figuur toon die bewegende gemiddelde skatting van die gemiddelde by elke keer en nie die voorspelling. Die vooruitskattings sal die bewegende gemiddelde kurwes skuif na regs deur periodes. Een gevolgtrekking is onmiddellik duidelik uit die figuur. Vir al drie skattings loop die bewegende gemiddelde agter die lineêre tendens, met die lag verhoog met m. Die lag is die afstand tussen die model en die raming in die tydsdimensie. As gevolg van die lag, die bewegende gemiddelde onderskat die waarnemings as die gemiddelde is aan die toeneem. Die vooroordeel van die beramer is die verskil op 'n spesifieke tyd in die gemiddelde waarde van die model en die gemiddelde waarde voorspel deur die bewegende gemiddelde. Die vooroordeel wanneer die gemiddelde is aan die toeneem is negatief. Vir 'n dalende gemiddelde, die vooroordeel is positief. Die vertraging in die tyd en die vooroordeel wat in die raming is funksies van m. Hoe groter die waarde van m. hoe groter die omvang van die lag en vooroordeel. Vir 'n voortdurend toenemende reeks met tendens a. die waardes van die lag en vooroordeel van die beramer van die gemiddelde is in die onderstaande vergelykings. Die voorbeeld krommes stem nie ooreen hierdie vergelykings omdat die voorbeeld model is nie voortdurend aan die toeneem, eerder dit begin as 'n konstante, veranderinge aan 'n tendens en dan weer word konstant. Ook die voorbeeld krommes geraak word deur die lawaai. Die bewegende gemiddelde voorspelling van periodes in die toekoms word verteenwoordig deur die verskuiwing van die kromme na regs. Die lag en vooroordeel te verhoog proporsioneel. Die onderstaande vergelykings dui die lag en vooroordeel van 'n voorspelling tydperke in die toekoms in vergelyking met die model parameters. Weereens, hierdie formules is vir 'n tyd reeks met 'n konstante lineêre tendens. Ons moet nie verbaas wees oor die resultaat wees. Die bewegende gemiddelde beramer is gebaseer op die aanname van 'n konstante gemiddelde, en die voorbeeld het 'n liniêre tendens in die gemiddelde tydens 'n gedeelte van die studietydperk. Sedert real time reeks sal selde presies die aannames van enige model te gehoorsaam, moet ons bereid wees om vir sulke resultate. Ons kan ook aflei uit die figuur dat die variasie van die geraas het die grootste effek vir kleiner m. Die skatting is baie meer wisselvallig vir die bewegende gemiddelde van 5 as die bewegende gemiddelde van 20. Ons het die botsende begeertes te m verhoog die effek van variasie te verminder as gevolg van die geraas, en om m te verminder die voorspelling meer reageer op veranderinge aan te bring in die gemiddelde. Die fout is die verskil tussen die werklike data en die geskatte waarde. As die tyd reeks is werklik 'n konstante waarde van die verwagte waarde van die fout is nul en die variansie van die fout bestaan ​​uit 'n term wat 'n funksie is van en 'n tweede termyn wat die variansie van die geraas,. Die eerste kwartaal is die variansie van die gemiddelde geskatte met 'n monster van m waarnemings, die aanvaarding van die data kom uit 'n bevolking met 'n konstante gemiddelde. Hierdie term word tot die minimum beperk deur m so groot as moontlik. 'N Groot m maak die voorspelling nie reageer op 'n verandering in die onderliggende tydreekse. Die voorspelling reageer op veranderinge aan te bring, wil ons m so klein as moontlik (1), maar dit verhoog die foutvariansie. Praktiese vooruitskatting vereis 'n intermediêre waarde. Vooruitskatting met Excel Die vooruitskatting add-in implemente die bewegende gemiddelde formules. Die voorbeeld hieronder toon die analise wat deur die byvoeging in vir die voorbeeld van die data in kolom B. Die eerste 10 waarnemings word geïndekseer -9 deur 0. In vergelyking met die tabel hierbo, is die tydperk indekse verskuif deur -10. Die eerste tien Waarnemings verskaf die begin waardes vir die beraming en gebruik word om die bewegende gemiddelde vir tydperk 0. Die MA (10) kolom (C) toon die berekende bewegende gemiddeldes te bereken. Die bewegende gemiddelde parameter m is in sel C3. Vore (1) kolom (D) toon 'n voorspelling vir een periode na die toekoms. Die voorspelling interval is in sel D3. Wanneer die voorspelling interval verander word na 'n groter aantal van die getalle in die kolom vore geskuif af. Die kolom Fout (1) (e) toon die verskil tussen die waarneming en die voorspelling. Byvoorbeeld, die waarneming by die tyd 1 is 6. Die geskatte waarde uit die bewegende gemiddelde op tydstip 0 is 11.1. Die fout dan is -5,1. Die gemiddeldes en standaardafwykings Gemiddelde Afwyking (MAD) word bereken in selle E6 en E7 respectively. Smoothing data verwyder ewekansige variasie en programme tendense en sikliese komponente inherent in die versameling van data geneem met verloop van tyd is 'n vorm van ewekansige variasie. Daar bestaan ​​metodes vir die vermindering van van die kansellasie van die effek as gevolg van ewekansige variasie. 'N dikwels gebruikte tegniek in bedryf is glad. Hierdie tegniek, wanneer dit behoorlik toegepas word, blyk duidelik die onderliggende tendens, seisoenale en sikliese komponente. Daar is twee afsonderlike groepe glad metodes Berekening van gemiddelde metodes Eksponensiële Smoothing Metodes Neem gemiddeldes is die eenvoudigste manier om data te stryk Ons sal eers ondersoek sommige gemiddelde metodes, soos die eenvoudige gemiddeld van al die afgelope data. 'N Bestuurder van 'n pakhuis wil weet hoeveel 'n tipiese verskaffer lewer in 1000 dollar eenhede. Hy / sy neem 'n monster van 12 verskaffers, na willekeur, die verkryging van die volgende resultate: Die berekende gemiddelde of gemiddeld van die data 10. Die bestuurder besluit om dit te gebruik as die skatting vir uitgawes van 'n tipiese verskaffer. Is dit 'n goeie of slegte skat Gemiddelde kwadraat fout is 'n manier om te oordeel hoe goed 'n model is Ons sal bereken die gemiddelde kwadraat fout. Die fout ware bedrag wat minus die beraamde bedrag. Die fout vierkant is die fout hierbo, vierkantig. Die SSE is die som van die gekwadreerde foute. Die MSE is die gemiddeld van die kwadraat foute. MSE lei byvoorbeeld Die uitslae is: Fout en gekwadreerde foute Die raming 10 Die vraag ontstaan: kan ons gebruik maak van die gemiddelde inkomste voorspel as ons vermoed dat 'n tendens 'n blik op die grafiek hieronder toon duidelik dat ons nie dit sou doen. Gemiddeld weeg al verlede Waarnemings ewe In opsomming, ons verklaar dat die eenvoudige gemiddelde of gemiddeld van al verlede waarnemings is net 'n nuttige skatting vir vooruitskatting wanneer daar geen tendense. As daar tendense, gebruik verskillende skattings dat die tendens in ag neem. Die gemiddelde weeg al verlede Waarnemings ewe. Byvoorbeeld, die gemiddelde van die waardes 3, 4, 5 is 4. Ons weet natuurlik dat 'n gemiddelde word bereken deur die toevoeging van al die waardes en die som te deel deur die aantal waardes. Nog 'n manier van berekening van die gemiddelde is deur die byvoeging van elke waarde gedeel deur die aantal waardes, of 3/3 4/3 5/3 1 1,3333 1,6667 4. Die vermenigvuldiger 1/3 is die gewig genoem. In die algemeen: bar frac som links (frac regs) x1 links (frac regs) x2,. ,, Links (frac regs) xn. Die (links (frac regs)) is die gewigte en, natuurlik, hulle vat om 1.5.2 Smoothing Tyd Reeks Smoothing word gewoonlik gedoen om ons te help patrone, tendense beter sien byvoorbeeld in tydreekse. Oor die algemeen glad die onreëlmatige ruheid om 'n duideliker sein sien. Vir seisoenale data, kan ons glad die seisoen, sodat ons die tendens kan identifiseer. Glad nie die geval is voorsien ons met 'n model, maar dit kan 'n goeie eerste stap in die beskrywing van die verskillende komponente van die reeks wees. Die term filter word soms gebruik om 'n glad prosedure beskryf. Byvoorbeeld, as die stryk waarde vir 'n bepaalde tyd word bereken as 'n lineêre kombinasie van waarnemings vir omliggende keer, dit kan gesê word dat weve toegepas n lineêre filter om die data (nie dieselfde as om te sê die resultaat is 'n reguit lyn, deur die manier). Die tradisionele gebruik van die term bewegende gemiddelde is dat by elke punt in die tyd wat ons bepaal (moontlik geweegde) gemiddeldes van waargenome waardes wat 'n bepaalde tyd omring. Byvoorbeeld, op tyd t. 'n gesentreerde bewegende gemiddelde lengte 3 met gelyke gewigte sal die gemiddelde waardes by tye t -1. t. en T1. Om seisoenaliteit weg te neem van 'n reeks, sodat ons kan beter sien tendens, sou ons 'n bewegende gemiddelde met 'n lengte seisoenale span gebruik. So in die stryk reeks, het elk stryk waarde is gemiddeld oor alle seisoene. Dit kan gedoen word deur te kyk na 'n eensydige bewegende gemiddelde waarin jy gemiddeld alle waardes vir die vorige jaar se data of 'n gesentreerde bewegende gemiddelde waarin jy waardes gebruik beide voor en na die huidige tyd. Vir kwartaallikse data, byvoorbeeld, ons kan 'n reëlmatige waarde vir tyd t as definieer (x t x t-1 x T-2 x t-3) / 4, die gemiddelde van hierdie tyd en die vorige 3/4. In R-kode sal dit 'n eensydige filter wees. A-gesentreerde bewegende gemiddelde skep 'n bietjie van 'n probleem wanneer ons 'n ewe getal van tydperke in die seisoenale span (soos ons gewoonlik doen). Om weg te stryk seisoenaliteit in kwartaallikse data. ten einde tendens te identifiseer, die gewone konvensie is om die bewegende gemiddelde stryk op tydstip t is om weg te stryk seisoenaliteit in maandelikse data gebruik. ten einde tendens te identifiseer, die gewone konvensie is om die bewegende gemiddelde stryk op tydstip t is wat deur gebruik gewig 1/24 pas ons om waardes by tye T6 en T6 en gewig 12/01 alle waardes te alle tye tussen T5 en T5. In die opdrag R filter, sowel spesifiseer 'n twee-sided filter wanneer ons wil waardes wat kom beide voor en na die tyd waarvoor was glad gebruik. Let daarop dat op bladsy 71 van ons boek, die skrywers gelyk gewigte van toepassing oor 'n gesentreerde seisoenale bewegende gemiddelde. Dis okay ook. Byvoorbeeld, kan 'n kwartaallikse gladder word stryk op tydstip t is frac x frac x frac xt frac x frac x A maandelikse gladder kan 'n gewig van 1/13 van toepassing op alle waardes van tye t-6 tot T6. Die kode van die skrywers gebruik op bladsy 72 maak gebruik van 'n rep bevel dat 'n waarde herhaal 'n sekere aantal kere. Hulle hoef te gebruik die parameter filter binne die opdrag filter. Voorbeeld 1 Kwartaallikse Beer Produksie in Australië in beide Les 1 en Les 4, het ons gekyk na 'n reeks kwartaallikse bier produksie in Australië. Die volgende R-kode skep 'n reëlmatige reeks waarmee ons sien die tendens patroon, en plotte hierdie tendens patroon op dieselfde grafiek as die tyd reeks. Die tweede opdrag skep en stoor die stryk reeks in die voorwerp genoem trendpattern. Let daarop dat binne die opdrag filter, die parameter genoem filter gee die koëffisiënte vir ons glad en kante 2 veroorsaak dat 'n gesentreerde glad te bereken. beerprod skandering (beerprod. dat) trendpattern filter (beerprod, filter c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) plot (beerprod, Tipe B, hoof bewegende gemiddelde jaarlikse tendens ) lyne (trendpattern) Hier is die resultaat: Ons kan die tendens patroon van die datawaardes trek om 'n beter blik op die seisoen kry. Hier is hoe dit sou gebeur: seasonals beerprod - trendpattern plot (seasonals, Tipe B, hoof seisoenale patroon vir bier produksie) Die resultaat volg: Nog 'n moontlikheid vir glad reeks tendens sien is die eensydige filter trendpattern2 filter (beerprod, filter c (1/4, 1/4, 1/4, 1/4), sides1) Met hierdie, die stryk waarde is die gemiddeld van die afgelope jaar. Voorbeeld 2. VS Maandeliks werkloosheid in die huiswerk vir week 4 jy kyk na 'n maandelikse reeks VSA Werkloosheid vir 1948-1978. Hier is 'n smoothing gedoen om te kyk na die tendens. trendunemployfilter (werkloos, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, 1 / 12,1 / 24), sides2) trendunemploy ts (trendunemploy, begin c (1948,1), freq 12) plot (trendunemploy, mainTrend in die VSA Werkloosheid, 1948-1978, XLab Jaar) Slegs die reëlmatige tendens is geplot. Die tweede opdrag identifiseer die kalender tyd kenmerke van die reeks. Dit maak die plot het 'n meer betekenisvolle as. Die plot volg. Vir nie-seisoenale reeks, Arent jy gebind te stryk oor 'n spesifieke span. Vir glad moet jy eksperimenteer met bewegende gemiddeldes van verskillende strek. Diegene strek van die tyd kan relatief kort wees. Die doel is om af te klop die ruwe kante om te sien wat tendens of patroon daar mag wees. Ander Smoothing Metodes (Afdeling 2.4) Afdeling 2.4 beskryf verskeie gesofistikeerde en nuttige alternatiewe vir bewegende gemiddelde glad. Die besonderhede kan oppervlakkig lyk, maar dis okay, want ons dont wil kry vasgeval in baie besonderhede vir diegene metodes. Van die alternatiewe metodes in Afdeling 2.4 beskryf, kan lowess (plaaslik geweeg regressie) die mees algemeen gebruik. Voorbeeld 2 Voortgesette Die volgende plot is glad tendens lyn vir die VSA Werkloosheid reeks, bevind die gebruik van 'n lowess gladder waarin 'n aansienlike bedrag (2/3) het bygedra tot elke stryk skatting. Let daarop dat hierdie stryk die reeks meer aggressief as die bewegende gemiddelde. Die opdragte gebruik is werkloos ts (werkloos, begin c (1948,1), freq12) plot (lowess (werkloos, f 2/3), hoof Lowess smoothing van die Amerikaanse Werkloosheid Trend) Enkellopend Eksponensiële glad die basiese vooruitskatting vergelyking vir enkele eksponensiële gladstryking Daar word dikwels gegee as hoed Alpha xt (1-alfa) hoed t teks Ons voorspel die waarde van x in die tyd T1 'n geweegde kombinasie van die waargeneem waarde op tydstip t en die geskatte waarde op tydstip t wees. Hoewel die metode 'n glad metode, staan ​​bekend as die hoofsaaklik gebruik word vir 'n kort termyn vooruitskatting. Die waarde van die smoothing konstante genoem. Vir een of ander rede, 0.2 is 'n gewilde verstek keuse van programme. Dit plaas 'n gewig van 0,2 op die mees onlangse waarneming en 'n gewig van 1 0,2 0,8 op die mees onlangse skatting. Met 'n relatief klein waarde van, sal die smoothing relatief meer uitgebreide wees. Met 'n relatief groot waarde van die smoothing is relatief minder uitgebreide as meer gewig op die waargenome waarde gestel sal word. Dit is eenvoudig 'n stap vorentoe vooruitskatting metode wat met die eerste oogopslag blyk 'n model vir die data nie nodig. Trouens, hierdie metode is soortgelyk aan die gebruik van 'n ARIMA (0,1,1) model met geen konstante. Die optimale proses is om 'n ARIMA (0,1,1) model om die waargenome dataset pas en gebruik die resultate om die waarde van vas. Dit is 'n optimale in die sin van die skep van die beste vir die reeds waargeneem data. Alhoewel die doel is glad en 'n stap vorentoe voorspel, die ekwivalensie van die ARIMA (0,1,1) model bring 'n goeie punt. Ons behoort nie blindelings toepassing eksponensiële gladstryking omdat die onderliggende proses nie goed kan beskryf deur 'n ARIMA (0,1,1). ARIMA (0,1,1) en Eksponensiële Smoothing Ekwivalensie Oorweeg 'n ARIMA (0,1,1) met gemiddelde 0 vir die eerste verskille, xt - x t-1: begin hoed amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1hat geneig. As ons toelaat dat (1 1) en dus - (1) 1, sien ons die ekwivalensie vergelyking (1) hierbo. Hoekom die metode staan ​​bekend as eksponensiële Smoothing Dit lewer die volgende: begin hoed amp amp Alpha xt (1-alfa) Alpha X (1-alfa) hoed amp amp Alpha xt alfa (1-alfa) x (1-alfa) 2hat einde voort in hierdie mode deur agtereenvolgens vervang vir die geskatte waarde aan die regterkant van die vergelyking. Dit lei tot: hoed Alpha xt alfa (1-alfa) x alfa (1-alfa) 2 x kolle alfa (1-alfa) JX kolle alfa (1-alfa) x1 teks vergelyking 2 toon dat die voorspelde waarde is 'n geweegde gemiddelde van alle afgelope waardes van die reeks, met eksponensieel verander gewigte soos ons beweeg terug in die reeks. Optimale Eksponensiële Smoothing in R Eintlik het ons net pas 'n ARIMA (0,1,1) om die data en bepaal die koëffisiënt. Ons kan die pas van die gladde ondersoek deur 'n vergelyking van die voorspelde waardes van die werklike reeks. Eksponensiële gladstryking is geneig om meer as 'n voorspelling instrument as 'n ware gladder te gebruik, so soek om te sien of ons 'n goeie passing. Voorbeeld 3. N 100 maandelikse waarnemings van die logaritme van 'n olie-prysindeks in die Verenigde State van Amerika. Die data-reeks is: 'n ARIMA (0,1,1) pas in R het 'n MA (1) koëffisiënt 0,3877. So (1 1) 1,3877 en 1- -0,3877. Die eksponensiële gladstryking vooruitskatting vergelyking hoed 1.3877xt - 0.3877hat t Ten tye 100, die waargenome waarde van die reeks is x 100 0,86601. Die voorspelde waarde vir die reeks op daardie tydstip is dus die voorspelling vir die tyd 101 is hoed 1.3877x - 0.3877hat 1,3877 (0,86601) -0,3877 (0,856789) 0,8696 aanleiding is hoe goed die gladder pas die reeks. Dit is 'n goeie passing. Dis 'n goeie teken vir vooruitskatting, die hoofdoel van hierdie gladder. Hier is die instruksies wat gebruik word om die uitset vir hierdie voorbeeld te genereer: oilindex skandering (oildata. dat) plot (oilindex, Tipe B, hoof log olie-indeks Series) expsmoothfit ARIMA (oilindex, sodat c (0,1,1)) expsmoothfit om die ARIMA resultate sien predicteds oilindex - expsmoothfitresiduals voorspelde waardes plot (oilindex, typeb, hoof eksponensiële smoothing van log olie-indeks) lyne (predicteds) 1.3877oilindex100-0.3877predicteds100 voorspelling vir tyd 101 Double eksponensiële smoothing Double eksponensiële gladstryking gebruik kan word wanneer Theres tendens (hetsy lang termyn of kort termyn), maar daar is geen seisoenaliteit. In wese die metode skep 'n voorspelling deur die kombinasie van eksponensieel stryk skattings van die tendens (helling van 'n reguit lyn) en die vlak (basies, die afsnit van 'n reguit lyn). Twee verskillende gewigte, of glad parameters, word gebruik om hierdie twee komponente by elke keer op te dateer. Die stryk is min of meer gelykstaande aan 'n eenvoudige eksponensiële gladstryking van die datawaardes en die reëlmatige tendens is min of meer gelykstaande aan 'n eenvoudige eksponensiële gladstryking van die eerste verskille. Die prosedure is gelykstaande aan pas 'n ARIMA (0,2,2) model, met geen konstante trek hom af met 'n ARIMA (0,2,2) fiks uitgevoer kan word. (1-B) 2 xt (1theta1B theta2B2) wt. navigasie


No comments:

Post a Comment