Skip to main content

R Bevegelig Gjennomsnitt Varsel


Flytte gjennomsnittlig prognose Innledning. Som du kanskje tror vi ser på noen av de mest primitive tilnærmingene til prognoser. Men forhåpentligvis er disse minst en verdig innføring i noen av databehandlingsproblemene knyttet til implementering av prognoser i regneark. I denne veinen vil vi fortsette med å starte i begynnelsen og begynne å jobbe med Moving Average prognoser. Flytte gjennomsnittlige prognoser. Alle er kjent med å flytte gjennomsnittlige prognoser, uansett om de tror de er. Alle studenter gjør dem hele tiden. Tenk på testresultatene dine i et kurs der du skal ha fire tester i løpet av semesteret. La oss anta at du fikk en 85 på din første test. Hva vil du forutsi for din andre testscore Hva tror du at læreren din ville forutse din neste testscore Hva tror du dine venner kan forutsi for din neste testscore Hva tror du at foreldrene dine kan forutsi for neste testresultat uansett om alt det du kan gjøre med dine venner og foreldre, de og din lærer er veldig sannsynlig å forvente deg å få noe i området av 85 du nettopp har fått. Vel, nå kan vi anta at til tross for selvforfremmelse til vennene dine, overestimerer du deg selv og figurerer du kan studere mindre for den andre testen, og så får du en 73. Nå er det alle de bekymrede og ubekymrede går til Forvent deg at du kommer på den tredje testen. Det er to svært sannsynlige tilnærminger for dem å utvikle et estimat, uansett om de vil dele det med deg. De kan si til seg selv, at denne fyren alltid blåser røyk om hans smarts. Hes kommer til å få en annen 73 hvis han er heldig. Kanskje foreldrene vil prøve å være mer støttende og si, quote, så langt har du fått en 85 og en 73, så kanskje du burde finne på å få en (85 73) 2 79. Jeg vet ikke, kanskje hvis du gjorde mindre fest og werent vevet vasselen over alt, og hvis du begynte å gjøre mye mer å studere, kan du få en høyere score. quot Begge disse estimatene flytter faktisk gjennomsnittlige prognoser. Den første bruker bare din siste poengsum for å prognose din fremtidige ytelse. Dette kalles en flytende gjennomsnittlig prognose ved hjelp av en periode med data. Den andre er også en flytende gjennomsnittlig prognose, men bruker to perioder med data. La oss anta at alle disse menneskene bråser på ditt store sinn, har slags pisset deg av og du bestemmer deg for å gjøre det bra på den tredje testen av dine egne grunner og for å sette en høyere poengsum foran din quotalliesquot. Du tar testen og poengsummen din er faktisk en 89 Alle, inkludert deg selv, er imponert. Så nå har du den endelige testen av semesteret som kommer opp, og som vanlig føler du behovet for å få alle til å gjøre sine spådommer om hvordan du skal gjøre på den siste testen. Vel, forhåpentligvis ser du mønsteret. Nå, forhåpentligvis kan du se mønsteret. Hvilke tror du er den mest nøyaktige fløyten mens vi jobber. Nå går vi tilbake til vårt nye rengjøringsfirma som startes av din fremmedgjorte halv søster, kalt Whistle While We Work. Du har noen tidligere salgsdata som er representert av følgende del fra et regneark. Vi presenterer først dataene for en tre-års glidende gjennomsnittlig prognose. Oppføringen for celle C6 skal være Nå kan du kopiere denne celleformelen ned til de andre cellene C7 til C11. Legg merke til hvordan gjennomsnittet beveger seg over de nyeste historiske dataene, men bruker nøyaktig de tre siste perioder som er tilgjengelige for hver prediksjon. Du bør også legge merke til at vi ikke virkelig trenger å gjøre spådommene for de siste perioder for å utvikle vår siste prediksjon. Dette er definitivt forskjellig fra eksponentiell utjevningsmodell. Ive inkluderte quotpast predictionsquot fordi vi vil bruke dem på neste nettside for å måle prediksjonens gyldighet. Nå vil jeg presentere de analoge resultatene for en to-års glidende gjennomsnittlig prognose. Oppføringen for celle C5 skal være Nå kan du kopiere denne celleformelen ned til de andre cellene C6 til C11. Legg merke til hvordan nå bare de to siste bitene av historiske data blir brukt for hver prediksjon. Igjen har jeg tatt med quotpast predictionsquot for illustrative formål og for senere bruk i prognose validering. Noen andre ting som er viktig å legge merke til. For en m-periode som beveger gjennomsnittlig prognose, brukes bare de nyeste dataverdiene for å gjøre prognosen. Ingenting annet er nødvendig. For en m-periode som beveger gjennomsnittlig prognose, legger du merke til at den første prediksjonen forekommer i periode m 1. Begge disse problemene vil være svært viktige når vi utvikler koden vår. Utvikle den bevegelige gjennomsnittsfunksjonen. Nå må vi utvikle koden for den bevegelige gjennomsnittlige prognosen som kan brukes mer fleksibelt. Koden følger. Legg merke til at inngangene er for antall perioder du vil bruke i prognosen og rekke historiske verdier. Du kan lagre den i hvilken arbeidsbok du vil ha. Funksjon MovingAverage (Historical, NumberOfPeriods) Som Single Deklarering og Initialisering av variabler Dim Item Som Variant Dim Counter Som Integer Dim Akkumulering Som Single Dim HistoricalSize Som Integer Initialiserende variabler Teller 1 Akkumulering 0 Bestemme størrelsen på Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Akkumulere riktig antall siste tidligere observerte verdier Akkumulasjonsakkumulering Historisk (HistoricalSize - NumberOfPeriods Counter) MovingAverage AkkumuleringsnummerOfPeriods Koden vil bli forklart i klassen. Du vil plassere funksjonen på regnearket slik at resultatet av beregningen vises der det vil like følgende. R - Forutsetninger til prognoser for å redigere ARIMA (AutoRegresive Integrated Moving Average) ETS (Eksponensiell utjevningstilstandsrommodell) Vi drøfter hvordan disse metodene fungerer og hvordan man bruker dem. Forventet pakkeoversikt rediger Eksponensiell utjevning Rediger navn AKA: eksponentielt vektet glidende gjennomsnitt (EWMA) Tilsvarer ARIMA (0,1,1) modell uten konstant term Brukes til glatt data for presentasjon gjør prognoser enkelt glidende gjennomsnitt: Tidligere observasjoner vektes like eksponentielt utjevning: tilordner eksponentielt avtagende vekter over tid Formel xt - rå datasekvens st - utdata fra eksponentiell utjevningsalgoritme (estimat for neste verdi av x) - utjevningsfaktor. 0160lt160160lt1601.Velgende rettighet ingen formell måte å velge statistisk teknikk på, kan brukes til å optimalisere verdien av (f. eks. OLS), jo større blir det nært til naiv prognoser (de samme porter som originalserier med en periodeforsinkelse). Dobbel eksponensiell utjevning rediger Enkel eksponensiell utjevning gjør det ikke bra når det er en trend (det vil alltid være forspenning) Dobbel eksponensiell utjevning er en gruppe metoder som håndterer problemet Holt-Winters dobbelt eksponensiell utjevning redigering Og for t gt 1 av hvor er datautjevningsfaktoren. 0160lt160160lt1601, og er trendutjevningsfaktoren. 0160lt160160lt1601. Output F tm - et estimat av verdien av x på tidspunktet tm, mgt0 basert på rå data opp til tid t Tredobbelt eksponensiell utjevning rediger tar hensyn til sesongmessige endringer samt trender først foreslått av Holts student, Peter Winters, i 1960 Input xt - rå datasekvens av observasjoner t 1601600 L lengde en syklus med sesongmessig endring Metoden beregner: en trendlinje for datasesongsindeksene som vekterer verdiene i trendlinjen basert på hvor tidspunktet faller i lengdecyklusen L. s t representerer den glatte verdien av den konstante delen for tiden t. bt representerer sekvensen av beste estimater av den lineære trenden som legges over på sesongmessige endringer ct er sekvensen av sesongmessige korreksjonsfaktorer ct er den forventede andelen av den forutsagte trenden når som helst t mod L i syklusen som observasjonene tar på initialiser sesongindeksene c tL det må være minst en komplett syklus i dataene. Algoritmens utgang skrives igjen som F tm. et estimat av verdien av x på tidspunktet tm, mgt0 basert på rå data opp til tid t. Tredobbelt eksponensiell utjevning er gitt av formlene hvor datautjevningsfaktoren er. 0160lt160160lt1601, er trendutjevningsfaktoren. 0160lt160160lt1601, og er sesongmessig forandringsutjevningsfaktor. 0160lt160160lt1601. Den generelle formelen for innledende trendestimat b 0 er: Stille inn de første estimatene for sesongindeksene c i for 1,2. L er litt mer involvert. Hvis N er antall komplette sykluser som er tilstede i dataene dine, så: Merk at A j er gjennomsnittsverdien av x i j t-syklusen til dataene dine. ETS-redigering Overordnede parametere redigere 8.4 Flytte gjennomsnittlige modeller I stedet for å bruke tidligere verdier av prognosen variabel i en regresjon, bruker en bevegelig gjennomsnittlig modell forbigående feil i en regresjonslignende modell. y c et theta e theta e dots theta e, hvor et er hvit støy. Vi refererer til dette som en MA (q) modell. Selvfølgelig observerer vi ikke verdiene til et, så det er ikke egentlig regresjon i vanlig forstand. Legg merke til at hver verdi av yt kan betraktes som et vektet glidende gjennomsnitt av de siste prognosefeilene. Imidlertid bør bevegelige gjennomsnittsmodeller ikke forveksles med flytende gjennomsnittsutjevning som vi diskuterte i kapittel 6. En flytende gjennomsnittsmodell brukes til å prognostisere fremtidige verdier mens flytende gjennomsnittsutjevning brukes til å estimere utviklingscyklusen til tidligere verdier. Figur 8.6: To eksempler på data fra bevegelige gjennomsnittsmodeller med forskjellige parametere. Venstre: MA (1) med y t 20e t 0.8e t-1. Høyre: MA (2) med y t e t-e t-1 0.8e t-2. I begge tilfeller er e t normalt distribuert hvit støy med gjennomsnittlig null og varians en. Figur 8.6 viser noen data fra en MA (1) modell og en MA (2) modell. Endring av parametrene theta1, prikker, thetaq resulterer i forskjellige tidsseriemønstre. Som med autoregressive modeller, vil variansen av feilbegrepet et bare endre omfanget av serien, ikke mønstrene. Det er mulig å skrive en stasjonær AR (p) modell som en MA (infty) modell. For eksempel ved bruk av gjentatt substitusjon, kan vi demonstrere dette for en AR (1) - modell: begynnelse og forsterkning og forsterkning (phi1y e) og forsterkning av phi1 og et phi13y phi12e phi1e og amplitud ende Forutsatt -1 lt phi1 lt 1, verdien av phi1k blir mindre etter hvert som k blir større. Så til slutt får vi yt og phi1 phi12 e phi13 e cdots, en MA (infty) prosess. Det motsatte resultatet holder seg dersom vi legger inn noen begrensninger på MA parametrene. Så kalles MA-modellen inverterbar. Det vil si at vi kan skrive en omvendt MA (q) prosess som en AR (infty) prosess. Invertible modeller er ikke bare å gjøre det mulig for oss å konvertere fra MA-modeller til AR-modeller. De har også noen matematiske egenskaper som gjør dem enklere å bruke i praksis. Invertibilitetsbegrensningene ligner stasjonære begrensninger. For en MA (1) modell: -1lttheta1lt1. For en MA (2) modell: -1lttheta2lt1, theta2theta1 gt-1, theta1-teteta1 1. Mer kompliserte forhold holder for qge3. Igjen vil R ta seg av disse begrensningene når vi estimerer modellene. Basisk prognoseprognose refererer til prosessen med å bruke statistiske prosedyrer for å forutsi fremtidige verdier av en tidsserie basert på historiske trender. For bedrifter er det mulig å kunne måle forventede resultater for en gitt tidsperiode for å håndtere markedsføring, planlegging og økonomi. For eksempel kan et reklamebyrå ønske å bruke salgsprognoser for å identifisere hvilke fremtidige måneder som kan kreve økte markedsføringsutgifter. Bedrifter kan også bruke prognoser for å identifisere hvilke selgere som oppfylte sine forventede mål for et skattekvarter. Det finnes en rekke teknikker som kan benyttes til å generere kvantitative prognoser. Noen metoder er ganske enkle mens andre er mer robuste og innarbeider eksogene faktorer. Uansett hva som benyttes, bør det første trinnet alltid være å visualisere dataene ved hjelp av en linjediagram. Du vil vurdere hvordan metriske endringer over tid, om det er en distinkt trend, eller om det er merkbare mønstre som er bemerkelsesverdige. Det er flere viktige begreper som vi bør være oppmerksomme på når vi beskriver tidsseriedata. Disse egenskapene vil informere om hvordan vi forprosesserer dataene og velger riktig modelleringsteknikk og parametere. Til slutt er målet å forenkle mønstrene i de historiske dataene ved å fjerne kilder til variasjonion og gjøre mønstrene mer konsistente over hele datasettet. Enkelere mønstre vil generelt føre til mer nøyaktige prognoser. Trend: En trend eksisterer når det er en langsiktig økning eller reduksjon i dataene. Seasonality: Et sesongmessig mønster oppstår når en tidsserie påvirkes av sesongmessige faktorer som årets eller ukedagens. Autokorrelasjon: Betegner fenomenet hvorved verdier av Y ved tid t påvirkes av tidligere verdier av Y ved t-i. For å finne riktig lagstruktur og typen av automatisk korrelerte verdier i dataene dine, bruk autokorrelasjonsfunksjonens plott. Stasjonær: En tidsserie sies å være stasjonær hvis det ikke er noen systematisk trend, ingen systematisk endring i variansen, og hvis det ikke eksisterer periodiske variasjoner eller sesongmessige forhold, er kvantitative prognoseteknikker vanligvis basert på gjenopprørsanalyse eller tidsserie teknikker. Regresjonsmetoder undersøker forholdet mellom den prognostiserte variabelen og andre forklarende variabler ved bruk av tverrsnittsdata. Tidsseriemodeller bruker hitoriske data som er blitt samlet inn regelmessig over tid for målvariablene for å prognostisere fremtidige verdier. Det er ikke tid til å dekke teorien bak hver av disse tilnærmingene i dette innlegget, så I8217ve valgt å dekke høyt nivå konsepter og gi kode for å utføre tidsserien prognoser i R. Jeg foreslår sterkt at du forstår statistisk teori bak en teknikk før du kjører koden. For det første kan vi bruke ma-funksjonen i prognosepakken til å utføre prognoser ved hjelp av den bevegelige gjennomsnittlige metoden. Denne teknikken anslår fremtidige verdier ved tid t ved å beregne verdier av tidsseriene innen k-perioder av t. Når tidsseriene er stasjonære, kan det bevegelige gjennomsnittet være svært effektivt da observasjonene er i nærheten over tid. Den enkle eksponensielle smootingen er også god når dataene ikke har noen trend eller sesongmessige mønstre. I motsetning til et bevegelige gjennomsnitt, gir denne teknikken større vekt på de siste observasjonene av tidsseriene. I prospektpakken er det en automatisk prognosefunksjon som vil løpe gjennom mulige modeller og velge den mest hensiktsmessige modellen gi dataene. Dette kan være en automatisk regressiv modell av den første oderen (AR (1)), en ARIMA-modell med de riktige verdiene for p, d og q, eller noe annet som er mer hensiktsmessig. Der går du, en grunnleggende ikke-teknisk introduksjon til prognoser. Dette bør få en kjent med nøkkelbegrepene og hvordan du utfører noen grunnleggende prognoser i R Aldri savner en oppdatering Abonner på R-bloggere for å motta e-post med de nyeste R-postene. (Du vil ikke se denne meldingen igjen.)

Comments