Saturday, 25 November 2017

Błędy przenoszenia średniej predykcji


Przenoszenie średniej prognozy Wprowadzenie. Jak można się spodziewać, patrzymy na niektóre z najbardziej prymitywnych podejść do prognozowania. Ale miejmy nadzieję, że są to co najmniej warte wstępu do niektórych zagadnień związanych z komputerem związanych z wdrażaniem prognoz w arkuszach kalkulacyjnych. W tym kontekście będziemy kontynuować od początku i rozpocząć pracę z prognozą Moving Average. Przenoszenie średnich prognoz. Wszyscy znają średnie ruchome prognozy niezależnie od tego, czy uważają, że są. Wszyscy studenci studiują je przez cały czas. Pomyśl o swoich testach w kursie, w którym podczas semestru będziesz miał cztery testy. Pozwala przyjąć, że masz 85 przy pierwszym testie. Jak oceniasz Twój drugi punkt testowy Co sądzisz, że Twój nauczyciel przewidziałby następny wynik testu Jak myślisz, że Twoi znajomi mogą przewidzieć następny wynik testu Jak myślisz, że Twoi rodzice mogą przewidzieć następny wynik testu Niezależnie od tego, wszystkie blabbing, które możesz zrobić znajomym i rodzicom, to oni i nauczyciel bardzo oczekują, że dostaniesz coś w tej dziedzinie, którą właśnie dostałeś. No cóż, teraz pomyślmy, że pomimo twojej samoobrony do swoich znajomych, oszacujesz siebie i postanów, że możesz uczyć się mniej na drugim teście, a więc dostajesz 73. Teraz wszyscy zainteresowani i niezainteresowani idą przewiduj, że otrzymasz trzeci test Istnieją dwa bardzo prawdopodobne podejścia do nich, aby opracować szacunkowe niezależnie od tego, czy będą dzielić się nim z Tobą. Mówią same do siebie: "Ten facet zawsze dmucha o jego inteligencję. On będzie dostać kolejne 73, jeśli ma szczęście. Może rodzice będą starali się być bardziej pomocni i powiedzieli: "WELL", jak dotąd dostałeś 85 i 73, więc może powinieneś się dowiedzieć na temat (85 73) 2 79. Nie wiem, może gdybyś mniej imprezował i werent waha się weasel na całym miejscu i jeśli zacząłeś robić dużo więcej studiów, możesz uzyskać wyższy score. quot Oba te szacunki są w rzeczywistości przechodzą średnie prognozy. Pierwszy używa tylko swojego ostatniego wyniku, aby prognozować przyszłe wyniki. Nazywa się to ruchomą średnią prognozą przy użyciu jednego okresu danych. Druga to również średnia ruchoma, ale wykorzystująca dwa okresy danych. Pozwala przyjąć, że wszyscy ci ludzie popychają do twojego wielkiego umysłu, jakby się wkurzyli i postanowili dobrze wykonać trzeci test ze swoich własnych powodów i położyć większy wynik przed Twoimi notatkami. Robisz test, a Twój wynik jest w rzeczywistości 89 Wszyscy, łącznie z sobą, są pod wrażeniem. Więc teraz masz ostatni test semestru nadchodzącego i jak zwykle masz wrażenie, że musimy nakłonić wszystkich do tworzenia swoich przepowiedni dotyczących tego, jak zrobisz to w ostatnim teście. Mam nadzieję, że widzisz wzór. Teraz, miejmy nadzieję, widać wzór. Jaki jest Twój najlepszy gwizdek podczas pracy. Teraz wracamy do naszej nowej firmy zajmującej się sprzątaniem, która rozpoczęła się od twojej ukochanej siostry o nazwie Gwizdek podczas pracy. Masz dane z przeszłych sprzedaży przedstawione w następnej części arkusza kalkulacyjnego. Najpierw przedstawiamy dane dotyczące trzech okresowych prognoz średniej ruchomej. Wpisem dla komórki C6 powinno być Teraz możesz skopiować tę formułę komórki do innych komórek C7 do C11. Zauważ, jak średnia przenosi się do ostatnich danych historycznych, ale używa dokładnie trzech ostatnich okresów dostępnych dla każdego przewidywania. Warto też zauważyć, że nie musimy naprawdę przewidzieć z ostatnich okresów, aby rozwinąć nasze najnowsze prognozy. To zdecydowanie różni się od wyrafinowanego modelu wygładzania. Ive uwzględniła przewidywania kwotowania, ponieważ będziemy używać ich na następnej stronie internetowej w celu pomiaru ważności przewidywania. Teraz chcę przedstawić analogiczne wyniki dla dwóch okresów ruchomych średniej prognozy. Wpisem dla komórki C5 powinno być Teraz możesz skopiować tę formułę komórki do innych komórek C6 do C11. Zauważmy, że teraz tylko dwie ostatnie dane historyczne są wykorzystywane do każdego przewidywania. Znowu uwzględniono prognozy kwotowania dla celów ilustracyjnych i późniejsze wykorzystanie w walidacji prognozy. Inne ważne rzeczy do zauważenia. W przypadku prognozy średniej ruchomej w skali m wykorzystuje się jedynie najmniejsze wartości danych, aby przewidzieć. Nic więcej nie jest konieczne. Jeśli chodzi o prognozę średniej ruchomej w okresie m, przy prognozowaniu kwotowania zauważ, że pierwsza predykcja ma miejsce w okresie m 1. Zarówno te kwestie będą bardzo znaczące, gdy opracujemy nasz kod. Rozwój funkcji przeciętnej ruchomości. Teraz musimy opracować kod dla prognozy średniej ruchomej, którą można używać bardziej elastycznie. Kod jest następujący. Zauważ, że dane wejściowe są dla liczby okresów, których chcesz używać w prognozie i tablicach wartości historycznych. Można go przechowywać w dowolnej skoroszycie. Funkcja MovingAverage (Historical, NumberOfPeriods) jako pojedynczy Deklarowanie i inicjalizacja zmiennych Dim Item as Variant Dim Counter jako Integer Dim Akumulacja jako pojedynczy Dim HistoricalSize jako Integer Inicjalizacja zmiennych Counter 1 Akumulacja 0 Określenie rozmiaru historycznego HistoricalSize Historical. Count licznika 1 do NumberOfPeriods Zbieranie odpowiedniej liczby ostatnich poprzednich wartości Accumulation Accumulation Historical (HistoricalSize - NumberOfPeriods Counter) MovingAverage Akumulacja NumberOfPeriods Kod zostanie wyjaśniony w klasie. Chcesz umieścić funkcję w arkuszu kalkulacyjnym tak, aby wynik obliczeń pojawił się w miejscu, w którym powinien on wyglądać jak poniżej.8.4 Ruchome modele średnie Zamiast używać przeszłych wartości zmiennej prognozy w regresji, model średniej ruchomości wykorzystuje w przeszłości błędy prognozy model regresji. y c t etta etta k etta, gdzie et jest białym szumem. Odnoszę się do tego jako model typu MA (q). Oczywiście nie obserwujemy wartości et, więc nie jest to regresja w zwykłym sensie. Zauważ, że każda wartość yt może być traktowana jako ważona średnia ruchoma ostatnich kilku błędów prognozy. Nie należy jednak mylić średnich ruchomej z ruchomej wygładzonej średniej, o której mówiliśmy w rozdziale 6. W celu oszacowania cyklu trendu wcześniejszych wartości wykorzystywany jest średnioroczny model prognozowania przyszłych wartości, podczas gdy ruchome średnie wygładzenie jest używane do szacowania cyklu trendu ostatnich wartości. Rysunek 8.6: Dwa przykłady danych z ruchomych średnich modeli o różnych parametrach. Lewo: MA (1) z y t 20e t 0.8e t-1. Po prawej: MA (2) z y t e t e t-1 0,8e t-2. W obu przypadkach, e t jest normalnie rozproszonym białym hałasem ze średnią zerem i wariancją. Rysunek 8.6 przedstawia niektóre dane z modelu MA (1) i modelu MA (2). Zmiana parametrów theta1, kropki, thetaq powodują, że różne wzorce serii czasowych. Podobnie jak w modelach autoregresywnych, wariancja warunku błędów et zmienia tylko skalę szeregu, a nie wzorców. Możliwe jest pisanie dowolnego stacjonarnego modelu AR (p) jako modelu MA (infty). Na przykład, używając powtórzonej podstawy, możemy to udowodnić za model AR (1): rozpocznij yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 i et phi fiordy phi12e phi1 i koniec amptext Pod warunkiem -1 lt phi1 lt 1, wartość phi1k będzie mniejsza, gdy k powiększy się. Więc ostatecznie otrzymujemy yt et phi1 e phi12 e phi13 e cdots, proces MA (infty). Wynik odwrotny utrzymuje się, jeśli wprowadzamy pewne ograniczenia parametrów MA. Następnie model MA nazywa się odwracalnym. Oznacza to, że możemy pisać dowolny proces odwracalny MA (q) jako proces AR (infty). Modele odwracalne nie tylko umożliwiają nam konwersję z modeli MA na modele AR. Mają także pewne właściwości matematyczne, które ułatwiają ich stosowanie w praktyce. Ograniczenia inwersji są podobne do ograniczeń stacjonarnych. Dla modelu MA (1): -1lttheta1lt1. Dla modelu MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1 - eta2l1. Bardziej skomplikowane warunki zachowują się dla qge3. Znowu R zajmuje się tymi ograniczeniami podczas szacowania modeli. W praktyce średnia ruchoma daje dobre oszacowanie średniej serii czasów, jeśli średnia jest stała lub powoli zmienia się. W przypadku średniej stałej, największa wartość m daje najlepsze oszacowania średniej podstawowej. Dłuższy okres obserwacji będzie wynosił średnie efekty zmienności. Celem zapewnienia mniejszej m jest umożliwienie prognozowania reakcji na zmianę procesu leżącego u ich podstaw. W celu zilustrowania proponujemy zestaw danych zawierający zmiany w podstawowej średniej serii czasowej. Na rysunku przedstawiono serie czasów używane do ilustracji wraz ze średnim zapotrzebowaniem, z którego generowane były serie. Średnia rozpoczyna się jako stała wartość 10. Rozpoczynanie w czasie 21 wzrasta o jedną jednostkę w każdym okresie, aż osiągnie wartość 20 w czasie 30. Następnie staje się stała ponownie. Dane są symulowane przez dodanie do średniej, losowego szumu z rozkładu normalnego ze średnią zerową i odchyleniem standardowym 3. Wyniki symulacji są zaokrąglane do najbliższej liczby całkowitej. W tabeli przedstawiono symulowane obserwacje stosowane w przykładzie. Kiedy korzystamy z tabeli, musimy pamiętać, że w danym momencie znane są tylko poprzednie dane. Szacunki modelu parametru, dla trzech różnych wartości m są pokazane razem ze średnią serii czasowej na poniższym rysunku. Na rysunku przedstawiono ruchomą średnią szacunkową wartość średnią za każdym razem, a nie prognozę. Prognozy zmieniłyby średnie ruchome krzywe w prawo w okresach. Jeden z wniosków jest natychmiast widoczny na rysunku. We wszystkich trzech szacunkach średnia ruchoma pozostaje w tyle za tendencją liniową, przy czym opóźnienie wzrasta o m. Opóźnienie to odległość pomiędzy modelem a szacunkiem w wymiarze czasu. Ze względu na opóźnienie, średnia ruchoma nie docenia uwag, gdy średnia rośnie. Oszacowanie estymatora jest różnicą w określonym czasie w średniej wartości modelu i średniej wartości przewidywanej przez średnią ruchoma. Oszacowanie, gdy średnia rośnie, jest negatywne. Dla malejącej średniej, nastawienie jest dodatnie. Opóźnienie w czasie i nastawienie wprowadzone w oszacowaniu to funkcje m. Im większa wartość m. im większa jest wielkość opóźnienia i stronniczości. Dla ciągle rosnącej serii z tendencją a. wartości opóźnień i stronniczości estymatora średniej podano w poniższych równaniach. Przykładowe krzywe nie pasują do tych równań, ponieważ przykładowy model nie wzrasta w sposób ciągły, raczej rozpoczyna się jako stała, zmienia tendencję, a następnie staje się stały ponownie. Również przykładowe krzywe mają wpływ na hałas. Ruchome przeciętne prognozy okresów w przyszłość są przedstawione przez przesunięcie krzywych w prawo. Opóźnienie i nastawienie wzrastają proporcjonalnie. Poniższe równania wskazują na opóźnienie i nastawienie prognozowanych okresów w przyszłość w porównaniu do parametrów modelu. Ponownie, te wzory są dla serii czasowych o stałym liniowym trendzie. Nie powinniśmy być zaskoczeni tym rezultatem. Ruchome średnie estymator opiera się na założeniu stałej średniej, a przykład ma tendencję liniową w średniej podczas części okresu badania. Ponieważ serie czasu rzeczywistego rzadko będą zgodne z założeniami dowolnego modelu, powinniśmy być przygotowani na takie rezultaty. Z rysunku wynika, że ​​zmienność hałasu ma największy wpływ na mniejsze m. Oszacowanie jest dużo bardziej niestabilne dla średniej ruchomej 5 niż średnia ruchoma równa 20. Mamy sprzeczne pragnienia, aby zwiększyć m, aby zmniejszyć wpływ zmienności spowodowany hałasem i zmniejszyć m, aby przewidzieć większą reakcję na zmiany w średniej. Błąd jest różnicą między rzeczywistymi danymi a przewidywaną wartością. Jeśli seria czasów jest rzeczywiście stałą wartością, oczekiwana wartość błędu wynosi zero, a wariancja błędu składa się z terminu, który jest funkcją, a drugi - to wariacja szumu,. Pierwsza z nich to wariancja średniej oszacowanej próbką m obserwacji, zakładając, że dane pochodzą z populacji o stałej średniej. Ten termin jest zminimalizowany przez uczynienie m jak największym. Duża m powoduje, że prognoza nie reaguje na zmianę podstawowej serii czasowej. Aby prognoza odpowiadała na zmiany, chcemy m tak małą (1), ale zwiększa to wariancję błędu. Praktyczne prognozy wymagają wartości pośredniej. Prognozowanie w programie Excel Dodatek Prognozowania implementuje średnie ruchome wzory. Poniższy przykład przedstawia analizę dostarczoną przez dodatek dla danych przykładowych w kolumnie B. Pierwsze 10 obserwacji indeksuje się od -9 do 0. W porównaniu z powyższą tabelą, indeksy okresu są przesuwane o -10. Pierwsze dziesięć obserwacji dostarcza wartości początkowe dla oszacowania i służy do obliczania średniej ruchomej dla okresu 0. Kolumna MA (10) (C) pokazuje obliczone średnie ruchome. Parametr średniej ruchomej m znajduje się w komórce C3. Kolumna Fore (1) (D) pokazuje prognozę dla jednego okresu w przyszłości. Interwał prognozy znajduje się w komórce D3. Gdy przedział prognozy zostanie zmieniony na większą liczbę, liczby w kolumnie Fore zostaną przesunięte w dół. Err (1) (E) pokazuje różnicę między obserwacją a prognozą. Na przykład, obserwacja w czasie 1 wynosi 6. Prognozowana wartość wykonana z średniej ruchomej w czasie 0 wynosi 11.1. Błąd to -5.1. Odchylenie standardowe i średnie odchylenie średnie (MAD) są obliczane odpowiednio w komórkach E6 i E7. Poprawa prognozowania przy średnich ruchach i punktach Z Ocena Andrew Creager 0 Prognozowanie jest integralną częścią zarządzania przedsiębiorstwem. Im lepsza prognoza, tym lepsze zarządzanie będzie w stanie zaplanować przyszłość. Chociaż istnieje wiele metod tworzenia prognoz, niektóre z nich są lepiej dostosowane do innych sytuacji. W przypadku prognoz krótkoterminowych Black Belts może korzystać z analizy trendów produkcyjnych i poszukiwania specjalnych przyczyn zmian. Jeśli chodzi o prognozy długoterminowe, najlepszym rozwiązaniem może okazać się metoda, która wykorzystuje normalną krzywą i wynikami Z-score. Obie metody są proste. Metody w praktyce Następujący scenariusz pozwala zrozumieć, w jaki sposób te metody działają. W tym przykładzie menedżer ds. Produkcji, który został niedawno certyfikowany jako Czarny pas, chce wykorzystać narzędzia Six Sigma i oprogramowanie do analizy statystycznej, aby przewidzieć. Menedżer śledzi wydziały8217 tygodniowych produkcji palet. Każda paleta zawiera stałą liczbę przypadków produktu, a menedżer używa w arkuszu kalkulacyjnym prostej, czterotygodniowej średniej ruchomej. W tabeli 1 przedstawiono próbkę, od końca cyklu 52-tygodniowego, produkcji wydziału8217s palety. Tabela 1: Produkcja palet według tygodni Menedżer składa się z dwóch podstawowych składników potrzebnych do wygenerowania prognoz: danych produkcyjnych i okresu prognozy. Okres, ordisororor, w tym przypadku jest kilka tygodni. Dzięki tej informacji może ona wykonać zarówno krótkoterminowe jak i długoterminowe metody prognozowania. Krótkoterminowe: Poszukiwanie trendów w przemieszczaniu się przeciętnych działek Oprogramowanie statystyczne może dostarczyć Czarnych Pasów z kilkoma opcjami do wypełniania prognoz. W takim przypadku menedżer zdecyduje się na krótką prognozę, aby wykreślić średnią ruchową za pomocą polecenia serii czasowej. Aby to zrobić, wprowadza zmienną i długość po wyświetleniu monitu. Rysunek 1: Płyta średnioroczna dla przemieszczania palety w ciągu czterech tygodni Rysunek 1 przedstawia średnią ruchomej z przełomu czterech tygodni roboczych z roku ubiegłego, jak to miało miejsce w programie. Chociaż wizualna reprezentacja analizy jest pomocna, prawdziwy nacisk położony jest na dokładność pomiaru, która przedstawia różnice między rzeczywistymi a prognozowanymi ilościami palety. Jedną z tych miar dokładności jest średnie odchylenie bezwzględne (MAD). Kompensuje dokładność wprowadzonych wartości serii czasowej i wyraża odchylenie w tych samych jednostkach co dane, co ułatwia zrozumienie ilości błędu. Wzór dla MAD: gdzie y jest rzeczywistą wartością w danym czasie, y-hat jest wartością dopasowaną, a n jest liczbą obserwacji. Tabela 2: MAD dla różnych przebiegających przeciętnych przebiegów Iteracje Długość średniej ruchomej Ponieważ menedżer szuka prognozy z największą liczbą błędów przewidywania, najlepiej jest iterować przez różne długości średniej ruchomej w celu znalezienia niższych wartości MAD. Tabela 2, po lewej stronie, przedstawia wyniki dla pięciu różnych ruchomych średnich iteracji. Tabela ilustruje, że kierownik miałby nieco dokładniejszą prognozę z pięcioma lub sześcioma tygodniami średnią ruchoma. Podczas przeanalizowania wykresu na rysunku 1 menedżer może zauważyć, że w punktach 40 i 45 występują skrajnie wartościowe wartości, a przewidywane wartości zostały zasadniczo rozciągnięte wokół tych punktów. Powinno to stworzyć zainteresowanie do dalszego przeglądu. Jednym ze sposobów kierowania menadżerem może być przeprowadzenie przeglądu i ocena skutków dwóch ekstremalnych punktów polegających na umieszczeniu danych w osobnym wykresie kontrolnym, jak pokazano na rysunku 2, i sprawdzić, czy istnieje odstępstwo poza granice kontroli 3-sigma. Rysunek 2: Osobisty wykres kontrolny punktów produkcyjnych 40 i 45 przekracza granice kontrolne. Oczywiście produkcja nie jest pojedynczym procesem i nie może być kontrolowana po prostu poprzez zastosowanie statystycznej kontroli procesu, ale wykres osobisty jest znanym narzędziem dla Czarnych Pasów i może dostarczyć cennych informacji na temat prognozy manager8217s. Po przeglądzie punktów poza granicami kontrolnymi menedżer znajduje prawdopodobne wyjaśnienie: miały miejsce w dwóch świętach, dziękczynieniu i świętach Bożego Narodzenia, gdy departament został zamknięty przez kilka dni. Wiedząc o tym, menedżer usuwa dwa punkty z zestawu danych i powtarza ruchome średnie, aby sprawdzić, czy MAD zmniejsza się. Menedżer dowiaduje się, że MAD zmniejsza się po usunięciu dwóch ekstremalnych punktów, które uaktualniono dane przedstawiono w Tabeli 3. Tabela 3: MAD dla różnych przebiegających przeciętnych Iteracji Po usunięciu niesprzyjających środków Długość Przeciętnej Kierownika może teraz spodziewać się lepszych prognoz krótkoterminowych przy użyciu pięć tygodni. Działania są dynamiczne i najlepiej byłoby przeanalizować prognozę okresowo i dostosować w razie potrzeby. Długoterminowe: Wykorzystanie krzywej Normy Dla długoterminowego planowania menedżera8217s, na przykład przewidywania rocznych wyników na następny rok, najlepszą metodą jest prognozowanie za pomocą krzywej normalnej i wyników Z-score. Ponieważ kierownik patrzy na prawdopodobieństwa przy użyciu krzywej normalnej, najpierw upewnia się, że dystrybucja jest w rzeczywistości normalna. Można to zrobić, stosując test normalności Anderson-Darling (AD). Wartość p (a gt10) do produkcji palet, dostosowana do wykluczania tygodni urlopu, wskazuje, że dystrybucja jest w przybliżeniu normalna. Kolejnym krokiem menedżera8217 jest użycie oprogramowania statystycznego, aby znaleźć statystyki podsumowania, jak pokazano na rysunku 3, ponieważ zawierają one kluczowe składniki prognozowania. Rysunek 3: Podsumowanie dla skorygowanej produkcji Z danych zebranych tutaj menedżer może rozpocząć prognozowanie produkcji następnej generacji w roku następującym bez wprowadzenia znaczących zmian. Aby rozpocząć, menedżer używa programu do utworzenia wykresu rozkładu prawdopodobieństwa, jak pokazano na rysunku 4. Rysunek 4: Plastyczna rozkład prawdopodobieństwa Ten wykres pokazuje, że około 34 procent produkcji będzie znajdować się pomiędzy średnią 203 palet i 1 odchyleniem standardowym (13 palety) więcej niż średnia, czyli 216 palet. Chociaż ten procent można znaleźć przy użyciu oprogramowania, ręczne obliczanie jest prawie tak proste. Czarny pas może obliczyć ten sam procent, korzystając z wyników Z i odnosząc się do normalnego rozkładu. W tym przykładzie, gdzie z (liczba s oznacza wartość) (216 203) 13 13 13 1. Obszar pod krzywą oznacza 1 (dodatni) odchylenie standardowe. Zwykła tabela rozkładów pokazuje, że z z 1 841 8211 .500 .341. lub 34 procent. Aby oszacować ile tygodni w ciągu roku dział może produkować przy 216 paletach lub większej liczbie produktów, lub więcej niż 1 odchylenie standardowe od średniej, menedżer zaktualizuje wykres dystrybucji (rysunek 5). Rysunek 5: Prawdopodobieństwo wytworzenia więcej niż 1 standardowego odchylenia od średniej Wykorzystując powyższy wykres menedżer szacuje, że dział może wynosić 216 palet lub więcej przez 16 procent roku lub około ośmiu z następnych 52 tygodni. Kierownik chce także pokonać rekord w roku poprzednim82 produkcji 231 palet produktu w ciągu jednego tygodnia. W związku z tym wyznacza cel osiągnięcia 235 palet co najmniej raz. Aby dowiedzieć się ile razy w ciągu najbliższych 52 tygodni wydział może wypełnić 235 palet, kierownik rozpoczyna obliczenie wyniku Z: z (235 202) 13 32 13 około 2,46 s Odpowiedź brzmi: patrząc na ten punkt Z w normalnej tabeli dystrybucji lub poprzez wyprodukowanie innego wykresu dystrybucji w programie (rysunek 6). Rysunek 6: Prawdopodobieństwo wytworzenia więcej niż 2.46 Odchylenia standardowe od średniej Perspektywy dla produkcji 235 palet nie jest dobre, jest mniej niż 1 procentowa szansa, co oznacza, że ​​może się zdarzyć raz. Wykorzystując punkty Z i wykresy dystrybucji menedżer jest w stanie prognozować te wyniki z wyprzedzeniem i wyznaczyć uzasadnione cele. Jeśli pokochałeś ten artykuł, możesz też kochać zostawić komentarz

No comments:

Post a Comment