In diesem Tutorial wird das Beispiel eines Katalogunternehmens vorgestellt, das die monatlichen Verkäufe seiner Herrenbekleidungslinie auf der Grundlage der Verkaufsdaten der letzten 10 Jahre prognostizieren möchte.
Im Tutorial zur Bandbreitennutzung für Prognosen haben Sie gelernt, wie der Expert Modeler entscheiden kann, welches Modell für Ihre Zeitreihe am besten geeignet ist. Nun ist es an der Zeit, die beiden Methoden, die Ihnen bei der Wahl eines Modells zur Verfügung stehen, näher zu betrachten: exponentielle Glättung und ARIMA.
Bei der Suche nach einem geeigneten Modell sollte zunächst die Zeitreihe geplottet werden. Die optische Untersuchung einer Zeitreihe kann oft entscheidende Hinweise für die Auswahl geben. Insbesondere sollten Sie sich folgende Fragen stellen:
Weist die Zeitreihe einen allgemeinen Trend auf? Wenn ja, scheint der Trend konstant zu sein oder scheint er mit der Zeit auszulaufen?
Weist die Zeitreihe Saisonalität auf? Wenn ja, scheinen die saisonalen Schwankungen im Laufe der Zeit zuzunehmen oder scheinen sie über mehrere aufeinander folgende Perioden konstant zu sein?
Vorschau des Lernprogramms anzeigen
Sehen Sie sich dieses Video an, um eine Vorschau der Schritte in diesem Lernprogramm anzuzeigen. Die Benutzeroberfläche, die im Video gezeigt wird, kann geringfügig abweichen. Das Video ist als Ergänzung zum schriftlichen Tutorial gedacht. Dieses Video bietet eine visuelle Methode, um die Konzepte und Aufgaben in dieser Dokumentation zu erlernen.
Versuchen Sie das Tutorial
In diesem Lernprogramm werden Sie die folgenden Tasks ausführen:
In diesem Lernprogramm wird der Ablauf der Katalogverkaufsprognose im Beispielprojekt verwendet. Die verwendete Datendatei ist catalog_seasfac.csv. Das folgende Bild zeigt ein Beispiel für den Ablauf der Modellierung.
Abb. 1. Ablauf der Modellierung von Proben
Das folgende Bild zeigt den Beispieldatensatz.Abbildung 2: Beispielhafter Datensatz
Aufgabe 1: Öffnen Sie das Beispielprojekt
Das Beispielprojekt enthält mehrere Datensätze und Modellierungsabläufe. Wenn Sie das Beispielprojekt noch nicht haben, finden Sie unter Tutorials eine Anleitung zum Erstellen des Beispielprojekts. Gehen Sie dann wie folgt vor, um das Beispielprojekt zu öffnen:
In Cloud Pak for Data wählen Sie im NavigationsmenüProjekte > Alle Projekte anzeigen aus.
Klicken Sie auf SPSS Modeler.
Klicken Sie auf die Registerkarte Assets, um die Datensätze und Modellierungsabläufe zu sehen.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt die Registerkarte Assets des Projekts. Sie sind nun bereit, mit dem zu diesem Lehrgang gehörenden Beispielmodellierungsablauf zu arbeiten.
Aufgabe 2: Untersuchen Sie die Knoten "Datenbestand" und "Typ"
Die Prognose der Katalogverkäufe umfasst mehrere Knotenpunkte. Gehen Sie folgendermaßen vor, um die Knoten Daten-Asset und Typ zu untersuchen:
Öffnen Sie auf der Registerkarte Assets den Modellierungsfluss Forecasting Catalog Sales, und warten Sie, bis die Leinwand geladen ist.
Doppelklicken Sie auf den Knoten catalog_seasfac.csv. Dieser Knoten ist ein Daten-Asset-Knoten, der auf die Datei catalog_seasfac.csv im Projekt verweist.
Überprüfen Sie die Eigenschaften des Dateiformats.
Optional: Klicken Sie auf Datenvorschau, um den vollständigen Datensatz zu sehen.
Doppelklicken Sie auf den Knoten Typ.
Klicken Sie auf Werte lesen.
Vergewissern Sie sich, dass die Rolle im Feld Männer auf Ziel eingestellt ist.
Vergewissern Sie sich, dass für alle anderen Felder die Rolle auf "Keine" gesetzt ist.
Klicken Sie auf Speichern.
Optional: Klicken Sie auf Datenvorschau, um den gefilterten Datensatz zu sehen.
Überprüfen Sie Ihren Fortschritt
Das folgende Bild zeigt den Knoten Typ. Jetzt können Sie die Daten visualisieren.
Führen Sie die folgenden Schritte aus, um einen Zeitdiagrammknoten zur Visualisierung der Daten zu verwenden:
Fügen Sie einen Knoten Zeitdiagramm hinzu:
Erweitern Sie in der Knotenpalette den Abschnitt Graphen.
Ziehen Sie den Knoten Zeitdiagramm auf die Leinwand.
Verbinden Sie den Knoten Typ mit dem neuen Knoten Zeitdiagramm.
Doppelklicken Sie auf den Knoten Zeitdiagramm, um seine Eigenschaften festzulegen.
Klicken Sie im Abschnitt Serien auf Spalten hinzufügen.
Wählen Sie das Feld Männer.
Klicken Sie auf OK.
Wählen Sie Benutzerdefinierte X-Achsen-Feldbeschriftung verwenden.
Für die Beschriftung der X-Achse wählen Sie Datum.
Deaktivieren Sie die Option Normalisieren.
Klicken Sie auf Speichern.
Bewegen Sie den Mauszeiger über das Feld ' [men] v. gehen Sie zum Knoten " " und klicken Sie auf das Symbol "Ausführen".
Klicken Sie im Bereich Ergebnisse und Modelle auf das Ergebnis mit dem Namen " [men] v. datum, um das Diagramm anzuzeigen.
Die Zeitreihe weist einen allgemeinen Aufwärtstrend auf; d. h. die Werte der Zeitreihe nehmen tendenziell im Laufe der Zeit zu. Der Aufwärtstrend scheint konstant zu sein, was auf einen linearen Trend hindeutet.
Außerdem weist die Zeitreihe ein deutliches saisonales Muster mit jährlichen Spitzen im Dezember auf, wie durch die vertikalen Linien im Diagramm angedeutet. Die saisonalen Schwankungen scheinen mit dem Aufwärtstrend der Zeitreihe zu wachsen, was darauf hindeutet, dass vermutlich eher eine multiplikative und keine additive Saisonalität vorliegt.
Nachdem Sie die Eigenschaften der Zeitreihe ermittelt haben, können Sie nun versuchen, sie zu modellieren. Das Verfahren der exponentiellen Glättung ist hilfreich für die Vorhersage von Zeitreihen, die Trends und/oder Saisonalität aufweisen. Wie bereits erwähnt, weisen diese Daten beide Merkmale auf.
Überprüfen Sie Ihren Fortschritt
Das folgende Bild zeigt ein Diagramm. Jetzt können Sie das Modell bauen.
Zur Konstruktion eines Modells mit exponentiellem Glätten mit bester Anpassung gehören die Bestimmung des Modelltyps, also die Frage, ob das Modell Trend, Saisonalität oder beides enthalten muss, und die anschließende Ermittlung der am besten geeigneten Parameter für das ausgewählte Modell.
Das Diagramm für den Umsatz im Bereich der Herrenbekleidung im Laufe der Zeit hat ein Modell mit linearer Trendkomponente und multiplikativer Saisonalitätskomponente nahegelegt. Dies deutet auf ein Winter-Modell hin. Zunächst wird jedoch ein einfaches Modell (ohne Trend und ohne Saisonalität) und dann ein Holt-Modell (mit linearem Trend, aber ohne Saisonalität) untersucht. Dadurch können Sie üben zu erkennen, wenn ein Modell keine gute Anpassung an die Daten darstellt. Dies ist eine entscheidende Fähigkeit für die erfolgreiche Modellerstellung.
Befolgen Sie diese Schritte, um ein einfaches Modell der exponentiellen Glättung zu erstellen:
Doppelklicken Sie auf den Knoten Männer (Zeitreihen), um seine Eigenschaften anzuzeigen.
Erweitern Sie den Abschnitt Beobachtungen und Zeitintervall, und legen Sie diese Eigenschaften fest:
Vergewissern Sie sich, dass Zeit/Datum auf Datum eingestellt ist.
Stellen Sie sicher, dass das Zeitintervall auf Monate eingestellt ist.
Erweitern Sie den Abschnitt Erstellungsoptionen - Allgemein, und legen Sie diese Eigenschaften fest:
Stellen Sie sicher, dass die Methode auf Exponentielle Glättung eingestellt ist.
Stellen Sie sicher, dass der Modelltyp auf Einfach eingestellt ist.
Klicken Sie auf Speichern.
Klicken Sie auf Alle ausführen.
Klicken Sie im Bereich " Ausgaben und Modelle " auf die Ausgabeergebnisse mit dem Namen " Zeitdiagramm von [men $TS-men] v. datum, um das Diagramm anzuzeigen.
Der Plot men (Herren) stellt die aktuellen Daten dar, während $TS-men das Zeitreihenmodell angibt.Abb. 3 Einfaches Modell mit exponentiellem Glätten
Das einfache Modell zeigt zwar einen graduellen (und ziemlich schwerfälligen) Aufwärtstrend, berücksichtigt jedoch keine Saisonalität. Sie können dieses Modell getrost verwerfen.
Versuchen Sie nun ein lineares Modell von Holt. Dieses Modell sollte zumindest den Trend besser abbilden als das einfache Modell, obwohl es wahrscheinlich auch nicht die Saisonalität erfasst.
Doppelklicken Sie auf den Knoten Männer (Zeitreihen) und legen Sie diese Eigenschaften fest:
Erweitern Sie den Abschnitt Build-Optionen - Allgemein.
Setzen Sie den Modelltyp auf den linearen Trend von Holt.
Klicken Sie auf Speichern.
Klicken Sie auf Alle ausführen.
Klicken Sie im Bereich " Ausgaben und Modelle " auf die Ausgabeergebnisse mit dem Namen " Zeitdiagramm von [men $TS-men] v. datum, um das Diagramm anzuzeigen.
Das Holt-Modell zeigt einen gleichmäßigeren Aufwärtstrend als das einfache Modell, berücksichtigt jedoch noch immer nicht die Saisonalität. Daher können Sie auch dieses Modell ignorieren.
Abbildung 4. Modell für den linearen Trend nach Holt
Sie erinnern sich, dass der ursprüngliche Plot für den Umsatz im Bereich Herrenbekleidung im Laufe der Zeit ein Modell nahelegte, das einen linearen Trend und multiplikative Saisonalität beinhaltet. Daher könnte das Winter-Modell ein geeigneterer Kandidat sein.
Doppelklicken Sie auf den Knoten Männer (Zeitreihen) und legen Sie diese Eigenschaften fest:
Erweitern Sie den Abschnitt Build-Optionen - Allgemein.
Setzen Sie den Modelltyp auf Winters' multiplikativ.
Klicken Sie auf Speichern.
Klicken Sie auf Alle ausführen.
Klicken Sie im Bereich " Ausgaben und Modelle " auf die Ausgabeergebnisse mit dem Namen " Zeitdiagramm von [men $TS-men] v. datum, um das Diagramm anzuzeigen.
Dieses Modell sieht besser aus. Das Modell spiegelt sowohl den Trend als auch die Saisonalität der Daten wider. Der Datensatz deckt einen Zeitraum von 10 Jahren ab und enthält 10 saisonale Spitzenwerte, die jeweils im Dezember eines Jahres auftreten. Die 10 Spitzen, die in den vorhergesagten Ergebnissen vorliegen, passen gut zu den 10 jährlichen Spitzen in den tatsächlichen Daten.
Die Ergebnisse zeigen jedoch auch die Grenzen des Verfahrens der exponentiellen Glättung auf. Wenn wir die nach oben und unten weisenden Spitzen betrachten, zeigt sich eine signifikante Struktur, die nicht berücksichtigt wurde.
Wenn Sie in erster Linie an der Modellierung eines langfristigen Trends mit saisonalen Schwankungen interessiert sind, kann das exponentielle Glätten eine gute Wahl sein. Um eine komplexere Struktur wie diese zu modellieren, sollten Sie das ARIMA-Verfahren verwenden.
Abbildung 5. Multiplikatives Winters-Modell.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt den Ablauf. Sie sind nun bereit, ein ARIMA-Modell zu erstellen.
Mit der Prozedur ARIMA können Sie ein Modell mit autoregressivem integriertem gleitendem Durchschnitt (AutoRegressive Integrated Moving Average) erstellen, das für eine feinabgestimmte Modellierung von Zeitreihen geeignet ist.
ARIMA-Modelle bieten feinere Methoden für die Modellierung von Trend- und saisonalen Komponenten als die Modelle mit exponentiellem Glätten und haben den zusätzlichen Vorteil, dass Prädiktorvariablen in das Modell integriert werden können.
In Fortsetzung des Beispiels des Katalogunternehmens, das ein Prognosemodell entwickeln möchte, haben Sie gesehen, wie das Unternehmen Daten über die monatlichen Verkäufe von Herrenbekleidung zusammen mit mehreren Reihen gesammelt hat, die zur Erklärung einiger der Schwankungen bei den Verkäufen verwendet werden könnten. Zu den möglichen Prädiktoren gehören die Anzahl der versendeten Kataloge und die Anzahl der Seiten im Katalog, die Anzahl der Telefonleitungen, über die eine Bestellung möglich ist, die Ausgaben für Werbung in Printmedien und die Anzahl der Kundendienstmitarbeiter.
Sind diese Prädiktoren sinnvoll für die Prognostizierung? Ist ein Modell mit Prädiktoren wirklich besser als ein Modell ohne Prädiktoren? Mit dem ARIMA-Verfahren können Sie ein Prognosemodell mit Prädiktoren erstellen und feststellen, ob es einen signifikanten Unterschied in der Vorhersagefähigkeit gegenüber dem exponentiellen Glättungsmodell ohne Prädiktoren gibt.
Bei der ARIMA-Methode können Sie eine Feinabstimmung des Modells vornehmen, indem Sie die Ordnungen der Autoregression, der Differenzierung und des gleitenden Durchschnitts sowie die saisonalen Gegenstücke zu diesen Komponenten festlegen. Die besten Werte für diese Komponenten manuell zu ermitteln, kann ein zeitaufwändiger Prozess sein, bei dem viel ausprobiert werden muss. Daher legen Sie für dieses Beispiel fest, dass der Expert Modeler ein ARIMA-Modell für Sie auswählt.
Als Nächstes erstellen Sie ein besseres Modell, indem Sie einige der anderen Variablen im Datensatz als Prädiktorvariablen behandeln. Als Prädiktoren am geeignetsten erscheinen folgende Variablen: Die Anzahl der versendeten Kataloge (mail), die Anzahl der Seiten im Katalog (page), die Anzahl der Telefonleitungen, über die eine Bestellung möglich ist (phone), die Ausgaben für Werbung in Printmedien (print) und die Anzahl der Kundendienstmitarbeiter (service).
Folgen Sie diesen Schritten, um ein ARIMA-Modell zu erstellen:
Doppelklicken Sie auf den Knoten Typ, um seine Eigenschaften festzulegen.
Vergewissern Sie sich, dass die Rolle für die Felder Mail, Page, Phone, Print und Service auf Input gesetzt ist.
Stellen Sie sicher, dass die Rolle für Männer auf Ziel eingestellt ist.
Setzen Sie die Rolle für alle übrigen Felder auf Keine.
Klicken Sie auf Speichern.
Doppelklicken Sie auf den Knoten Männer (Zeitreihen) und legen Sie diese Eigenschaften fest:
Erweitern Sie den Abschnitt Build-Optionen - Allgemein.
Setzen Sie die Methode auf Expert Modeler.
Stellen Sie als Modelltypnur ARIMA-Modelle ein.
Wählen Sie die Option Expert Modeler berücksichtigt saisonale Modelle.Abbildung 6. Wählen Sie nur ARIMA-Modelle
Klicken Sie auf Speichern.
Klicken Sie auf Alle ausführen.
Klicken Sie im Fensterbereich Ausgaben und Modelle auf das Modell mit dem Namen men, um die Modelldetails anzuzeigen.
Klicken Sie auf der Seite Modelle in der Spalte Ziel auf Männer.
Klicken Sie auf die Seite Modellinformationen. Sie sehen, dass das Modelierungprogramm Expert Modeler nur zwei der fünf angegebenen Prädiktoren als für das Modell signifikant ausgewählt hat.Abbildung 7. Der Expert Modeler wählt zwei Prädiktoren aus.
Schließen Sie die beiden Modellfenster.
Klicken Sie im Bereich " Ausgaben und Modelle " auf die Ausgabeergebnisse mit dem Namen " Zeitdiagramm von [men $TS-men] v. datum, um das Diagramm anzuzeigen.
Dieses Modell stellt eine Verbesserung gegenüber dem vorherigen Modell dar, da auch die große Spitze nach unten erfasst wird. Damit stellt es die bisher beste Anpassung dar.
Abbildung 8. ARIMA-Modell mit angegebenen Prädiktoren
Als nächstes können Sie das Modell noch weiter verfeinern, aber alle Verbesserungen ab diesem Zeitpunkt werden wahrscheinlich minimal sein. Sie haben festgestellt, dass das ARIMA-Modell mit Prädiktoren vorzuziehen ist, also verwenden Sie dieses Modell, um die Verkäufe für das kommende Jahr zu prognostizieren.
Schließen Sie das Diagrammfenster.
Doppelklicken Sie auf den Knoten Männer (Zeitreihen) und legen Sie diese Eigenschaften fest:
Erweitern Sie den Abschnitt Modelloptionen.
Wählen Sie die Option " Datensätze in die Zukunft verlängern " und setzen Sie den Wert auf " 12.
Wählen Sie die Option Zukünftige Werte für Eingaben berechnen aus.
Klicken Sie auf Speichern.
Klicken Sie auf Alle ausführen.
Klicken Sie im Bereich " Ausgaben und Modelle " auf die Ausgabeergebnisse mit dem Namen " Zeitdiagramm von [men $TS-men] v. datum, um das Diagramm anzuzeigen.
Die Vorhersage sieht gut aus. Wie erwartet, kehren die Umsätze nach dem Höchststand im Dezember wieder auf ein normales Niveau zurück, und in der zweiten Jahreshälfte ist ein stetiger Aufwärtstrend zu verzeichnen, wobei die Umsätze im Allgemeinen über denen des Vorjahrs liegen.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt ein Diagramm, das das ARIMA-Modell verwendet.
Sie haben erfolgreich eine komplexe Zeitreihe modelliert, die nicht nur einen Aufwärtstrend, sondern auch saisonale und andere Schwankungen beinhaltet. Außerdem haben Sie erfahren, wie Sie durch systematisches Ausprobieren eine immer engere Annäherung an ein genaues Modell erreichen können. Dieses Modell können Sie anschließend zur Vorhersage des zukünftigen Umsatzes verwenden.
In der Praxis müssten Sie das Modell bei jeder Aktualisierung Ihrer tatsächlichen Verkaufsdaten erneut anwenden, z. B. jeden Monat oder jedes Quartal, und aktualisierte Prognosen erstellen.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Tasks you'll do
Some tasks have a choice of tools and services.
Tools you'll use
Some tools perform the same tasks but have different features and levels of automation.
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Automate the model lifecycle, including preparing data, training models, and creating deployments.
Work with R notebooks and scripts in an integrated development environment.
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deploy and run your data science and AI solutions in a test or production environment.
Find and share your data and other assets.
Import asset metadata from a connection into a project or a catalog.
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Measure and monitor the quality of your data.
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Create your business vocabulary to enrich assets and rules to protect data.
Track data movement and usage for transparency and determining data accuracy.
Track AI models from request to production.
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Create a virtual table to segment or combine data from one or more tables.
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
Discover, profile, catalog, and share trusted data in your organization.
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
View, access, manipulate, and analyze your data without moving it.
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Where you work with data.
> Projects > View all projects
Where you find and share assets.
> Catalogs > View all catalogs
Where you deploy and run assets that are ready for testing or production.
> Deployments
Where you manage governance artifacts.
> Governance > Categories
Where you virtualize data.
> Data > Data virtualization
Where you consolidate data into a 360 degree view.
Über den Einsatz von Cookies auf dieser WebsiteUnsere Websites benötigen einige Cookies, um ordnungsgemäß zu funktionieren (erforderlich). Darüber hinaus können mit Ihrer Zustimmung weitere Cookies verwendet werden, um die Nutzung der Website zu analysieren, die Benutzerfreundlichkeit zu verbessern und Werbung zu schalten.Weitere Informationen finden Sie in Ihren. Durch den Besuch unserer Website erklären Sie sich mit der Verarbeitung von Informationen einverstanden, wie in der IBMDatenschutzbestimmung beschrieben.Um eine reibungslose Navigation zu ermöglichen, werden Ihre Cookie-Präferenzen über die hier aufgeführten IBM Web-Domains hinweg gemeinsam genutzt.