In diesem Tutorium geht es um die Überwachung von Statusinformationen einer Maschine und das Problem der Erkennung und Vorhersage von Fehlerzuständen.
Die Daten werden aus einer fiktiven Simulation erstellt und bestehen aus mehreren verketteten Reihen, die über die Zeit gemessen werden. Jeder Datensatz ist ein Snapshot-Bericht über das Gerät und enthält die folgenden Felder:
- In:
Time
. Eine ganze Zahl. - In:
Power
. Eine ganze Zahl. - In:
Temperature
. Eine ganze Zahl. Pressure
.0
wenn normal,1
für eine momentane Druckwarnung.- In:
Uptime
. Zeit seit letzter Wartung. - In:
Status
. Normalerweise ändert sich0
in einen Fehlercode, wenn ein Fehler auftritt (101
,202
oder303
). - In:
Outcome
. Der Fehlercode, der in dieser Zeitreihe angezeigt wird, oder0
, wenn kein Fehler auftritt. (Diese Codes stehen nur rückwirkend zur Verfügung.)
Die folgende Vorgehensweise ist für die meisten Data-Mining-Projekte typisch:
- Untersuchen Sie die Daten, um festzustellen, welche Attribute für die Vorhersage oder Erkennung der interessierenden Zustände relevant sein könnten.
- Behalten Sie diese Attribute (falls bereits vorhanden) bei oder leiten Sie diese ab und fügen Sie sie gegebenenfalls den Daten hinzu.
- Verwenden Sie die resultierenden Daten für das Training von Regeln und neuronalen Netzen.
- Testen Sie die trainierten Systeme mit unabhängigen Testdaten.
Versuchen Sie das Tutorial
In diesem Lernprogramm werden Sie die folgenden Tasks ausführen:
Beispielhafter Modellierungsablauf und Datensatz
In diesem Lehrgang wird der Ablauf der Zustandsüberwachung im Beispielprojekt verwendet. Die verwendete Datendatei ist cond1n.csv. Das folgende Bild zeigt ein Beispiel für den Ablauf der Modellierung.
Für jede Zeitreihe gibt es eine Reihe von Aufzeichnungen aus einer Periode des Normalbetriebs, gefolgt von einer Periode, die zur Störung führt, wie in der folgenden Abbildung dargestellt:
Aufgabe 1: Öffnen Sie das Beispielprojekt
Das Beispielprojekt enthält mehrere Datensätze und Modellierungsabläufe. Wenn Sie noch nicht über das Beispielprojekt verfügen, lesen Sie bitte das Thema Tutorials, um das Beispielprojekt zu erstellen. Gehen Sie dann wie folgt vor, um das Beispielprojekt zu öffnen:
- Wählen Sie in " watsonx aus dem Navigationsmenü " Projekte > Alle Projekte anzeigen.
- Klicken Sie auf SPSS Modeler Project.
- Klicken Sie auf die Registerkarte Assets, um die Datensätze und Modellierungsabläufe zu sehen.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt die Registerkarte Assets des Projekts. Sie sind nun bereit, mit dem zu diesem Lehrgang gehörenden Beispielmodellierungsablauf zu arbeiten.
Aufgabe 2: Untersuchen Sie den Datenbestand
Der Ablauf des Modellierers für die Zustandsüberwachung umfasst mehrere Knotenpunkte. Gehen Sie folgendermaßen vor, um den Knoten Daten-Asset zu untersuchen:
- Öffnen Sie auf der Registerkarte Assets den Modellierungsfluss für die Zustandsüberwachung und warten Sie, bis der Canvas geladen ist.
- Doppelklicken Sie auf den Knoten cond1n.csv. Dieser Knoten ist ein Data Asset-Knoten, der auf die Datei cond1n.csv im Projekt verweist.
- Überprüfen Sie die Eigenschaften des Dateiformats.
- Ziehen Sie den Knoten Auswählen aus dem Abschnitt Aufzeichnungsoperationen in der Palette auf die Leinwand. Bewegen Sie den Mauszeiger über den Knoten, klicken Sie auf Titel bearbeiten, und benennen Sie ihn in "
Select (101)
um. Verbinden Sie ihn mit dem Daten-Asset-Knoten cond1n.csv. Doppelklicken Sie auf den Knoten Auswählen und geben Sie den Wert 'Outcome == 101
für Bedingung ein. - Klicken Sie auf Speichern.
- Ziehen Sie als Nächstes aus dem Abschnitt Graph in der Palette den Knoten Plot auf die Leinwand. Bewegen Sie den Mauszeiger über den Knoten, klicken Sie auf die Schaltfläche " Titel bearbeiten" und benennen Sie ihn in " Time v um. Leistung v. Temperatur (101). Verbinden Sie ihn dann mit dem Knoten Select.
- Doppelklicken Sie auf den Knoten Darstellung und klicken Sie auf die Schaltfläche 3-D-Diagramm, um eine dritte Achse zu Ihrer Darstellung hinzuzufügen. Wählen Sie aus der Liste die Felder aus, die im 3-D-Diagramm angezeigt werden sollen. In diesem Fall: "
Time
, "Power
und "Temperature
. - Bewegen Sie den Mauszeiger über den Knoten " Plot" und klicken Sie auf das Ausführungssymbol " .
- Klicken Sie im Fensterbereich Ausgaben und Modelle auf die Ausgabeergebnisse mit dem Namen " Zeit v. Leistung v. Temperatur (101), um die Ergebnisse zu sehen.
Diese Grafik zeigt 101 Fehler bei steigender Temperatur und schwankender Leistung im Laufe der Zeit. Experimentieren Sie mit der Auswahl anderer Fehlerbedingungen und zeigen Sie andere Diagramme an.
Anhand dieser Diagramme sind das Vorhandensein und die Änderungsrate von Temperatur und Leistung sowie das Vorhandensein und der Grad von Schwankungen für die Vorhersage und Unterscheidung von Fehlern relevant. Diese Attribute können den Daten vor der Anwendung der Lernsysteme hinzugefügt werden.
- Optional: Löschen Sie die Knoten Select und Plot, um einen möglichen Fehler zu vermeiden, wenn der Benutzer den Ablauf später ausführt.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt den Ablauf. Jetzt können Sie die Daten vorbereiten.
Aufgabe 3: Aufbereitung der Daten
Basierend auf den Ergebnissen einer Datenexploration leitet der folgende Ablauf die relevanten Daten ab und lernt, wie Fehler vorhergesagt werden.
In diesem Beispiel wird der Fluss mit dem Namen Condition Monitoring verwendet, der in dem mit dem Produkt installierten Beispielprojekt verfügbar ist. Die Datendateien sind cond1n.csv und cond2n.csv.
- Importknoten für Datenassets. Liest die Datendatei cond1n.csv.
- Druckwarnungen (Ableiten). Zählt die Anzahl der momentan vorhandenen Druckwarnungen. Wird zurückgesetzt, wenn Zeit zu 0 zurückkehrt.
- TempInc (Ableiten). Berechnet die momentane Temperaturänderungsrate mit Hilfe von "
@DIFF1
. - PowerInc (Ableitung). Berechnet die momentane Leistungsänderungsrate mit Hilfe von "
@DIFF1
. - EnergieFlux (Ableiten). Ein Flag, das wahr ist, wenn die Leistung im letzten und im aktuellen Datensatz in entgegengesetzte Richtungen variiert, d. h. für eine Leistungsspitze oder ein Leistungstief.
- Energiestatus (Ableiten). Ein Zustand, der als "
Stable
beginnt und zu "Fluctuating
wechselt, wenn zwei aufeinanderfolgende Leistungsflüsse erkannt werden. Schaltet nur dann auf 'Stable
zurück, wenn fünf Zeitintervalle lang kein Stromfluss vorhanden ist oder wenn 'Time
zurückgesetzt wird. - EnergieVeränd (Ableiten). Durchschnitt von
PowerInc
im Verlauf der letzten fünf Zeitintervalle. - TempVeränd (Ableiten). Durchschnitt von
TempInc
im Verlauf der letzten fünf Zeitintervalle. - Ursprungswerte verwerfen (Auswahl). Verwirft den ersten Datensatz aller Zeitreihen, um große (inkorrekte) Sprünge in
Power
undTemperature
an den Grenzen zu vermeiden. - Felder verwerfen (Filter). Reduziert Datensätze zu
Uptime
,Status
,Outcome
,Pressure Warnings
,PowerState
,PowerChange
, andTempChange
. - Typ. Definiert die Rolle von "
Outcome
als Ziel (das Feld, das vorhergesagt werden soll). Darüber hinaus wird der Messwert für 'Outcome
als Nominalwert, für 'Pressure Warnings
als Kontinuierlich und für 'PowerState
' als Flag definiert.
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt die Ableitungsknoten. Sie sind nun bereit, das Modell zu trainieren.
Aufgabe 4: Trainieren des Modells
Die Ausführung des Ablaufs trainiert die C5.0-Regel und das neuronale Netz Das Training des Netzes kann einige Zeit in Anspruch nehmen, aber es kann frühzeitig unterbrochen werden, um ein Netz zu erhalten, das vernünftige Ergebnisse liefert. Nach Abschluss des Lernvorgangs werden Modell-Nuggets erstellt: eines für das neuronale Netz und eines für die Regel.
Mit diesen Modell-Nuggets können Sie das System testen oder die Ergebnisse des Modells exportieren. In diesem Beispiel testen Sie die Ergebnisse des Modells. Folgen Sie diesen Schritten, um das Modell zu trainieren:
- Klicken Sie auf Alle ausführen und generieren Sie sowohl das C5.0 als auch das Neuronale Netzwerkmodell.
- Sehen Sie sich jedes der Modelle an. Doppelklicken Sie auf das Modell Outcome (C5.0) und klicken Sie auf Modell anzeigen, um die Ergebnisse zu überprüfen. Wiederholen Sie diesen Schritt für das Modell Outcome (Neuronales Netz).
Überprüfen Sie Ihren Fortschritt
Die folgende Abbildung zeigt die Ergebnisse des Modells. Jetzt können Sie das Modell testen.
Aufgabe 5: Testen Sie das Modell
Folgen Sie diesen Schritten, um das Modell zu testen:
- Positionieren Sie die Nuggets neu, so dass der Knoten "Typ" mit dem Nugget "Neuronales Netz" verbunden ist, das wiederum mit dem Nugget " C5.0 verbunden ist.
- Ziehen Sie aus dem Abschnitt Ausgaben in der Palette den Knoten Analyse auf die Leinwand und verbinden Sie ihn mit dem C5.0.
- Doppelklicken Sie auf den Knoten Daten-Asset.
- Klicken Sie auf Datenbestand ändern.
- Wählen Sie Datenbestand > cond2n.csv.
- Klicken Sie auf Auswählen.
- Klicken Sie auf Speichern.
- Bewegen Sie den Mauszeiger über den Analyseknoten und klicken Sie auf das Ausführungssymbol " . Auf diese Weise erhält man Zahlen, die die Genauigkeit des lernfähigen Netzes und der Regel widerspiegeln.
- Klicken Sie im Fensterbereich Ausgaben und Modelle auf die Ausgabeergebnisse mit dem Namen Analyse, um die Ergebnisse anzuzeigen.
- Überprüfen Sie die Ergebnisse und vergleichen Sie die Analyse für jedes Modell.
Überprüfen Sie Ihren Fortschritt
Das folgende Bild zeigt den fertigen Ablauf.
Zusammenfassung
In diesem Beispiel wurde gezeigt, wie Statusinformationen einer Maschine überwacht werden können, um Fehlerzustände zu erkennen und vorherzusagen. Sie haben eine Reihe von Ableitungsknoten verwendet, um die Daten vorzubereiten, und dann ein C5.0 erstellt.
Nächste Schritte
Sie sind nun bereit, andere ' SPSS® Modeler Tutorials auszuprobieren.