Tool auswählen

Die Basisservices für Cloud Pak for Data as a Service stellen eine Reihe von Tools für das Vorbereiten, Analysieren undModellieren von Daten für Benutzer mit unterschiedlichem Kenntnisstand - vom Einsteigerbis hin zum Experten - bereit. Das richtige Tool für Sie hängt vom Typ der Daten, die Sie haben, von den Aufgaben, die Sie ausführen möchten, und vom Umfang der gewünschten Automatisierung ab.

Beachten Sie die folgenden Faktoren, um das richtige Tool zu wählen.

Der Typ der Daten, die Sie haben

  • Tabellendaten in Dateien mit begrenzter Satzlänge oder relationale Daten in fernen Datenquellen
  • Bilddateien
  • Textdaten in Dokumenten

Die Art der Tasks, die Sie ausführen müssen.

  • Daten vorbereiten: Daten bereinigen, formen, visualisieren, organisieren und validieren.
  • Daten analysieren: Muster und Beziehungen in Daten erkennen und Erkenntnisse anzeigen.
  • Modelle erstellen: Erstellen, Trainieren, Testen sowie Bereitstellen von Modellen, um Vorhersagen zu treffen oder Entscheidungen zu optimieren.

Wie viel Automatisierung Sie wünschen

  • Codeeditortools: Schreiben von Code in Python, R oder Scala.
  • Tools für grafische Erstellungsprogramme: Verwenden Sie Menüs und Drag-and-drop-Funktionalität in einem Erstellungsprogramm, um eine visuelle Programmierung durchzuführen.

  • Automatisierte Erstellungstools: Verwenden Sie diese Option, um automatisierte Tasks zu konfigurieren, die eine eingeschränkte Benutzereingabe erfordern.

Wählen Sie das geeignete Tool:

Tools für Tabellendaten und relationale Daten

{: #tab}Tools für Tabellendaten und relationale Daten nach Task:

Tool Tooltyp Daten vorbereiten Daten analysieren Modelle erstellen
Editor für Jupyter-Notebooks Codeeditor
Federated Learning Codeeditor
RStudio Codeeditor
Data Refinery Grafisches Erstellungsprogramm
Maskierungsabläufe Automatisiertes Erstellungsprogramm
Watson Anfrage Grafisches Erstellungsprogramm
DataStage Grafisches Erstellungsprogramm
Dashboard-Editor Grafisches Erstellungsprogramm
SPSS Modeler Grafisches Erstellungsprogramm
Erstellungsprogramm für Decision Optimization-Modelle Grafisches Erstellungsprogramm und Codeeditor
AutoAI Automatisiertes Erstellungsprogramm
Metadatenimport Automatisiertes Erstellungsprogramm
Metadatenaufbereitung Automatisiertes Erstellungsprogramm
IBM Match 360 with Watson (Betaversion) Automatisiertes Erstellungsprogramm

Tools für Textdaten

{: #text}Tools zum Erstellen eines Modells, das Textdaten klassifiziert:

Tool Codeeditor Grafisches Erstellungsprogramm Automatisiertes Erstellungsprogramm
Editor für Jupyter-Notebooks
RStudio
SPSS Modeler

Tools für Bilddaten

{: #image}Tools zum Erstellen eines Modells, das Bilder klassifiziert:

Tool Codeeditor Grafisches Erstellungsprogramm Automatisiertes Erstellungsprogramm
Editor für Jupyter-Notebooks
RStudio

Zugriff auf Tools

{: #access}Wenn Sie ein Tool verwenden möchten, müssen Sie ein Asset erstellen, das für dieses Tool spezifisch ist, oder Sie müssen ein vorhandenes Asset für dieses Tool öffnen. Klicken Sie zum Erstellen eines Assets auf Neues Asset und wählen Sie dann den gewünschten Assettyp aus. In dieser Tabelle werden die Assettypen für die einzelnen Tools gezeigt.

Verwendetes Tool Auszuwählender Assettyp
Editor für Jupyter-Notebooks Jupyter-Notebook
Data Refinery Data Refinery-Ablauf
Maskierungsabläufe Maskierungsabläufe
DataStage DataStage-Fluss
Dashboard-Editor Dashboard
SPSS Modeler Modeler-Ablauf
Erstellungsprogramm für Decision Optimization-Modelle Decision Optimization
AutoAI AutoAI-Experiment
Federated Learning Experiment für föderiertes Lernen
Metadatenimport Metadatenimport
Metadatenaufbereitung Metadatenanreicherung
IBM Match 360 with Watson (Betaversion) Konfiguration der Masterdaten

Klicken Sie auf IDE starten > RStudio, um Notebooks mit RStudio zu bearbeiten.

Editor für Jupyter-Notebooks

{: #jn}Verwenden Sie den Editor für Jupyter-Notebooks, um ein Notebook zu erstellen, in dem Sie Code ausführen, um Daten vorzubereiten, zu visualisieren und zu analysieren, oder ein Modell erstellen und trainieren.

Erforderlicher Service Watson Studio

Datenformat Beliebig

Datengröße Beliebig

Wie Sie Daten vorbereiten, analysieren oder Modelle erstellen können Schreiben Sie Code in Python, R oder Scala. Schließen Sie Rich Text und Medien mit Ihrem Code ein. Arbeiten Sie mit jeder Art von Daten in jeder Art und Weise, die Sie wollen. Verwenden Sie vorinstalliert oder installieren Sie andere Open-Source-und IBM Bibliotheken und -Pakete. Ausführung des Codes planen Importieren Sie ein Notebook aus einer Datei, einer URL oder der Galerie. Teilen Sie schreibgeschützte Kopien Ihres Notebooks extern mit.

Erste Schritte Klicken Sie zum Erstellen eines Notebooks auf Neues Asset > Notebook.

Weitere Informationen Video zu öffentlichen Datasets laden und analysieren Videos zu Notebooks Beispielnotebooks Dokumentation zu Notebooks

Data Refinery

{: #dr}Verwenden Sie Data Refinery, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen Data Refinery-Ablauf und führen ihn als Gruppe von geordneten Operationen für Daten aus.

Erforderliche Services Watson Studio oder Watson Knowledge Catalog

Datenformat Tabellarisch: Avro, CSV, JSON, Parquet, SAS mit der Erweiterung "sas7bdat" (schreibgeschützt), TSV (schreibgeschützt) oder Textdateien mit Trennzeichen Relational: Tabellen in relationalen Datenquellen

Datengröße Beliebig

Vorbereitung von Daten Daten mit über 60 Operationen bereinigen, formen, organisieren. Speichern Sie verfeinerte Daten als neue Datei, oder aktualisieren Sie die ursprünglichen Daten. Profildaten, um sie zu validieren. Verwenden Sie interaktive Vorlagen, um Daten mit Codeoperationen, Funktionen und logischen Operatoren zu bearbeiten. Planen Sie wiederkehrende Operationen für Daten.

Analyse von Daten Identifizieren Sie Muster, Verbindungen und Beziehungen innerhalb der Daten in mehreren Visualisierungsdiagrammen.

Erste Schritte Klicken Sie auf Neues Asset > Data Refinery-Ablauf, um einen Data Refinery-Ablauf zu erstellen.

Weitere Informationen Videos über Data Refinery Formdatenvideo Dokumentation zu Data Refinery

Watson Anfrage

{: #dv} Verwenden Sie Watson Query, um mehrere Datenquellen in einer einzigen selbstausgleichenden Sammlung von Datenquellen oder Datenbanken zu verbinden.

Datenformat Relational: Tabellen in relationalen Datenquellen

Datengröße Beliebig

Vorbereitung von Daten Verbindung zu mehreren Datenquellen herstellen. Erstellen Sie virtuelle Tabellen.

Erste Schritte Klicken Sie zum Erstellen virtueller Tabellen auf Daten > Datenvirtualisierung. Klicken Sie im Servicemenü auf Virtualisierung > Virtualisieren > Tabellen.

Weitere Informationen Dokumentation zu Watson Query

DataStage

{: #ds}Verwenden Sie DataStage, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen DataStage-Ablauf und führen ihn als geordnete Folge von Operationen aus, die auf Daten angewendet werden.

Datenformat Tabellarisch: Avro-, CSV-, JSON-, Parquet-, TSV- (schreibgeschützt) oder Textdateien mit Trennzeichen Relational: Tabellen in relationalen Datenquellen

Datengröße Beliebig

Vorbereitung von Daten Entwerfen Sie einen grafischen Datenintegrationsablauf, der Orchestrate-Code für die Ausführung auf der DataStage-Parallelverarbeitungsengine mit hoher Leistung generiert. Führen Sie Operationen wie Join, Funnel, Checksum, Merge, Modify, Remove Duplicates und Sort aus.

Erste Schritte Klicken Sie zum Erstellen eines DataStage-Ablaufs auf Neues Asset > DataStage -Ablauf.

Weitere Informationen DataStage-Dokumentation

Dashboard-Editor

{: #dash} Mit dem Dashboardeditor können Sie eine Gruppe von Visualisierungen von Analyseergebnissen in einem grafischen Erstellungsprogramm erstellen.

Erforderlicher Service Cognos Dashboard Embedded

Datenformat Tabellarisch: CSV-Dateien Relational: Tabellen in einigen relationalen Datenquellen

Datengröße Beliebige Größe

Analyse von Daten Erstellen Sie Diagramme ohne Codierung. Fügen Sie Text, Medien, Webseiten, Bilder und Formen in Ihr Dashboard ein. Teilen Sie interaktive Dashboards extern mit.

Erste Schritte Klicken Sie zum Erstellen eines Dashboards auf Neues Asset > Statusübersicht.

Weitere Informationen

Videos zu Dashboards Dokumentation zu Dashboards

SPSS Modeler

{: #spss} Mit SPSS Modeler können Sie einen Ablauf erstellen, um Daten vorzubereiten und ein Modell mit einem Ablaufeditor in einem grafischen Erstellungsprogramm zu erstellen und zu trainieren.

Erforderliche Services Watson Studio

Datenformate Relational: Tabellen in relationalen Datenquellen Tabellarisch: Excel-Dateien (.xls oder .xlsx), CSV-Dateien oder SPSS Statistics-Dateien (.sav) Text: In den unterstützten relationalen Tabellen oder Dateien

Datengröße Beliebig

Vorbereitung von Daten Verwenden Sie automatische Datenaufbereitungsfunktionen. SQL-Anweisungen schreiben, um Daten zu bearbeiten. Bereinigen, Formen, Muster, Sortieren und Ableiten von Daten.

Analyse von Daten Visualisieren Sie Daten mit über 40 Diagrammen. Geben Sie die natürliche Sprache eines Textfelds an.

So können Sie Modelle erstellen Erstellen Sie Vorhersagemodelle. Wählen Sie aus über 40 Modellierungsalgorithmen. Automatische Modellierungsfunktionen verwenden. Modellzeitreihen oder georäumliche Daten.
Klassifizieren Sie Textdaten. Identifizieren Sie Beziehungen zwischen den Konzepten in Textdaten.

Erste Schritte Klicken Sie zum Erstellen eines SPSS Modeler-Ablaufs auf Neues Asset > Modeler-Ablauf und wählen Sie IBM SPSS Modeler aus.

Weitere Informationen SPSS Modeler - Aktualisierte Benutzerschnittstelle für ein Data-Science-Powerhouse-Video für Unternehmen Dokumentation zu SPSS Modeler

Erstellungsprogramm für Decision Optimization-Modelle

{: #do}Sie können Decision Optimization zum Erstellen und Ausführen von Optimierungsmodellen im Erstellungsprogramm für Decision Optimization-Modelle oder in einem Jupyter-Notebook verwenden.

Erforderliche Services Watson Studio

Datenformate Tabellarisch: CSV-Dateien

Datengröße Beliebig

Vorbereitung von Daten Importieren Sie relevante Daten in ein Szenario und bearbeiten Sie sie.

So können Sie Modelle erstellen Erstellen Sie präskriptive Entscheidungsoptimierungsmodelle. Erstellen, Importieren und Bearbeiten von Modellen in Python DOcplex, OPL oder Ausdrücken natürlicher Sprache Erstellen, Importieren und Bearbeiten von Modellen in Notebooks

Wie Sie Modelle lösen können Führen Sie Entscheidungsoptimierungsmodelle mit CPLEX-Engines aus und lösen Sie sie. Untersuchen und Vergleichen von Lösungen für mehrere Szenarios Erstellen von Tabellen, Diagrammen und Anmerkungen, um Daten und Lösungen für ein oder mehrere Szenarios zu visualisieren

Erste Schritte Klicken Sie zum Erstellen eines Decision Optimization-Modells auf Neues Asset > Decision Optimization oder bei Notebooks auf Neues Asset > Notebook.

Weitere Informationen Videos über Decision Optimization Dokumentation zu Decision Optimization

AutoAI-Tool

{: #auto}Sie können das AutoAI-Tool zum automatischen Analysieren Ihrer Daten und Generieren von infrage kommenden Modellpipelines verwenden, die für Ihr Vorhersagemodellierungsproblem angepasst sind.

Erforderlicher Service Watson Machine Learning

Datenformat Tabellarisch: CSV-Dateien

Datengröße Weniger als 1 GB

Vorbereitung von Daten Daten automatisch transformieren, z. B. fehlende Werte imputieren.

So können Sie Modelle erstellen Trainieren Sie eine binäre Klassifizierung, eine Klassifizierung mit mehreren Klassen oder ein Regressionsmodell. Zeigen Sie eine Baumstrukturinfografik an, die die Sequenzen von AutoAI-Trainingsstufen anzeigt. Generieren Sie ein Leaderboard von Modellpipelines, die durch Cross-Validation-Scores eingestuft werden. Speichern Sie eine Pipeline als Modell.

Erste Schritte Zum Erstellen eines AutoAI-Experiments klicken Sie auf Neues Asset > AutoAI-Experiment.

Weitere Informationen Dokumentation zu AutoAI

Federated Learning

{: #fl}Verwenden Sie das Tool "Federated Learning", um ein allgemeines Modell mithilfe von verteilten Daten zu trian. Die Daten werden niemals kombiniert oder gemeinsam genutzt, wobei die Datenintegrität zu wahren ist, während alle teilnehmenden Parteien ein Modell basierend auf den aggregierten Daten bereitstellen.

Erforderlicher Service Watson Machine Learning

Datenformat Beliebig

Datengröße Beliebige Größe

So können Sie Modelle erstellen Wählen Sie ein Schulungsframework aus. Konfigurieren Sie das allgemeine Modell. Konfigurieren Sie eine Datei für die Schulung des allgemeinen Modells. Haben ferne Parteien ihre Daten trainiert. Implementieren Sie das allgemeine Modell.

Erste Schritte Klicken Sie zum Erstellen eines Experiments auf Neues Asset > Experiment für föderiertes Lernen.

Weitere Informationen Dokumentation zu Federated Learning

Metadatenimport

{: #metadata}Verwenden Sie das Tool für Metadatenimport, um technische Metadaten und Prozessmetadaten für Datenressourcen in ein Projekt oder einen Katalog zu importieren.

Erforderlicher Service Watson Knowledge Catalog

Datenformat Beliebig

Datengröße Beliebige Größe

Vorbereitung von Daten Importieren von Datenassets aus einer Verbindung zu einer Datenquelle.

Erste Schritte Klicken Sie auf Neues Asset > Metadatenimport, um Metadaten zu importieren.

Weitere Informationen Dokumentation zum Metadatenimport Videos über Watson Knowledge Catalog

Metadatenanreicherung

{: #mde}Verwenden Sie das Metadatenanreicherungswerkzeug, um Datenressourcen automatisch zu profilieren und die Datenqualität in einem Projekt zu analysieren.

Erforderlicher Service Watson Knowledge Catalog

Datenformat Relational und strukturiert: Tabellen und Dateien in relationalen und nicht relationalen Datenquellen Tabellarisch: Avro-, CSV-oder Parquet-Dateien

Datengröße Beliebige Größe

Wie Sie Daten vorbereiten und analysieren können Erstellen Sie ein Profil und analysieren Sie eine ausgewählte Gruppe von Datenassets in einem Projekt.

Erste Schritte Klicken Sie auf Neues Asset > Metadatenaufbereitung, um Daten aufzubereiten.

Weitere Informationen Dokumentation zur Aufbereitung von Metadaten

IBM Match 360 mit Watson

{: #match360}Verwenden Sie IBM Match 360 mit Watson, um Stammdatenentitäten zu erstellen, die digitale Zwillinge Ihrer Kunden darstellen. Modellieren Sie Ihre Daten und ordnen Sie sie zu und führen Sie anschließend den Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen. Passen Sie Ihren Abgleichalgorithmus an und optimieren Sie ihn, um die Anforderungen Ihres Unternehmens zu erfüllen.

Erforderliche Services IBM Match 360 mit Watson IBM Watson Knowledge Catalog

Datengröße Bis zu 1.000.000 Datensätze (für den Beta Lite-Plan)

Vorbereitung von Daten Modellieren und ordnen Sie Daten aus Quellen in Ihrem gesamten Unternehmen zu. Führen Sie den anpassbaren Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen. Master-Datenentitäten und die zugehörigen Datensätze anzeigen und bearbeiten.

Erste Schritte Klicken Sie zum Erstellen eines IBM Match 360-Konfigurationsassets auf Neues Asset > Stammdatenkonfiguration.

Weitere Informationen Dokumentation zu IBM Match 360 with Watson

RStudio-IDE

{: #rs}Verwenden Sie die RStudio-IDE, um Daten zu analysieren oder um Shiny-Anwendungen zu erstellen, indem Sie R-Code schreiben. RStudio kann in ein Git-Repository integriert werden, das dem Projekt zugeordnet werden muss.

Erforderlicher Service Watson Studio

Datenformat Beliebig

Datengröße Beliebige Größe

Wie Sie Daten vorbereiten, analysieren und Modelle erstellen können Schreiben Sie Code in R. Erstellen Sie Shiny-Apps. Verwenden Sie Open-Source-Bibliotheken und -Pakete. Schließen Sie Rich Text und Medien mit Ihrem Code ein. Bereiten Sie Daten vor. Daten visualisieren. Entdecken Sie Erkenntnisse aus den Daten. Bauen und trainieren Sie ein Modell mit Open-Source-Bibliotheken. Teilen Sie Ihre Shiny-App in einem Git-Repository.

Erste Schritte Um RStudio zu verwenden, klicken Sie auf IDE starten > RStudio-.

Weitere InformationenÜbersicht über RStudio IDE-Video Videos über RStudio Dokumentation zu RStudio

Maskierungsabläufe

{: #dp}Verwenden Sie das Werkzeug "Maskierungsflüsse", um maskierte Kopien oder maskierte Untergruppen von Daten aus dem Katalog vorzubereiten. Die Daten werden mithilfe von erweiterten Maskierungsoptionen mit Datenschutzregeln deidentifiziert.

Erforderlicher Service Watson Knowledge Catalog

Datenformat Relational: Tabellen in relationalen Datenquellen

Datengröße Beliebige Größe

Wie Sie Daten vorbereiten, analysieren oder Modelle erstellen können Importieren Sie Datenassets aus dem regulierten Katalog in das Projekt. Erstellen Sie Definitionen für Maskierungsflussjobs, um anzugeben, welche Daten mit den Datenschutzregeln maskiert werden sollen. Optional Teilmengen von Daten, um die Größe kopierter Daten zu reduzieren. Führen Sie Maskierungsflussjobs aus, um maskierte Kopien in Zieldatenbankverbindungen zu laden.

Erste Schritte Stellen Sie sicher, dass Vorausgesetzte Schritte in Watson Knowledge Catalog sind abgeschlossen. Führen Sie eine der folgenden Tasks aus, um Daten zu privatisieren:

  • Klicken Sie auf Neues Asset > Maskierungsablauf.
  • Klicken Sie auf die Menüoptionen für einzelne Datenressourcen, um diese Anlage direkt zu maskieren.

Weitere Informationen Dokumentation zur Maskierung von Daten

Übergeordnetes Thema: Projekte