Tool auswählen | IBM Cloud Pak for Data as a Service

Zurück zur englischen Version der Dokumentation

Tool auswählen

Die Basisservices für Cloud Pak for Data as a Service stellen eine Reihe von Tools für das Vorbereiten, Analysieren undModellieren von Daten für Benutzer mit unterschiedlichem Kenntnisstand - vom Einsteigerbis hin zum Experten - bereit. Das richtige Tool für Sie hängt vom Typ der Daten, die Sie haben, von den Aufgaben, die Sie ausführen möchten, und vom Umfang der gewünschten Automatisierung ab.

Um zu sehen, welche Tools Sie in einem Projekt verwenden und welche Services für diese Tools erforderlich sind, öffnen Sie die Karte für Tools und Services.

Beachten Sie die folgenden Faktoren, um das richtige Tool zu wählen.

Der Typ der Daten, die Sie haben

Tabellendaten in Dateien mit begrenzter Satzlänge oder relationale Daten in fernen Datenquellen
Bilddateien
Textdaten (unstrukturierte Daten) in Dokumenten

Die Art der Tasks, die Sie ausführen müssen.

Daten vorbereiten: Daten bereinigen, formen, visualisieren, organisieren und validieren.
Daten analysieren: Muster und Beziehungen in Daten erkennen und Erkenntnisse anzeigen.
Modelle erstellen: Erstellen, Trainieren, Testen sowie Bereitstellen von Modellen, um Vorhersagen zu treffen oder Entscheidungen zu optimieren.

Wie viel Automatisierung Sie wünschen

Codeeditortools: Zum Schreiben von Code in Python oder R, alle auch mit Spark.
Tools für grafische Erstellungsprogramme: Verwenden Sie Menüs und Drag-and-drop-Funktionalität in einem Erstellungsprogramm, um eine visuelle Programmierung durchzuführen.
Automatisierte Erstellungstools: Verwenden Sie diese Option, um automatisierte Tasks zu konfigurieren, die eine eingeschränkte Benutzereingabe erfordern.

Wählen Sie das geeignete Tool:

Tools für Tabellendaten und relationale Daten
Tools für Textdaten
Tools für Bilddaten
Zugriff auf Tools

Tools für Tabellendaten und relationale Daten

Tools für Tabellendaten und relationale Daten nach Task:

Tools für Tabellendaten und relationale Daten
Tool	Tooltyp	Daten vorbereiten	Daten analysieren	Modelle erstellen
Editor für Jupyter-Notebooks	Codeeditor	✓	✓	✓
Federated Learning	Codeeditor			✓
RStudio	Codeeditor	✓	✓	✓
Data Refinery	Grafisches Erstellungsprogramm	✓	✓
Maskierungsablauf	Automatisiertes Erstellungsprogramm	✓
Watson Query	Grafisches Erstellungsprogramm	✓
DataStage	Grafisches Erstellungsprogramm	✓
SPSS Modeler	Grafisches Erstellungsprogramm	✓	✓	✓
Erstellungsprogramm für Decision Optimization-Modelle	Grafisches Erstellungsprogramm und Codeeditor	✓		✓
AutoAI	Automatisiertes Erstellungsprogramm	✓		✓
Metadata import	Automatisiertes Erstellungsprogramm	✓
Metadatenaufbereitung	Automatisiertes Erstellungsprogramm	✓	✓
Datenqualitätsregel	Automatisierter Builder und Codeeditor		✓
IBM Match 360 with Watson (Betaversion)	Automatisiertes Erstellungsprogramm	✓
Watson Pipelines	Grafisches Erstellungsprogramm	✓	✓	✓

Tools für Textdaten

Tools zum Erstellen eines Modells, das mit Textdaten arbeitet:

Tools für Textdaten
Tool	Codeeditor	Grafisches Erstellungsprogramm
Editor für Jupyter-Notebooks	✓
RStudio	✓
SPSS Modeler		✓
Watson Pipelines		✓

Tools für Bilddaten

Tools zum Erstellen eines Modells, das Bilder klassifiziert:

Tools für Bilddaten
Tool	Codeeditor	Grafisches Erstellungsprogramm
Editor für Jupyter-Notebooks	✓
RStudio	✓
Watson Pipelines		✓

Zugriff auf Tools

Wenn Sie ein Tool verwenden möchten, müssen Sie ein Asset erstellen, das für dieses Tool spezifisch ist, oder Sie müssen ein vorhandenes Asset für dieses Tool öffnen. Klicken Sie zum Erstellen eines Assets auf Neues Asset oder Assets importieren und wählen Sie dann den gewünschten Assettyp aus. In dieser Tabelle werden die Assettypen für die einzelnen Tools gezeigt.

Zuordnung von Tools zu Assettyp
Verwendetes Tool	Auszuwählender Assettyp
Editor für Jupyter-Notebooks	Editor für Jupyter-Notebooks
Data Refinery	Data Refinery-Ablauf
Maskierungsabläufe	Maskierungsabläufe
DataStage	DataStage-Fluss
SPSS Modeler	Modeler-Ablauf
Erstellungsprogramm für Decision Optimization-Modelle	Decision Optimization
AutoAI	AutoAI-Experiment
Federated Learning	Experiment für föderiertes Lernen
Metadata import	Metadata import
Metadatenaufbereitung	Metadatenanreicherung
Datenqualitätsregeln	Datenqualitätsregel
IBM Match 360 with Watson (Betaversion)	Konfiguration der Masterdaten

Klicken Sie auf IDE starten > RStudio, um Notebooks mit RStudio zu bearbeiten.

Editor für Jupyter-Notebooks

Verwenden Sie den Editor für Jupyter-Notebooks, um ein Notebook zu erstellen, in dem Sie Code ausführen, um Daten vorzubereiten, zu visualisieren und zu analysieren, oder ein Modell erstellen und trainieren.

Erforderliche Services: Watson Studio
Datenformat: Any
Data Size: Any
Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können: Schreiben Sie Code in Python oder R, alle auch mit Spark.; Schließen Sie Rich Text und Medien mit Ihrem Code ein.; Arbeiten Sie mit jeder Art von Daten in jeder Art und Weise, die Sie wollen.; Verwenden Sie vorinstalliert oder installieren Sie andere Open-Source-und IBM Bibliotheken und -Pakete.; Ausführung des Codes planen; Importieren Sie ein Notebook aus einer Datei, einer URLoder dem Ressourcenhub.; Teilen Sie schreibgeschützte Kopien Ihres Notebooks extern mit.
Erste Schritte: Klicken Sie zum Erstellen eines Notebooks auf New asset > Jupyter notebook editor.
Weitere Informationen: Video zum Laden undAnalysieren öffentlicher Datasets; Videos zu Notebooks; Beispielnotebooks; Dokumentation zu Notebooks

Data Refinery

Verwenden Sie Data Refinery, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen Data Refinery-Ablauf und führen ihn als Gruppe von geordneten Operationen für Daten aus.

Erforderliche Services: Watson Studio oder IBM Knowledge Catalog
Datenformat: Tabellarisch: Avro, CSV, JSON, Microsoft Excel (Formate xls und xlsx. Nur erstes Arbeitsblatt mit Ausnahme von Verbindungen und verbundenen Datenassets. Parquet, SAS mit der Erweiterung "sas7bdat" (schreibgeschützt), TSV (schreibgeschützt) oder Textdatenasset mit Trennzeichen; Relational: Tabellen in relationalen Datenquellen
Data Size: Any
Wie Sie Daten vorbereiten können: Bereinigen, gestalten, organisieren Sie Daten mit über 60 Operationen.; Speichern Sie verfeinerte Daten als neue Datei, oder aktualisieren Sie die ursprünglichen Daten.; Profildaten, um sie zu validieren.; Verwenden Sie interaktive Vorlagen, um Daten mit Codeoperationen, Funktionen und logischen Operatoren zu bearbeiten.; Planen Sie wiederkehrende Operationen für Daten.
Wie Sie Daten analysieren können: Identifizieren Sie Muster, Verbindungen und Beziehungen innerhalb der Daten in mehreren Visualisierungsdiagrammen.
Erste Schritte: Klicken Sie zum Erstellen eines Data Refinery -Ablaufs auf Neues Asset > Data Refinery. Die Kachel Data Refinery befindet sich im Abschnitt Grafische Builder .
Weitere Informationen: Dokumentation zu Data Refinery; Videos zu Data Refinery; Video zu Shapedaten

Watson Query

Verwenden Sie Watson Query , um mehrere Datenquellen zu einer einzigen selbstausgleichenden Sammlung von Datenquellen oder Datenbanken zu verbinden.

Datenformat: Relational: Tabellen in relationalen Datenquellen
Data Size: Any
Wie Sie Daten vorbereiten können: Stellen Sie eine Verbindung zu mehreren Datenquellen her.; Erstellen Sie virtuelle Tabellen.
Erste Schritte: Klicken Sie zum Erstellen virtueller Tabellen auf Daten > Data virtualization. Klicken Sie im Servicemenü auf Virtualisierung > Virtualisieren > Tabellen.
Weitere Informationen: Dokumentation zu Watson Query

DataStage

Verwenden Sie DataStage, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen DataStage-Ablauf und führen ihn als geordnete Folge von Operationen aus, die auf Daten angewendet werden.

Erforderlicher Service: DataStage
Datenformat: Tabellarisch: Avro, CSV, JSON, Parquet, TSV (schreibgeschützt) oder Textdateien mit Trennzeichen; Relational: Tabellen in relationalen Datenquellen
Data Size: Any
Wie Sie Daten vorbereiten können: Entwerfen Sie einen grafischen Datenintegrationsfluss, der Orchestrate-Code generiert, der auf der hochleistungsfähigen DataStage-Parallelverarbeitungsengine ausgeführt werden soll.; Führen Sie Operationen wie Join (Verknüpfen), Funnel (Trichter), Checksum (Kontrollsumme), Merge (Zusammenführen), Modify (Ändern), Remove Duplicates (Duplikate entfernen) und Sort (Sortieren) aus.
Erste Schritte: Klicken Sie zum Erstellen eines DataStage -Ablaufs auf Neues Asset > DataStage. Die Kachel DataStage befindet sich im Bereich Grafische Erstellungsprogramme .
Weitere Informationen: DataStage-Dokumentation

SPSS Modeler

Verwenden Sie SPSS Modeler , um einen Flow zu erstellen, um Daten vorzubereiten und ein Modell mit einem Flow-Editor in einem grafischen Erstellungsprogramm zu erstellen und zu trainieren.

Erforderliche Services: Watson Studio
Datenformate: Relational: Tabellen in relationalen Datenquellen; Tabellarisch: Excel-Dateien (.xls oder .xlsx), CSV-Dateien oder SPSS Statistics-Dateien (.sav); Text: In den unterstützten relationalen Tabellen oder Dateien
Data Size: Any
Wie Sie Daten vorbereiten können: Automatische Datenvorbereitungsfunktionen verwenden.; SQL-Anweisungen schreiben, um Daten zu bearbeiten.; Bereinigen, Formen, Muster, Sortieren und Ableiten von Daten.
Wie Sie Daten analysieren können: Visualisieren Sie Daten mit mehr als 40 Graphen.; Geben Sie die natürliche Sprache eines Textfelds an.
Wie Sie Modelle erstellen können: Erstellen Sie Vorhersagemodelle.; Wählen Sie aus über 40 Modellierungsalgorithmen.; Automatische Modellierungsfunktionen verwenden.; Modellzeitreihen oder georäumliche Daten.; Klassifizieren Sie Textdaten.; Identifizieren Sie Beziehungen zwischen den Konzepten in Textdaten.
Erste Schritte: Zum Erstellen eines SPSS Modeler -Ablaufs klicken Sie auf Neues Asset > SPSS Modeler.
Weitere Informationen: SPSS-Modeler – aktualisierte Benutzerschnittstelle für das Datenwissenschaftszentrum eines Unternehmens(Video); Dokumentation zu SPSS Modeler

Erstellungsprogramm für Decision Optimization-Modelle

Sie können Decision Optimization zum Erstellen und Ausführen von Optimierungsmodellen im Erstellungsprogramm für Decision Optimization-Modelle oder in einem Jupyter-Notebook verwenden.

Erforderliche Services: Watson Studio
Datenformate: Tabellarisch: CSV-Dateien
Data Size: Any
Wie Sie Daten vorbereiten können: Importieren relevanter Daten in ein Szenario und Bearbeiten der Daten
Wie Sie Modelle erstellen können: Erstellen präskriptiver Decision Optimization-Modelle; Erstellen, Importieren und Bearbeiten von Modellen in Python DOcplex, OPL oder Ausdrücken natürlicher Sprache; Erstellen, Importieren und Bearbeiten von Modellen in Notebooks
Wie Sie Modelle lösen können: Ausführen und Lösen von Decision Optimization-Modellen mit CPLEX-Engines; Untersuchen und Vergleichen von Lösungen für mehrere Szenarios; Erstellen von Tabellen, Diagrammen und Anmerkungen, um Daten und Lösungen für ein oder mehrere Szenarios zu visualisieren
Erste Schritte: Klicken Sie zum Erstellen eines Decision Optimization -Modells auf Neues Asset > Decision Optimizationoder für Notebooks auf Neues Asset > Jupyter Notebook-Editor.
Weitere Informationen: Videos zu Decision Optimization; Dokumentation zu Decision Optimization

AutoAI-Tool

Sie können das AutoAI-Tool zum automatischen Analysieren Ihrer Daten und Generieren von infrage kommenden Modellpipelines verwenden, die für Ihr Vorhersagemodellierungsproblem angepasst sind.

Erforderliche Services: Watson Machine Learning; Watson Studio
Datenformat: Tabellarisch: CSV-Dateien
Data Size: Abhängig vom Modelltyp. Details hierzu finden Sie unter AutoAI -Übersicht .
Wie Sie Daten vorbereiten können: Daten automatisch transformieren, z. B. fehlende Werte imputieren und Text in skalare Werte umwandeln.
Wie Sie Modelle erstellen können: Trainieren Sie eine binäre Klassifizierung, Mehrklassenklassifizierung oder Regressionsmodell.; Zeigen Sie eine Baumstrukturinfografik an, die die Sequenzen von AutoAI-Trainingsstufen anzeigt.; Generieren Sie ein Leaderboard von Modellpipelines, die durch Cross-Validation-Scores eingestuft werden.; Speichern Sie eine Pipeline als Modell.
Erste Schritte: Klicken Sie zum Erstellen eines AutoAI -Experiments auf Neues Asset > AutoAI.
Weitere Informationen: Dokumentation zu AutoAI

Federated Learning

Verwenden Sie das Tool Federated Learning, um ein allgemeines Modell unter Verwendung verteilter Daten zu trainieren. Die Daten werden nie kombiniert oder gemeinsam genutzt, wodurch die Datenintegrität gewahrt bleibt und gleichzeitig allen beteiligten Parteien ein Modell auf der Basis der aggregierten Daten bereitgestellt wird.

Erforderliche Services: Watson Studio; Watson Machine Learning
Datenformat: Any
Data Size: Beliebige Größe
Wie Sie Modelle erstellen können: Wählen Sie einen Schulungsrahmen aus.; Konfigurieren Sie das allgemeine Modell.; Konfigurieren Sie eine Datei für die Schulung des allgemeinen Modells.; Haben ferne Parteien ihre Daten trainiert.; Implementieren Sie das allgemeine Modell.
Erste Schritte: Klicken Sie zum Erstellen eines Experiments auf Neues Asset > Federated Learning.
Weitere Informationen: Dokumentation zu Federated Learning

Metadata import

Verwenden Sie das Tool für Metadatenimport, um technische Metadaten und Prozessmetadaten für Datenressourcen in ein Projekt oder einen Katalog zu importieren.

Erforderlicher Service: IBM Knowledge Catalog
Datenformat: Any
Data Size: Beliebige Größe
Wie Sie Daten vorbereiten können: Importieren Sie Datenressourcen aus einer Verbindung zu einer Datenquelle.
Erste Schritte: Klicken Sie zum Importieren von Metadaten auf Neues Asset > Metadata import.
Weitere Informationen: Dokumentation zum Metadatenimport; Videos zu IBM Knowledge Catalog

Metadatenanreicherung

Verwenden Sie das Metadatenanreicherungswerkzeug, um Datenressourcen automatisch zu profilieren und die Datenqualität in einem Projekt zu analysieren.

Erforderlicher Service: IBM Knowledge Catalog
Datenformat: Relational und strukturiert: Tabellen und Dateien in relationalen und nicht relationalen Datenquellen; Tabellarisch: Avro-, CSV-oder Parquet-Dateien
Data Size: Beliebige Größe
Wie Sie Daten vorbereiten und analysieren können: Wählen Sie in einem Projekt eine ausgewählte Gruppe von Datenressourcen aus und analysieren Sie sie.
Erste Schritte: Klicken Sie zum Aufbereiten von Daten auf Neues Asset > Metadatenaufbereitung.
Weitere Informationen: Dokumentation zur Aufbereitung von Metadaten

Datenqualitätsregel

Mit dem Datenqualitätstool können Sie Regeln erstellen, die die Datenqualität in einem Projekt analysieren.

Erforderlicher Service: IBM Knowledge Catalog
Datenformat: Relational und strukturiert: Tabellen und Dateien in relationalen und nicht relationalen Datenquellen; Tabellarisch: Avro-, CSV-oder Parquet-Dateien
Data Size: Beliebige Größe
Wie Sie Daten vorbereiten und analysieren können: Analysieren Sie die Qualität einer ausgewählten Gruppe von Datenassets in einem Projekt.
Erste Schritte: Klicken Sie zum Erstellen einer Datenqualitätsregel auf Neues Asset > Datenqualitätsregel.
Weitere Informationen: Dokumentation zu Datenqualitätsregeln

IBM Match 360 with Watson

Verwenden Sie IBM Match 360 mit Watson, um Stammdatenentitäten zu erstellen, die digitale Zwillinge Ihrer Kunden darstellen. Modellieren Sie Ihre Daten und ordnen Sie sie zu und führen Sie anschließend den Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen. Passen Sie Ihren Abgleichalgorithmus an und optimieren Sie ihn, um die Anforderungen Ihres Unternehmens zu erfüllen.

Erforderliche Services: IBM Match 360 with Watson IBM Knowledge Catalog
Data Size: Bis zu 1.000.000 Datensätze (für den Beta Lite-Plan)
Wie Sie Daten vorbereiten können: Modellieren Sie Daten aus Quellen in Ihrem Unternehmen und ordnen Sie sie zu.; Führen Sie den anpassbaren Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen.; Master-Datenentitäten und die zugehörigen Datensätze anzeigen und bearbeiten.
Erste Schritte: Klicken Sie zum Erstellen eines IBM Match 360 -Konfigurationsassets auf Neues Asset > Masterdatenkonfiguration.
Weitere Informationen: Dokumentation zu IBM Match 360 with Watson

RStudio-IDE

Verwenden Sie die RStudio-IDE, um Daten zu analysieren oder um Shiny-Anwendungen zu erstellen, indem Sie R-Code schreiben.

Erforderlicher Service: Watson Studio
Datenformat: Any
Data Size: Beliebige Größe
Wie Sie Daten vorbereiten, Daten analysieren und Modelle erstellen können: Schreiben Sie Code in R.; Erstellen Sie Shiny-Apps.; Verwenden Sie Open-Source-Bibliotheken und -Pakete.; Schließen Sie Rich Text und Medien mit Ihrem Code ein.; Bereiten Sie Daten vor.; Daten visualisieren.; Entdecken Sie Erkenntnisse aus den Daten.; Bauen und trainieren Sie ein Modell mit Open-Source-Bibliotheken.; Teilen Sie Ihre Shiny-App in einem Git-Repository.
Erste Schritte: Wenn Sie RStudioverwenden möchten, klicken Sie auf IDE starten > RStudio.
Weitere Informationen: Dokumentation zu RStudio; Video mit Übersicht überRStudio-IDE; Videos zu RStudio

Maskierungsabläufe

Verwenden Sie das Maskierungsablauftool, um maskierte Kopien oder maskierte Untergruppen von Daten aus dem Katalog vorzubereiten. Die Daten werden mithilfe von erweiterten Maskierungsoptionen mit Datenschutzregeln deidentifiziert.

Erforderlicher Service: IBM Knowledge Catalog
Datenformat: Relational: Tabellen in relationalen Datenquellen
Data Size: Beliebige Größe
Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können: Importieren Sie Datenressourcen aus dem regulierten Katalog in das Projekt.; Erstellen Sie Definitionen für Maskierungsflussjobs, um anzugeben, welche Daten mit den Datenschutzregeln maskiert werden sollen.; Optional Teilmengen von Daten, um die Größe kopierter Daten zu reduzieren.; Führen Sie Maskierungsflussjobs aus, um maskierte Kopien in Zieldatenbankverbindungen zu laden.
Erste Schritte: Stellen Sie sicher, dass vorausgesetzte Schritte in IBM Knowledge Catalog ausgeführt werden. Führen Sie eine der folgenden Tasks aus, um Daten zu privatisieren:

Klicken Sie auf Neues Asset > Maskierungsablauf.
Klicken Sie auf die Menüoptionen für einzelne Datenressourcen, um diese Anlage direkt zu maskieren.

Weitere Informationen: Dokumentation zur Maskierung von Daten

Watson Pipelines

Mit dem Erstellungsbereichseditor für Pipelines können Sie einen Ablauf erstellen, um Daten vorzubereiten, zu visualisieren und zu analysieren oder ein Modell zu erstellen und zu trainieren.

Datenformat: Any
Data Size: Any
Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können: Verwenden Sie eine Vielzahl von Knoten, die jeweils eigene Protokolle enthalten.; Integrieren Sie Notebooks in den Ablauf, um beliebigen Python -oder R-Code auszuführen.; Arbeiten Sie mit jeder Art von Daten in jeder Art und Weise, die Sie wollen.; Planen Sie Ausführungen Ihres Ablaufs.; Importieren Sie Daten aus Ihrem angehängten PVC, Projekt oder nehmen Sie Daten aus Github auf.; Erstellen Sie Ihre angepasste Komponente mit einem Python -Code.; Konditionalisieren Sie Ihre Pipelines, um die Datenqualität wie gewünscht zu überwachen.; Verwenden Sie Webhook zum Senden von E-Mails oder Nachrichten, um über den Status Ihres Ablaufs auf dem Laufenden zu bleiben.
Erste Schritte: Klicken Sie zum Erstellen einer neuen Pipeline auf Neues Asset > Pipelines.

Datenvisualisierungen

Mit Datenvisualisierungen können Sie Erkenntnisse aus Ihren Daten gewinnen. Durch die Untersuchung von Daten aus unterschiedlichen Perspektiven mit Visualisierungen können Sie Muster, Verbindungen und Beziehungen innerhalb dieser Daten ermitteln und schnell große Datenmengen verstehen.

Datenformat: Tabellarisch: Avro-, CSV-, JSON-, Parquet-, TSV-, SAV-, Microsoft Excel-XLS-und XLSX-Dateien, SAS-Dateien, Textdateien mit Trennzeichen und verbundene Daten. Weitere Informationen zu unterstützten Datenquellen finden Sie unter Connectors.
Data Size: Keine Begrenzung
Erste Schritte: Zum Erstellen einer Visualisierung klicken Sie in der Liste der Assettypen in Ihrem Projekt auf Datenasset und wählen Sie ein Datenasset aus. Klicken Sie auf die Registerkarte Visualisierung und wählen Sie einen Diagrammtyp aus.
Weitere Informationen: Daten visualisieren

Übergeordnetes Thema: Projekte