0 / 0
Zurück zur englischen Version der Dokumentation
Tool auswählen

Tool auswählen

Die Basisservices für Cloud Pak for Data as a Service stellen eine Reihe von Tools für das Vorbereiten, Analysieren undModellieren von Daten für Benutzer mit unterschiedlichem Kenntnisstand - vom Einsteigerbis hin zum Experten - bereit. Das richtige Tool für Sie hängt vom Typ der Daten, die Sie haben, von den Aufgaben, die Sie ausführen möchten, und vom Umfang der gewünschten Automatisierung ab.

Um zu sehen, welche Tools Sie in einem Projekt verwenden und welche Services für diese Tools erforderlich sind, öffnen Sie die Karte für Tools und Services.

Beachten Sie die folgenden Faktoren, um das richtige Tool zu wählen.

Der Typ der Daten, die Sie haben

  • Tabellendaten in Dateien mit begrenzter Satzlänge oder relationale Daten in fernen Datenquellen
  • Bilddateien
  • Textdaten (unstrukturierte Daten) in Dokumenten

Die Art der Tasks, die Sie ausführen müssen.

  • Daten vorbereiten: Daten bereinigen, formen, visualisieren, organisieren und validieren.
  • Daten analysieren: Muster und Beziehungen in Daten erkennen und Erkenntnisse anzeigen.
  • Modelle erstellen: Erstellen, Trainieren, Testen sowie Bereitstellen von Modellen, um Vorhersagen zu treffen oder Entscheidungen zu optimieren.

Wie viel Automatisierung Sie wünschen

  • Codeeditortools: Zum Schreiben von Code in Python oder R, alle auch mit Spark.
  • Tools für grafische Erstellungsprogramme: Verwenden Sie Menüs und Drag-and-drop-Funktionalität in einem Erstellungsprogramm, um eine visuelle Programmierung durchzuführen.
  • Automatisierte Erstellungstools: Verwenden Sie diese Option, um automatisierte Tasks zu konfigurieren, die eine eingeschränkte Benutzereingabe erfordern.

Wählen Sie das geeignete Tool:

Tools für Tabellendaten und relationale Daten

Tools für Tabellendaten und relationale Daten nach Task:

Tools für Tabellendaten und relationale Daten
Tool Tooltyp Daten vorbereiten Daten analysieren Modelle erstellen
Editor für Jupyter-Notebooks Codeeditor
Federated Learning Codeeditor
RStudio Codeeditor
Data Refinery Grafisches Erstellungsprogramm
Maskierungsablauf Automatisiertes Erstellungsprogramm
Watson Query Grafisches Erstellungsprogramm
DataStage Grafisches Erstellungsprogramm
SPSS Modeler Grafisches Erstellungsprogramm
Erstellungsprogramm für Decision Optimization-Modelle Grafisches Erstellungsprogramm und Codeeditor
AutoAI Automatisiertes Erstellungsprogramm
Metadata import Automatisiertes Erstellungsprogramm
Metadatenaufbereitung Automatisiertes Erstellungsprogramm
Datenqualitätsregel Automatisierter Builder und Codeeditor
IBM Match 360 with Watson (Betaversion) Automatisiertes Erstellungsprogramm
Watson Pipelines Grafisches Erstellungsprogramm

Tools für Textdaten

Tools zum Erstellen eines Modells, das mit Textdaten arbeitet:

Tools für Textdaten
Tool Codeeditor Grafisches Erstellungsprogramm Automatisiertes Erstellungsprogramm
Editor für Jupyter-Notebooks
RStudio
SPSS Modeler
Watson Pipelines

Tools für Bilddaten

Tools zum Erstellen eines Modells, das Bilder klassifiziert:

Tools für Bilddaten
Tool Codeeditor Grafisches Erstellungsprogramm Automatisiertes Erstellungsprogramm
Editor für Jupyter-Notebooks
RStudio
Watson Pipelines

Zugriff auf Tools

Wenn Sie ein Tool verwenden möchten, müssen Sie ein Asset erstellen, das für dieses Tool spezifisch ist, oder Sie müssen ein vorhandenes Asset für dieses Tool öffnen. Klicken Sie zum Erstellen eines Assets auf Neues Asset oder Assets importieren und wählen Sie dann den gewünschten Assettyp aus. In dieser Tabelle werden die Assettypen für die einzelnen Tools gezeigt.

Zuordnung von Tools zu Assettyp
Verwendetes Tool Auszuwählender Assettyp
Editor für Jupyter-Notebooks Editor für Jupyter-Notebooks
Data Refinery Data Refinery-Ablauf
Maskierungsabläufe Maskierungsabläufe
DataStage DataStage-Fluss
SPSS Modeler Modeler-Ablauf
Erstellungsprogramm für Decision Optimization-Modelle Decision Optimization
AutoAI AutoAI-Experiment
Federated Learning Experiment für föderiertes Lernen
Metadata import Metadata import
Metadatenaufbereitung Metadatenanreicherung
Datenqualitätsregeln Datenqualitätsregel
IBM Match 360 with Watson (Betaversion) Konfiguration der Masterdaten

Klicken Sie auf IDE starten > RStudio, um Notebooks mit RStudio zu bearbeiten.

Editor für Jupyter-Notebooks

Verwenden Sie den Editor für Jupyter-Notebooks, um ein Notebook zu erstellen, in dem Sie Code ausführen, um Daten vorzubereiten, zu visualisieren und zu analysieren, oder ein Modell erstellen und trainieren.

Erforderliche Services
Watson Studio
Datenformat
Any
Data Size
Any
Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können
Schreiben Sie Code in Python oder R, alle auch mit Spark.
Schließen Sie Rich Text und Medien mit Ihrem Code ein.
Arbeiten Sie mit jeder Art von Daten in jeder Art und Weise, die Sie wollen.
Verwenden Sie vorinstalliert oder installieren Sie andere Open-Source-und IBM Bibliotheken und -Pakete.
Ausführung des Codes planen
Importieren Sie ein Notebook aus einer Datei, einer URLoder dem Ressourcenhub.
Teilen Sie schreibgeschützte Kopien Ihres Notebooks extern mit.
Erste Schritte
Klicken Sie zum Erstellen eines Notebooks auf New asset > Jupyter notebook editor.
Weitere Informationen
Video zum Laden undAnalysieren öffentlicher Datasets
Videos zu Notebooks
Beispielnotebooks
Dokumentation zu Notebooks

Data Refinery

Verwenden Sie Data Refinery, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen Data Refinery-Ablauf und führen ihn als Gruppe von geordneten Operationen für Daten aus.

Erforderliche Services
Watson Studio oder IBM Knowledge Catalog
Datenformat
Tabellarisch: Avro, CSV, JSON, Microsoft Excel (Formate xls und xlsx. Nur erstes Arbeitsblatt mit Ausnahme von Verbindungen und verbundenen Datenassets. Parquet, SAS mit der Erweiterung "sas7bdat" (schreibgeschützt), TSV (schreibgeschützt) oder Textdatenasset mit Trennzeichen
Relational: Tabellen in relationalen Datenquellen
Data Size
Any
Wie Sie Daten vorbereiten können
Bereinigen, gestalten, organisieren Sie Daten mit über 60 Operationen.
Speichern Sie verfeinerte Daten als neue Datei, oder aktualisieren Sie die ursprünglichen Daten.
Profildaten, um sie zu validieren.
Verwenden Sie interaktive Vorlagen, um Daten mit Codeoperationen, Funktionen und logischen Operatoren zu bearbeiten.
Planen Sie wiederkehrende Operationen für Daten.
Wie Sie Daten analysieren können
Identifizieren Sie Muster, Verbindungen und Beziehungen innerhalb der Daten in mehreren Visualisierungsdiagrammen.
Erste Schritte
Klicken Sie zum Erstellen eines Data Refinery -Ablaufs auf Neues Asset > Data Refinery. Die Kachel Data Refinery befindet sich im Abschnitt Grafische Builder .
Weitere Informationen
Dokumentation zu Data Refinery
Videos zu Data Refinery
Video zu Shapedaten

Watson Query

Verwenden Sie Watson Query , um mehrere Datenquellen zu einer einzigen selbstausgleichenden Sammlung von Datenquellen oder Datenbanken zu verbinden.

Datenformat
Relational: Tabellen in relationalen Datenquellen
Data Size
Any
Wie Sie Daten vorbereiten können
Stellen Sie eine Verbindung zu mehreren Datenquellen her.
Erstellen Sie virtuelle Tabellen.
Erste Schritte
Klicken Sie zum Erstellen virtueller Tabellen auf Daten > Data virtualization. Klicken Sie im Servicemenü auf Virtualisierung > Virtualisieren > Tabellen.
Weitere Informationen
Dokumentation zu Watson Query

DataStage

Verwenden Sie DataStage, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen DataStage-Ablauf und führen ihn als geordnete Folge von Operationen aus, die auf Daten angewendet werden.

Erforderlicher Service
DataStage
Datenformat
Tabellarisch: Avro, CSV, JSON, Parquet, TSV (schreibgeschützt) oder Textdateien mit Trennzeichen
Relational: Tabellen in relationalen Datenquellen
Data Size
Any
Wie Sie Daten vorbereiten können
Entwerfen Sie einen grafischen Datenintegrationsfluss, der Orchestrate-Code generiert, der auf der hochleistungsfähigen DataStage-Parallelverarbeitungsengine ausgeführt werden soll.
Führen Sie Operationen wie Join (Verknüpfen), Funnel (Trichter), Checksum (Kontrollsumme), Merge (Zusammenführen), Modify (Ändern), Remove Duplicates (Duplikate entfernen) und Sort (Sortieren) aus.
Erste Schritte
Klicken Sie zum Erstellen eines DataStage -Ablaufs auf Neues Asset > DataStage. Die Kachel DataStage befindet sich im Bereich Grafische Erstellungsprogramme .
Weitere Informationen
DataStage-Dokumentation

SPSS Modeler

Verwenden Sie SPSS Modeler , um einen Flow zu erstellen, um Daten vorzubereiten und ein Modell mit einem Flow-Editor in einem grafischen Erstellungsprogramm zu erstellen und zu trainieren.

Erforderliche Services
Watson Studio
Datenformate
Relational: Tabellen in relationalen Datenquellen
Tabellarisch: Excel-Dateien (.xls oder .xlsx), CSV-Dateien oder SPSS Statistics-Dateien (.sav)
Text: In den unterstützten relationalen Tabellen oder Dateien
Data Size
Any
Wie Sie Daten vorbereiten können
Automatische Datenvorbereitungsfunktionen verwenden.
SQL-Anweisungen schreiben, um Daten zu bearbeiten.
Bereinigen, Formen, Muster, Sortieren und Ableiten von Daten.
Wie Sie Daten analysieren können
Visualisieren Sie Daten mit mehr als 40 Graphen.
Geben Sie die natürliche Sprache eines Textfelds an.
Wie Sie Modelle erstellen können
Erstellen Sie Vorhersagemodelle.
Wählen Sie aus über 40 Modellierungsalgorithmen.
Automatische Modellierungsfunktionen verwenden.
Modellzeitreihen oder georäumliche Daten.
Klassifizieren Sie Textdaten.
Identifizieren Sie Beziehungen zwischen den Konzepten in Textdaten.
Erste Schritte
Zum Erstellen eines SPSS Modeler -Ablaufs klicken Sie auf Neues Asset > SPSS Modeler.
Weitere Informationen
SPSS-Modeler – aktualisierte Benutzerschnittstelle für das Datenwissenschaftszentrum eines Unternehmens(Video)
Dokumentation zu SPSS Modeler

Erstellungsprogramm für Decision Optimization-Modelle

Sie können Decision Optimization zum Erstellen und Ausführen von Optimierungsmodellen im Erstellungsprogramm für Decision Optimization-Modelle oder in einem Jupyter-Notebook verwenden.

Erforderliche Services
Watson Studio
Datenformate
Tabellarisch: CSV-Dateien
Data Size
Any
Wie Sie Daten vorbereiten können
Importieren relevanter Daten in ein Szenario und Bearbeiten der Daten
Wie Sie Modelle erstellen können
Erstellen präskriptiver Decision Optimization-Modelle
Erstellen, Importieren und Bearbeiten von Modellen in Python DOcplex, OPL oder Ausdrücken natürlicher Sprache
Erstellen, Importieren und Bearbeiten von Modellen in Notebooks
Wie Sie Modelle lösen können
Ausführen und Lösen von Decision Optimization-Modellen mit CPLEX-Engines
Untersuchen und Vergleichen von Lösungen für mehrere Szenarios
Erstellen von Tabellen, Diagrammen und Anmerkungen, um Daten und Lösungen für ein oder mehrere Szenarios zu visualisieren
Erste Schritte
Klicken Sie zum Erstellen eines Decision Optimization -Modells auf Neues Asset > Decision Optimizationoder für Notebooks auf Neues Asset > Jupyter Notebook-Editor.
Weitere Informationen
Videos zu Decision Optimization
Dokumentation zu Decision Optimization

AutoAI-Tool

Sie können das AutoAI-Tool zum automatischen Analysieren Ihrer Daten und Generieren von infrage kommenden Modellpipelines verwenden, die für Ihr Vorhersagemodellierungsproblem angepasst sind.

Erforderliche Services
Watson Machine Learning
Watson Studio
Datenformat
Tabellarisch: CSV-Dateien
Data Size
Abhängig vom Modelltyp. Details hierzu finden Sie unter AutoAI -Übersicht .
Wie Sie Daten vorbereiten können
Daten automatisch transformieren, z. B. fehlende Werte imputieren und Text in skalare Werte umwandeln.
Wie Sie Modelle erstellen können
Trainieren Sie eine binäre Klassifizierung, Mehrklassenklassifizierung oder Regressionsmodell.
Zeigen Sie eine Baumstrukturinfografik an, die die Sequenzen von AutoAI-Trainingsstufen anzeigt.
Generieren Sie ein Leaderboard von Modellpipelines, die durch Cross-Validation-Scores eingestuft werden.
Speichern Sie eine Pipeline als Modell.
Erste Schritte
Klicken Sie zum Erstellen eines AutoAI -Experiments auf Neues Asset > AutoAI.
Weitere Informationen
Dokumentation zu AutoAI

Federated Learning

Verwenden Sie das Tool Federated Learning, um ein allgemeines Modell unter Verwendung verteilter Daten zu trainieren. Die Daten werden nie kombiniert oder gemeinsam genutzt, wodurch die Datenintegrität gewahrt bleibt und gleichzeitig allen beteiligten Parteien ein Modell auf der Basis der aggregierten Daten bereitgestellt wird.

Erforderliche Services
Watson Studio
Watson Machine Learning
Datenformat
Any
Data Size
Beliebige Größe
Wie Sie Modelle erstellen können
Wählen Sie einen Schulungsrahmen aus.
Konfigurieren Sie das allgemeine Modell.
Konfigurieren Sie eine Datei für die Schulung des allgemeinen Modells.
Haben ferne Parteien ihre Daten trainiert.
Implementieren Sie das allgemeine Modell.
Erste Schritte
Klicken Sie zum Erstellen eines Experiments auf Neues Asset > Federated Learning.
Weitere Informationen
Dokumentation zu Federated Learning

Metadata import

Verwenden Sie das Tool für Metadatenimport, um technische Metadaten und Prozessmetadaten für Datenressourcen in ein Projekt oder einen Katalog zu importieren.

Erforderlicher Service
IBM Knowledge Catalog
Datenformat
Any
Data Size
Beliebige Größe
Wie Sie Daten vorbereiten können
Importieren Sie Datenressourcen aus einer Verbindung zu einer Datenquelle.
Erste Schritte
Klicken Sie zum Importieren von Metadaten auf Neues Asset > Metadata import.
Weitere Informationen
Dokumentation zum Metadatenimport
Videos zu IBM Knowledge Catalog

Metadatenanreicherung

Verwenden Sie das Metadatenanreicherungswerkzeug, um Datenressourcen automatisch zu profilieren und die Datenqualität in einem Projekt zu analysieren.

Erforderlicher Service
IBM Knowledge Catalog
Datenformat
Relational und strukturiert: Tabellen und Dateien in relationalen und nicht relationalen Datenquellen
Tabellarisch: Avro-, CSV-oder Parquet-Dateien
Data Size
Beliebige Größe
Wie Sie Daten vorbereiten und analysieren können
Wählen Sie in einem Projekt eine ausgewählte Gruppe von Datenressourcen aus und analysieren Sie sie.
Erste Schritte
Klicken Sie zum Aufbereiten von Daten auf Neues Asset > Metadatenaufbereitung.
Weitere Informationen
Dokumentation zur Aufbereitung von Metadaten

Datenqualitätsregel

Mit dem Datenqualitätstool können Sie Regeln erstellen, die die Datenqualität in einem Projekt analysieren.

Erforderlicher Service
IBM Knowledge Catalog
Datenformat
Relational und strukturiert: Tabellen und Dateien in relationalen und nicht relationalen Datenquellen
Tabellarisch: Avro-, CSV-oder Parquet-Dateien
Data Size
Beliebige Größe
Wie Sie Daten vorbereiten und analysieren können
Analysieren Sie die Qualität einer ausgewählten Gruppe von Datenassets in einem Projekt.
Erste Schritte
Klicken Sie zum Erstellen einer Datenqualitätsregel auf Neues Asset > Datenqualitätsregel.
Weitere Informationen
Dokumentation zu Datenqualitätsregeln

IBM Match 360 with Watson

Verwenden Sie IBM Match 360 mit Watson, um Stammdatenentitäten zu erstellen, die digitale Zwillinge Ihrer Kunden darstellen. Modellieren Sie Ihre Daten und ordnen Sie sie zu und führen Sie anschließend den Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen. Passen Sie Ihren Abgleichalgorithmus an und optimieren Sie ihn, um die Anforderungen Ihres Unternehmens zu erfüllen.

Erforderliche Services
IBM Match 360 with Watson IBM Knowledge Catalog
Data Size
Bis zu 1.000.000 Datensätze (für den Beta Lite-Plan)
Wie Sie Daten vorbereiten können
Modellieren Sie Daten aus Quellen in Ihrem Unternehmen und ordnen Sie sie zu.
Führen Sie den anpassbaren Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen.
Master-Datenentitäten und die zugehörigen Datensätze anzeigen und bearbeiten.
Erste Schritte
Klicken Sie zum Erstellen eines IBM Match 360 -Konfigurationsassets auf Neues Asset > Masterdatenkonfiguration.
Weitere Informationen
Dokumentation zu IBM Match 360 with Watson

RStudio-IDE

Verwenden Sie die RStudio-IDE, um Daten zu analysieren oder um Shiny-Anwendungen zu erstellen, indem Sie R-Code schreiben.

Erforderlicher Service
Watson Studio
Datenformat
Any
Data Size
Beliebige Größe
Wie Sie Daten vorbereiten, Daten analysieren und Modelle erstellen können
Schreiben Sie Code in R.
Erstellen Sie Shiny-Apps.
Verwenden Sie Open-Source-Bibliotheken und -Pakete.
Schließen Sie Rich Text und Medien mit Ihrem Code ein.
Bereiten Sie Daten vor.
Daten visualisieren.
Entdecken Sie Erkenntnisse aus den Daten.
Bauen und trainieren Sie ein Modell mit Open-Source-Bibliotheken.
Teilen Sie Ihre Shiny-App in einem Git-Repository.
Erste Schritte
Wenn Sie RStudioverwenden möchten, klicken Sie auf IDE starten > RStudio.
Weitere Informationen
Dokumentation zu RStudio
Video mit Übersicht überRStudio-IDE
Videos zu RStudio

Maskierungsabläufe

Verwenden Sie das Maskierungsablauftool, um maskierte Kopien oder maskierte Untergruppen von Daten aus dem Katalog vorzubereiten. Die Daten werden mithilfe von erweiterten Maskierungsoptionen mit Datenschutzregeln deidentifiziert.

Erforderlicher Service
IBM Knowledge Catalog
Datenformat
Relational: Tabellen in relationalen Datenquellen
Data Size
Beliebige Größe
Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können
Importieren Sie Datenressourcen aus dem regulierten Katalog in das Projekt.
Erstellen Sie Definitionen für Maskierungsflussjobs, um anzugeben, welche Daten mit den Datenschutzregeln maskiert werden sollen.
Optional Teilmengen von Daten, um die Größe kopierter Daten zu reduzieren.
Führen Sie Maskierungsflussjobs aus, um maskierte Kopien in Zieldatenbankverbindungen zu laden.
Erste Schritte
Stellen Sie sicher, dass vorausgesetzte Schritte in IBM Knowledge Catalog ausgeführt werden. Führen Sie eine der folgenden Tasks aus, um Daten zu privatisieren:
  • Klicken Sie auf Neues Asset > Maskierungsablauf.
  • Klicken Sie auf die Menüoptionen für einzelne Datenressourcen, um diese Anlage direkt zu maskieren.
Weitere Informationen
Dokumentation zur Maskierung von Daten

Watson Pipelines

Mit dem Erstellungsbereichseditor für Pipelines können Sie einen Ablauf erstellen, um Daten vorzubereiten, zu visualisieren und zu analysieren oder ein Modell zu erstellen und zu trainieren.

Datenformat
Any
Data Size
Any
Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können
Verwenden Sie eine Vielzahl von Knoten, die jeweils eigene Protokolle enthalten.
Integrieren Sie Notebooks in den Ablauf, um beliebigen Python -oder R-Code auszuführen.
Arbeiten Sie mit jeder Art von Daten in jeder Art und Weise, die Sie wollen.
Planen Sie Ausführungen Ihres Ablaufs.
Importieren Sie Daten aus Ihrem angehängten PVC, Projekt oder nehmen Sie Daten aus Github auf.
Erstellen Sie Ihre angepasste Komponente mit einem Python -Code.
Konditionalisieren Sie Ihre Pipelines, um die Datenqualität wie gewünscht zu überwachen.
Verwenden Sie Webhook zum Senden von E-Mails oder Nachrichten, um über den Status Ihres Ablaufs auf dem Laufenden zu bleiben.
Erste Schritte
Klicken Sie zum Erstellen einer neuen Pipeline auf Neues Asset > Pipelines.

Datenvisualisierungen

Mit Datenvisualisierungen können Sie Erkenntnisse aus Ihren Daten gewinnen. Durch die Untersuchung von Daten aus unterschiedlichen Perspektiven mit Visualisierungen können Sie Muster, Verbindungen und Beziehungen innerhalb dieser Daten ermitteln und schnell große Datenmengen verstehen.

Datenformat
Tabellarisch: Avro-, CSV-, JSON-, Parquet-, TSV-, SAV-, Microsoft Excel-XLS-und XLSX-Dateien, SAS-Dateien, Textdateien mit Trennzeichen und verbundene Daten. Weitere Informationen zu unterstützten Datenquellen finden Sie unter Connectors.
Data Size
Keine Begrenzung
Erste Schritte
Zum Erstellen einer Visualisierung klicken Sie in der Liste der Assettypen in Ihrem Projekt auf Datenasset und wählen Sie ein Datenasset aus. Klicken Sie auf die Registerkarte Visualisierung und wählen Sie einen Diagrammtyp aus.
Weitere Informationen
Daten visualisieren

Übergeordnetes Thema: Projekte

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen