Die Basisservices für Cloud Pak for Data as a Service stellen eine Reihe von Tools für das Vorbereiten, Analysieren undModellieren von Daten für Benutzer mit unterschiedlichem Kenntnisstand - vom Einsteigerbis hin zum Experten - bereit. Das richtige Tool für Sie hängt vom Typ der Daten, die Sie haben, von den Aufgaben, die Sie ausführen möchten, und vom Umfang der gewünschten Automatisierung ab.
Um zu sehen, welche Tools Sie in einem Projekt verwenden und welche Services für diese Tools erforderlich sind, öffnen Sie die Karte für Tools und Services.
Beachten Sie die folgenden Faktoren, um das richtige Tool zu wählen.
Der Typ der Daten, die Sie haben
- Tabellendaten in Dateien mit begrenzter Satzlänge oder relationale Daten in fernen Datenquellen
- Bilddateien
- Textdaten (unstrukturierte Daten) in Dokumenten
Die Art der Tasks, die Sie ausführen müssen.
- Daten vorbereiten: Daten bereinigen, formen, visualisieren, organisieren und validieren.
- Daten analysieren: Muster und Beziehungen in Daten erkennen und Erkenntnisse anzeigen.
- Modelle erstellen: Erstellen, Trainieren, Testen sowie Bereitstellen von Modellen, um Vorhersagen zu treffen oder Entscheidungen zu optimieren.
Wie viel Automatisierung Sie wünschen
- Codeeditortools: Zum Schreiben von Code in Python oder R, alle auch mit Spark.
- Tools für grafische Erstellungsprogramme: Verwenden Sie Menüs und Drag-and-drop-Funktionalität in einem Erstellungsprogramm, um eine visuelle Programmierung durchzuführen.
- Automatisierte Erstellungstools: Verwenden Sie diese Option, um automatisierte Tasks zu konfigurieren, die eine eingeschränkte Benutzereingabe erfordern.
Wählen Sie das geeignete Tool:
- Tools für Tabellendaten und relationale Daten
- Tools für Textdaten
- Tools für Bilddaten
- Zugriff auf Tools
Tools für Tabellendaten und relationale Daten
Tools für Tabellendaten und relationale Daten nach Task:
Tool | Tooltyp | Daten vorbereiten | Daten analysieren | Modelle erstellen |
---|---|---|---|---|
Editor für Jupyter-Notebooks | Codeeditor | ✓ | ✓ | ✓ |
Federated Learning | Codeeditor | ✓ | ||
RStudio | Codeeditor | ✓ | ✓ | ✓ |
Data Refinery | Grafisches Erstellungsprogramm | ✓ | ✓ | |
Maskierungsablauf | Automatisiertes Erstellungsprogramm | ✓ | ||
Data Virtualization | Grafisches Erstellungsprogramm | ✓ | ||
DataStage | Grafisches Erstellungsprogramm | ✓ | ||
Data Replication | Grafisches Erstellungsprogramm | ✓ | ||
SPSS Modeler | Grafisches Erstellungsprogramm | ✓ | ✓ | ✓ |
Erstellungsprogramm für Decision Optimization-Modelle | Grafisches Erstellungsprogramm und Codeeditor | ✓ | ✓ | |
AutoAI | Automatisiertes Erstellungsprogramm | ✓ | ✓ | |
Metadata import | Automatisiertes Erstellungsprogramm | ✓ | ||
Metadatenaufbereitung | Automatisiertes Erstellungsprogramm | ✓ | ✓ | |
Datenqualitätsregel | Automatisierter Builder und Codeeditor | ✓ | ||
IBM Match 360 with Watson (Betaversion) | Automatisiertes Erstellungsprogramm | ✓ | ||
Orchestrierungspipelines | Grafisches Erstellungsprogramm | ✓ | ✓ | ✓ |
Tools für Textdaten
Tools zum Erstellen eines Modells, das mit Textdaten arbeitet:
Tool | Codeeditor | Grafisches Erstellungsprogramm | Automatisiertes Erstellungsprogramm |
---|---|---|---|
Editor für Jupyter-Notebooks | ✓ | ||
RStudio | ✓ | ||
SPSS Modeler | ✓ | ||
Orchestrierungspipelines | ✓ |
Tools für Bilddaten
Tools zum Erstellen eines Modells, das Bilder klassifiziert:
Tool | Codeeditor | Grafisches Erstellungsprogramm | Automatisiertes Erstellungsprogramm |
---|---|---|---|
Editor für Jupyter-Notebooks | ✓ | ||
RStudio | ✓ | ||
Orchestrierungspipelines | ✓ |
Zugriff auf Tools
Wenn Sie ein Tool verwenden möchten, müssen Sie ein Asset erstellen, das für dieses Tool spezifisch ist, oder Sie müssen ein vorhandenes Asset für dieses Tool öffnen. Klicken Sie zum Erstellen eines Assets auf Neues Asset oder Assets importieren und wählen Sie dann den gewünschten Assettyp aus. In dieser Tabelle werden die Assettypen für die einzelnen Tools gezeigt.
Verwendetes Tool | Auszuwählender Assettyp |
---|---|
Editor für Jupyter-Notebooks | Editor für Jupyter-Notebooks |
Data Refinery | Data Refinery-Ablauf |
Maskierungsabläufe | Maskierungsabläufe |
DataStage | DataStage-Fluss |
SPSS Modeler | Modeler-Ablauf |
Erstellungsprogramm für Decision Optimization-Modelle | Decision Optimization |
AutoAI | AutoAI-Experiment |
Federated Learning | Experiment für föderiertes Lernen |
Metadata import | Metadata import |
Metadatenaufbereitung | Metadatenanreicherung |
Datenqualitätsregeln | Datenqualitätsregel |
IBM Match 360 with Watson (Betaversion) | Konfiguration der Masterdaten |
Klicken Sie auf IDE starten > RStudio, um Notebooks mit RStudio zu bearbeiten.
Editor für Jupyter-Notebooks
Verwenden Sie den Editor für Jupyter-Notebooks, um ein Notebook zu erstellen, in dem Sie Code ausführen, um Daten vorzubereiten, zu visualisieren und zu analysieren, oder ein Modell erstellen und trainieren.
- Erforderliche Services
- watsonx.ai Studio
- Datenformat
- Any
- Data Size
- Any
- Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können
- Schreiben Sie Code in Python oder R, alle auch mit Spark.
- Schließen Sie Rich Text und Medien mit Ihrem Code ein.
- Arbeiten Sie mit jeder Art von Daten in jeder Art und Weise, die Sie wollen.
- Verwenden Sie vorinstalliert oder installieren Sie andere Open-Source-und IBM Bibliotheken und -Pakete.
- Ausführung des Codes planen
- Importieren Sie ein Notebook aus einer Datei, einer URL oder dem Ressourcenhub.
- Teilen Sie schreibgeschützte Kopien Ihres Notebooks extern mit.
- Erste Schritte
- Um ein Notizbuch zu erstellen, klicken Sie auf Neues Asset > Arbeiten mit Daten und Modellen inPython oder R-Notebooks .
- Weitere Informationen
- Dokumentation zu Notebooks
- Videos zu Notebooks
- Beispielnotebooks
Sehen Sie sich ein Video an, um die Grundlagen des Jupyter zu erlernen
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Data Refinery
Verwenden Sie Data Refinery, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen Data Refinery-Ablauf und führen ihn als Gruppe von geordneten Operationen für Daten aus.
- Erforderliche Services
- watsonx.ai Studio oder IBM Knowledge Catalog
- Datenformat
- Tabellarisch: Avro, CSV, JSON, Microsoft Excel (Formate xls und xlsx. Nur erstes Arbeitsblatt mit Ausnahme von Verbindungen und verbundenen Datenassets. Parquet, SAS mit der Erweiterung "sas7bdat" (schreibgeschützt), TSV (schreibgeschützt) oder Textdatenasset mit Trennzeichen
- Relational: Tabellen in relationalen Datenquellen
- Data Size
- Any
- Wie Sie Daten vorbereiten können
- Bereinigen, gestalten, organisieren Sie Daten mit über 60 Operationen.
- Speichern Sie verfeinerte Daten als neue Datei, oder aktualisieren Sie die ursprünglichen Daten.
- Profildaten, um sie zu validieren.
- Verwenden Sie interaktive Vorlagen, um Daten mit Codeoperationen, Funktionen und logischen Operatoren zu bearbeiten.
- Planen Sie wiederkehrende Operationen für Daten.
- Wie Sie Daten analysieren können
- Identifizieren Sie Muster, Verbindungen und Beziehungen innerhalb der Daten in mehreren Visualisierungsdiagrammen.
- Erste Schritte
- Klicken Sie zum Erstellen eines Data Refinery -Ablaufs auf Neues Asset > Daten vorbereiten und visualisieren.
- Weitere Informationen
- Dokumentation zu Data Refinery
- Videos zu Data Refinery
Sehen Sie sich ein Video an, um zu erfahren, wie man Daten verfeinert
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Data Replication
Verwenden Sie Data Replication, um Daten zu integrieren und zu synchronisieren. Data Replication bietet echtzeitnahe Datenbereitstellung mit geringen Auswirkungen auf Quellen.
- Erforderlicher Service
Data Replication
- Zugehöriger Service
IBM Knowledge Catalog
- Datenformate
Die Data Replication arbeitet mit Verbindungen zu und von ausgewählten Arten von Datenquellen und -formaten. Weitere Informationen finden Sie unter Unterstützte Data Replication.
- Berechtigungsnachweise
Data Replication verwendet Ihre IBM Cloud für die Verbindung mit dem Service.
- Erste Schritte
Um die Datenreplikation in einem Projekt zu starten, klicken Sie auf Neues Asset > Datenreplikation.
- Weitere Informationen
Sehen Sie sich ein Video an, um zu erfahren, wie man Daten repliziert
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Data Virtualization
Verwenden Sie Datenvirtualisierung, um mehrere Datenquellen in eine einzelne, sich selbst ausbalancierende Sammlung von Datenquellen oder Datenbanken zu verbinden.
- Datenformat
- Relational: Tabellen in relationalen Datenquellen
- Data Size
- Any
- Wie Sie Daten vorbereiten können
- Stellen Sie eine Verbindung zu mehreren Datenquellen her.
- Erstellen Sie virtuelle Tabellen.
- Erste Schritte
- Um virtuelle Tabellen zu erstellen, klicken Sie auf Daten > Data virtualization. Klicken Sie im Servicemenü auf Virtualisierung > Virtualisieren > Tabellen.
- Weitere Informationen
- Dokumentation über Data Virtualization
- Videos über Data Virtualization
Sehen Sie sich ein Video an, um zu erfahren, wie Sie Daten virtualisieren können
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
DataStage
Verwenden Sie DataStage, um Tabellendaten mit einem grafischen Ablaufeditor vorzubereiten und zu visualisieren. Sie erstellen einen DataStage-Ablauf und führen ihn als geordnete Folge von Operationen aus, die auf Daten angewendet werden.
- Erforderlicher Service
- DataStage
- Datenformat
- Tabellarisch: Avro, CSV, JSON, Parquet, TSV (schreibgeschützt) oder Textdateien mit Trennzeichen
- Relational: Tabellen in relationalen Datenquellen
- Data Size
- Any
- Wie Sie Daten vorbereiten können
- Entwerfen Sie einen grafischen Datenintegrationsfluss, der Orchestrate-Code generiert, der auf der hochleistungsfähigen DataStage-Parallelverarbeitungsengine ausgeführt werden soll.
- Führen Sie Operationen wie Join (Verknüpfen), Funnel (Trichter), Checksum (Kontrollsumme), Merge (Zusammenführen), Modify (Ändern), Remove Duplicates (Duplikate entfernen) und Sort (Sortieren) aus.
- Erste Schritte
- So erstellen Sie einen DataStage fließen, klicken Sie auf Neues Asset > Daten transformieren und integrieren. Der DataStage Kachel ist in der Grafische Builder Abschnitt.
- Weitere Informationen
- Dokumentation über DataStage
- Videos über DataStage
Sehen Sie sich ein Video an, um zu erfahren, wie Sie Daten umwandeln können
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
SPSS Modeler
Verwenden Sie SPSS Modeler , um einen Flow zu erstellen, um Daten vorzubereiten und ein Modell mit einem Flow-Editor in einem grafischen Erstellungsprogramm zu erstellen und zu trainieren.
- Erforderliche Services
- watsonx.ai Studio
- Datenformate
- Relational: Tabellen in relationalen Datenquellen
- Tabellarisch: Excel-Dateien (.xls oder .xlsx), CSV-Dateien oder SPSS Statistics-Dateien (.sav)
- Text: In den unterstützten relationalen Tabellen oder Dateien
- Data Size
- Any
- Wie Sie Daten vorbereiten können
- Automatische Datenvorbereitungsfunktionen verwenden.
- SQL-Anweisungen schreiben, um Daten zu bearbeiten.
- Bereinigen, Formen, Muster, Sortieren und Ableiten von Daten.
- Wie Sie Daten analysieren können
- Visualisieren Sie Daten mit mehr als 40 Graphen.
- Geben Sie die natürliche Sprache eines Textfelds an.
- Wie Sie Modelle erstellen können
- Erstellen Sie Vorhersagemodelle.
- Wählen Sie aus über 40 Modellierungsalgorithmen.
- Automatische Modellierungsfunktionen verwenden.
- Modellzeitreihen oder georäumliche Daten.
- Klassifizieren Sie Textdaten.
- Identifizieren Sie Beziehungen zwischen den Konzepten in Textdaten.
- Erste Schritte
- So erstellen Sie einSPSS Modeler fließen, klicken Sie auf Neues Asset > Modelle als visuellen Ablauf erstellen .
- Weitere Informationen
- Dokumentation zu SPSS Modeler
- Videos über SPSS Modeler
Sehen Sie sich ein Video an, um zu erfahren, wie Sie ein Modell mit SPSS Modeler erstellen
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Erstellungsprogramm für Decision Optimization-Modelle
Sie können Decision Optimization zum Erstellen und Ausführen von Optimierungsmodellen im Erstellungsprogramm für Decision Optimization-Modelle oder in einem Jupyter-Notebook verwenden.
- Erforderliche Services
- watsonx.ai Studio
- Datenformate
- Tabellarisch: CSV-Dateien
- Data Size
- Any
- Wie Sie Daten vorbereiten können
- Importieren relevanter Daten in ein Szenario und Bearbeiten der Daten
- Wie Sie Modelle erstellen können
- Erstellen präskriptiver Decision Optimization-Modelle
- Erstellen, Importieren und Bearbeiten von Modellen in Python DOcplex, OPL oder Ausdrücken natürlicher Sprache
- Erstellen, Importieren und Bearbeiten von Modellen in Notebooks
- Wie Sie Modelle lösen können
- Ausführen und Lösen von Decision Optimization-Modellen mit CPLEX-Engines
- Untersuchen und Vergleichen von Lösungen für mehrere Szenarios
- Erstellen von Tabellen, Diagrammen und Anmerkungen, um Daten und Lösungen für ein oder mehrere Szenarios zu visualisieren
- Erste Schritte
- So erstellen Sie einenDecision Optimization Modell, klicken Sie auf Neues Asset > Optimierungsprobleme lösen , oder klicken Sie für Notizbücher auf Neues Asset > Arbeiten mit Daten und Modellen inPython oder R-Notebooks .
- Weitere Informationen
- Dokumentation zu Decision Optimization
- Videos zu Decision Optimization
Sehen Sie sich ein Video an, um zu erfahren, wie man ein Experiment Decision Optimization erstellt
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
AutoAI-Tool
Sie können das AutoAI-Tool zum automatischen Analysieren Ihrer Daten und Generieren von infrage kommenden Modellpipelines verwenden, die für Ihr Vorhersagemodellierungsproblem angepasst sind.
- Erforderliche Services
- watsonx.ai Laufzeit
- watsonx.ai Studio
- Datenformat
- Tabellarisch: CSV-Dateien
- Data Size
- Abhängig vom Modelltyp. Details hierzu finden Sie unter AutoAI -Übersicht .
- Wie Sie Daten vorbereiten können
- Daten automatisch transformieren, z. B. fehlende Werte imputieren und Text in skalare Werte umwandeln.
- Wie Sie Modelle erstellen können
- Trainieren Sie eine binäre Klassifizierung, Mehrklassenklassifizierung oder Regressionsmodell.
- Zeigen Sie eine Baumstrukturinfografik an, die die Sequenzen von AutoAI-Trainingsstufen anzeigt.
- Generieren Sie ein Leaderboard von Modellpipelines, die durch Cross-Validation-Scores eingestuft werden.
- Speichern Sie eine Pipeline als Modell.
- Erste Schritte
- So erstellen Sie einAutoAI experimentieren, klicken Sie Neues Asset > Machine-Learning-Modelle automatisch erstellen .
- Weitere Informationen
- Dokumentation zu AutoAI
- Videos über AutoAI
Sehen Sie sich ein Video an, um zu erfahren, wie man ein AutoAI aufbaut
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Federated Learning
Verwenden Sie das Tool Federated Learning, um ein allgemeines Modell unter Verwendung verteilter Daten zu trainieren. Die Daten werden nie kombiniert oder gemeinsam genutzt, wodurch die Datenintegrität gewahrt bleibt und gleichzeitig allen beteiligten Parteien ein Modell auf der Basis der aggregierten Daten bereitgestellt wird.
- Erforderliche Services
- watsonx.ai Studio
- watsonx.ai Laufzeit
- Datenformat
- Any
- Data Size
- Beliebige Größe
- Wie Sie Modelle erstellen können
- Wählen Sie einen Schulungsrahmen aus.
- Konfigurieren Sie das allgemeine Modell.
- Konfigurieren Sie eine Datei für die Schulung des allgemeinen Modells.
- Haben ferne Parteien ihre Daten trainiert.
- Implementieren Sie das allgemeine Modell.
- Erste Schritte
- Um ein Experiment zu erstellen, klicken Sie auf Neues Asset > Modelle anhand verteilter Daten trainieren .
- Weitere Informationen
- Dokumentation zu Federated Learning
- Videos über Federated Learning
Sehen Sie sich ein Video an, um zu erfahren, wie man ein Experiment zum föderierten Lernen aufbaut
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Metadata import
Verwenden Sie das Tool für Metadatenimport, um technische Metadaten und Prozessmetadaten für Datenressourcen in ein Projekt oder einen Katalog zu importieren.
- Erforderlicher Service
- IBM Knowledge Catalog
- Datenformat
- Any
- Data Size
- Beliebige Größe
- Wie Sie Daten vorbereiten können
- Importieren Sie Datenressourcen aus einer Verbindung zu einer Datenquelle.
- Erste Schritte
- Um Metadaten zu importieren, klicken Sie auf Neues Asset > Metadaten für Daten-Assets importieren.
- Weitere Informationen
- Dokumentation zum Metadatenimport
- Videos zu IBM Knowledge Catalog
Sehen Sie sich ein Video an, um zu erfahren, wie Sie Asset-Metadaten importieren
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Metadatenanreicherung
Verwenden Sie das Metadatenanreicherungswerkzeug, um Datenressourcen automatisch zu profilieren und die Datenqualität in einem Projekt zu analysieren.
- Erforderlicher Service
- IBM Knowledge Catalog
- Datenformat
- Relational und strukturiert: Tabellen und Dateien in relationalen und nicht relationalen Datenquellen
- Tabellarisch: Avro-, CSV-oder Parquet-Dateien
- Data Size
- Beliebige Größe
- Wie Sie Daten vorbereiten und analysieren können
- Wählen Sie in einem Projekt eine ausgewählte Gruppe von Datenressourcen aus und analysieren Sie sie.
- Erste Schritte
- Um Daten anzureichern, klicken Sie auf Neues Asset > Datenassets mit Metadaten anreichern.
- Weitere Informationen
- Dokumentation zur Aufbereitung von Metadaten
- Videos zu IBM Knowledge Catalog
Sehen Sie sich ein Video an, um zu erfahren, wie man Datenbestände anreichert
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Datenqualitätsregel
Mit dem Datenqualitätstool können Sie Regeln erstellen, die die Datenqualität in einem Projekt analysieren.
- Erforderlicher Service
- IBM Knowledge Catalog
- Datenformat
- Relational und strukturiert: Tabellen und Dateien in relationalen und nicht relationalen Datenquellen
- Tabellarisch: Avro-, CSV-oder Parquet-Dateien
- Data Size
- Beliebige Größe
- Wie Sie Daten vorbereiten und analysieren können
- Analysieren Sie die Qualität einer ausgewählten Gruppe von Datenassets in einem Projekt.
- Erste Schritte
- Um eine Datenqualitätsregel zu erstellen, klicken Sie auf Neues Asset > Datenqualität messen und überwachen.
- Weitere Informationen
- Dokumentation zu Datenqualitätsregeln
IBM Match 360 with Watson
Verwenden Sie IBM Match 360 mit Watson, um Stammdatenentitäten zu erstellen, die digitale Zwillinge Ihrer Kunden darstellen. Modellieren Sie Ihre Daten und ordnen Sie sie zu und führen Sie anschließend den Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen. Passen Sie Ihren Abgleichalgorithmus an und optimieren Sie ihn, um die Anforderungen Ihres Unternehmens zu erfüllen.
- Erforderliche Services
- IBM Match 360 with Watson IBM Knowledge Catalog
- Data Size
- Bis zu 1.000.000 Datensätze (für den Beta Lite-Plan)
- Wie Sie Daten vorbereiten können
- Modellieren Sie Daten aus Quellen in Ihrem Unternehmen und ordnen Sie sie zu.
- Führen Sie den anpassbaren Abgleichalgorithmus aus, um Stammdatenentitäten zu erstellen.
- Master-Datenentitäten und die zugehörigen Datensätze anzeigen und bearbeiten.
- Erste Schritte
- So erstellen Sie ein IBM Match 360 Konfigurationsressource, klicken Sie auf Neues Asset > Daten in 360-Grad-Ansichten konsolidieren.
- Weitere Informationen
- Dokumentation zu IBM Match 360 with Watson
- Videos über IBM Match 360
Sehen Sie sich ein Video an, um zu erfahren, wie Sie IBM Match 360 verwenden
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
RStudio-IDE
Verwenden Sie die RStudio-IDE, um Daten zu analysieren oder um Shiny-Anwendungen zu erstellen, indem Sie R-Code schreiben.
- Erforderlicher Service
- watsonx.ai Studio
- Datenformat
- Any
- Data Size
- Beliebige Größe
- Wie Sie Daten vorbereiten, Daten analysieren und Modelle erstellen können
- Schreiben Sie Code in R.
- Erstellen Sie Shiny-Apps.
- Verwenden Sie Open-Source-Bibliotheken und -Pakete.
- Schließen Sie Rich Text und Medien mit Ihrem Code ein.
- Bereiten Sie Daten vor.
- Daten visualisieren.
- Entdecken Sie Erkenntnisse aus den Daten.
- Bauen und trainieren Sie ein Modell mit Open-Source-Bibliotheken.
- Teilen Sie Ihre Shiny-App in einem Git-Repository.
- Erste Schritte
- Um RStudio zu verwenden, klicken Sie auf IDE starten > RStudio.
- Weitere Informationen
- Dokumentation zu RStudio
- Videos zu RStudio
Sehen Sie sich ein Video an, um einen Überblick über die RStudio-IDE zu erhalten
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Maskierungsabläufe
Verwenden Sie das Maskierungsablauftool, um maskierte Kopien oder maskierte Untergruppen von Daten aus dem Katalog vorzubereiten. Die Daten werden mithilfe von erweiterten Maskierungsoptionen mit Datenschutzregeln deidentifiziert.
- Erforderlicher Service
- IBM Knowledge Catalog
- Datenformat
- Relational: Tabellen in relationalen Datenquellen
- Data Size
- Beliebige Größe
- Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können
- Importieren Sie Datenressourcen aus dem regulierten Katalog in das Projekt.
- Erstellen Sie Definitionen für Maskierungsflussjobs, um anzugeben, welche Daten mit den Datenschutzregeln maskiert werden sollen.
- Optional Teilmengen von Daten, um die Größe kopierter Daten zu reduzieren.
- Führen Sie Maskierungsflussjobs aus, um maskierte Kopien in Zieldatenbankverbindungen zu laden.
- Erste Schritte
- Stellen Sie sicher, dass vorausgesetzte Schritte in IBM Knowledge Catalog ausgeführt werden. Führen Sie eine der folgenden Tasks aus, um Daten zu privatisieren:
- Klicken Neues Asset > Daten kopieren und maskieren.
- Klicken Sie auf die Menüoptionen für einzelne Datenressourcen, um diese Anlage direkt zu maskieren.
- Weitere Informationen
- Dokumentation zur Maskierung von Daten
- Videos zu IBM Knowledge Catalog
Sehen Sie sich ein Video an, um zu erfahren, wie Sie einen Maskierungsfluss erstellen
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Orchestrierungspipelines
Mit dem Erstellungsbereichseditor für Pipelines können Sie einen Ablauf erstellen, um Daten vorzubereiten, zu visualisieren und zu analysieren oder ein Modell zu erstellen und zu trainieren.
- Datenformat
- Any
- Data Size
- Any
- Wie Sie Daten vorbereiten, Daten analysieren oder Modelle erstellen können
- Verwenden Sie eine Vielzahl von Knoten, die jeweils eigene Protokolle enthalten.
- Integrieren Sie Notebooks in den Ablauf, um beliebigen Python -oder R-Code auszuführen.
- Arbeiten Sie mit jeder Art von Daten in jeder Art und Weise, die Sie wollen.
- Planen Sie Ausführungen Ihres Ablaufs.
- Importieren Sie Daten aus Ihrem angehängten PVC, Projekt oder nehmen Sie Daten aus Github auf.
- Erstellen Sie Ihre angepasste Komponente mit einem Python -Code.
- Konditionalisieren Sie Ihre Pipelines, um die Datenqualität wie gewünscht zu überwachen.
- Verwenden Sie Webhook zum Senden von E-Mails oder Nachrichten, um über den Status Ihres Ablaufs auf dem Laufenden zu bleiben.
- Erste Schritte
- Um eine neue Pipeline zu erstellen, klicken Sie auf Neues Asset > Modelllebenszyklus automatisieren .
- Weitere Informationen
- Dokumentation über Orchestrierungspipelines
- Videos über Orchestrierungspipelines
Sehen Sie sich ein Video an, um zu erfahren, wie man eine Pipeline erstellt
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Aufgaben in dieser Dokumentation.
Datenvisualisierungen
Mit Datenvisualisierungen können Sie Erkenntnisse aus Ihren Daten gewinnen. Durch die Untersuchung von Daten aus unterschiedlichen Perspektiven mit Visualisierungen können Sie Muster, Verbindungen und Beziehungen innerhalb dieser Daten ermitteln und schnell große Datenmengen verstehen.
- Datenformat
- Tabellarisch: Avro-, CSV-, JSON-, Parquet-, TSV-, SAV-, Microsoft Excel-XLS-und XLSX-Dateien, SAS-Dateien, Textdateien mit Trennzeichen und verbundene Daten. Weitere Informationen zu unterstützten Datenquellen finden Sie unter Connectors.
- Data Size
- Keine Begrenzung
- Erste Schritte
- Zum Erstellen einer Visualisierung klicken Sie in der Liste der Assettypen in Ihrem Projekt auf Datenasset und wählen Sie ein Datenasset aus. Klicken Sie auf die Registerkarte Visualisierung, und wählen Sie einen Diagrammtyp aus.
- Weitere Informationen
- Visualisierung Ihrer Daten
Übergeordnetes Thema: Projekte