0 / 0
Zurück zur englischen Version der Dokumentation
Daten zu Data Refinery hinzufügen
Letzte Aktualisierung: 19. Juni 2024
Daten zu Data Refinery hinzufügen

Nachdem Sie ein Projekt erstellt und Verbindungen erstellt oder Datenassets zum Projekt hinzugefügt haben, können Sie Daten zu Data Refinery hinzufügen und mit der Vorbereitung dieser Daten für die Analyse beginnen.

Zum Hinzufügen von Daten *zu Data Refinery steht Ihnen eine der folgenden Vorgehensweisen zur Verfügung:

  • Wählen Sie Daten vorbereiten im Symbol Überlauf Überlaufmenü eines Datenassets in der Liste Alle Assets für das Projekt aus.
  • Vorschau eines Datenassets im Projekt anzeigen und anschließend auf Daten vorbereiten klicken
  • Sie navigieren zuerst zu Data Refinery und fügen dann Daten hinzu.
  1. Greifen Sie aus einem Projekt heraus auf Data Refinery zu. Klicken Sie auf die Registerkarte Assets.

  2. Klicken Sie auf Neues Asset > Daten vorbereiten und visualisieren.

    • Klicken Sie auf Vom lokalen Standort aus durchsuchen , um ein neues Datenasset hochzuladen.
    • Klicken Sie auf Aus Projekt auswählen , um ein zuvor hochgeladenes Datenasset oder eine Verbindung auszuwählen.

    Datenasset:

    • Wählen Sie eine Datendatei aus (die Auswahl umfasst Datendateien, die bereits mit Data Refinery geformt wurden).
    • Wählen Sie ein verbundenes Datenasset aus.

    Verbindung:

    • Wählen Sie eine Verbindung und eine Datei aus.
    • Wählen Sie eine Verbindung, einen Ordner und eine Datei aus.
    • Wählen Sie eine Verbindung, ein Schema sowie eine Tabelle oder eine Ansicht aus.

    Data Refinery unterstützt die folgenden Dateitypen: Avro, CSV, Textdateien mit Trennzeichen, JSON, Microsoft Excel (XLS-und XLSX-Formate. Nur erstes Arbeitsblatt, mit Ausnahme von Verbindungen und verbundenen Datenassets. Parquet, SAS mit Erweiterung "sas7bdat" (schreibgeschützt), TSV (schreibgeschützt)

    Jede. Data Refinery arbeitet mit einem Beispielsubset von Zeilen des Datasets. Die Stichprobengröße beträgt 1 MB oder 10.000 Zeilen, je nachdem, welcher Wert zuerst erreicht wird. Wenn Sie einen Job für den Data Refinery-Ablauf ausführen, wird jedoch das gesamte Dataset verarbeitet. Wenn der Data Refinery -Ablauf mit einem großen Datenasset fehlschlägt, finden Sie weitere Informationen unter Fehlerbehebung für Data Refinery.

    Datenverbindungen, die mit einem Schlüsselsymbol (Schlüsselsymbol für private Verbindungen) markiert sind, sind gesperrt. Wenn Sie für den Zugriff auf die Datenquelle berechtigt sind, werden Sie bei der ersten Auswahl zur Eingabe Ihrer persönlichen Berechtigungsnachweise aufgefordert. Dieser einmalige Schritt entsperrt die Verbindung permanent für Sie. Nachdem Sie die Verbindung entsperrt haben, wird das Schlüsselsymbol nicht mehr angezeigt. Siehe Verbindungen zu Projekten hinzufügen.

  3. Geben Sie einen Namen und eine optionale Beschreibung ein.

  4. Klicken Sie auf Erstellen , um die Daten in Data Refineryzu laden.

Nächste Schritte

Übergeordnetes Thema: Daten optimieren

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen