Um auf Ihre Daten zuzugreifen in IBM watsonx.data, erstellen Sie ein Verbindungsressource dafür. Das Verbindungs-Asset enthält Informationen für die Verbindung mit einer watsonx.data-Instanz und mit der Presto-Abfrage-Engine, die auf dieser Instanz läuft.
IBM watsonx.data ist ein offenes, hybrides und reguliertes Data-Lakehouse, das durch eine Abfrageengine für alle Daten-und KI-Workloads optimiert wird.
Vorbereitende Schritte
Unterschiede zwischen den watsonx.data Presto und den Presto Verbindungen
IBM watsonx.data beinhaltet die Presto SQL Query Engine. Sowohl die watsonx.data Presto und Presto Verbindungen können Verbindungselemente erstellen, um mit der Presto SQL Query Engine in IBM watsonx.data zu interagieren.
watsonx.data Presto Verbindung
Die watsonx.data Presto unterstützt das Lesen von IBM watsonx.data mit der Presto SQL Query Engine und das Schreiben von Tabellen im Iceberg-Tabellenformat in Amazon S3, Apache Ozone, IBM Ceph und IBM Cloud Object Storage Buckets in IBM watsonx.data. Die Verbindung wird auch benötigt, wenn Sie die Integration mit IBM Knowledge Catalog wünschen, um die Vorteile des Dienstes mit watsonx.data zu nutzen.
IBM empfiehlt die Verwendung der watsonx.data Presto zu verwenden, wenn eine Verbindung von Cloud Pak for Data zu IBM watsonx.data hergestellt wird.
Weitere Informationen über die watsonx.data Presto-Verbindung finden Sie im weiteren Verlauf dieses Themas.
Presto
Die Presto-Verbindung kann eine Nur-Lese-Verbindung zu jeder Presto-Engine herstellen, einschließlich der Implementierung in IBM watsonx.data.
Für weitere Informationen über die Presto-Verbindung siehe Presto-Verbindung.
Voraussetzung
Konfigurieren Sie eine Instanz von watsonx.data.
Sie können eine Verbindung zu Software oder als Serviceinstanz herstellen:
watsonx.data -Software auf Cloud Pak for Data: Siehe Installation von watsonx.data auf Cloud Pak for Data.
watsonx.data als Service in der IBM Cloud: Siehe Erste Schritte mit watsonx.data in der IBM Cloud
watsonx.data als eigenständige Software: Siehe Installation der eigenständigen watsonx.data
Verbindung zu watsonx.data erstellen
Die Details Ihrer Verbindung variieren je nach gewählter Bereitstellungsart. Um das Verbindungs-Asset zu erstellen, wählen Sie im Abschnitt Verbindungsdetails auf der Seite Verbindung zu einer Datenquelle den Bereitstellungstyp:
- IBM watsonx.data Entwicklerausgabe
- IBM watsonx.data auf IBM Cloud
- IBM watsonx.data auf Red Hat OpenShift
Sie können die Bereitstellungsart auch auf dem Standardwert belassen, bei dem Sie die Details der alten Verbindung sehen.
Die Angaben, die Sie machen müssen, richten sich nach der von Ihnen gewählten Abrechnungsart:
IBM watsonx.data Entwicklerausgabe
Sie können eine JSON-Datei importieren, um diese Felder mit Hilfe der Funktion Verbindungswerte importieren auszufüllen. Um die JSON-Datei zu erhalten, die für diese Verbindung benötigt wird, müssen Sie auf die Konsolenseite Ihrer watsonx.data -Instanz gehen und zum Feld Connect information navigieren, um die JSON-Datei zu kopieren.
- Hostname oder IP-Adresse: Diese Informationen finden Sie in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails.
- Port: Die Standardportnummer ist
443
. Sie finden diese Informationen in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails. - Instanz-ID: Diesen Wert finden Sie in der Konsole watsonx.data. Klicken Instanzdetails aus dem Navigationsmenü. Sie können diese Informationen auch in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails finden.
IBM watsonx.data auf IBM Cloud
Sie können eine JSON-Datei importieren, um diese Felder mit Hilfe der Funktion Verbindungswerte importieren auszufüllen. Um die JSON-Datei zu erhalten, die für diese Verbindung benötigt wird, müssen Sie auf die Konsolenseite Ihrer watsonx.data -Instanz gehen und zum Feld Connect information navigieren, um die JSON-Datei zu kopieren.
- Hostname oder IP-Adresse: Diese Informationen finden Sie in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails.
- Port: Die Standardportnummer ist
443
. Sie finden diese Informationen in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails. - CRN: Name der Cloud-Ressource: Diesen Wert finden Sie in der Konsole watsonx.data. Klicken Instanzdetails aus dem Navigationsmenü. Sie können diese Informationen auch in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails finden.
IBM watsonx.data auf Red Hat OpenShift
Sie können eine JSON-Datei importieren, um diese Felder mit Hilfe der Funktion Verbindungswerte importieren auszufüllen. Um die JSON-Datei zu erhalten, die für diese Verbindung benötigt wird, müssen Sie auf die Konsolenseite Ihrer watsonx.data -Instanz gehen und zum Feld Connect information navigieren, um die JSON-Datei zu kopieren.
- Hostname oder IP-Adresse: Diese Informationen finden Sie in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails.
- Port: Die Standardportnummer ist
443
. Sie finden diese Informationen in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails. - Instanz-ID: Diesen Wert finden Sie in der Konsole watsonx.data. Klicken Instanzdetails aus dem Navigationsmenü. Sie können diese Informationen auch in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails finden.
Details zur alten Verbindung
watsonx.data Software
Um das Verbindungs-Asset zu erstellen, wählen Sie im Abschnitt Verbindungsdetails auf der Seite Verbinden mit einer Datenquelle die Option Verbinden mit watsonx.data auf Cloud Pak for Data und geben Sie diese Details an:
- Hostname oder IP-Adresse: Diese Informationen finden Sie in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails.
- Port: Die Standardportnummer ist
443
. Sie finden diese Informationen in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails. - Instanz-ID: Diesen Wert finden Sie in der Konsole watsonx.data. Klicken Instanzdetails aus dem Navigationsmenü. Sie können diese Informationen auch in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails finden.
- Instanzname: Finden Sie den Instanznamen auf der Cloud Pak for Data Web-Client-Startseite. Klicken Sie im Navigationsmenü auf Dienste > Instanzen.
watsonx.data als Dienst
Hostname oder IP-Adresse: Diese Informationen finden Sie in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails.
Port: Die Standardportnummer ist
443
. Sie finden diese Informationen in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails.Instanz-ID: Diesen Wert finden Sie in der Konsole watsonx.data. Klicken Instanzdetails aus dem Navigationsmenü. Sie können diese Informationen auch in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails finden.
Instanzname: Diesen Wert finden Sie auf der watsonx.ai Dienstinstanzen Seite. Klicken Verwaltung > Dienste > Dienstinstanzen. Zum Beispiel
watsonx.data-aaa
. Verwenden Sie nicht den vorgeschlagenen Instanznamen, der im Feld angezeigt wird.CRN: Name der Cloud-Ressource: Diesen Wert finden Sie in der Konsole watsonx.data. Klicken Instanzdetails aus dem Navigationsmenü. Sie können diese Informationen auch in der Konsole unter Konfigurationen > Verbindungsinformationen > Instanzdetails finden.
Berechtigungsnachweise
Ihre Anmeldedaten variieren je nach gewählter Bereitstellungsart:
- IBM watsonx.data Entwicklerausgabe
- IBM watsonx.data auf IBM Cloud
- IBM watsonx.data auf Red Hat OpenShift
Sie können die Bereitstellungsart auch auf dem Standardwert belassen, bei dem Sie die Details der alten Verbindung sehen.
IBM watsonx.data Entwicklerausgabe
- Benutzername und Kennwort: Der Benutzername und das Kennwort, die für die Anmeldung bei der watsonx.datastandalone-Konsole verwendet werden.
IBM watsonx.data auf IBM Cloud
- API-Schlüssel: Der API-Schlüssel des Kontos, das Zugriff auf die watsonx.data-Instanz auf IBM Cloud hat.
Der API-Schlüssel kann in der IBM Cloud-Konsole generiert werden.
IBM watsonx.data auf Red Hat OpenShift
Sie müssen eine Authentifizierungsmethode auswählen:
- Benutzername und Kennwort: Der Benutzername und das Kennwort, das für den Zugriff auf Cloud Pak for Data verwendet wird, wo sich die watsonx.data-Instanz befindet.
- Benutzername und API-Schlüssel: Der Benutzername und API-Schlüssel, der für den Zugriff auf Cloud Pak for Data verwendet wird, wo sich die watsonx.data-Instanz befindet.
Diese Authentifizierungsmethode wird empfohlen, wenn Cloud Pak for Data einen Identity Management Service (IAM) verwendet, zum Beispiel LDAP oder SSO. Der API-Schlüssel befindet sich im Profil und Einstellungen des Zielclusters Cloud Pak for Data. Informationen zu API-Schlüsseln finden Sie unter Erzeugen von API-Schlüsseln für die Authentifizierung.
Details zur alten Verbindung
watsonx.data Software
Der Benutzername und das Passwort oder die Benutzernamen und der API-Schlüssel für die Instanz watsonx.data. Die gleichen Anmeldedaten werden auch für den Motor verwendet.
Sie müssen die Authentifizierungsmethode auswählen:
- Benutzername und Kennwort: Der Benutzername und das Kennwort, das für den Zugriff auf Cloud Pak for Data verwendet wird, wo sich die watsonx.data-Instanz befindet, oder der Benutzername und das Kennwort für watsonx.data standalone.
- Benutzername und API-Schlüssel: Der Benutzername und API-Schlüssel, der für den Zugriff auf Cloud Pak for Data verwendet wird, wo sich die watsonx.data-Instanz befindet, oder der Benutzername und das Passwort für watsonx.data standalone. Diese Authentifizierungsmethode wird empfohlen, wenn Cloud Pak for Data einen Identity Management Service (IAM) verwendet, zum Beispiel LDAP oder SSO. Der API-Schlüssel befindet sich im Profil und Einstellungen des Zielclusters Cloud Pak for Data. Informationen zu API-Schlüsseln finden Sie unter Erzeugen von API-Schlüsseln für die Authentifizierung.
watsonx.data als Dienst
Der Benutzername und das Passwort für die Instanz watsonx.data. Die gleichen Anmeldedaten werden auch für den Motor verwendet.
- Benutzername: Der Standard-Benutzername ist
ibmlhapikey_<cloud-account-email-address>
. Zum Beispiel[email protected]
. - Passwort: Das Passwort ist der API-Schlüssel des Benutzers. Um einen API-Schlüssel zu erstellen, siehe IBM Cloud docs: Erstellen eines API-Schlüssels in der Konsole.
Zertifikate
Standardmäßig ist SSL ist aktiviert ausgewählt. Diese Einstellung wird zur Erhöhung der Sicherheit empfohlen. Wenn Sie SSL nicht verwenden, können die Daten Sicherheitslücken wie Datenlecks aufweisen. Obwohl die Datenbank, die in watsonx.data gehostet wird, auch über ein SSL-Zertifikat verfügen kann, erfolgt die Verbindung über die Engine.
Das SSL-Zertifikat muss im PEM-Format vorliegen.
Die Informationen zu den SSL-Zertifikaten variieren je nach gewählter Bereitstellungsart:
- IBM watsonx.data Entwicklerausgabe
- IBM watsonx.data auf IBM Cloud
- IBM watsonx.data auf Red Hat OpenShift
IBM watsonx.data Entwicklerausgabe
Das SSL-Zertifikat ist optional.
Wenn SSL auf einer watsonx.data -Instanz in Cloud Pak for Data aktiviert ist und das Zertifikat ein selbst signiertes Zertifikat ist, müssen Sie das Zertifikat im Feld SSL-Zertifikat eingeben.
Fragen Sie Ihren watsonx.data-Administrator, ob SSL eingerichtet ist. Sie finden das SSL-Zertifikat in der Konsole watsonx.data unter Konfigurationen > Verbindungsinformationen > Instanzdetails.
IBM watsonx.data auf IBM Cloud
Das SSL-Zertifikat ist optional.
IBM watsonx.data auf Red Hat OpenShift
Das SSL-Zertifikat ist optional.
Wenn SSL auf einer watsonx.data -Instanz in Cloud Pak for Data aktiviert ist und das Zertifikat ein selbst signiertes Zertifikat ist, müssen Sie das Zertifikat im Feld SSL-Zertifikat eingeben.
Fragen Sie Ihren watsonx.data-Administrator, ob SSL eingerichtet ist. Sie finden das SSL-Zertifikat in der Konsole watsonx.data unter Konfigurationen > Verbindungsinformationen > Instanzdetails.
Details zu der Engineverbindung
Geben Sie die Verbindungsdaten des Motors ein
Unterstützte Motorversionen
Für watsonx.data auf Cloud Pak for Data Version 5.0.3 und höher:
- Presto (Java)
- Presto (C++)
Für watsonx.data auf Cloud Pak for Data Version 5.0.2 und früher:
- Presto (Java)
Für watsonx.data als Dienst:
- Presto (Java)
- Presto (C++)
Geben Sie diese Motorverbindungsdetails an. Diese Informationen finden Sie in der Webkonsole watsonx.data unter Konfigurationen > Verbindungsinformationen > Maschinen- und Dienstverbindungsdetails.
Hostname oder IP-Adresse der Engine: Der Hostname oder die IP-Adresse ist der Wert der Interner Host Feld.
Motorkennung: Dieser Wert liegt im Motorkennung Feld.
Motoranschluss: Die Portnummer ist der Wert in der Interner Host Feld nach dem Doppelpunkt (
:
). Die Standard-Portnummer ist8443
.
Je nach Position auf der Plattform geeignete Methode zum Erstellen einer Verbindung auswählen
- In einem Projekt
- Klicken Sie auf Assets > Neues Asset > Verbindung zu einer Datenquelle herstellen. Weitere Informationen finden Sie unter Verbindung zu einem Projekt hinzufügen.
- In einem Katalog
- Klicken Sie auf Zu Katalog hinzufügen > Verbindung. Weitere Informationen finden Sie unter Verbindungsasset zu einem Katalog hinzufügen.
- Im Katalog der Plattformressourcen
- Klicken Sie auf Neue Verbindung. Weitere Informationen finden Sie unter Hinzufügen von Plattformverbindungen.
Nächster Schritt: Fügen Sie Datenassets aus der Verbindung hinzu
Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Projekt hinzufügen.
Weitere Informationen finden Sie unter Daten aus einer Verbindung in einem Katalog hinzufügen.
Wo Sie diese Verbindung verwenden können
Sie können die Verbindung watsonx.data Presto in den folgenden Arbeitsbereichen und Tools verwenden:
Projekte
- Data Refinerywatsonx.ai Studio oder IBM Knowledge Catalog)
- DataStage (DataStage -Service). Weitere Informationen finden Sie unter Verbindung zu einer Datenquelle in DataStage.
- Decision Optimizationwatsonx.ai Studio und watsonx.ai Runtime)
- Metadata import (IBM Knowledge Catalog)
Kataloge
Platform assets catalog
Andere Kataloge (IBM Knowledge Catalog)
Schreiben von Daten in watsonx.data
Sie können Daten aufnehmen in watsonx.data mit DataStage. Sie müssen einencatalog_name
,schema_name
, Undtable_name
Eigenschaften. Die Eigenschaft table_name
ist erforderlich. Sie können den voll qualifizierten Namen, catalog_name.schema_name.table_name
, in die Eigenschaft table_name
übertragen.
Der watsonx.data Presto erstellt Iceberg-Tabellen direkt auf dem in IBM watsonx.data definierten Speicher. Derzeit unterstützt der Konnektor das Schreiben auf die folgenden Speicher:
- Amazon S3
- Apache
- IBM Ceph
- IBM Cloud Object Storage
Webkonsole watsonx.data
Weitere Informationen
- watsonx.data auf Cloud Pak for Data
- watsonx.data als Service in der IBM Cloud
- Eigenständige watsonx.data
Zugehörige Verbindungen
Übergeordnetes Thema: Unterstützte Verbindungen