Traduction non à jour
Pour accéder à vos données dans IBM watsonx.data, créez un actif de connexion pour celui-ci. La ressource de connexion comprend des informations permettant de se connecter à une instance de watsonx.data et au moteur de requête Presto qui s'exécute sur cette instance.
IBM watsonx.data est un lakehouse de données ouvert, hybride et gouverné qui est optimisé par un moteur de requête pour toutes les charges de travail de données et d'intelligence artificielle.
Avant de commencer
Différences entre les connexions watsonx.data Presto et Presto
IBM watsonx.data intègre le Presto SQL Query Engine. Les connexions watsonx.data Presto et Presto peuvent créer des actifs de connexion pour interagir avec le Presto SQL Query Engine dans IBM watsonx.data.
watsonx.data Presto connexion
La connexion Presto watsonx.data prend en charge la lecture à partir d'IBM watsonx.data à l'aide du moteur de SQL Query Presto et prend en charge l'écriture de tables au format Iceberg vers les buckets Amazon S3, Apache Ozone, IBM Ceph et IBM Cloud Object Storage dans IBM watsonx.data La connexion est également nécessaire si vous souhaitez que l'intégration avec IBM Knowledge Catalog bénéficie du service watsonx.data
IBM recommande d'utiliser la connexion watsonx.data Presto lors de la connexion de Cloud Pak for Data à IBM watsonx.data.
Pour plus d'informations sur la connexion watsonx.data Presto, voir le reste de la rubrique.
Presto
La connexion Presto peut créer une connexion en lecture seule avec n'importe quel moteur Presto, y compris la mise en œuvre dans IBM watsonx.data.
Pour plus d'informations sur la connexion Presto, voir Presto connexion.
Prérequis
Configurez une instance de watsonx.data.
Vous pouvez vous connecter à des instances logicielles ou en tant que service :
watsonx.data sur Cloud Pak for Data: Voir Installation de watsonx.data sur Cloud Pak for Data.
watsonx.data en tant que service sur IBM Cloud: Voir Démarrer avec watsonx.data sur IBM Cloud
logiciel autonome watsonx.data: Voir " Installation de l'application autonome " watsonx.data"
Créez une connexion à watsonx.data
Les détails de votre connexion varient selon le type de déploiement choisi. Pour créer la ressource de connexion, dans la section Détails de connexion de la page Connecter à une source de données, sélectionnez le type de déploiement :
- IBM watsonx.data Édition développeur
- IBM watsonx.data on IBM Cloud
- IBM watsonx.data sur Red Hat OpenShift
Vous pouvez également laisser le type de déploiement dans la valeur par défaut, ce qui vous permettra d'afficher les détails de la connexion existante.
Les informations que vous devez fournir changent en fonction du type de déploiement que vous avez choisi :
IBM watsonx.data Édition pour développeurs
Vous pouvez importer un fichier JSON pour remplir ces champs à l'aide de l'option Importer des valeurs de connexion. Pour obtenir le fichier JSON nécessaire à cette connexion, vous devez vous rendre sur la page de la console de votre instance watsonx.data et naviguer jusqu'au champ " Connect information" pour copier le fichier JSON.
- Nom d'hôte ou adresse IP : Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
- Port: le numéro de port par défaut est
443
. Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance. - Instance ID : Trouvez cette valeur dans la console watsonx.data. Cliquez sur Détails de l'instance à partir du menu de navigation. Vous pouvez également trouver ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
IBM watsonx.data sur IBM Cloud
Vous pouvez importer un fichier JSON pour remplir ces champs à l'aide de l'option Importer des valeurs de connexion. Pour obtenir le fichier JSON nécessaire à cette connexion, vous devez vous rendre sur la page de la console de votre instance watsonx.data et naviguer jusqu'au champ " Connect information" pour copier le fichier JSON.
- Nom d'hôte ou adresse IP : Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
- Port: le numéro de port par défaut est
443
. Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance. - CRN : Nom de la ressource cloud : Trouvez cette valeur dans la console watsonx.data. Cliquez sur Détails de l'instance à partir du menu de navigation. Vous pouvez également trouver ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
IBM watsonx.data sur Red Hat OpenShift
Vous pouvez importer un fichier JSON pour remplir ces champs à l'aide de l'option Importer des valeurs de connexion. Pour obtenir le fichier JSON nécessaire à cette connexion, vous devez vous rendre sur la page de la console de votre instance watsonx.data et naviguer jusqu'au champ " Connect information" pour copier le fichier JSON.
- Nom d'hôte ou adresse IP : Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
- Port: le numéro de port par défaut est
443
. Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance. - Instance ID : Trouvez cette valeur dans la console watsonx.data. Cliquez sur Détails de l'instance à partir du menu de navigation. Vous pouvez également trouver ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
Détails de l'ancienne connexion
watsonx.data logiciel
Pour créer l'actif de connexion, dans la section Détails de connexion de la page Connecter à une source de données, sélectionnez Connecter à watsonx.data sur Cloud Pak for Data et fournissez ces détails :
- Nom d'hôte ou adresse IP : Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
- Port: le numéro de port par défaut est
443
. Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance. - Instance ID : Trouvez cette valeur dans la console watsonx.data. Cliquez sur Détails de l'instance à partir du menu de navigation. Vous pouvez également trouver ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
- Nom de l'instance : Trouvez le nom de l'instance sur la page d'accueil du client web Cloud Pak for Data. Cliquez sur Services > Instances dans le menu de navigation.
watsonx.data en tant que service
Nom d'hôte ou adresse IP : Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
Port: le numéro de port par défaut est
443
. Vous trouverez ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.Instance ID : Trouvez cette valeur dans la console watsonx.data. Cliquez sur Détails de l'instance à partir du menu de navigation. Vous pouvez également trouver ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
Nom de l'instance: Trouvez cette valeur sur le watsonx.ai Instances de service page. Cliquez sur Administration > Services > Instances de service. Par exemple,
watsonx.data-aaa
. N'utilisez pas le nom d'instance suggéré qui est affiché dans le champ.CRN : Nom de la ressource cloud : Trouvez cette valeur dans la console watsonx.data. Cliquez sur Détails de l'instance à partir du menu de navigation. Vous pouvez également trouver ces informations dans la console sous Configurations > Informations de connexion > Détails de l'instance.
Données d'identification
Vos informations d'identification varient selon le type de déploiement choisi :
- IBM watsonx.data Édition développeur
- IBM watsonx.data on IBM Cloud
- IBM watsonx.data sur Red Hat OpenShift
Vous pouvez également laisser le type de déploiement dans la valeur par défaut, ce qui vous permettra d'afficher les détails de la connexion existante.
IBM watsonx.data Édition pour développeurs
- Nom d'utilisateur et mot de passe : Le nom d'utilisateur et le mot de passe utilisés pour se connecter à la console watsonx.datastandalone.
IBM watsonx.data sur IBM Cloud
- Clé API : La clé API du compte qui a accès à l'instance watsonx.data sur IBM Cloud.
La clé API peut être générée dans la console IBM Cloud
IBM watsonx.data sur Red Hat OpenShift
Vous devez sélectionner une méthode d'authentification :
- Nom d'utilisateur et mot de passe : Le nom d'utilisateur et le mot de passe utilisés pour accéder à Cloud Pak for Data où se trouve l'instance watsonx.data.
- Nom d'utilisateur et clé API : Le nom d'utilisateur et la clé API qui sont utilisés pour accéder à Cloud Pak for Data où se trouve l'instance watsonx.data.
Cette méthode d'authentification est recommandée si Cloud Pak for Data utilise un service de gestion des identités (IAM), par exemple LDAP ou SSO. La clé API se trouve dans le Profil et paramètres du cluster Cloud Pak for Data cible. Pour plus d'informations sur les clés API, voir Générer des clés API pour l'authentification.
Détails de l'ancienne connexion
watsonx.data logiciel
Le nom d'utilisateur et le mot de passe ou les noms d'utilisateur et la clé API pour l'instance watsonx.data Les mêmes références sont utilisées pour le moteur.
Vous devez sélectionner la méthode d'authentification :
- Nom d'utilisateur et mot de passe: Le nom d'utilisateur et le mot de passe utilisés pour accéder au Cloud Pak for Data où se trouve l'instance watsonx.data, ou le nom d'utilisateur et le mot de passe pour watsonx.data standalone.
- Nom d'utilisateur et clé API: Le nom d'utilisateur et la clé API utilisés pour accéder au Cloud Pak for Data où se trouve l'instance watsonx.data, ou le nom d'utilisateur et le mot de passe pour watsonx.data standalone. Cette méthode d'authentification est recommandée si Cloud Pak for Data utilise un service de gestion des identités (IAM), par exemple LDAP ou SSO. La clé API se trouve dans le profil et les paramètres du cluster Cloud Pak for Data cible. Pour plus d'informations sur les clés API, voir Générer des clés API pour l'authentification.
watsonx.data en tant que service
Le nom d'utilisateur et le mot de passe de l'instance watsonx.data Les mêmes références sont utilisées pour le moteur.
- Nom d'utilisateur : Le nom d'utilisateur par défaut est
ibmlhapikey_<cloud-account-email-address>
. Par exemple,[email protected]
. - Mot de passe: Le mot de passe est la clé API de l'utilisateur. Pour créer une clé API, consultez la documentation d'IBM Cloud: Créer une clé API dans la console.
Certificats
Par défaut, SSL est activé est sélectionné. Ce paramètre est recommandé pour une sécurité accrue. Si vous n'utilisez pas SSL, les données peuvent être sujettes à des vulnérabilités telles que la fuite de données. Bien que la base de données hébergée dans watsonx.data puisse également disposer d'un certificat SSL, la connexion passe par le moteur.
Le certificat SSL doit être au format PEM.
Les informations sur les certificats SSL varient selon le type de déploiement choisi :
- IBM watsonx.data Édition développeur
- IBM watsonx.data on IBM Cloud
- IBM watsonx.data sur Red Hat OpenShift
IBM watsonx.data Édition pour développeurs
Le certificat SSL est facultatif.
Si SSL est activé sur une instance watsonx.data sur Cloud Pak for Data et que le certificat est un certificat autosigné, vous devez entrer le certificat dans la zone Certificat SSL .
Demandez à votre administrateur watsonx.data si SSL est configuré. Vous trouverez le certificat SSL dans la console watsonx.data sous Configurations > Informations de connexion > Détails de l'instance.
IBM watsonx.data sur IBM Cloud
Le certificat SSL est facultatif.
IBM watsonx.data sur Red Hat OpenShift
Le certificat SSL est facultatif.
Si SSL est activé sur une instance watsonx.data sur Cloud Pak for Data et que le certificat est un certificat autosigné, vous devez entrer le certificat dans la zone Certificat SSL .
Demandez à votre administrateur watsonx.data si SSL est configuré. Vous trouverez le certificat SSL dans la console watsonx.data sous Configurations > Informations de connexion > Détails de l'instance.
Détails de la connexion au moteur
Saisir les détails de la connexion du moteur
Versions du moteur prises en charge
Pour watsonx.data sur Cloud Pak for Data version 5.0.3 et ultérieures :
- Presto (Java)
- Presto (C++)
Pour watsonx.data sur Cloud Pak for Data version 5.0.2 et avant :
- Presto (Java)
Pour watsonx.data en tant que service :
- Presto (Java)
- Presto (C++)
Fournissez ces détails de connexion du moteur. Vous trouverez ces informations dans la console web watsonx.data sous Configurations > Informations de connexion > Détails de la connexion au moteur et au service.
Nom d'hôte ou adresse IP du moteur: Le nom d'hôte ou l'adresse IP est la valeur du Hôte interne champ.
ID du moteur: Cette valeur est dans le ID du moteur champ.
Port moteur: Le numéro de port est la valeur dans le Hôte interne champ après les deux points (
:
). Le numéro de port par défaut est8443
.
Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.
- Dans un projet
- Cliquez sur Actifs > Nouvel actif > Connexion à une source de données. Voir Ajout d'une connexion à un projet.
- Dans le catalogue d'actifs de la plateforme
- Cliquez sur Nouvelle connexion. Voir Ajout de connexions de plateforme.
Etape suivante : ajout d'actifs de données à partir de la connexion
Où vous pouvez utiliser cette connexion
Vous pouvez utiliser la connexion watsonx.data Presto dans les espaces de travail et les outils suivants :
Projets
- Data Refinery
- Decision Optimization
Catalogs
- Platform assets catalog
Actions de table
Dans DataStage,, vous pouvez utiliser le connecteur IBM watsonx.data Presto pour intégrer des données dans IBM watsonx.data. Les données sont écrites au format de table Iceberg.
En utilisant les actions de table, vous pouvez spécifier l'opération que vous souhaitez effectuer avec la table Iceberg.
Les actions de tableau suivantes sont prises en charge :
Create
- Le connecteur créera une nouvelle table Iceberg. Lorsque vous utiliserez cette action sur la table existante, vous obtiendrez une erreur.
Console Web watsonx.data
Restriction
- La connexion Presto IBM watsonx.data ne prend pas en charge les types de données
TIME
etTIMESTAMP
lorsque le moteur Presto C++ est utilisé
En savoir plus
- watsonx.data sur Cloud Pak for Data
- watsonx.data en tant que service sur IBM Cloud
- Autonome watsonx.data
Connexions associées
Rubrique parent : Connexions prises en charge