Pour accéder à vos données à partir d'un service de stockage compatible avec l'API S3 d'Amazon, créez un actif de connexion pour celui-ci.
Création d'une connexion Generic S3
Pour créer l'actif de connexion, il vous faut ces informations de connexion :
- URL du nœud final : URL de nœud final permettant d'accéder à S3
- Compartiment(facultatif): nom du compartiment qui contient les fichiers
- Région (facultatif) : région S3. Indiquez une région correspondant au nœud final régional.
- Clé d'accès : la clé d'accès (nom d'utilisateur) qui autorise l'accès à S3
- Clé secrète : mot de passe associé à l'ID de clé d'accès qui autorise l'accès à S3
- Le certificat SSL de l'hôte sécurisé. Le certificat est requis lorsque le certificat hôte n'est pas signé par une autorité de certification connue.
- Désactiver le codage par blocs : sélectionnez si le stockage ne prend pas en charge le codage par blocs.
- Activer l'accès au compartiment global : Consultez la documentation de votre source de données S3 pour savoir si vous souhaitez sélectionner cette propriété.
- Activer l'accès par style de chemin: consultez la documentation de votre source de données S3 pour savoir si cette propriété doit être sélectionnée.
Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.
- Dans un projet
- Cliquez sur Actifs > Nouvel actif > Connexion à une source de données. Voir Ajout d'une connexion à un projet.
- Dans un catalogue
- Cliquez sur Ajouter au catalogue > Connexion. Voir Ajout d'un actif de connexion à un catalogue.
- Dans un espace de déploiement
- Cliquez sur Importer les actifs > Accès aux données > Connexion. Voir Ajout d'actifs de données à un espace de déploiement.
- Dans le catalogue d'actifs de la plateforme
- Cliquez sur Nouvelle connexion. Voir Ajout de connexions de plateforme.
Etape suivante : ajout d'actifs de données à partir de la connexion
Où vous pouvez utiliser cette connexion
Vous pouvez utiliser la connexion Generic S3 dans les espaces de travail et les outils suivants :
Projets
- Règles de qualité des données ( IBM Knowledge Catalog ). Voir Sources de données prises en charge pour la curation et la qualité des données.
- Data Refinerywatsonx.ai Studio ou IBM Knowledge Catalog)
- DataStage (serviceDataStage ). Voir Connexion à une source de données dans DataStage.
- Decision Optimizationwatsonx.ai Studio et watsonx.ai Runtime)
- Enrichissement des métadonnées ( IBM Knowledge Catalog ) Voir Sources de données soutenues pour la curation et la qualité des données.
- Metadata import ( IBM Knowledge Catalog ) Voir les sources de données prises en charge pour la curation et la qualité des données.
Catalogs
Platform assets catalog
Autres cataloguesIBM Knowledge Catalog)
Remarque :La prévisualisation, le profil et le masquage ne sont pas certifiés pour cette connexion dans IBM Knowledge Catalog
Configuration de la connexion S3 générique
Pour plus d'informations sur la configuration, consultez la documentation de la source de données compatible S3 à laquelle vous vous connectez.
Types de fichier pris en charge
La connexion Generic S3 prend en charge les types de fichiers suivants : Avro, CSV, texte délimité, Excel, JSON, ORC, Parquet, SAS, SAV, SHP et XML.
Formats de table
Outre les fichiers plats, la connexion générique S3 prend en charge les formats de table Data Lake suivants : Delta Lake et Iceberg.
Connexion associée: Amazon S3
Rubrique parent : Connexions prises en charge