Pour accéder à vos données dans Amazon S3, créez un actif de connexion pour elles.
Amazon S3 (Amazon Simple Storage Service) est un service offert par Amazon Web Services (AWS) qui fournit le stockage d'objets via une interface de service Web.
Pour les autres types de connexions S3-compliant , vous pouvez utiliser la connexion S3 générique.
Créer une connexion à Amazon S3
Pour créer l'actif de connexion, il vous faut ces informations de connexion :
- Compartiment: nom du compartiment qui contient les fichiers. Si vos données d'identification AWS sont autorisées à répertorier les compartiments et à accéder à tous les compartiments, il vous suffit de les fournir. Si vos données d'identification n'ont pas le privilège de répertorier les compartiments et ne peuvent accéder qu'à un compartiment particulier, vous devez spécifier le compartiment.
- URL de noeud final: à utiliser pour une instance AWS GovCloud . Incluez le code de région. Par exemple,
https://s3.<region-code>.amazonaws.com
. Pour obtenir la liste des codes régionaux, voir les points de terminaison des servicesAWS. - Région: région Amazon Web Services (AWS). Si vous spécifiez une URL de noeud final qui n'est pas pour la région par défaut AWS (us-west-2), vous devez également entrer une valeur pour Région.
Sélectionnez Serveur proxy pour accéder à la source de données Amazon S3 via un serveur proxy. En fonction de sa configuration, un serveur proxy peut fournir un équilibrage de charge, une sécurité et une confidentialité accrues. Les paramètres du serveur proxy sont indépendants des données d'authentification et de la sélection des données d'identification personnelles ou partagées.
- Hôte du proxy: URL du proxy. Par exemple,
https://proxy.example.com
. - Numéro de port du proxy: numéro de port utilisé pour la connexion au serveur proxy. Par exemple,
8080
ou8443
. - Les zones Nom d'utilisateur du proxy et Mot de passe du proxy sont facultatives.
Données d'identification
La combinaison de la clé d'accès et de la clé secrète correspond aux données d'identification minimales.
Si le propriétaire du compte Amazon S3 a configuré des données d'identification temporaires ou un rôle ARN (nom de ressource Amazon), entrez les valeurs fournies par le propriétaire du compte Amazon S3 pour la combinaison d'authentification applicable :
- Clé d'accès, Clé secrète et Jeton de session
- Clé d'accès, Clé secrète, Rôle ARN, Nom de session de rôle et la durée en secondes facultative
- Clé d'accès, Clé secrète, Rôle ARN, Nom de session de rôle, ID externe et la durée en secondes facultative
Pour obtenir les instructions de configuration du propriétaire du compte Amazon S3, voir Configuration des données d'identification temporaires ou un rôle ARN pour Amazon S3.
Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.
- Dans un projet
- Cliquez sur Actifs > Nouvel actif > Connexion à une source de données. Voir Ajout d'une connexion à un projet.
- Dans un catalogue
- Cliquez sur Ajouter au catalogue > Connexion. Voir Ajout d'un actif de connexion à un catalogue.
- Dans un espace de déploiement
- Cliquez sur Importer les actifs > Accès aux données > Connexion. Voir Ajout d'actifs de données à un espace de déploiement.
- Dans le catalogue d'actifs de la plateforme
- Cliquez sur Nouvelle connexion. Voir Ajout de connexions de plateforme.
Etape suivante : ajout d'actifs de données à partir de la connexion
Où vous pouvez utiliser cette connexion
Vous pouvez utiliser les connexions Amazon S3 dans les espaces de travail et outils suivants :
Projets
- Data Refinerywatsonx.ai Studio ou IBM Knowledge Catalog)
- DataStage (serviceDataStage ). Voir Connexion à une source de données dans DataStage.
- Decision Optimizationwatsonx.ai Studio et watsonx.ai Runtime)
- Enrichissement de métadonnées (IBM Knowledge Catalog)
- Metadata import (IBM Knowledge Catalog)
- Carnets de noteswatsonx.ai Studio). Cliquez sur Lire les données dans le panneau Fragments de code pour obtenir les données d'identification de connexion et charger les données dans une structure de données. Voir Chargement de données à partir de connexions de source de données.
- SPSS Modelerwatsonx.ai Studio)
Catalogs
Platform assets catalog
Autres catalogues (IBM Knowledge Catalog)
- Service deData Virtualization
- Vous pouvez vous connecter à cette source de données depuis Data Virtualization. Cette connexion nécessite une attention particulière dans le cadre de la Data Virtualization. Voir Connexion à Amazon S3 dans Data Virtualization.
Configuration d'Amazon S3
Pour les étapes de configuration, voir le document Amazon Simple Storage Service User Guide.
Restriction
Les dossiers ne peuvent pas être nommés avec le symbole de barre oblique (/
) car le symbole de barre oblique est un délimiteur pour la structure de fichier.
Types de fichier pris en charge
La connexion Amazon S3 prend en charge les types de fichiers suivants : Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP et XML.
Formats de table
En plus du fichier à plat, la connexion Amazon S3 prend en charge les formats de table Data Lake suivants: Delta Lake et Iceberg.
En savoir plus
Connexion associée: Connexion S3 générique
Rubrique parent : Connexions prises en charge