Connexion Analytics Engine HDFS
Utilisez la connexion Analytics Engine HDFS pour vous connecter à IBM Analytics Engine avec l'API WebHDFS.
IBM Analytics Engine est un service Hadoop et Spark sur IBM Cloud qui fournit un environnement pour développer et déployer des applications d'analyse avancées. Les données sont stockées dans IBM Cloud Object Storage (COS). Le service Analytics
Engine démarre des clusters de noeuds de calcul lorsque c'est nécessaire. Analytics Engine HDFS était auparavant appelé "IBM BigInsights on Cloud".
Créer une connexion à IBM Analytics Engine
Pour créer l'actif de connexion, il vous faut ces informations de connexion :
- URL WebHDFS : Obligatoire.
- Nom d'utilisateur. Obligatoire.
- Mot de passe
- Certificat SSL si requis par le serveur Apache Hive
Sélectionnez Utiliser l'accueil comme racine pour utiliser le répertoire de base du nom d'utilisateur pour la racine pour la navigation.
Pour la connectivité privée, pour vous connecter à une base de données qui n'est pas externalisée sur Internet (par exemple, derrière un pare-feu), vous devez configurer une connexion sécurisée.
Propriétés Hive
Les propriétés Hive ne sont applicables que lorsque vous souhaitez utiliser la connexion Analytics Engine HDFS pour les données cible (écriture). Si vous spécifiez des propriétés Hive et que vous écrivez un
fichier dans le HDFS cible, une connexion Hive est établie qui crée un tableau Hive pour le fichier associé. Si vous souhaitez parcourir les tableaux Hive de Analytics Engine, utilisez Connexion Apache Hive.
- Hôte Hive : Nom d'hôte ou adresse IP du serveur Apache Hive.
- Base de données Hive: Base de données dans Apache Hive.
- Numéro de port Hive : numéro de port du serveur Apache Hive. La valeur par défaut est
10000
. - Chemin HTTP Hive : Chemin du nœud final tel que
gateway/default/hive
lorsque le serveur Apache Hive est configuré pour le mode de transport HTTP. - Utilisateur Hive
- Mot de passe Hive
Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.
Dans un projet Cliquez sur Nouvel actif > Connexion. Voir Ajout d'une connexion à un projet.
Dans un catalogue
Cliquez sur Ajouter au catalogue > Connexion . Voir [ Ajout d'un actif de connexion à un catalogue ] (../catalog/c-add-conn.html).
Dans un espace de déploiement
Cliquez sur Ajouter à l'espace > Connexion . Voir [ Ajout d'actifs de données à un espace de déploiement ] (../analysent-data/ml-space-add-assets.html).
Dans le catalogue des actifs de la plateforme
Cliquez sur Nouvelle connexion . Voir [ Ajout de connexions de plateforme ] (platform-conn.html).
Etape suivante : ajout d'actifs de données à partir de la connexion
- Ajouter des données à partir d'une connexion dans un projet
- Ajouter des données à partir d'une connexion dans un catalogue
Où vous pouvez utiliser cette connexion
Vous pouvez utiliser les connexions Analytics Engine HDFS dans les espaces de travail et outils suivants :
Projets
- Data Refinery (Watson Studio ou Watson Knowledge Catalog)
- Importation de métadonnées (Watson Knowledge Catalog)
- SPSS Modeler (Watson Studio)
Catalogues
- Catalogue d'actifs de la plate-forme
- Autres catalogues (Watson Knowledge Catalog)
Configuration de Analytics Engine
Types de fichier pris en charge
La connexion HDFS Analytics Engine prend en charge les types de fichiers suivants : Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP et XML.
En savoir plus
Rubrique parent : Connexions prises en charge