Connexion Analytics Engine HDFS

Utilisez la connexion Analytics Engine HDFS pour vous connecter à IBM Analytics Engine avec l'API WebHDFS.

IBM Analytics Engine est un service Hadoop et Spark sur IBM Cloud qui fournit un environnement pour développer et déployer des applications d'analyse avancées. Les données sont stockées dans IBM Cloud Object Storage (COS). Le service Analytics Engine démarre des clusters de noeuds de calcul lorsque c'est nécessaire. Analytics Engine HDFS était auparavant appelé "IBM BigInsights on Cloud".

Créer une connexion à IBM Analytics Engine

Pour créer l'actif de connexion, il vous faut ces informations de connexion :

  • URL WebHDFS : Obligatoire.
  • Nom d'utilisateur. Obligatoire.
  • Mot de passe
  • Certificat SSL si requis par le serveur Apache Hive

Sélectionnez Utiliser l'accueil comme racine pour utiliser le répertoire de base du nom d'utilisateur pour la racine pour la navigation.

Pour la connectivité privée, pour vous connecter à une base de données qui n'est pas externalisée sur Internet (par exemple, derrière un pare-feu), vous devez configurer une connexion sécurisée.

Propriétés Hive
Les propriétés Hive ne sont applicables que lorsque vous souhaitez utiliser la connexion Analytics Engine HDFS pour les données cible (écriture). Si vous spécifiez des propriétés Hive et que vous écrivez un fichier dans le HDFS cible, une connexion Hive est établie qui crée un tableau Hive pour le fichier associé. Si vous souhaitez parcourir les tableaux Hive de Analytics Engine, utilisez Connexion Apache Hive.

  • Hôte Hive : Nom d'hôte ou adresse IP du serveur Apache Hive.
  • Base de données Hive: Base de données dans Apache Hive.
  • Numéro de port Hive : numéro de port du serveur Apache Hive. La valeur par défaut est 10000.
  • Chemin HTTP Hive : Chemin du nœud final tel que gateway/default/hive lorsque le serveur Apache Hive est configuré pour le mode de transport HTTP.
  • Utilisateur Hive
  • Mot de passe Hive

Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.

Dans un projet Cliquez sur Nouvel actif > Connexion. Voir Ajout d'une connexion à un projet.


Dans un catalogue Cliquez sur Ajouter au catalogue > Connexion . Voir [ Ajout d'un actif de connexion à un catalogue ] (../catalog/c-add-conn.html).


Dans un espace de déploiement Cliquez sur Ajouter à l'espace > Connexion . Voir [ Ajout d'actifs de données à un espace de déploiement ] (../analysent-data/ml-space-add-assets.html).


Dans le catalogue des actifs de la plateforme Cliquez sur Nouvelle connexion . Voir [ Ajout de connexions de plateforme ] (platform-conn.html).

Etape suivante : ajout d'actifs de données à partir de la connexion

Où vous pouvez utiliser cette connexion

Vous pouvez utiliser les connexions Analytics Engine HDFS dans les espaces de travail et outils suivants :

Projets

  • Data Refinery (Watson Studio ou Watson Knowledge Catalog)
  • Importation de métadonnées (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Catalogues

  • Catalogue d'actifs de la plate-forme
  • Autres catalogues (Watson Knowledge Catalog)

Configuration de Analytics Engine

Tutoriel d'initiation

Types de fichier pris en charge

La connexion HDFS Analytics Engine prend en charge les types de fichiers suivants : Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP et XML.

En savoir plus

Rubrique parent : Connexions prises en charge