Pour accéder à vos données dans Apache Hive, créez un actif de connexion pour celui-ci.
Apache Hive est un projet de logiciel d'entrepôt de données qui fournit des requêtes et des analyses de données et s'appuie sur Apache Hadoop.
Versions prises en charge
Apache Hive 1.0.x, 1.1.x, 1.2.x. 2.0.x, 2.1.x, 3.0.x, 3.1.x.
Créez une connexion à Apache Hive
Pour créer l'actif de connexion, vous avez besoin des détails de connexion suivants:
- Nom de la base de données (facultatif) : si vous n'entrez pas de nom de base de données, vous devez entrer le nom du catalogue, le nom du schéma et le nom de la table dans les propriétés des requêtes SQL.
- Nom d'hôte ou adresse IP
- Numéro de port
- Chemin HTTP (facultatif) : Le chemin du nœud final tel que la passerelle, la valeur par défaut ou Hive si le serveur est configuré pour le mode de transport HTTP.
- Nom d'utilisateur et mot de passe
- Si le serveur de base de données l'exige, le certificat SSL
Pour la connectivité privée, pour vous connecter à une base de données qui n'est pas externalisée sur Internet (par exemple, derrière un pare-feu), vous devez configurer une connexion sécurisée.
Choisissez la méthode de création d'une connexion basée sur l'emplacement dans la plateforme.
- Dans un projet
- Cliquez sur Actifs > Nouvel actif > Connexion à une source de données. Voir Ajout d'une connexion à un projet.
- Dans un catalogue
- Cliquez sur Ajouter au catalogue > Connexion. Voir Ajout d'un actif de connexion à un catalogue.
- Dans un espace de déploiement
- Cliquez sur Importer les actifs > Accès aux données > Connexion. Voir Ajout d'actifs de données à un espace de déploiement.
- Dans le catalogue d'actifs de la plateforme
- Cliquez sur Nouvelle connexion. Voir Ajout de connexions de plateforme.
Etape suivante : ajout d'actifs de données à partir de la connexion
Où vous pouvez utiliser cette connexion
Vous pouvez utiliser la connexion Apache Hive dans les espaces de travail et les outils suivants :
Projets
- Règles de qualité des données (IBM Knowledge Catalog)
- Data Refinerywatsonx.ai Studio ou IBM Knowledge Catalog)
- DataStage (serviceDataStage ). Pour plus d'informations, voir Connexion à une source de données dans DataStage.
- Decision Optimizationwatsonx.ai Studio et watsonx.ai Runtime)
- Enrichissement de métadonnées (IBM Knowledge Catalog)
- Metadata import (IBM Knowledge Catalog)
- SPSS Modelerwatsonx.ai Studio)
Catalogs
Platform assets catalog
Autres catalogues (IBM Knowledge Catalog)
- Service deData Virtualization
- Vous pouvez vous connecter à cette source de données depuis Data Virtualization.
Configuration d'Apache Hive
Restriction
Vous pouvez utiliser cette connexion uniquement pour les données source. Vous ne pouvez pas écrire sur des données ou exporter des données à l'aide de cette connexion.
Exécution d'instructions SQL
Pour vous assurer que vos instructions SQL s'exécutent correctement, reportez-vous aux opérations SQL dans la documentation Apache Hive pour connaître la syntaxe correcte.
En savoir plus
Rubrique parent : Connexions prises en charge