Connessione Apache Hive
Per accedere ai dati in Apache Hive, creare un asset di connessione per esso.
Apache Hive è un progetto software data warehouse che fornisce query e analisi dei dati ed è costruito sopra Apache Hadoop.
Versioni supportate
Apache Hive 1.0.x, 1.1.x, 1.2.x. 2.0.x, 2.1.x, 3.0.x, 3.1.x.
Crea una connessione a Apache Hive
Per creare l'asset di connessione, sono necessari i seguenti dettagli di connessione:
- Nome del database (facoltativo): se non si immette un nome di database, è necessario immettere il nome del catalogo, il nome dello schema e il nome della tabella nelle proprietà per le query SQL.
- Nome host o Indirizzo IP
- Numero porta
- Percorso HTTP (facoltativo): il percorso dell'endpoint come il gateway, il valore predefinito o hive se il server è configurato per la modalità di trasporto HTTP.
- Nome utente e password
- Se richiesto dal server di database, il certificato SSL
Per la connettività privata, per stabilire una connessione a un database che non sia esternalizzato a internet (ad esempio, dietro un firewall), devi configurare una connessione sicura.
Scegliere il metodo per la creazione di una connessione in base alla posizione in cui ci si trova nella piattaforma
- In un progetto
- Fare clic su Asset> Nuovo asset> Connetti a una origine dati. Consultare Aggiunta di una connessione a un progetto.
- In un catalogo
- Fare clic su Aggiungi al catalogo> Connessione. Consultare Aggiunta di un asset di connessione a un catalogo.
- In uno spazio di distribuzione
- Fare clic su Importa asset> Accesso dati> Connessione. Consultare Aggiunta di asset di dati a uno spazio di distribuzione.
- Nel Platform assets catalog
- Fare clic su Nuova connessione. Consultare Aggiunta di connessioni di piattaforma.
Passo successivo: aggiungere gli asset di dati dalla connessione
Dove è possibile utilizzare questa connessione
È possibile utilizzare la connessione Apache Hive nei seguenti spazi di lavoro e strumenti:
Progetti
- Regole di qualità dei dati (IBM Knowledge Catalog)
- Data Refinerywatsonx.ai Studio o IBM Knowledge Catalog)
- DataStage (servizioDataStage ). Per ulteriori informazioni, consultare Connessione a un'origine dati in DataStage.
- Decision Optimizationwatsonx.ai Studio e watsonx.ai Runtime)
- Arricchimento metadati (IBM Knowledge Catalog)
- Metadata import (IBM Knowledge Catalog)
- SPSS Modelerwatsonx.ai Studio)
Cataloghi
Platform assets catalog
Altri cataloghi (IBM Knowledge Catalog)
- Servizio diData Virtualization
- È possibile collegarsi a questa origine dati da Data Virtualization.
Configurazione Apache Hive
Limitazione
È possibile utilizzare questa connessione solo per i dati di origine. Non è possibile scrivere sui dati o esportare i dati con questa connessione.
Esecuzione di istruzioni SQL
Per assicurarsi che le istruzioni SQL vengano eseguite correttamente, consultare le Operazioni SQL nella documentazione di Apache Hive per la sintassi corretta.
Ulteriori informazioni
Argomento principale: Connessioni supportate