Para acceder a los datos en Apache Hive, cree un activo de conexión para el mismo.
Apache Hive es un proyecto de software de depósito de datos que proporciona consulta y análisis de datos y se basa en Apache Hadoop.
Versiones soportadas
Apache Hive 1.0.x, 1.1.x, 1.2.x. 2.0.x, 2.1.x, 3.0.x, 3.1.x.
Crear una conexión con Apache Hive
Para crear el activo de conexión, necesita los siguientes detalles de conexión:
- Nombre de la base de datos (opcional): si no ingresa un nombre de base de datos, debe ingresar el nombre del catálogo, el nombre del esquema y el nombre de la tabla en las propiedades para consultas SQL.
- Nombre de host o dirección IP
- Número de puerto
- Vía de acceso HTTP (Opcional): La vía de acceso del punto final, como por ejemplo la pasarela, el valor predeterminado o hive si el servidor está configurado para la modalidad de transporte HTTP.
- Nombre de usuario y contraseña
- Si lo requiere el servidor de bases de datos, el certificado SSL
Para Conectividad privada, para conectarse a una base de datos que no se exterioriza a Internet (por ejemplo, detrás de un cortafuegos), debe configurar una conexión segura.
Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma
- En un proyecto
- Pulse Activos > Nuevo activo > Conectar a un origen de datos. Consulte Adición de una conexión a un proyecto.
- En un catálogo
- Pulse Añadir al catálogo > Conexión. Consulte Adición de un activo de conexión a un catálogo.
- En un espacio de despliegue
- Pulse Importar activos > Acceso a datos > Conexión. Consulte Adición de activos de datos a un espacio de despliegue.
- En el catálogo de activos de la plataforma
- Pulse Nueva conexión. Consulte Adición de conexiones de plataforma.
Paso siguiente: Añadir activos de datos desde la conexión
Dónde puede utilizar esta conexión
Puede utilizar la conexión Apache Hive en los siguientes espacios de trabajo y herramientas:
Proyectos
- Reglas de calidad de datos (IBM Knowledge Catalog)
- Data Refinerywatsonx.ai Studio o IBM Knowledge Catalog)
- DataStage (servicioDataStage ). Para obtener más información, consulte Conexión a un origen de datos en DataStage.
- 'Decision Optimization (watsonx.ai Studio y ' watsonx.ai Runtime)
- Enriquecimiento de metadatos (IBM Knowledge Catalog)
- Metadata import (IBM Knowledge Catalog)
- SPSS Modelerwatsonx.ai Studio)
Catálogos
Platform assets catalog
Otros catálogos (IBM Knowledge Catalog)
- Servicio deData Virtualization
- Puede conectarse a este origen de datos desde Data Virtualization.
Configuración de Apache Hive
Restricción
Solo puede utilizar esta conexión para datos de origen. No puede grabar datos ni exportar datos con esta conexión.
Ejecución de sentencias SQL
Para asegurarse de que sus sentencias SQL se ejecutan correctamente, consulte las Operaciones SQL en la documentación de Apache Hive para conocer la sintaxis correcta.
Más información
Tema principal: Conexiones soportadas