Conexión de Apache Hive

Para acceder a los datos en Apache Hive, cree un activo de conexión para el mismo.

Apache Hive es un proyecto de software de depósito de datos que proporciona consulta y análisis de datos y se basa en Apache Hadoop.

Versiones soportadas

  • Amazon Elastic MapReduce 2.1.4+
  • Apache Hadoop Hive
  • Cloudera CDH3 actualización 4 +
  • Hortonworks 1.3+
  • MapR 1.2+
  • Pivotal HD Enterprise 2.0.1

Crear una conexión con Apache Hive

Para crear el activo de conexión, necesita estos detalles de conexión:

  • Nombre de base de datos
  • Nombre de host o dirección IP
  • Número de puerto
  • Vía de acceso HTTP (Opcional): La vía de acceso del punto final, como por ejemplo la pasarela, el valor predeterminado o hive si el servidor está configurado para la modalidad de transporte HTTP.
  • Nombre de usuario y contraseña
  • Certificado SSL (si lo necesita el servidor de base de datos)

Para Conectividad privada, para conectarse a una base de datos que no se exterioriza a Internet (por ejemplo, detrás de un cortafuegos), debe configurar una conexión segura.

Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma

En un proyecto Pulse Añadir al proyecto > Conexión. Consulte Adición de una conexión a un proyecto.


En un catálogo Pulse Añadir al catálogo > Conexión . Consulte [Adición de un activo de conexión a un catálogo] (../catalog/c-add-conn.html).


En un espacio de despliegue Pulse Añadir al espacio > Conexión. Consulte [Adición de datos a un espacio de despliegue] (../analyze-data/deploy-data-sources.html#add).


En el catálogo de activos de plataforma Pulse Nueva conexión. Consulte [Adición de conexiones de plataforma] (platform-conn.html).

Paso siguiente: Añadir activos de datos desde la conexión

Dónde puede utilizar esta conexión

Puede utilizar la conexión Apache Hive en los siguientes espacios de trabajo y herramientas:

Proyectos

  • Data Refinery (Watson Studio o Watson Knowledge Catalog)
  • DataStage (servicio de DataStage)
  • Importación de medatatos (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Catálogos

  • Catálogo de activos de la plataforma
  • Otros catálogos (Watson Knowledge Catalog)

Servicio Watson Query Puede conectarse a este origen de datos desde Watson Query.

Configuración de Apache Hive

Instalación y configuración de Apache Hive

Restricciones

  • Para Data Refinery, solo puede utilizar esta conexión como origen. No puede utilizar esta conexión como conexión de destino ni como activo de datos conectado de destino.
  • Para SPSS Modeler, solo puede utilizar esta conexión para importar datos. No puede exportar datos a esta conexión o a un activo de datos conectado a Apache Hive.

Ejecución de sentencias SQL

Para asegurarse de que las sentencias SQL se ejecutan correctamente, consulte la documentación de Apache Hive para ver la sintaxis correcta.

Más información

Documentación de Apache Hive

Tema principal: Conexiones soportadas