Conexión de Analytics Engine HDFS

Utilice la conexión Analytics Engine HDFS para conectarse a IBM Analytics Engine con la API de WebHDFS.

IBM Analytics Engine es un servicio de Hadoop y Spark en IBM Cloud que proporciona un entorno para desarrollar y desplegar aplicaciones analíticas avanzadas. Los datos se almacenan en IBM Cloud Object Storage (COS). El servicio Analytics Engine inicia clústeres de nodos de cálculo cuando es necesario. Analytics Engine HDFS se llamaba anteriormente "IBM BigInsights on Cloud".

Crear una conexión con IBM Analytics Engine

Para crear el activo de conexión, necesita estos detalles de conexión:

  • URL de WebHDFS: Obligatorio.
  • Nombre de usuario. Obligatorio.
  • Contraseña
  • Certificado SSL si lo necesita el servidor Apache Hive

Seleccione Utilizar inicio como raíz para utilizar el directorio inicial del nombre de usuario para la raíz que examinar.

Para Conectividad privada, para conectarse a una base de datos que no se exterioriza a Internet (por ejemplo, detrás de un cortafuegos), debe configurar una conexión segura.

Propiedades de Hive
Las propiedades Hive son solo para cuando se desea utilizar la conexión Analytics Engine HDFS para datos de destino (grabación). Si especifica propiedades de Hive y escribe un archivo en el HDFS de destino, se establecerá una conexión Hive que crea una tabla Hive para el archivo asociado. Si desea examinar las tablas Hive de Analytics Engine, utilice la conexión Apache Hive.

  • Host de Hive: El nombre de host o dirección IP del servidor Apache Hive.
  • Base de datos de Hive: La base de datos en Apache Hive.
  • Número de puerto Hive: El número de puerto del servidor Apache Hive. El valor predeterminado es 10000.
  • Vía de acceso HTTP de Hive: La vía de acceso del punto final, como por ejemplo gateway/default/hive, cuando el servidor Apache Hive está configurado para la modalidad de transporte HTTP.
  • Usuario de Hive
  • Contraseña de Hive

Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma

En un proyecto Pulse Nuevo activo > Conexión. Consulte Adición de una conexión a un proyecto.


En un catálogo Pulse Añadir al catálogo > Conexión . Consulte [Adición de un activo de conexión a un catálogo] (../catalog/c-add-conn.html).


En un espacio de despliegue Pulse Añadir al espacio > Conexión. Consulte [Adición de activos de datos a un espacio de despliegue] (../analyze-data/ml-space-add-assets.html).


En el catálogo de activos de plataforma Pulse Nueva conexión. Consulte [Adición de conexiones de plataforma] (platform-conn.html).

Paso siguiente: Añadir activos de datos desde la conexión

Dónde puede utilizar esta conexión

Puede utilizar las conexiones Analytics Engine HDFS en los siguientes espacios de trabajo y herramientas:

Proyectos

  • Data Refinery (Watson Studio o Watson Knowledge Catalog)
  • Importación de medatatos (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Catálogos

  • Catálogo de activos de la plataforma
  • Otros catálogos (Watson Knowledge Catalog)

Configuración de Analytics Engine

Guía de aprendizaje de inicio

Tipos de archivo soportado

La conexión Analytics Engine HDFS da soporte a estos tipos de archivo: Avro, CSV, Texto delimitado, Excel, JSON, ORC, Parquet, SAS, SAV, SHP y XML.

Más información

Tema principal: Conexiones soportadas