Inicio rápido: Virtualizar datos

Puede utilizar Watson Query para crear una tabla virtual para segmentar o combinar datos de una o más tablas. Watson Query conecta varios orígenes de datos en una única colección de autoequilibrio de orígenes de datos o bases de datos. Lea acerca de la herramienta de consulta de Watson y vea un vídeo y siga una guía de aprendizaje adecuada para los usuarios con ciertos conocimientos sobre virtualización de datos, pero no requiera codificación.

Servicio necesario Watson Query

El flujo de trabajo básico incluye estas tareas:

  1. Suministre el servicio y cree sus credenciales de servicio.
  2. Cree bases de datos en varios orígenes de datos y recopile las credenciales y los detalles de la base de datos.
  3. Añada conexiones a sus orígenes de datos.
  4. Cree objetos virtuales combinando datos de todos los orígenes de datos.
  5. Gestione el acceso a los objetos virtuales.
  6. Añada datos virtualizados a sus catálogos y proyectos.
  7. Supervise la instancia de servicio con la consola de gestión de datos de IBM Db2.

Más información acerca de Watson Query

Con el servicio de consulta de Watson, puede conectarse a varios orígenes de datos, crear y gobernar activos virtuales y consumir los datos virtualizados.

Más información sobre Watson Query

Vea un vídeo sobre Watson Query

Ver vídeo Vea este vídeo para ver cómo virtualizar los datos a un proyecto o catálogo utilizando el servicio Watson Query.

Este vídeo proporciona un método visual como una alternativa a seguir los pasos escritos incluidos en esta documentación.

Pruebe una guía de aprendizaje para virtualizar datos

En esta guía de aprendizaje, hará lo siguiente:

  • Cree un proyecto.
  • Suministre los servicios de Watson Query y Db2 on Cloud.
  • Cargue datos en su instancia de servicio de Db2 on Cloud.
  • Añada conexiones a un origen de datos.
  • Cree una tabla virtualizada desde un único origen de datos.
  • Publique los datos virtualizados en un catálogo o proyecto.

Le llevará aproximadamente 30 minutos el completar esta guía de aprendizaje.

Paso 1: Crear un proyecto

{: #step1}Necesita un proyecto para almacenar los datos virtualizados.

  1. Si tiene un proyecto existente, ábralo. Si no tiene un proyecto existente, pulse Crear un proyecto en la página de inicio o pulse Nuevo proyecto en la página Proyectos.
  2. Seleccione Crear un proyecto vacío.
  3. En la pantalla Crear un proyecto, añada un nombre y una descripción opcional para el proyecto.
  4. Elija una instancia de servicio de almacenamiento de objetos existente o cree una nueva.
  5. Pulse Crear.

Para obtener más información o ver un vídeo, consulte Creación de un proyecto.

Paso 2: Suministrar los servicios

{: #step2}Esta guía de aprendizaje requiere el servicio Watson Query así como un servicio de Db2.

  1. En el menú de navegación, pulse Servicios > Instancias de servicio.
  2. Si tiene un servicio Watson Query listado, no es necesario suministrar otra instancia. De lo contrario, siga estos pasos:
    1. Pulse Añadir servicio.
    2. Seleccione Watson Query.
    3. Seleccione el plan Lite para Watson Query.
    4. Pulse Crear.
  3. Si tiene un servicio Db2 on Cloud o Db2 Warehouse on Cloud listado, no es necesario suministrar otra instancia. De lo contrario, siga estos pasos:
    1. Pulse Añadir servicio.
    2. Seleccione Db2.
    3. Seleccione el plan Lite para Db2 on Cloud.
    4. Pulse Crear.
  4. Verifique que los servicios se suministran en la página Instancias de servicio.
  5. Acceda al menú de instancia de Db2 on Cloud (o Db2 Warehouse on Cloud) y seleccione Gestionar en IBM Cloud. Esto iniciará la página de la instancia de servicio en IBM Cloud.
  6. Pulse Credenciales de servicio.
  7. Si no aparece listada ninguna credencial, siga estos pasos:
    1. Pulse Nueva credencial.
    2. Pulse Añadir.
  8. Expanda las credenciales de servicio y cópielas en el portapapeles. Necesitará estas credenciales más adelante para configurar una conexión, por lo que puede que sea conveniente guardar las credenciales en un archivo de texto.

Para obtener más información, consulte Db2 on Cloud Pak for Data as a Service y Watson Query on Cloud Pak for Data as a Service.

Paso 3: Cargar datos en Db2 on Cloud

{: #step3} Los conjuntos de datos que utilizará en esta guía de aprendizaje están disponibles en la Galería. Debe cargar esos conjuntos de datos en Db2 on Cloud.

  1. En la página de la instancia de servicio de Db2 on Cloud (o Db2 Warehouse on Cloud) en IBM Cloud, seleccione el panel Gestionar.
  2. Pulse Ir a la interfaz de usuario. Se muestra la consola de Db2 on Cloud.
  3. Seleccione el panel Datos.
  4. Acceda a estos dos conjuntos de datos en la Galería y descárguelos en la máquina local:
  5. Arrastre el archivo customers.csv desde la máquina local al panel Cargar datos de la consola de Db2 on Cloud y pulse Siguiente.
  6. Seleccione un esquema.
  7. Pulse Nueva tabla +, escriba customers para el nombre de tabla y pulse Crear.
  8. Pulse Siguiente para continuar.
  9. Revise los datos que se van a cargar y pulse Siguiente.
  10. Revise el resumen y pulse Iniciar carga.
  11. Cuando la carga sea satisfactoria, pulse Cargar más datos.
  12. Repita los pasos 5-10 para cargar el conjunto de datos sales.csv en el mismo esquema con el nombre de tabla sales.

Paso 4: Añadir una conexión a la instancia de Db2 on Cloud

{: #step4}Para poder virtualizar los datos, es necesario crear una conexión con el origen de datos.

  1. Vuelva a Cloud Pak for Data as a Service.
  2. En el menú de navegación principal, seleccione Datos > Virtualización de datos. Se visualiza la lista de Orígenes de datos configurados.
  3. Pulse Añadir conexión > Nueva conexión.
  4. Seleccione Db2 on Cloud (o Db2 Warehouse on Cloud).
  5. Pulse Seleccionar.
  6. Complete los detalles de la conexión en función de las credenciales que ha copiado para su instancia en IBM Cloud.
  7. Pulse Probar.
  8. Pulse Crear.

Para obtener más información, consulte Adición y conexión a orígenes de datos en Watson Query.

Paso 5: Añadir tablas a los datos virtualizados

{: #step5}Con la conexión definida, puede virtualizar datos procedentes de ese origen de datos.

  1. En el menú Orígenes de datos, seleccione Virtualización > Virtualizar y espere a que se carguen las tablas disponibles.
  2. Localice y seleccione las tablas clientes y ventas de la lista y pulse Añadir al carro.
  3. Pulse Ver carro.
  4. Seleccione Datos virtualizados para añadir estas dos tablas a la lista de datos virtualizados.
  5. Pulse Virtualizar.
  6. Pulse Continuar.
  7. Pulse Ver datos virtualizados.

Para obtener más información, consulte Creación de objetos virtuales en Watson Query.

Paso 6: Publicar datos virtualizados en un catálogo y proyecto

{: #step6}A continuación, una dos tablas para crear un activo virtualizado y publicarlo en un catálogo y proyecto.

  1. En la pantalla Datos virtualizados, seleccione las tablas clientes y ventas de la lista y pulse Unir.
  2. Para cada tabla, busque salesrep.
  3. Conecte las columnas SALESREP_ID de las dos tablas.
  4. Pulse Siguiente.
  5. Revise la tabla unida y pulse Siguiente.
  6. Para el nombre de la vista, escriba joined_customers_sales_table.
  7. Seleccione un servidor en la lista.
  8. Marque la opción Publicar en catálogo y seleccione un catálogo.
  9. Pulse Crear vista.
  10. Cuando se completa el proceso, puede ver el proyecto o el catálogo para obtener una vista previa de los datos virtualizados. Necesitará una clave de API de IBM Cloud para ver los datos del proyecto o catálogo. Consulte Creación de una clave de API de IBM Cloud.

Para obtener más información, consulte Gobierno de datos virtuales en Watson Query.

Próximos pasos

Ahora sus datos virtuales están listos para ser utilizados. Por ejemplo, puede realizar cualquiera de estas tareas:

Recursos

adicionales

Tema principal: Cómo empezar con la preparación de datos