0 / 0
Volver a la versión inglesa de la documentación
Guía de aprendizaje de integración de datos: Integrar datos

Guía de aprendizaje de integración de datos: Integrar datos

Siga esta guía de aprendizaje para transformar datos almacenados en tres orígenes de datos externos con el caso de uso de integración de datos de la prueba de entramado de datos. Su objetivo es utilizar DataStage para transformar los datos y luego distribuir los datos transformados a un único archivo de salida. Si ha completado la guía de aprendizaje Virtualizar datos externos , ha realizado muchas de las mismas tareas utilizando Watson Query que esta guía de aprendizaje realiza utilizando DataStage.

Inicio rápido: Si todavía no ha creado el proyecto de ejemplo para esta guía de aprendizaje, acceda al Proyecto de ejemplo de integración de datos en el concentrador de recursos.

La historia de la guía de aprendizaje es que Golden Bank necesita cumplir con un nuevo reglamento por el que no puede realizar préstamos a los solicitantes de préstamos que no estén cualificados. Como ingeniero de datos en Golden Bank, actualmente utiliza DataStage para agregar sus datos de solicitudes de hipotecas anónimas a la información de identificación personal de los solicitantes de hipotecas. Sus prestamistas utilizan esta información para ayudarles a decidir si deben aprobar o denegar solicitudes de hipoteca. Su liderazgo agregó algunos analistas de riesgo que calculan diariamente qué tasa de interés recomiendan ofrecer a los prestatarios en cada rango de puntuación de crédito. Es necesario integrar esta información en la hoja de cálculo que comparte con los prestamistas. La hoja de cálculo incluye información de puntuación de crédito para cada solicitante, la deuda total del solicitante y una tabla de búsqueda de tipos de interés. Por último, cargue los datos en un archivo CSV de salida de destino.

La siguiente imagen animada proporciona una vista previa rápida de lo que logrará al final de este tutorial. Utilizará DataStage para unirse a los datos del solicitante y de la solicitud, filtrar por estado, unirse a las puntuaciones de crédito del solicitante, calcular la deuda total, buscar el tipo de interés de la hipoteca para ofrecer en función de los rangos de puntuación de crédito y generar el resultado en un archivo CSV. Pulse la imagen para ver una imagen más grande.

Imagen animada

Vista previa de la guía de aprendizaje

En esta guía de aprendizaje, realizará estas tareas:

Ver vídeo Vea este vídeo para obtener una vista preliminar de los pasos de esta guía de aprendizaje. Puede haber pequeñas diferencias en la interfaz de usuario que se muestra en el vídeo. El vídeo está pensado para ser un compañero del tutorial escrito.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.





Sugerencias para completar esta guía de aprendizaje

Utilizar la imagen en imagen de vídeo

Sugerencia: Inicie el vídeo y, a continuación, a medida que se desplaza por el tutorial, el vídeo se desplaza al modo de imagen en imagen. Cierre la tabla de contenido de vídeo para obtener la mejor experiencia con la imagen en imagen. Puede utilizar el modo de imagen en imagen para poder seguir el vídeo mientras completa las tareas de este tutorial. Pulse las indicaciones de fecha y hora para cada tarea a seguir.

La siguiente imagen animada muestra cómo utilizar las características de imagen en imagen y tabla de contenido de vídeo:

Cómo utilizar la imagen en la imagen y los capítulos

Obtener ayuda en la comunidad

Si necesita ayuda con esta guía de aprendizaje, puede formular una pregunta o encontrar una respuesta en el foro de discusión de la comunidad deCloud Pak for Data.

Configurar las ventanas del navegador

Para obtener la experiencia óptima al completar esta guía de aprendizaje, abra Cloud Pak for Data en una ventana de navegador y mantenga abierta esta página de la guía de aprendizaje en otra ventana de navegador para conmutar fácilmente entre las dos aplicaciones. Considere la posibilidad de organizar las dos ventanas del navegador una al lado de la otra para que sea más fácil de seguir.

Guía de aprendizaje en paralelo e interfaz de usuario

Sugerencia: Si encuentra una visita guiada al completar esta guía de aprendizaje en la interfaz de usuario, pulse Quizás más tarde.



Configurar los requisitos previos

Requisitos previos

Registro en Cloud Pak for Data as a Service

Debe registrarse en Cloud Pak for Data as a Service y suministrar los servicios necesarios para el caso de uso de integración de datos.

  • Si tiene una cuenta de Cloud Pak for Data as a Service existente, puede empezar con esta guía de aprendizaje. Si tiene una cuenta de plan Lite, sólo un usuario por cuenta puede ejecutar esta guía de aprendizaje.
  • Si todavía no tiene una cuenta de Cloud Pak for Data as a Service , regístrese para una prueba de entramado de datos.

Icono Vídeo Vea el siguiente vídeo para obtener más información sobre el entramado de datos en Cloud Pak for Data.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Verificar los servicios suministrados necesarios

vídeo tutorial de vista previa Para obtener una vista preliminar de esta tarea, vea el vídeo que empieza en 01:09.

Importante: El servicio DataStage sólo está disponible en las regiones de Dallas y Frankfurt. Si es necesario, cambie a la región de Dallas o Frankfurt antes de continuar.

Siga estos pasos para verificar o suministrar los servicios necesarios:

  1. En Cloud Pak for Data, verifique que está en la región de Dallas o Frankfurt. Si no es así, pulse el desplegable de región y, a continuación, seleccione Dallas o Frankfurt.
    Cambiar región

  2. En el Cloud Pak for Data menú de navegación Menú de navegación, elija Servicios > Instancias de servicio.

  3. Utilice la lista desplegable Producto para determinar si existe una instancia de servicio de DataStage .

  4. Si necesita crear una instancia de servicio de DataStage, pulse Añadir servicio.

  5. Seleccione DataStage.

    1. Para la región, seleccione Dallas o Frankfurt.

    2. Seleccione el plan Lite.

    3. Pulse Crear.

  6. Repita estos pasos para verificar o suministrar los siguientes servicios adicionales:

    • IBM Knowledge Catalog
    • Cloud Object Storage

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra las instancias de servicio suministradas:

Servicio de suministro

Crear el proyecto de ejemplo

vídeo tutorial de vista previa Para obtener una vista preliminar de esta tarea, vea el vídeo que empieza en 01:44.

Si ya tiene el proyecto de ejemplo para esta guía de aprendizaje, vaya a la Tarea 1. De lo contrario, siga estos pasos:

  1. Acceda al Proyecto de ejemplo de integración de datos en el concentrador de recursos.

  2. Pulse Crear proyecto.

  3. Si se le solicita que asocie el proyecto a una instancia de Cloud Object Storage, seleccione una instancia de Cloud Object Storage de la lista.

  4. Pulse Crear.

  5. Espere a que finalice la importación del proyecto y, a continuación, pulse Ver proyecto nuevo para verificar que el proyecto y los activos se han creado correctamente.

  6. Pulse el separador Activos para ver las conexiones y el flujo de DataStage .

Nota: Es posible que vea una visita guiada que muestra las guías de aprendizaje que se incluyen con este caso de uso. Los enlaces de la visita guiada abrirán estas instrucciones del tutorial.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el separador Activos en el proyecto de ejemplo. Ahora está preparado para iniciar la guía de aprendizaje.

Proyecto de ejemplo




Tarea 1: Ejecutar un flujo de DataStage existente

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 02:40.

Empiece con un flujo de DataStage básico que se une a los solicitantes de hipotecas y a los conjuntos de datos de aplicaciones de hipotecas y, a continuación, genera el resultado en un archivo CSV en el proyecto. Siga estos pasos para ejecutar el flujo de DataStage :

  1. Inicie el proyecto Integración de datos . Si no tiene el proyecto abierto, siga estos pasos:

    1. En el menú de navegación Cloud Pak for Data Menú de navegación, seleccione Proyectos > Ver todos los proyectos.

    2. Abra el proyecto Integración de datos .

  2. Pulse el separador Activos para ver todos los activos del proyecto.

  3. Pulse Flujos > Flujos de DataStage.

    Sugerencia: Si no ve ningún flujo de DataStage , vuelva a ver las instancias de servicio para verificar que la instancia de DataStage se ha suministrado correctamente. Consulte Suministro de los servicios necesarios.
  4. Pulse el flujo Integración de datos en la lista para abrirlo. Este flujo se une a las tablas Solicitantes de hipoteca y Aplicaciones de hipoteca que están almacenadas en Db2 Warehouse, filtra los datos a esos registros desde el estado de California y crea un archivo secuencial en formato CSV como salida.

  5. Pulse el icono acercar Acercar y el icono alejar Alejar en la barra de herramientas para establecer la vista preferida del lienzo.

  6. Efectúe una doble pulsación en el nodo MORTGAGE_APPLICATIONS_1 para ver los valores.

    1. Expanda la sección Propiedades.

    2. Desplácese hacia abajo y, a continuación, pulse Vista previa de datos. Este conjunto de datos incluye información que se captura en una aplicación de hipoteca.

    3. Pulse Cerrar.

  7. Efectúe una doble pulsación en el nodo MORTGAGE_APPLICANTS_1 para ver los valores.

    1. Expanda la sección Propiedades.

    2. Desplácese hacia abajo y pulse Vista preliminar de los datos. Este conjunto de datos incluye información sobre los solicitantes de hipotecas que solicitaron un préstamo.

    3. Opcional: Visualice los datos.

      1. Pulse el panel Gráfico .

      2. En la lista Columnas a visualizar , seleccione STATE.

      3. Pulse Visualizar datos para ver un gráfico circular que muestra la distribución de los datos por estado.

      4. Pulse el icono Mapa de árbol para ver los mismos datos en un gráfico de mapa de árbol.

    4. Pulse Cerrar.

  8. Efectúe una doble pulsación en el nodo Join_on_ID para ver los valores.

    1. Expanda la sección Propiedades.

    2. Tenga en cuenta que la clave de unión es la columna de ID.
      Clave de unión Join_on_ID

    3. Pulse Cancelar para cerrar los valores.

  9. Pulse el icono Registros Ver registro en la barra de herramientas para que pueda ver el progreso del flujo.

  10. Pulse Compilar y luego Ejecutar. De forma alternativa, puede pulsar Ejecutar , que compila y, a continuación, ejecuta el flujo de DataStage . La ejecución puede tardar aproximadamente un minuto en completarse.

  11. Vea los registros. Puede utilizar el total de filas y filas/seg para cada paso del flujo para verificar visualmente que el filtro funciona según lo esperado.

  12. Cuando la ejecución se complete correctamente, pulse Integración de datos en la pista de navegación para volver al proyecto.
    Ruta de navegación

  13. En la pestaña Activos , pulse Datos > Activos de datos.

  14. Abra el archivo MORTGAGE_INTEREST_RATES.CSV. Puede ver que este archivo contiene las columnas de los solicitantes de hipoteca y los conjuntos de datos de solicitudes de hipoteca.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra los MORTGAGE_INTEREST_RATES.CSV . La tarea siguiente es editar el flujo de DataStage .

MORTGAGE_INTEREST_RATES.CSV




Visión general: Editar el flujo de DataStage

Ahora que se ha unido al solicitante de hipoteca y a los datos de solicitud, está preparado para editar el flujo de DataStage para:

  • Tarea 2: Especificar una columna clave para la etapa Join.
  • Tarea 3: Añadir datos de puntuación de crédito de una base de datos PostgreSQL .
  • Tarea 4: Añadir una etapa de unión para unir los datos de puntuación de crédito con el solicitante y los datos de solicitud.
  • Tarea 5: Añadir una etapa Transformer para calcular la deuda total.
  • Tarea 6: Añadir datos de tipo de interés de una base de datos MongoDB .
  • Tarea 7: Añadir una etapa de búsqueda para buscar tasas de interés para los solicitantes en función de sus puntuaciones de crédito y los rangos de tasas de interés diarias de Golden Bank.



Tarea 2: Especificar la columna clave para la etapa Join

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 04:33.

La identificación de una columna clave indica a DataStage que la columna contiene valores exclusivos. El nodo Join_on_ID se une a los solicitantes de hipoteca y a los conjuntos de datos de aplicaciones de hipoteca utilizando la columna de ID para la clave de unión. La siguiente fase es unir el conjunto de datos resultante con los datos de puntuación de crédito. Más adelante, unirá los datos filtrados resultantes con el conjunto de datos de puntuación de crédito. La segunda unión utilizará la columna EMAIL_ADDRESS como clave de unión. En esta tarea, edite el flujo de DataStage para especificar la columna EMAIL_ADDRESS como columna clave para el conjunto de datos resultante cuando se une con los datos de puntuación de crédito.

La siguiente imagen animada proporciona una representación visual como alternativa a la descripción de los dos nodos de unión. Pulse la imagen para ver una imagen más grande.

Nodos de unión

Siga estos pasos para cambiar los valores del nodo Join:

  1. Pulse Integración de datos en la ruta de navegación para volver al proyecto.
    Ruta de navegación

  2. En el separador Activos , pulse Flujos > Flujos de DataStage.

  3. Abra el flujo Integración de datos .

  4. Efectúe una doble pulsación en el nodo Join_on_ID para editar los valores.

  5. Pulse la pestaña Salida y expanda la sección Columnas para ver una lista de las columnas del conjunto de datos unido.

  6. Pulse Editar.

  7. Para el nombre de columna EMAIL_ADDRESS, seleccione Clave.

  8. Pulse Aplicar y volver para volver a los valores del nodo de Join_on_ID.

  9. Pulse Guardar para guardar los valores del nodo de Join_on_ID.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el flujo de DataStage con la etapa Join_on_id editada. Ahora que ha identificado la columna EMAIL_ADDRESS como la columna clave, puede añadir los datos de PostgreSQL que contienen las puntuaciones de crédito de los solicitantes.

Etapa Join_on_id




Tarea 3: Añadir datos de puntuación de crédito de una base de datos PostgreSQL

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 05:14.

Siga estos pasos para añadir los datos de puntuación de crédito almacenados en una base de datos PostgreSQL al flujo de DataStage :

  1. En la paleta de nodos, expanda la sección Conectores.

  2. Arrastre el conector Navegador de activos al lienzo junto al nodo MORTGAGE_APPLICANTS_1 .

  3. Localice el activo seleccionando Conexión > Data Fabric Trial- Databases for PostgreSQL > BANKING > CREDIT_SCORE.

    Nota: Pulse el nombre de conexión o esquema en lugar del recuadro de selección para expandir la conexión y el esquema.

    Vista previa de puntuación de crédito

  4. Pulse el icono Vista previa Icono de vista para obtener una vista previa de los datos de puntuación de crédito para cada candidato.

  5. Pulse Añadir.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el flujo de DataStage con el activo de puntuación de crédito añadido. Ahora que ha añadido los datos de puntuación de crédito al lienzo, debe unirse a los datos de solicitante, solicitud y puntuación de crédito.

Activo de datos de puntuación de crédito




Tarea 4: Añadir una etapa de unión para unir los datos de puntuación de crédito con el solicitante y los datos de solicitud

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 05:46.

Siga estos pasos para añadir otra etapa Join para unirse a la solicitud de hipoteca filtrada y el solicitante de hipoteca se unió a los datos con los datos de puntuación de crédito en el flujo de DataStage :

  1. En la paleta de nodos, expanda la sección Etapas.

  2. Arrastre la etapa Unión al lienzo y suelte el nodo en la línea de enlace entre los nodos Filter_State_Code y Sequential_file_1 .

  3. Pase el ratón por encima del conector CREDIT_SCORE_1 para ver la flecha. Conecte la flecha a la etapa Unión.

  4. Efectúe una doble pulsación en el nodo CREDIT_SCORE_1 para editar los valores.

    1. Pulse la pestaña Salida y expanda la sección Columnas para ver una lista de las columnas del conjunto de datos unido.

    2. Pulse Editar.

    3. Para los nombres de columna EMAIL_ADDRESS y CREDIT_SCORE, seleccione Clave.

    4. Pulse Aplicar y volver para volver a los valores del nodo de CREDIT_SCORE_1.

    5. Pulse Guardar para guardar los valores del nodo de CREDIT_SCORE_1.

  5. Efectúe una doble pulsación en el nodo Join_1 para editar los valores.

    1. Expanda la sección Propiedades.

    2. Pulse Añadir clave.

      1. Vuelva a pulsar Añadir clave.

      2. Seleccione EMAIL_ADDRESS en la lista de claves posibles.

      3. Haga clic en Aplicar.

    3. Pulse Aplicar y volver para volver a los valores del nodo de Join_1.

    4. Cambie el nombre de nodo de Join_1 por Join_on_email.

    5. Pulse Guardar para guardar los valores del nodo de Join_1.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el flujo de DataStage con una segunda etapa Join añadida. Ahora que se ha unido a los datos de solicitud, solicitante y puntuación de crédito, debe añadir una etapa Transformer para calcular la deuda total de cada solicitante.

Etapa Join_on_email




Tarea 5: Añadir una etapa Transformer para calcular la deuda total

vídeo tutorial de vista previa Para obtener una vista preliminar de esta tarea, vea el vídeo que empieza en 07:00.

Siga estos pasos para añadir una etapa Transformer que cree una nueva columna sumando las columnas LOAN_AMOUNT y CREDITCARD_DEBT:

  1. En la sección Etapas , arrastre la etapa Transformer al lienzo y suelte el nodo en la línea de enlace entre los nodos Join_on_email y Sequential_file_1 .

  2. Efectúe una doble pulsación en el nodo Transformador para editar los valores.

  3. Pulse la pestaña Salida.

    1. Pulse Añadir columna.

    2. Desplácese hacia abajo en la lista de columnas para ver la nueva columna.

    3. Nombre de la columna TOTAL_DEBT.

    4. Pulse el icono Editar Icono Editar en la columna Derivación de la fila.

    5. Pulse el icono Calculadora Icono de calculadora en la columna Derivación para abrir el generador de expresiones.

    6. Busque LOAN_AMOUNT y efectúe una doble pulsación en el nombre de columna para añadirlo a la expresión. Tenga en cuenta que el número de enlace se añade al nombre de columna.

    7. Escriba un signo más +.

    8. Busque CREDITCARD_DEBTy, a continuación, efectúe una doble pulsación en el nombre de columna para añadirlo a la expresión. Tenga en cuenta que el número de enlace se añade al nombre de columna.

    9. Verifique que la expresión final es Link_5.LOAN_AMOUNT + Link_5.CREDITCARD_DEBT.

      Nota: El número de enlace puede ser diferente.
    10. Pulse Aplicar y volver para volver a la página Transformador.

    11. Para el nombre de columna CREDIT_SCORE , seleccione Clave.

  4. Pulse Guardar y volver para volver al lienzo.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el flujo de DataStage con la etapa Transformer añadida. Ahora que ha calcluido la deuda total de cada solicitante, debe añadir la tabla de tipos de interés para ofrecer en función de los rangos de puntuación de crédito.

Etapa Transformer




Tarea 6: Añadir datos de tipo de interés de una base de datos MongoDB

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 07:49.

Siga estos pasos para incluir los tipos de interés en el flujo añadiendo un conector de activo de datos a una base de datos MongoDB :

  1. En la paleta de nodos, expanda la sección Conectores.

  2. Arrastre el conector Navegador de activos al lienzo junto al nodo CREDIT_SCORE_1.

  3. Localice el activo seleccionando Conexión > Data Fabric Trial-Mongo DB > DOCUMENT > DS_INTEREST_RATES.

  4. Pulse el icono Vista previa Icono de vista para obtener una vista previa de los tipos de interés para cada rango de puntuación de crédito.
    Ver activo de datos
    Puede utilizar los valores de las columnas STARTING_LIMIT y ENDING_LIMIT para buscar el tipo de interés adecuado en función de la puntuación de crédito del solicitante. La columna ID no es necesaria, por lo que suprimirá esa columna en el paso siguiente.

  5. Pulse Añadir.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el flujo de DataStage con el activo de datos de tipos de interés añadido desde el origen externo MongoDB . Ahora que ha añadido la tabla de tipos de interés, puede buscar la tasa de interés adecuada para cada solicitante.

Activo de datos de tipos de interés




Tarea 7: Añadir una etapa de búsqueda para buscar tipos de interés para los candidatos

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 08:35.

Basándose en la puntuación de crédito de cada solicitante, desea buscar la tasa de interés apropiada. Siga estos pasos para añadir una etapa de búsqueda y especificar el rango para los límites de puntuación de crédito inicial y final para cada tipo de interés:

  1. En la sección Etapas , arrastre la etapa Búsqueda al lienzo y suelte el nodo en la línea de enlace entre los nodos Transformer_1 y Sequential_file_1 .

  2. Conecte el conector DS_INTEREST_RATES_1 a la etapa Lookup_1.

  3. Efectúe una doble pulsación en el nodo DS_INTEREST_RATES_1 para editar los valores.

  4. Pulse la pestaña Salida.

    1. Expanda la sección Columnas y pulse Editar.

    2. Seleccione la columna _ID.

    3. Pulse el icono Suprimir Icono de Papelera para suprimir la columna _ID .

    4. Pulse Aplicar y volver para volver a los valores del nodo de DS_INTEREST_RATES_1.

    5. Pulse Guardar para guardar los cambios en el nodo DS_INTEREST_RATES_1.

  5. Efectúe una doble pulsación en el nodo Lookup_1 para editar los valores.

  6. Expanda la sección Propiedades.

    1. Para el campo Aplicar rango a columnas, seleccione CREDIT_SCORE. Se muestran los campos Enlaces de referencia, Operadory Columna de rango .

    2. Para Enlaces de referencia, seleccione Link_9.

      Nota: El número de enlace puede ser diferente.
    3. Para el primer Operador, seleccione < =.

    4. Para la primera Columna de rango, seleccione ENDING_LIMIT.

    5. Para el segundo Operador, seleccione > =.

    6. Para la segunda Columna de rango, seleccione STARTING_LIMIT.

  7. Pulse la pestaña Salida.

    1. Expanda la sección Columnas y pulse Editar.

    2. Seleccione las columnas STARTING_LIMIT y ENDING_LIMIT .

    3. Pulse el icono Suprimir Icono de Papelera para suprimir estas columnas STARTING_LIMIT y ENDING_LIMIT innecesarias.

    4. Pulse Aplicar y volver para volver a los valores del nodo de Lookup_1.

    5. Pulse Guardar para guardar los cambios en el nodo Lookup_1.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra que el flujo de DataStage con la etapa Lookup se ha añadido. Ahora el flujo de DataStage se ha completado. La última tarea antes de ejecutar el flujo es especificar el nombre del archivo de salida.

Etapa Búsqueda




Tarea 8: Editar el nodo de archivo secuencial y ejecutar el flujo de DataStage

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 09:56.

Siga estos pasos para editar el nodo de archivo secuencial para crear un archivo de salida final como un activo de datos en el proyecto y, a continuación, compile y ejecute el flujo de DataStage :

  1. Efectúe una doble pulsación en el nodo Sequential_file_1 para editar los valores.

  2. Pulse la pestaña Salida.

  3. Expanda la sección Propiedades.

  4. Para el Archivo de destino, copie y pegue MORTGAGE_APPLICANTS_INTEREST_RATES.CSV para el nombre de archivo.

  5. Seleccione Crear activo de datos.

  6. En el campo La primera línea son los nombres de columna , seleccione True.

  7. Pulse Guardar.

  8. Pulse Ejecutar , que compila y, a continuación, ejecuta el flujo de DataStage . El trabajo tarda aproximadamente 1 minuto en completarse.

  9. Pulse Registros en la barra de herramientas para ver el progreso del flujo. Es normal ver avisos durante la ejecución y, a continuación, ver que el flujo se ha ejecutado correctamente.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra que el flujo de DataStage se ha ejecutado correctamente. Ahora que el flujo de DataStage ha creado el archivo de salida, debe crear el catálogo donde publicará el archivo de salida.

Ejecución de DataStage completada




Tarea 9: Crear un catálogo para almacenar el elemento de datos publicado

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 10:28.

Otros ingenieros de datos y analistas de negocios en Golden Bank necesitan acceso a las tasas de interés hipotecario. Con el plan Lite IBM Knowledge Catalog , puede crear dos catálogos. Si ya tiene un catálogo, omita este paso. De lo contrario, realice los pasos siguientes para crear un catálogo en el que pueda publicar el conjunto de datos de tipos de interés.

  1. En el menú de navegación Cloud Pak for Data Menú de navegación, elija Catálogos > Ver todos los catálogos.

  2. Si ve un Catálogo de aprobación de hipotecas en la página Catálogos , vaya a Tarea 10: Ver la salida y publicar en un catálogo. De lo contrario, siga estos pasos para crear un catálogo nuevo:

  3. Pulse Crear catálogo.

  4. Para el Nombre, copie y pegue el nombre de catálogo exactamente como se muestra sin espacios iniciales ni finales:

    Mortgage Approval Catalog
    
  5. Seleccione Imponer reglas de protección de datos, confirme la selección y acepte los valores predeterminados para los otros campos.

  6. Pulse Crear.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el catálogo. Ahora que ya existe el catálogo de aprobación de hipoteca, puede publicar el archivo de salida en el catálogo.

Catálogo de aprobación de hipoteca




Tarea 10: Ver la salida y publicar en un catálogo

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 10:57.

Siga estos pasos para ver el archivo de salida en el proyecto y, a continuación, publíquelo en un catálogo:

  1. En el menú de navegación Cloud Pak for Data Menú de navegación, seleccione Proyectos > Ver todos los proyectos.

  2. Abra el proyecto Integración de datos .

  3. En la pestaña Activos , pulse Datos > Activos de datos.

  4. Abra el archivo MORTGAGE_APPLICANTS_INTEREST_RATES.CSV.

  5. Desplácese para ver todas las columnas del conjunto de datos integrado con tipos de interés al final de cada entrada de datos.

  6. Pulse Integración de datos en la ruta de navegación para volver al proyecto.

  7. En la pestaña Activos , pulse el menú Desbordamiento Menú de desbordamiento al final de la fila para MORTGAGE_APPLICANTS_INTEREST_RATES.CSV y elija Publicar en catálogo.

    1. Seleccione el Catálogo de aprobación de hipoteca (o su nombre de catálogo) en la lista y pulse Siguiente.

    2. Seleccione la opción Ir al catálogo después de publicarloy pulse Siguiente.

    3. Revise los activos y pulse Publicar.

  8. En el catálogo, busque Mortgage.

  9. Abra el archivo MORTGAGE_APPLICANTS_INTEREST_RATES.CSV.

  10. Pulse el separador Activo para ver los datos.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra MORTGAGE_APPLICANTS_INTEREST_RATES.CSV en el catálogo. Los datos que los prestamistas necesitan para tomar decisiones hipotecarias ya están disponibles.

MORTGAGE_APPLICANTS_INTEREST_RATES.CSV en el catálogo



Como ingeniero de datos de Golden Bank, ha integrado el solicitante de la hipoteca, la solicitud, la calificación crediticia y la información de puntuación de crédito, y ha publicado esos datos en un catálogo.

Limpieza (opcional)

Si desea volver a tomar las guías de aprendizaje en el caso de uso de integración de datos, suprima los artefactos siguientes.

Artefacto Cómo suprimir
Catálogo de aprobación de hipoteca Suprimir un catálogo
Proyecto de ejemplo de integración de datos Suprimir un proyecto

Próximos pasos

Más información

Tema padre: Guías de aprendizaje de casos de uso

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información