0 / 0

Implementación de servicios de IA con herramientas visuales

Última actualización: 20 mar 2025
Implementación de servicios de IA con herramientas visuales

Cuando se utilizan herramientas visuales para crear una aplicación para un caso de uso complejo, como la Generación Aumentada de Recuperación (RAG) o la IA agéntica, la aplicación se despliega como un servicio de IA. Un servicio de IA es una unidad de código desplegable que captura la lógica de su aplicación de IA generativa. Después de desplegar un servicio de IA, puede probarlo desde la interfaz de pruebas proporcionada en el espacio o acceder al punto final para poner el despliegue en producción.

Herramientas visuales que despliegan servicios de IA

Cuando se crea una aplicación con cualquiera de las siguientes herramientas, la aplicación se implementa como un servicio de IA:

  • Agent Lab : Puede utilizar Agent Lab para crear e implementar soluciones de IA de agentes en watsonx.ai. Las soluciones de IA Agentic que construyes en el Laboratorio de Agentes se implementan como servicios de IA.

  • Prompt Lab : Puede utilizar el Prompt Lab para crear e implementar una solución de IA generativa para un caso de uso complejo, como la generación aumentada de recuperación (RAG). Las soluciones de IA generativa para casos de uso complejos que usted crea en el Laboratorio de Agentes se implementan como servicios de IA.

  • AutoAI (para RAG ): Puede utilizar AutoAI para crear experimentos de IA generativa basados en RAG e implementar el pipeline que mejor funcione como servicio de IA.

Por ejemplo, un servicio de IA para un aviso que chatea con documentos de base puede gestionar la lógica para recuperar contenido del índice de documentos vectorizados, así como la inferencia con un modelo de base para generar una respuesta.

Métodos de despliegue

Dependiendo de sus necesidades, puede implementar su aplicación como un servicio de IA desde una herramienta visual compatible utilizando uno de los siguientes enfoques:

  • Implementación directa (vía rápida ): Utilice esta opción si su solución está completa y no desea realizar más cambios. Si elige implementar mediante una ruta rápida, se crea automáticamente una implementación en línea.
  • Cuaderno de implementación : Utilice esta opción si desea personalizar su solución añadiendo o modificando el código, como por ejemplo, creando una implementación por lotes.

Además de las herramientas visuales, puede implementar manualmente su aplicación como un servicio de IA directamente desde el proyecto si ha creado un activo de servicio de IA mediante programación.

La siguiente tabla contrasta las opciones de despliegue de varias herramientas y proyectos:

Comparación de métodos de implantación
Herramienta Despliegue en línea Despliegue por lotes Despliegue directo (Fast-path) Cuaderno de despliegue
Prompt Lab Automático Manuales Proceso en dos etapas Soportado; generado automáticamente
Agent Lab Automático Manuales Proceso en dos etapas Soportado; generado automáticamente
AutoAI (para RAG) Automático Manuales Proceso en varios pasos No soportado
Proyectos Manuales Manuales Proceso en varios pasos Soportado; creado manualmente

El servicio AI captura la lógica de su caso de uso y contiene la función de generación, que es una unidad de código desplegable. El despliegue se expone como un punto final de la API REST al que pueden acceder otras aplicaciones. Puede enviar una solicitud al punto final de la API REST para utilizar el servicio de IA desplegado para inferencias. El servicio de IA desplegado procesa la solicitud y devuelve una respuesta.

Implementación de servicios de IA con herramientas visuales

Implementación desde herramientas

Utilice la ruta rápida para implementar directamente desde una herramienta visual o guarde su trabajo en un cuaderno de implementación para implementar su solución como un servicio de IA.

Implementación con acceso rápido

Si utilizó una herramienta visual compatible para crear su aplicación en watsonx.ai, puede implementar su solución directamente desde la herramienta. La implementación directa desde las herramientas le ofrece una vía rápida para implementar su solución como un servicio de IA y crea una implementación en línea automáticamente. Dado que la implementación no puede modificarse una vez creada, debe asegurarse de que la solución esté completamente construida antes de implementarla.

Para crear un despliegue por lotes, debe desplegar su solución manualmente desde un Proyecto. Para más información, consulte Despliegue desde proyecto.

Para implementar una solución compleja como RAG de Prompt Lab o para implementar un agente del Laboratorio de Agentes, siga estos pasos:

  1. Haga clic en Implementar en el espacio de trabajo.
  2. Introduce los detalles de tu implementación, elige o crea tu espacio de implementación y haz clic en Crear.

Para implementar un patrón RAG desde AutoAI,, siga estos pasos:

  1. Desde el generador de experimentos de AutoAI, elija el pipeline con mejor rendimiento y haga clic en Guardar como.
  2. Elija Recuperación y generación como objetivo y seleccione el tipo de activo de servicio de IA.
  3. Habilitar la opción para promocionar e implementar el servicio de IA en un espacio de implementación.
  4. Elija un espacio de implementación existente o cree uno nuevo y haga clic en Crear e implementar.

Este procedimiento crea automáticamente una implementación en línea. La implementación se crea y se abre en el espacio de destino para que pueda probar la implementación o acceder al punto final para la inferencia.

Implementación desde el cuaderno generado automáticamente

Después de crear una aplicación en una herramienta visual, si desea personalizar la lógica de su aplicación antes de la implementación, puede guardar su trabajo en un cuaderno de implementación. Por ejemplo, puede editar y ejecutar un cuaderno RAG ( AutoAI ) si desea añadir nuevos documentos a la base de datos vectorizada, y luego aplicar el patrón RAG optimizado que descubrió con la herramienta AutoAI al índice actualizado.

El cuaderno de implementación contiene el código para probar, promocionar e implementar un servicio de IA. Para implementar su aplicación, debe guardar su trabajo en un cuaderno de implementación. No se puede utilizar un cuaderno estándar para desplegar un activo de servicio AI.

Para guardar su solución en un cuaderno de despliegue en Prompt Lab o Agent Lab:

  1. Haga clic en el icono Guardar Icono Guardar y seleccione Guardar como en el menú desplegable.
  2. En el cuadro de diálogo Guardar trabajo, seleccione Cuaderno de despliegue.
  3. En la sección Definir detalles, introduzca un nombre y una descripción opcional para su cuaderno de despliegue.
  4. Pulse Guardar.

Cuando guarda su trabajo en un cuaderno de despliegue, watsonx.ai genera automáticamente un cuaderno que contiene el código para probar, promover y desplegar un servicio de IA. Para crear un despliegue en línea para su servicio AI, ejecute las celdas del cuaderno de despliegue.

Despliegue desde el proyecto

Cree una implementación en línea o por lotes para implementar su aplicación como un servicio de IA. Las implementaciones en línea son adecuadas para aplicaciones que requieren alta disponibilidad y actualizaciones en tiempo real, mientras que las implementaciones por lotes son ideales para actualizaciones complejas o cuando el tiempo de inactividad programado es aceptable.

Requisitos previos

Debe configurar sus credenciales de tarea generando una clave API. Para obtener más información, consulte Gestión de credenciales de tareas.

Creación de implementaciones en línea

Si ha guardado un activo de IA en un proyecto como activo de servicio de IA implementable, siga estos pasos para promocionar el servicio de IA y crear una implementación en línea:

  1. En la pestaña Activos de su proyecto o espacio de implementación, seleccione Implementar para el servicio de IA.
  2. Elija o cree un espacio de implementación.
  3. Seleccione En línea como tipo de implementación.
  4. Introduzca un nombre para su implementación y, opcionalmente, introduzca un nombre de servicio, una descripción y etiquetas.
  5. Pulse Crear.

Creación de implementaciones por lotes

Si ha guardado un activo de IA en un proyecto como activo de servicio de IA implementable, siga estos pasos para promocionar el servicio de IA y crear una implementación por lotes:

  1. Desde su espacio de implementación, vaya a la pestaña Activos.
  2. Para el activo de servicio de IA en la lista de activos, haga clic en el icono de Menú y seleccione Implementar.
  3. Seleccione Lote como tipo de implementación.
  4. Introduzca un nombre para su implementación y, opcionalmente, introduzca un nombre de servicio, una descripción y etiquetas.
  5. Seleccione una especificación de hardware:
    • Extrapequeño : 1 CPU y 4 GB de RAM
    • Pequeño : 2 CPU y 8 GB de RAM
    • Medio : 4 CPU y 16 GB de RAM
    • Grande : 8 CPU y 32 GB de RAM
    • Extra grande : 16 CPU y 64 GB de RAM
  6. Pulse Crear.

Próximos pasos

Tema principal: Despliegue de servicios de IA