0 / 0

Implementación de servicios de IA con código

Última actualización: 25 mar 2025
Implementación de servicios de IA con código

Puede crear un servicio de IA personalizado que se adapte a su aplicación de IA generativa desde cero. Por ejemplo, si está implementando un activo que utiliza la generación aumentada de recuperación (RAG), puede capturar la lógica para recuperar respuestas de los documentos de base en el servicio de IA.

Métodos para implementar servicios de IA con código

Puede utilizar los siguientes métodos para codificar e implementar sus servicios de IA:

  1. Codificación e implementación manual de servicios de IA

    Puede crear un cuaderno que contenga el servicio de IA y las conexiones dentro del proyecto. El servicio de IA captura la lógica de su aplicación RAG y contiene la función de generación, que es una unidad de código desplegable. La función de generación se promueve al espacio de implementación, que se utiliza para crear una implementación. La implementación se expone como un punto final de la API REST al que pueden acceder otras aplicaciones. Puede enviar una solicitud al punto final de la API REST para utilizar el servicio de IA implementado para la inferencia. El servicio de IA implementado procesa la solicitud y devuelve una respuesta.

    Para obtener más información, consulte Codificación e implementación manual de servicios de IA.

  2. Codificación e implementación de servicios de IA con plantillas

    Puede utilizar plantillas predefinidas para implementar sus servicios de IA en watsonx.ai. Las plantillas de servicios de IA proporcionan una base preconstruida para las aplicaciones de IA, lo que permite a los desarrolladores centrarse en la lógica central de su aplicación, en lugar de empezar desde cero. Al proporcionar una estructura, configuración y conjunto de herramientas predefinidas, las plantillas de servicios de IA simplifican el proceso de implementación de servicios de IA, reducen el riesgo de errores y mejoran la eficiencia general y la coherencia del desarrollo y la implementación de IA.

    Para obtener más información, consulte Codificación e implementación de servicios de IA con plantillas.

  3. Codificación e implementación de servicios de IA con CPDCTL

    CPDCTL es una herramienta de línea de comandos para implementar y gestionar servicios de IA en la plataforma de desarrollo de productos ( IBM Cloud Pak for Data, CPD). Proporciona una forma sencilla y ágil de implementar servicios de IA, eliminando la necesidad de configuración manual y reduciendo el riesgo de errores. El proceso de implementación de un servicio de IA con CPDCTL implica preparar el entorno instalando CPDCTL y configurando variables de entorno, crear una instancia de servicio de IA, cargar el código para el servicio de IA e implementar el servicio de IA para que esté disponible para su uso. El proceso de implementación se inicia ejecutando una serie de comandos CPDCTL, que incluyen la creación de una instancia de servicio de IA, la carga del código y la implementación del servicio de IA. A continuación, se puede acceder al servicio de IA implementado a través de un punto final de la API REST.

    Para obtener más información, consulte Codificación e implementación de servicios de IA con CPDCTL.

Elegir el método de implementación adecuado

Existen tres enfoques para implementar servicios de IA: codificación manual, plantillas de desarrollador y CPDCTL. Cada enfoque tiene sus ventajas y desventajas. La elección del enfoque de implementación depende de las necesidades y requisitos específicos del proyecto. Las plantillas de desarrollador son adecuadas para implementaciones sencillas con necesidades de personalización limitadas, mientras que la codificación manual es adecuada para implementaciones complejas con altas necesidades de personalización. CPDCTL es adecuado para implementaciones que requieren simplicidad y escalabilidad.

La siguiente tabla ofrece un resumen comparativo de los tres enfoques para implementar servicios de IA con código:

Diferencias importantes
Enfoque Facilidad de uso Personalización Escalabilidad Tiempo de comercialización
Codificación manual difícil Completo Alto Lento
Plantillas para desarrolladores Fácil Limitado Limitado Rápida
CPDCTL Fácil Limitado Alto Rápida

Más información

Tema principal: Implementación de servicios de IA