0 / 0
Volver a la versión inglesa de la documentación
Despliegue de funciones Python en watsonx.ai Runtime
Última actualización: 21 nov 2024
Despliegue de funciones Python en watsonx.ai Runtime

Puede desplegar funciones Python en watsonx.ai Runtime del mismo modo que puede desplegar modelos. Las herramientas y aplicaciones pueden utilizar el cliente watsonx.ai Python o la API REST para enviar datos a las funciones desplegadas de la misma forma que envían datos a los modelos desplegados. El despliegue de funciones de Python le ofrece la posibilidad de ocultar detalles (como las credenciales). También puede preprocesar datos antes de pasarlos a modelos. Además, puede manejar errores e incluir llamadas a varios modelos, todo dentro de la función desplegada en lugar de en la aplicación.

Cuadernos de ejemplo para crear y desplegar funciones de Python

Para ver ejemplos de cómo crear y desplegar funciones de Python utilizando la biblioteca de cliente watsonx.ai Python, consulte estos cuadernos de ejemplo:

Nombre de ejemplo Infraestructura Técnicas demostradas
Realizar pronósticos en el negocio de automóviles Hybrid(Tensorflow) Configurar una definición de IA
Preparar los datos
Crear un modelo Keras utilizando Tensorflow
Desplegar y puntuar el modelo
Definir, almacenar y desplegar una función Python
Desplegar la función Python para la especificación de software Core Crear una función Python
Crear un servicio web
Puntuar el modelo

Los cuadernos muestran los seis pasos para crear y desplegar una función:

  1. Definir la función.
  2. Autenticar y definir un espacio.
  3. Almacenar la función en el repositorio.
  4. Obtener la especificación de software.
  5. Desplegar la función almacenada.
  6. Enviar datos a la función para su proceso.

Para ver enlaces a otros cuadernos de muestra que utilizan el ' watsonx.ai ' biblioteca cliente Python , consulte ' Utilización de ' watsonx.ai Runtime en un cuaderno.

Aumento de la escalabilidad de una función

Cuando despliega una función desde un espacio de despliegue o de forma programada, de forma predeterminada se despliega una única copia del modelo. Para aumentar la escalabilidad, puede aumentar el número de copias (réplicas) editando la configuración del despliegue. Más réplicas permiten un mayor volumen de solicitudes de puntuación.

En el ejemplo siguiente, se utiliza la API de cliente Python para establecer el número de nodos en 3.

change_meta = {
                client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
                                       "name":"S",
                                       "num_nodes":3}
            }

client.deployments.update(<deployment_id>, change_meta)

Más información

Tema padre: Gestión de despliegues predictivos

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información