Tema traducido automáticamente Puede cambiar a la versión en inglésConsulte la declaración de limitación de responsabilidad
Consulte la versión en inglés (original) para obtener la versión más precisa y actualizada de esta documentación. IBM no se responsabiliza de los daños o pérdidas resultantes del uso de contenido traducido automáticamente (máquina).
Creación de implantaciones en línea
Última actualización: 28 nov 2024
Creación de implantaciones en línea
Cree un despliegue en línea para modelos de aprendizaje automático, activos de IA generativos o funciones de Python para generar predicciones o resultados en tiempo real. Por ejemplo, cree un despliegue en línea para un modelo de clasificación entrenado para predecir si un cliente de banco se inscribe en una promoción. El envío de nuevos datos de cliente al punto final de despliegue devuelve una predicción en tiempo real.
Tipos de activos desplegables para despliegues en línea
Copy link to section
Puede crear despliegues en línea para estos tipos de activos:
Después de crear un despliegue en línea, se genera un URL de punto final. Puede utilizar el URL de punto final para probar el despliegue o para incluir el despliegue en las aplicaciones.
Antes de empezar
Copy link to section
Debe configurar sus credenciales de tarea generando una clave API. Para obtener más información, consulte Gestión de credenciales de tareas.
Creación de un despliegue en línea desde un espacio de despliegue
Copy link to section
Siga estos pasos para crear el despliegue en línea desde un espacio de despliegue:
No puede crear o seleccionar especificaciones de hardware personalizadas desde la interfaz de usuario en un espacio de despliegue. Para obtener más información sobre cómo crear y seleccionar una especificación de hardware, consulte Gestión de especificaciones de hardware para despliegues.
Opcional: Seleccione una especificación de software que sea compatible con el activo. Puede seleccionar especificaciones de software sólo para funciones.
Pulse Crear para crear el despliegue.
Prueba de un despliegue en línea
Copy link to section
Siga estos pasos para probar el despliegue en línea:
En el separador Despliegues del espacio, pulse el nombre del despliegue.
Pulse la pestaña Probar para especificar datos y obtener una predicción u otra respuesta del activo desplegado.
La forma en que proporcione datos de prueba para un despliegue en línea depende del tipo de activo que haya desplegado. Para la mayoría de los activos, puede especificar directamente datos de prueba en un formulario, cargar un archivo que contenga datos de prueba o pegar los datos de prueba como código JSON. Por ejemplo, a continuación se muestra la interfaz de prueba para un modelo de clasificación:
Nota:
Para proporcionar datos de prueba:
Si el modelo desplegado tiene un esquema definido, los datos de prueba deben utilizar el mismo esquema. Por ejemplo, para un modelo de clasificación, especifique datos de prueba utilizando las mismas columnas, omitiendo la columna de predicción.
Para una plantilla de solicitud desplegada, el formulario para probar el despliegue duplica el formulario de entrada/salida que ha utilizado para crear la solicitud.
Código JSON de ejemplo para probar un despliegue
Copy link to section
Al enviar código JSON como carga útil, o datos de entrada, para un despliegue, los datos de entrada deben coincidir con los requisitos del activo desplegado.
Por ejemplo, para un modelo con un esquema, el fields debe coincidir con las cabeceras de columna para los datos y el values debe contener los datos (en el mismo orden). Utilice este formato:
{"input_data":[{
"fields": ["PassengerId","Pclass","Name","Sex","Age","SibSp","Parch","Ticket","Fare","Cabin","Embarked"],
"values": [[1,3,"Braund, Mr. Owen Harris",0,22,1,0,"A/5 21171",7.25,null,"S"]]
}]}
Copy to clipboardSe ha copiado en el portapapeles
Sin embargo, para especificar datos de entrada para una plantilla de solicitud desplegada, la estructura duplica la entrada y salida para solicitar el modelo. Por ejemplo, consulte el siguiente fragmento de código:
Todas las series están entre comillas dobles. La notación Python para diccionarios es similar, pero las series Python entre comillas simples no se aceptan en los datos JSON.
Indique los valores perdidos con null.
Recuperación del punto final para un despliegue en línea
Copy link to section
Siga estos pasos para recuperar el URL de punto final para el despliegue en línea para que pueda acceder al despliegue desde las aplicaciones:
En el separador Despliegues del espacio, pulse el nombre del despliegue.
En el separador Referencia de API , busque los enlaces de punto final privado y público. También puede encontrar fragmentos de código en varios lenguajes de programación como Python, Java, y más para incluir los detalles de punto final en una aplicación.
Nota:
Si ha añadido Nombre de servicio al crear el despliegue en línea, verá dos URL de punto final. El primer URL contiene el ID de despliegue y el segundo URL contiene el nombre de servicio. Puede utilizar cualquiera de estos URL con el despliegue.
Acceso a los detalles de despliegue en línea
Copy link to section
Siga estos pasos para revisar o actualizar los detalles de despliegue:
En el separador Despliegues del espacio, pulse un nombre de despliegue.
Pulse el separador Detalles de despliegue para acceder a la información relacionada con el despliegue en línea.
Creación de un despliegue en línea mediante programación utilizando cuadernos
Copy link to section
Puede crear un despliegue en línea mediante programación utilizando:
Para acceder a cuadernos de ejemplo que demuestran cómo crear y gestionar implementaciones mediante el cliente watsonx.ai Runtime Python, consulte Ejemplos y ejemplos de aprendizaje automático.
Prueba programática del despliegue en línea
Copy link to section
Para probar el despliegue en línea mediante programación, debe preparar una carga útil que coincida con el esquema de los requisitos de modelo existentes del activo desplegado. Por ejemplo, los datos de entrada (carga útil) para un modelo de clasificación deben coincidir con el esquema del modelo desplegado. El ejemplo siguiente para un modelo de clasificación proporciona datos de prueba con columnas y valores que coinciden exactamente con el esquema del modelo:
model_details = client.repository.get_details("<model_id>") # retrieves details and includes schema
columns_in_schema = []
for i inrange(0, len(model_details['entity']['schemas']['input'][0].get('fields'))):
columns_in_schema.append(model_details['entity']['schemas']['input'][0].get('fields')[i]['name'])
X = X[columns_in_schema] # where X is a pandas dataframe that contains values to be scored#(...)
scoring_values = X.values.tolist()
array_of_input_fields = X.columns.tolist()
payload_scoring = {"input_data": [{"fields": [array_of_input_fields],"values": scoring_values}]}
Copy to clipboardSe ha copiado en el portapapeles
Recuperación del punto final para un despliegue en línea mediante programación
Copy link to section
Para recuperar el URL de punto final del despliegue en línea de un cuaderno:
Para obtener información sobre cómo gestionar trabajos de despliegue y actualizar, escalar o suprimir un despliegue en línea, consulte Gestión de activos.
Para obtener más información sobre los puntos finales de implementación, consulte URL de puntos finales .