Una vez cargado el foundation model personalizado en el almacenamiento de objetos en la nube, cree una conexión con el modelo y un activo de modelo correspondiente. Utilice la conexión para crear un activo modelo en un proyecto o espacio.
Para crear un activo de modelo, añada una conexión al modelo y, a continuación, cree un activo de modelo. Si desea probar primero su " foundation model " personalizado en un proyecto (por ejemplo, evaluándolo en un cuaderno Jupyter), añada su activo " foundation model personalizado a un proyecto y, a continuación, promuévalo a un espacio.
Después de añadir el activo de modelo, puede desplegarlo y utilizar Prompt Lab para inferirlo.
- Si subes tu modelo a un almacenamiento remoto en la nube, debes crear una conexión basada en tus credenciales personales. Con el almacenamiento remoto en la nube sólo se permiten conexiones que utilicen credenciales personales. Como resultado, otros usuarios del mismo espacio de despliegue no obtienen acceso al contenido del modelo, pero se les permite hacer inferencias sobre los despliegues del modelo. Cree la conexión utilizando su clave de acceso y su clave de acceso secreta. Para obtener información sobre cómo habilitar las credenciales personales para tu cuenta, consulta Configuración de la cuenta.
Antes de empezar
Debe activar las credenciales de tarea para poder desplegar un foundation model personalizado. Para obtener más información, consulte Añadir credenciales de tareas.
Añadir una conexión a su modelo
Puede añadir una conexión a su modelo desde un espacio de despliegue o desde un proyecto. Para añadir una conexión mediante programación, consulte Creación de una conexión mediante el cliente Python o Creación de una conexión mediante la API.
Para utilizar la API watsonx.ai, necesitas un token de portador. Para obtener más información, consulte Credenciales de acceso programático.
Añadir una conexión al modelo desde su espacio de despliegue
Para añadir una conexión al modelo desde su espacio de despliegue:
- Vaya a la pestaña Activos y haga clic en Importar activos.
- Seleccione Activos de datos y, a continuación, siga los pasos que aparecen en pantalla.
Para Credenciales, seleccione Access key and Secret access key
. Si selecciona cualquier otra opción, su despliegue no funcionará.
Añadir una conexión al modelo desde su proyecto
Para añadir una conexión al modelo desde tu proyecto:
- Vaya a la pestaña Activos y haga clic en Nuevo activo.
- seleccione Conectarse a una fuente de datos y, a continuación, siga los pasos que aparecen en pantalla.
Para Credenciales, seleccione Access key and Secret access key
. Si selecciona cualquier otra opción, su despliegue no funcionará.
Para obtener información detallada sobre cómo crear tipos específicos de conexiones, consulte Conectores.
Creación de un activo modelo
Para crear un activo de foundation model personalizado:
En su espacio de despliegue o en su proyecto, vaya a Activos y, a continuación, haga clic en Importar activos.
Seleccione foundation model personalizado.
Seleccione la conexión al almacenamiento en la nube donde se encuentra el modelo.
Seleccione la carpeta que contiene su modelo.
Especifique la información necesaria. Si no envía ninguna entrada para los parámetros del modelo, se utilizarán los valores por defecto.
Haga clic en Importar.
Para obtener información sobre los parámetros de modelo disponibles, consulte Parámetros globales para modelos de cimentación personalizados.
Creación programática de un activo foundation model personalizado
Para utilizar la API watsonx.ai, necesitas un token de portador. Para obtener más información, consulte Credenciales de acceso programático.
Para obtener información sobre los parámetros de modelo disponibles, consulte Parámetros globales para modelos de cimentación personalizados. Si no envía ninguna entrada para los parámetros del modelo, se utilizarán los valores por defecto.
Véase el código de ejemplo para añadir un activo de modelo a un espacio de despliegue:
curl -X POST "https://<your cloud hostname>/ml/v4/models?version=2024-01-29" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '{
"type": "custom_foundation_model_1.0",
"framework": "custom_foundation_model",
"version": "1.0",
"name": "<asset name>",
"software_spec": {
"name": "<name of software specification>"
},
"space_id": "<your space ID>",
"foundation_model": {
"model_id": "<model ID>",
"parameters": [
{
"name": "dtype",
"default": "float16",
"type": "string",
"display_name": "Data Type",
"options": ["float16","bfloat16"]
},
{
"name": "max_batch_size",
"default": 256,
"type": "number",
"display_name": "Max Batch Size"
}],
"model_location": {
"type": "connection_asset",
"connection": {
"id": "<your connection ID>"
},
"location": {
"bucket": "<bucket where the model is located>",
"file_path": "<subpath to model files, if required>"
}
}
}
}'
Véase el código de ejemplo para añadir un activo de modelo a un proyecto:
curl -X POST "https://<your cloud hostname>/ml/v4/models?version=2024-01-29" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '{
"type": "custom_foundation_model_1.0",
"framework": "custom_foundation_model",
"version": "1.0",
"name": "<asset name>",
"software_spec": {
"name": "<name of software specification>"
},
"project_id": "<your project ID>",
"foundation_model": {
"model_id": "<model ID>",
"parameters": [
{
"name": "dtype",
"default": "float16",
"type": "string",
"display_name": "Data Type",
"options": ["float16","bfloat16"]
},
{
"name": "max_batch_size",
"default": 256,
"type": "number",
"display_name": "Max Batch Size"
}],
"model_location": {
"type": "connection_asset",
"connection": {
"id": "<your connection ID>"
},
"location": {
"bucket": "<bucket where the model is located>",
"file_path": "<subpath to model files, if required>"
}
}
}
}'
Parámetros globales para modelos de cimentación personalizados
Puede utilizar parámetros globales para desplegar sus modelos de base personalizados. Ajuste el valor del parámetro de su modelo base dentro del rango que se especifica en la siguiente tabla. Si no lo hace, su despliegue podría fallar y la inferencia no será posible.
Parámetro | Tipo | Rango de valores | Valor predeterminado | Descripción |
---|---|---|---|---|
dtype |
Serie | float16 , bfloat16 |
float16 |
Utilice este parámetro para especificar el tipo de datos de su modelo. |
max_batch_size |
Número | max_batch_size >= 1 |
256 | Utilice este parámetro para especificar el tamaño máximo de lote para su modelo. |
max_concurrent_requests |
Número | max_concurrent_requests >= 1 y max_concurrent_requests >= max_batch_size |
1024 | Utilice este parámetro para especificar el número máximo de peticiones concurrentes que se pueden hacer a su modelo. Este parámetro no está disponible para las implantaciones que utilizan la watsonx-cfm-caikit-1.1 especificación de software. |
max_new_tokens |
Número | max_new_tokens >= 20 |
2047 | Utilice este parámetro para especificar el número máximo de tokens que su modelo generará para una solicitud de inferencia. |
max_sequence_length |
Número | max_sequence_length >= 20 y max_sequence_length > max_new_tokens |
2048 | Utilice este parámetro para especificar la longitud máxima de la secuencia para su modelo. |
Próximos pasos
Implantación de un foundation model personalizado
Tema principal: Despliegue de un foundation model personalizado