0 / 0
Volver a la versión inglesa de la documentación
Creación de un activo modelo
Última actualización: 21 nov 2024
Creación de un activo modelo

Una vez cargado el foundation model personalizado en el almacenamiento de objetos en la nube, cree una conexión con el modelo y un activo de modelo correspondiente. Utilice la conexión para crear un activo modelo en un proyecto o espacio.

Para crear un activo de modelo, añada una conexión al modelo y, a continuación, cree un activo de modelo. Si desea probar primero su " foundation model " personalizado en un proyecto (por ejemplo, evaluándolo en un cuaderno Jupyter), añada su activo " foundation model personalizado a un proyecto y, a continuación, promuévalo a un espacio.

Después de añadir el activo de modelo, puede desplegarlo y utilizar Prompt Lab para inferirlo.

Importante:
  • Si subes tu modelo a un almacenamiento remoto en la nube, debes crear una conexión basada en tus credenciales personales. Con el almacenamiento remoto en la nube sólo se permiten conexiones que utilicen credenciales personales. Como resultado, otros usuarios del mismo espacio de despliegue no obtienen acceso al contenido del modelo, pero se les permite hacer inferencias sobre los despliegues del modelo. Cree la conexión utilizando su clave de acceso y su clave de acceso secreta. Para obtener información sobre cómo habilitar las credenciales personales para tu cuenta, consulta Configuración de la cuenta.

Antes de empezar

Debe activar las credenciales de tarea para poder desplegar un foundation model personalizado. Para obtener más información, consulte Añadir credenciales de tareas.

Añadir una conexión a su modelo

Puede añadir una conexión a su modelo desde un espacio de despliegue o desde un proyecto. Para añadir una conexión mediante programación, consulte Creación de una conexión mediante el cliente Python o Creación de una conexión mediante la API.

Nota:

Para utilizar la API watsonx.ai, necesitas un token de portador. Para obtener más información, consulte Credenciales de acceso programático.

Añadir una conexión al modelo desde su espacio de despliegue

Para añadir una conexión al modelo desde su espacio de despliegue:

  1. Vaya a la pestaña Activos y haga clic en Importar activos.
  2. Seleccione Activos de datos y, a continuación, siga los pasos que aparecen en pantalla.
Importante:

Para Credenciales, seleccione Access key and Secret access key. Si selecciona cualquier otra opción, su despliegue no funcionará.

Añadir una conexión al modelo desde su proyecto

Para añadir una conexión al modelo desde tu proyecto:

  1. Vaya a la pestaña Activos y haga clic en Nuevo activo.
  2. seleccione Conectarse a una fuente de datos y, a continuación, siga los pasos que aparecen en pantalla.
Importante:

Para Credenciales, seleccione Access key and Secret access key. Si selecciona cualquier otra opción, su despliegue no funcionará.

Para obtener información detallada sobre cómo crear tipos específicos de conexiones, consulte Conectores.

Creación de un activo modelo

Para crear un activo de foundation model personalizado:

  1. En su espacio de despliegue o en su proyecto, vaya a Activos y, a continuación, haga clic en Importar activos.

  2. Seleccione foundation model personalizado.

  3. Seleccione la conexión al almacenamiento en la nube donde se encuentra el modelo.

  4. Seleccione la carpeta que contiene su modelo.

    Importación de un foundation model personalizado

  5. Especifique la información necesaria. Si no envía ninguna entrada para los parámetros del modelo, se utilizarán los valores por defecto.

    Parametrización de un foundation model personalizado

  6. Haga clic en Importar.

Para obtener información sobre los parámetros de modelo disponibles, consulte Parámetros globales para modelos de cimentación personalizados.

Creación programática de un activo foundation model personalizado

Nota:

Para utilizar la API watsonx.ai, necesitas un token de portador. Para obtener más información, consulte Credenciales de acceso programático.

Para obtener información sobre los parámetros de modelo disponibles, consulte Parámetros globales para modelos de cimentación personalizados. Si no envía ninguna entrada para los parámetros del modelo, se utilizarán los valores por defecto.

Véase el código de ejemplo para añadir un activo de modelo a un espacio de despliegue:

curl -X POST "https://<your cloud hostname>/ml/v4/models?version=2024-01-29" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '{
    "type": "custom_foundation_model_1.0",
    "framework": "custom_foundation_model",
    "version": "1.0",
    "name": "<asset name>",
    "software_spec": {
        "name": "<name of software specification>"
    },
    "space_id": "<your space ID>",
    "foundation_model": {
        "model_id": "<model ID>",
        "parameters": [
        {
            "name": "dtype",
            "default": "float16",
            "type": "string",
            "display_name": "Data Type",
            "options": ["float16","bfloat16"]
        },
        {
            "name": "max_batch_size",
            "default": 256,
            "type": "number",
            "display_name": "Max Batch Size"
        }],

        "model_location": {
            "type": "connection_asset",
            "connection": {
                "id": "<your connection ID>"
            },
            "location": {
                "bucket": "<bucket where the model is located>",
                "file_path": "<subpath to model files, if required>"
            }
        }
    }
}'

Véase el código de ejemplo para añadir un activo de modelo a un proyecto:

curl -X POST "https://<your cloud hostname>/ml/v4/models?version=2024-01-29" \
-H "Authorization: Bearer $TOKEN" \
-H "content-type: application/json" \
--data '{
    "type": "custom_foundation_model_1.0",
    "framework": "custom_foundation_model",
    "version": "1.0",
    "name": "<asset name>",
    "software_spec": {
        "name": "<name of software specification>"
    },
    "project_id": "<your project ID>",
    "foundation_model": {
        "model_id": "<model ID>",
        "parameters": [
        {
            "name": "dtype",
            "default": "float16",
            "type": "string",
            "display_name": "Data Type",
            "options": ["float16","bfloat16"]
        },
        {
            "name": "max_batch_size",
            "default": 256,
            "type": "number",
            "display_name": "Max Batch Size"
        }],

        "model_location": {
            "type": "connection_asset",
            "connection": {
                "id": "<your connection ID>"
            },
            "location": {
                "bucket": "<bucket where the model is located>",
                "file_path": "<subpath to model files, if required>"
            }
        }
    }
}'

Parámetros globales para modelos de cimentación personalizados

Puede utilizar parámetros globales para desplegar sus modelos de base personalizados. Ajuste el valor del parámetro de su modelo base dentro del rango que se especifica en la siguiente tabla. Si no lo hace, su despliegue podría fallar y la inferencia no será posible.

Parámetros globales para modelos de cimentación personalizados
Parámetro Tipo Rango de valores Valor predeterminado Descripción
dtype Serie float16, bfloat16 float16 Utilice este parámetro para especificar el tipo de datos de su modelo.
max_batch_size Número max_batch_size >= 1 256 Utilice este parámetro para especificar el tamaño máximo de lote para su modelo.
max_concurrent_requests Número max_concurrent_requests >= 1 y max_concurrent_requests >= max_batch_size 1024 Utilice este parámetro para especificar el número máximo de peticiones concurrentes que se pueden hacer a su modelo. Este parámetro no está disponible para las implantaciones que utilizan la watsonx-cfm-caikit-1.1 especificación de software.
max_new_tokens Número max_new_tokens >= 20 2047 Utilice este parámetro para especificar el número máximo de tokens que su modelo generará para una solicitud de inferencia.
max_sequence_length Número max_sequence_length >= 20 y max_sequence_length > max_new_tokens 2048 Utilice este parámetro para especificar la longitud máxima de la secuencia para su modelo.

Próximos pasos

Implantación de un foundation model personalizado

Tema principal: Despliegue de un foundation model personalizado

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información