0 / 0
Volver a la versión inglesa de la documentación
Guardar indicaciones
Última actualización: 06 feb 2025
Guardar indicaciones

La ingeniería de solicitud implica prueba y error. Realice un seguimiento de su experimentación y guarde las combinaciones de modelo y solicitud que generan la salida que desea.

Al guardar el trabajo, puede optar por guardarlo como tipos de activos diferentes. Guardar su trabajo como activo permite compartir su trabajo con colaboradores en el proyecto actual.

Tabla 1: Tipos de activos utilizados para guardar avisos
Tipo de activo Cuándo utilizar este tipo de activo Qué se guarda Cómo recuperar el activo
Solicitar activo de plantilla Cuando encuentre una combinación de texto estático de solicitud, variables de solicitud y parámetros de ingeniería de solicitud que generen los resultados que desee de un modelo específico y deseen reutilizarlos. Texto del aviso, modelo, parámetros de ingeniería del aviso, variables del aviso y ajustes de los guardarraíles AI.
Nota: La salida generada por el modelo no se guarda como parte de la plantilla de solicitud a menos que la solicitud se haya creado en modalidad de conversación.
En la pestaña Plantillas de solicitud guardadas
Solicitar activo de sesión Cuando quieras llevar un registro de los pasos involucrados con tu experimentación para que sepas lo que has probado y lo que no. Texto del aviso, modelo, parámetros de ingeniería del aviso, configuración de las barreras de seguridad de IA y salida del modelo para un máximo de 500 avisos enviados durante una sesión de ingeniería de avisos. En la pestaña Historial
Activo portátil estándar Cuando desee trabajar con modelos de forma programática, pero quiera empezar desde la interfaz de Prompt Lab para una mejor experiencia de ingeniería de prontos. El texto del prompt, el modelo, los parámetros de ingeniería del prompt y los nombres y valores por defecto de las variables del prompt se formatean como código Python y se almacenan como cuaderno Python. Desde la página Activos del proyecto
Cuaderno de despliegue Cuando su pronta puede hacer funciones avanzadas como la búsqueda de documentos de base para las respuestas a las preguntas de un chat y desea implementar la función como un servicio de IA. Un servicio de IA desplegable que puede ser consumido por las API REST.
Nota: Sólo podrá guardar su trabajo como cuaderno de despliegue cuando seleccione un índice vectorial y utilice un modelo de chat.
Desde la página Activos del proyecto

Cada uno de estos tipos de activos está disponible en la página Activos del proyecto. Los colaboradores del proyecto con el rol de administrador o editor pueden abrir y trabajar con los activos. Sus activos de plantilla y sesión de avisos se bloquean automáticamente, pero puede desbloquearlos haciendo clic en el icono de bloqueo Icono de bloqueo.

Los editores y administradores pueden utilizar activos de plantilla de solicitud bloqueados para generar inferencias. Sólo el propietario del bloqueo puede utilizar un activo de sesión de solicitud bloqueado para generar inferencias.

Ahorro de su trabajo de ingeniería de comandos

Para guardar el trabajo de ingeniería de solicitud, realice los pasos siguientes:

  1. En la cabecera del editor de avisos, haga clic en el icono Guardar trabajo Icono Guardar y, a continuación, en Guardar como.

  2. Elija un tipo de activo.

    Si decide crear un cuaderno de flujo Gen AI desplegable, debe asociar la solicitud a un espacio de despliegue. Para obtener más información, consulte Espacios de despliegue.

    Puede hojear los 100 principales espacios de implementación.

  3. Asigne un nombre al activo y, a continuación, añada opcionalmente una descripción.

  4. Pulse Guardar.

Cómo trabajar con solicitudes guardadas en un cuaderno

Cuando guarda el trabajo como un activo de cuaderno, se crea un cuaderno Python .

Para trabajar con un activo de cuaderno de notas, siga el procedimiento para su tipo de cuaderno.

Cuaderno estándar

  1. Abra el activo de cuaderno desde la pestaña Activos del proyecto.

  2. Haga clic en el icono Editar Icono Editar para crear una instancia del cuaderno y poder recorrer el código.

    El cuaderno contiene código ejecutable que gestiona los pasos siguientes:

    • Se autentica con el servicio.
    • Define una clase Python .
    • Define el texto de entrada para el modelo y declara las variables de solicitud. Puede editar el texto de solicitud estático y asignar valores a las variables de solicitud.
    • Utiliza la clase definida para llamar a la API de inferencias de watsonx.ai y pasar su entrada al foundation model.
    • Muestra la salida generada por el foundation model.
    Nota: Para los avisos que inferencia modelos sintonizados que se almacenan en el proyecto, sustituya el ID de espacio con el ID del proyecto.
  3. Utilice el cuaderno tal cual, o cámbielo para satisfacer las necesidades de su caso de uso.

    El código Python que se genera utilizando el Prompt Lab Lab se ejecuta correctamente. Debe probar y validar los cambios que realice en el código.

Cuaderno de despliegue

  1. Abra el activo de cuaderno desde la pestaña Activos del proyecto.

  2. Haga clic en el icono Editar Icono Editar para crear una instancia del cuaderno y poder recorrer el código.

    El cuaderno contiene código ejecutable que gestiona los pasos siguientes:

    • Se autentica con el servicio.
    • Se conecta al espacio objetivo y promueve el índice vectorial.
    • Define el servicio de IA que se implementará. Esto incluye código para inicializar el índice de vectores, realizar consultas en el índice de vectores, formatear la entrada para el modelo y ejecutar inferencias.
    • Prueba el servicio de IA localmente.
    • Implementa el servicio de IA en el espacio de destino.
    • Prueba el servicio de IA implementado.
  3. Utilice el cuaderno tal cual, o cámbielo para satisfacer las necesidades de su caso de uso.

    El código Python que se genera utilizando el Prompt Lab Lab se ejecuta correctamente. Debe probar y validar los cambios que realice en el código.

  4. El servicio de IA implementado por el portátil se puede utilizar mediante una API REST. El siguiente es un ejemplo de solicitud de cURL para llamar a su implementación:

    curl --location '${PUBLIC_ENDPOINT}' \
    --header 'Content-Type: application/json' \
    --header 'Authorization: Bearer ${IAM_TOKEN}' \
    --data '{ \
      "input_data": [{
          "fields": ["Search", "Access token"],
          "values": [
            [${MESSAGES}],
            [${IAM_TOKEN}]]
        }]
    }'
    

    donde

    • PUBLIC_ENDPOINT es el punto final público de su implementación. Ver Crear implementaciones en línea .
    • IAM_TOKEN es el token de autenticación para accederIBM Cloud servicios. Ver Credenciales para acceso programático . El token de acceso que utilice debe estar asociado a la misma cuenta que el proyecto al que se hace referencia en el cuaderno.
    • MENSAJES es una matriz de entradas de texto del historial de chat con el siguiente esquema:
    {
       "role": type, // "user" or "assistant"
       "content": content // The text content of the message
    }
    

Para obtener más información sobre cómo implementar e inferir servicios de IA, consulte Implementación de servicios de IA con herramientas.

Cómo trabajar con plantillas de solicitud guardadas

Para seguir trabajando con una solicitud guardada, ábrala desde la pestaña Plantillas de solicitudes guardadas del Prompt Lab.

Al abrir una plantilla de solicitud guardada, Guardar automáticamente está activado, lo que significa que los cambios que realice en la solicitud se reflejarán en el activo de plantilla de solicitud guardada. Si desea que la plantilla de solicitud que ha guardado permanezca sin cambios, pulse Nueva solicitud para iniciar una nueva solicitud.

No puede cambiar las modalidades de edición desde una plantilla de solicitud guardada.

A diferencia de otras modalidades de edición, una plantilla de solicitud que se guarda en modalidad de conversación también almacena la salida del modelo. No puede conmutar a una modalidad diferente de una plantilla de solicitud que se ha guardado en modalidad de conversación.

Cuando se suministra watsonx.governance , si la plantilla de solicitud incluye al menos una variable de solicitud, puede evaluar la eficacia de las respuestas del modelo.

Nota: No se pueden desplegar ni evaluar plantillas de avisos guardadas que desplieguen por inferencia modelos de cimientos a petición.

Cómo trabajar con sesiones de solicitud guardadas

Para seguir trabajando con una sesión de avisos guardada, ábrala desde la pestaña Historial del Prompt Lab.

Para revisar los envíos de solicitudes anteriores, puede pulsar una entrada de solicitud del historial para abrirla en el editor de solicitudes. Si prefiere los resultados de la solicitud anterior, puede restablecerlos como solicitud actual pulsando Restaurar. Cuando restaura una solicitud anterior, la sesión de solicitud actual se sustituye por la versión anterior de la sesión de solicitud.

Más información

Tema principal: Prompt Lab