Inicio rápido: Provocar un foundation model con el patrón de generación de recuperación aumentada
Última actualización: 23 ene 2025
Inicio rápido: Provocar un foundation model con el patrón de generación de recuperación aumentada
Siga esta guía de aprendizaje para aprender a utilizar los modelos base en IBM watsonx.ai para generar una salida objetivamente precisa basada en la información en una base de conocimiento aplicando el patrón de generación aumentada de recuperación. Los modelos de base pueden generar resultados que son objetivamente inexactos por diversas razones. Una forma de mejorar la precisión de la salida generada es proporcionar los hechos necesarios como contexto en el texto de solicitud. Esta guía de aprendizaje utiliza un cuaderno de ejemplo utilizando el método de patrón de generación aumentada de recuperación para mejorar la precisión de la salida generada.
Servicios necesarios
estudio watsonx.ai
tiempo de ejecución de watsonx.ai
El flujo de trabajo básico incluye estas tareas:
Abra un proyecto. Los proyectos son la ubicación donde puede colaborar con otros para trabajar con los datos.
Añada un cuaderno al proyecto. Puede crear su propia libreta o añadir una libreta de muestra a su proyecto.
Añada y edite código y, a continuación, ejecute el cuaderno.
Revise la salida del cuaderno.
Leer sobre el patrón de generación de recuperación aumentada
Copy link to section
Puede escalar la técnica de incluir contexto en las solicitudes aprovechando la información de una base de conocimiento. El patrón de generación de recuperación aumentada implica tres pasos básicos:
Buscar contenido relevante en su base de conocimientos
Extraer el contenido más relevante en la solicitud como contexto
Enviar el texto de solicitud combinado al modelo para generar la salida
Vea un vídeo sobre el uso del patrón de generación de recuperación aumentada
Copy link to section
Vea este vídeo para obtener una vista preliminar de los pasos de esta guía de aprendizaje. Puede haber pequeñas diferencias en la interfaz de usuario que se muestra en el vídeo. El vídeo está pensado para ser un compañero del tutorial escrito.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Pruebe un tutorial para solicitar un foundation model con el patrón de generación de recuperación aumentada
Copy link to section
En esta guía de aprendizaje, realizará estas tareas:
Sugerencias para completar esta guía de aprendizaje Estas son algunas sugerencias para completar correctamente esta guía de aprendizaje.
Utilizar la imagen en imagen de vídeo
Copy link to section
Sugerencia: Inicie el vídeo y, a continuación, a medida que se desplaza por el tutorial, el vídeo se desplaza al modo de imagen en imagen. Cierre la tabla de contenido de vídeo para obtener la mejor experiencia con la imagen en imagen. Puede utilizar el modo de imagen en imagen para poder seguir el vídeo mientras completa las tareas de este tutorial. Pulse las indicaciones de fecha y hora para cada tarea a seguir.
La siguiente imagen animada muestra cómo utilizar las características de imagen en imagen y tabla de contenido de vídeo:
Para obtener la experiencia óptima al completar esta guía de aprendizaje, abra Cloud Pak for Data en una ventana de navegador y mantenga abierta esta página de la guía de aprendizaje en otra ventana de navegador para conmutar fácilmente entre las dos aplicaciones. Considere la posibilidad de organizar las dos ventanas del navegador una al lado de la otra para que sea más fácil de seguir.
Sugerencia: Si encuentra una visita guiada al completar esta guía de aprendizaje en la interfaz de usuario, pulse Quizás más tarde.
Tarea 1: Abrir un proyecto
Necesita un proyecto para almacenar el cuaderno de ejemplo.
Vea un vídeo para ver cómo crear un proyecto de recinto de pruebas y asociar un servicio. A continuación, siga los pasos para verificar que tiene un proyecto existente o cree un proyecto de recinto de pruebas.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Siga los pasos para verificar que tiene un proyecto existente o cree un proyecto.
En la pantalla de inicio de watsonx , desplácese a la sección Proyectos . Si ves algún proyecto en la lista, pasa a Asociar el servicio watsonx.ai Runtime. Si no ve ningún proyecto, siga estos pasos para crear un proyecto.
Pulse Crear un proyecto de recinto de pruebas. Cuando se cree el proyecto, verá el recinto de seguridad en la sección Proyectos .
Abra un proyecto existente o el nuevo proyecto de recinto de pruebas.
Asociar el servicio watsonx.ai Runtime al proyecto
Copy link to section
Usted utilizará ' watsonx.ai Runtime para solicitar el ' foundation model, así que siga estos pasos para asociar su instancia de servicio ' watsonx.ai Runtime con su proyecto.
En el proyecto, pulse el separador Gestionar .
Pulse la página Servicios e integraciones .
Comprueba si este proyecto tiene asociado un servicio watsonx.ai Runtime. Si no hay ningún servicio asociado, siga estos pasos:
Pulse Asociar servicio.
Marque la casilla situada junto a su instancia de servicio watsonx.ai Runtime.
Pulse Asociar.
Si es necesario, pulse Cancelar para volver a la página Servicios e integraciones .
La imagen siguiente muestra el separador Gestionar con el servicio asociado. Ahora está preparado para añadir el cuaderno de ejemplo al proyecto.
Tarea 2: Añadir el cuaderno de ejemplo al proyecto
El cuaderno de ejemplo utiliza una pequeña base de conocimiento y un componente de búsqueda simple para demostrar el patrón básico. El escenario utilizado en este cuaderno es para una empresa que vende semillas para plantar en un jardín. El sitio web para un catálogo de semillas en línea tiene muchos artículos para ayudar a los clientes a planificar su jardín y, en última instancia, seleccionar qué semillas comprar. El nuevo widge se está añadiendo a la página web para responder a las preguntas de los clientes sobre el contenido de los artículos.
Vea este vídeo para ver cómo añadir un cuaderno de ejemplo a un proyecto y, a continuación, siga los pasos para añadir el cuaderno al proyecto.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Seleccione el proyecto en la lista y pulse Añadir.
Escriba el nombre y la descripción del cuaderno (opcional).
Seleccione un entorno de ejecución para este cuaderno.
Pulse Crear. Espere a que se cargue el editor de cuadernos.
En el menú, pulse Kernel > Reiniciar y Borrar saliday, a continuación, confirme pulsando Reiniciar y borrar todas las salidas para borrar la salida de la última ejecución guardada.
La imagen siguiente muestra el cuaderno abierto en modalidad de edición. Ahora está preparado para configurar los requisitos previos para ejecutar el cuaderno.
Tarea 3: Editar el cuaderno
' Para previsualizar esta tarea, vea el vídeo que comienza en 00:57.
Para poder ejecutar el cuaderno, debe configurar el entorno. Siga estos pasos para verificar los requisitos previos del cuaderno:
Desplácese a la sección Para IBM watsonx en IBM Cloud del cuaderno para ver los dos requisitos previos para ejecutar el cuaderno.
En la sección Crear una clave de API IBM Cloud, debe pasar sus credenciales a la API de tiempo de ejecución de watsonx.ai mediante una clave de API. Si todavía no tiene una clave de API guardada, siga estos pasos para crear una clave de API.
Pulse Crear una clave de API de IBM Cloud. Si tiene alguna clave de API existente, el botón se puede etiquetar como Crear.
Escriba un nombre y una descripción.
Pulse Crear.
Copie la clave de API.
Descargue la clave de API para su uso futuro.
Revise la sección Asociar una instancia del servicio watsonx.ai Runtime con el proyecto actual. Ha completado este requisito previo en la Tarea 1.
Desplácese a la sección Ejecutar la célula para proporcionar la clave de API de IBM Cloud :
Haga clic en el icono Ejecutar ' para ejecutar la celda.
Pegue la clave de API y pulse Enter.
En ' Ejecuta la celda para establecer las credenciales para ' IBM ' watsonx en ' IBM Cloud, haga clic en el icono ' Ejecutar ' para ejecutar la celda y establecer las credenciales.
' Comprueba tu progreso
Copy link to section
Las imágenes siguientes muestran el cuaderno con los requisitos previos completados. Ahora está preparado para ejecutar el cuaderno y revisar la salida.
Tarea 4: Ejecutar el cuaderno y revisar la salida
Para obtener una vista preliminar de esta tarea, vea el vídeo que empieza en 01:03.
El cuaderno de ejemplo incluye información sobre la generación aumentada de recuperación y cómo puede adaptar el cuaderno para su caso de uso específico. Siga estos pasos para ejecutar el cuaderno y revisar la salida:
Desplácese a la sección Paso 2: Crear una base de conocimiento del cuaderno:
Haga clic en el icono Ejecutar ' ' para cada una de las tres celdas de esa sección.
Revise la salida para las tres celdas de la sección. El código de estas celdas establece la base de conocimientos como una colección de dos artículos. Estos artículos se han escrito como ejemplos para watsonx.ai, no son artículos reales publicados en ningún otro lugar. Los autores y las fechas de publicación son ficticios.
Desplácese hasta la sección Paso 3: Crear un componente de búsqueda simple en el cuaderno:
Haga clic en el icono Ejecutar ' ' para cada una de las dos celdas de esa sección.
Revise la salida de las dos celdas de la sección. El código de estas celdas crea un componente de búsqueda simple. Muchos artículos que discuten la generación aumentada de recuperación asumen que el componente de recuperación utiliza una base de datos de vectores. Sin embargo, para realizar el patrón de generación general de recuperación aumentada, cualquier método de búsqueda y recuperación que pueda devolver de forma fiable contenido relevante de la base de conocimiento lo hará. En este cuaderno, el componente de búsqueda es una función de búsqueda trivial que devuelve el índice de uno u otro de los dos artículos de la base de conocimiento, basándose en una coincidencia de expresión regular simple.
Desplácese a la sección Paso 4: Texto de solicitud de especialidad en el cuaderno:
Haga clic en el icono Ejecutar ' ' para cada una de las dos celdas de esa sección.
Revise la salida de las dos celdas de la sección. El código de estas celdas elabora el texto de solicitud. No hay nadie, la mejor solicitud para una tarea determinada. Sin embargo, los modelos que se han ajustado mediante instrucciones, como bigscience/mt0-xxl-13b, google/flan-t5-xxl-11bo google/flan-ul2-20b, generalmente pueden realizar esta tarea con una solicitud de ejemplo. Los métodos de decodificación conservadores tienden a respuestas sucintas. En la solicitud, observe dos marcadores de serie (marcados con %s) que se sustituirán en el momento de la generación:
El primer marcador se sustituirá por el texto del artículo pertinente de la base de conocimientos
El segundo marcador de posición se sustituirá por la pregunta que se va a responder
Desplácese hasta la sección Paso 5: Generar salida utilizando los modelos base de la biblioteca Python en el cuaderno:
Haga clic en el icono Ejecutar ' ' para cada una de las tres celdas de esa sección.
Revise la salida para las tres celdas de la sección. El código de estas celdas genera salida utilizando la biblioteca Python . Puede solicitar modelos de base en watsonx.ai mediante programación utilizando la biblioteca Python . Para obtener más información sobre la biblioteca, consulte los temas siguientes:
Desplácese a la sección Paso 6: Reunir todo para realizar la recuperación-generación aumentada en el cuaderno:
Haga clic en el icono Ejecutar ' ' para cada una de las dos celdas de esa sección. Este código reúne todo para realizar la generación aumentada de recuperación.
Revise la salida de la primera celda de la sección. El código de esta celda configura los elementos de entrada de usuario.
Para la segunda celda de la sección, escriba una pregunta relacionada con los tomates o pepinos para ver la respuesta y la fuente. Por ejemplo, Do I use mulch with tomatoes?.
Revise la respuesta a su pregunta.
' Comprueba tu progreso
Copy link to section
La imagen siguiente muestra el cuaderno completado.
Próximos pasos
Copy link to section
' Vea el vídeo que comienza en 02:55 para conocer las consideraciones para aplicar el patrón de generación de recuperación aumentada a una solución de producción.
Acerca de las cookies de este sitioNuestros sitios web necesitan algunas cookies para funcionar correctamente (necesarias). Además, se pueden utilizar otras cookies con su consentimiento para analizar el uso del sitio, para mejorar la experiencia del usuario y para publicidad.Para obtener más información, consulte sus opciones de preferencias de cookies. Al visitar nuestro sitio web, acepta que procesemos la información tal y como se describe en ladeclaración de privacidad de IBM.Para facilitar la navegación, sus preferencias de cookies se compartirán entre los dominios web de IBM que se muestran aquí.