Decisiones estratégicas iniciales

Última actualización: 04 mar 2025

Antes de empezar a planificar su solución de IA generativa, debe tomar algunas decisiones estratégicas clave. Su estrategia debe tener en cuenta los requisitos y prioridades de su organización, las habilidades y preferencias de su equipo de desarrollo, sus requisitos de datos y los requisitos de la solución.

Para establecer la estrategia de implantación de su solución de IA generativa, tome las siguientes decisiones:

¿Cuál es su caso de uso?
A quién implicar
Cómo gestionar el riesgo y el cumplimiento
Cómo desarrollar su solución
Cómo elegir un modelo
Cómo preparar los datos
Cómo evaluar la calidad y mitigar los riesgos
Cómo optimizar y gestionar los modelos de cimentación
Cómo entregar y mantener su solución

¿Cuál es su caso de uso?

Comprenda el objetivo de su solución, si ese objetivo es factible y valioso, y cómo puede determinar cuándo está lista su solución:

Tarea de IA generativa: ¿Qué necesita que haga el modelo?
Salidas conversacionales o separadas: Comprenda si necesita una experiencia conversacional en la que los usuarios chatean con un modelo que conserva el contexto de las interacciones anteriores o si cada interacción con el modelo es independiente. Algunas tareas, como la clasificación, el resumen o la generación, pueden no beneficiarse de una conversación. Las conversaciones cuestan más que las salidas separadas porque las conversaciones incluyen el historial de chat con cada entrada.
Viabilidad: Comprenda los límites de los modelos de cimentación para poder evaluar si su caso de uso es viable. Por ejemplo, puede comprobar las puntuaciones de referencia del modelo para el tipo de caso de uso que desea implantar.
Valor empresarial: Considere si los beneficios de la solución son mayores que el coste de su funcionamiento.
Criterios de éxito: Decidir cómo medir el éxito de la solución. Por ejemplo, puede basarse en las métricas de evaluación o en los comentarios de los usuarios objetivo.

A quién implicar

Si involucra a las partes interesadas adecuadas desde el principio, correrá menos riesgo de tener que cambiar de dirección o repetir partes del proceso. Como mínimo, implique a las partes interesadas de estos equipos en el proceso de planificación:

Personas que definen las prioridades y los procesos de su organización: Necesita que estas personas le informen de los requisitos y restricciones que debe cumplir. Puede que necesite documentar información específica sobre su solución, seguir un flujo de trabajo para cumplir una normativa o seleccionar un modelo con un tipo de fuente concreto. Por ejemplo, su organización puede exigirle que seleccione un modelo de código abierto.
Personas que utilizan la solución: Necesita a estas personas para definir los requisitos de la solución y para ayudar a probar y validar que la solución funciona en sus procesos.
Personas que crean la solución: Necesita que estas personas participen en el diseño y las decisiones operativas. Este equipo de colaboradores podría incluir diseñadores, ingenieros de datos, ingenieros de IA, científicos de datos y gestores de riesgos y cumplimiento. Si está implantando una solución de generación aumentada por recuperación en su documentación, considere la posibilidad de incluir a sus redactores de contenidos, que pueden adaptar el contenido para la IA.

Cómo gestionar el riesgo y el cumplimiento

Si comprende sus riesgos y necesidades de cumplimiento antes de empezar a desarrollar su solución, podrá estar mejor preparado para las auditorías posteriores.

Riesgos relacionados con la IA: Comprender las dimensiones clave del riesgo, como el riesgo de reputación, normativo y operativo. Los riesgos de utilizar IA generativa incluyen los mismos riesgos que para los modelos tradicionales de aprendizaje automático, riesgos que se ven amplificados por la IA generativa y nuevos riesgos específicos de la IA generativa. Por ejemplo, el riesgo de generar resultados con contenidos inexactos o falsos, lo que se denomina alucinar, es específico de la IA generativa.
Cumplimiento legal y reglamentario: Determine qué leyes y normativas debe cumplir, los métodos de seguimiento del cumplimiento y los métodos para garantizarlo. Por ejemplo, su organización podría exigir una evaluación formal de riesgos o un flujo de trabajo de aprobación para las soluciones de IA.
Documentación de casos prácticos: Cree un caso de uso de IA para recopilar toda la información para gestionar un modelo o plantilla de solicitud desde la fase de solicitud, pasando por el desarrollo, hasta la producción. Documentar su caso de uso proporciona una forma práctica de realizar un seguimiento de su progreso, independientemente de que su organización lo exija o no con fines normativos.

Más información sobre riesgo y cumplimiento

Cómo desarrollar su solución

Usted y su equipo de desarrollo pueden elegir entre diferentes herramientas y métodos en la interfaz de usuario de watsonx.ai o trabajar totalmente con código:

Lenguaje de codificación

Si quieres escribir código, puedes elegir entre API REST, Python y código Node.js. Los factores para elegir el lenguaje incluyen las preferencias y habilidades de sus desarrolladores, cómo quiere desplegar la solución y cuánto trabajo quiere hacer su equipo en su entorno de desarrollo interactivo (IDE) frente a la interfaz de usuario de watsonx.ai.

Nivel de automatización

Puede elegir qué parte del código de la solución se genera por usted:

Sin código: Puede completar todas las tareas de ingeniería rápida, ajuste de modelos e incrustación y vectorización de documentos con herramientas. Por ejemplo, puede automatizar la búsqueda del mejor patrón RAG con AutoAI para RAG, crear una plantilla de aviso en Prompt Lab y construir un agente de IA en Agent Lab.
Algo de código: Puedes generar cuadernos Python con muchas herramientas y luego adaptar el código según sea necesario. Por ejemplo, puede generar un cuaderno basado en una plantilla de aviso, para incrustar y vectorizar documentos, o para implementar un agente de IA.
Todo el código: Puedes escribir código con las API REST en tu IDE. Puedes escribir y ejecutar código con bibliotecas Python con el editor de cuadernos.

Funcionalidad

La mayor parte de la funcionalidad de watsonx.ai está disponible tanto con herramientas en la interfaz de usuario como con código, como API y SDK.

Más información sobre los métodos de trabajo

Cómo elegir un modelo

No es necesario elegir un modelo antes de planificar la solución. Sin embargo, si comprende qué criterios son los más importantes para usted y su organización, podrá reducir el riesgo de seleccionar un modelo inadecuado.

Tarea: La tarea que desea que realice el modelo puede ser un factor limitante a la hora de elegir un modelo. Para muchas tareas de modelado, puede elegir entre varios modelos. Sin embargo, para otras tareas modelo, como traducir o responder en un idioma distinto del inglés, tiene menos opciones.
Coste: El coste de la inferencia varía según los modelos. Si mantener bajos los costes de inferencia es una prioridad para usted, elija un modelo más barato, un modelo más pequeño, un modelo cuantizado o un modelo que pueda ajustar.
Impacto medioambiental: En general, los modelos más grandes tienen un mayor impacto ambiental tanto durante el entrenamiento como durante la inferencia. Los modelos más pequeños y cuantificados tienen un menor impacto ambiental.
Precisión y otras puntuaciones: Puede comparar los puntos de referencia de los modelos y elegir el que tenga puntuaciones altas en las áreas más importantes para usted.
Indemnización y modelo de origen: Es posible que su organización tenga políticas sobre la elección de modelos que sean transparentes en cuanto a sus datos de formación, que sean de código abierto o que ofrezcan indemnizaciones.
Personalización: Puede personalizar un modelo para un dominio específico ajustándolo. Puedes elegir afinar algunos modelos que se proporcionan con watsonx.ai en el Tuning Studio. Alternativamente, puede ajustar un modelo en una herramienta externa e importar su modelo personalizado en watsonx.ai.; Puede añadir conocimientos o habilidades a los modelos de IBM Granite con InstructLab.; Si desea implementar modelos de base en su propio centro de datos, puede adquirir e instalar el softwar watsonx.ai.

Más información sobre cómo elegir un modelo de base

Cómo preparar los datos

Los modelos Foundation se entrenan con grandes cantidades de datos, pero no con los datos internos de su empresa. Si necesita un modelo de base para conocer los datos de su empresa, debe decidir cómo proporcionarle sus datos al modelo.

Documentos de puesta a tierra: Si necesita una solución que responda a las preguntas basando el modelo en la información de sus documentos, puede configurar un patrón de generación aumentada por recuperación (RAG). En un patrón RAG, usted vectoriza sus documentos para una recuperación eficaz de los pasajes que responden a las preguntas de los usuarios.
Datos de ajuste y comprobación: Si necesita mejorar o adaptar el resultado a tareas de procesamiento del lenguaje natural como la clasificación, el resumen y la generación, puede ajustar el modelo. Si desea comprobar la calidad de su mensaje, puede evaluarlo con métricas de IA generativa. Para ambas tareas, debe proporcionar un conjunto de ejemplos de entrada y salida validados. Si sus datos contienen información sensible, como información de identificación personal (IIP), asegúrese de conocer la política de su organización al respecto. Por ejemplo, puede que necesite enmascarar PII o generar datos sintéticos para ajustar o probar su modelo.
Conocimientos o competencias: Proporcionar conjuntos de datos que sirvan de base al modelo. Puede utilizar IntructLab para aumentar un modelo de base existente con las capacidades necesarias para su caso de uso. Usted proporciona ejemplos de semillas o datos de base que son la base para generar datos sintéticos para la instrucción que ajusta el modelo de base.

Más información sobre la preparación de datos

Cómo evaluar la calidad y mitigar los riesgos

Debe decidir cómo medir la calidad y garantizar la seguridad.

Evaluación: Puede evaluar el rendimiento y los riesgos de la solución en función de las métricas estándar del sector. Puede medir la precisión textual, la similitud y la calidad del resultado del modelo de base. También puede evaluar la equidad, el rendimiento y la deriva de los resultados del modelo. Puede evaluar el rendimiento de varios activos simultáneamente y ver análisis comparativos de resultados para identificar las mejores soluciones. Estas métricas le ayudan a garantizar que las soluciones de IA están libres de sesgos, pueden ser explicadas y comprendidas fácilmente por los usuarios empresariales y son auditables en las transacciones comerciales.
Evaluación de riesgos: Puede identificar los riesgos potenciales completando un cuestionario de evaluación de riesgos.
Límites: Puede activar las barandillas para eliminar el contenido potencialmente dañino o el contenido PII tanto del texto de entrada como del de salida en los avisos.
Pruebas: Considere la posibilidad de crear un equipo rojo para emular ataques adversarios.

Más información para evaluar la calidad y mitigar los riesgos

Cómo optimizar y gestionar los modelos de cimentación

Puede optimizar un modelo de base para mejorar la precisión, el coste, la latencia de inferencia y el control del ciclo de vida del modelo.

Optimización por defecto: IBM proporciona un conjunto de modelos básicos que se despliegan en hardware multiarrendamiento. La inferencia se paga por ficha. IBM controla el ciclo de vida de los modelos actualizándolos y eliminándolos. Cuando un modelo queda obsoleto, debe actualizar su solución para inferir la nueva versión del modelo o un modelo diferente.
Optimizar la precisión y los costes: Si necesita mejorar la precisión de su modelo y reducir costes mediante la inferencia de un modelo de base más pequeño, puede ajustar un modelo de base proporcionado. Se despliega un modelo de sintonización de avisos en hardware multiarrendamiento y se paga la inferencia por token.
Optimice la precisión y el control: Si has entrenado o ajustado un modelo externo a watsonx.ai para tu caso de uso, puedes importar y desplegar un modelo personalizado. Despliegue el modelo en hardware dedicado. Se paga por hora de alojamiento del modelo en lugar de por la inferencia. Usted controla el ciclo de vida del modelo.
Optimización de la latencia y el control: Si su solución debe dar soporte a un elevado número de usuarios simultáneos, puede desplegar un modelo de despliegue bajo demanda proporcionado por IBM en hardware dedicado. El hardware dedicado proporciona una latencia menor que el hardware multiusuario. Se paga por hora de alojamiento del modelo en lugar de por la inferencia. Usted controla el ciclo de vida del modelo.

Más información sobre la optimización y gestión de los modelos de cimentación

Cómo entregar y mantener su solución

Debe decidir cómo ofrecer su solución gen AI y ayudar a garantizar su calidad continua.

Implantar su solución: Para inferir un modelo de base, se implementa un punto final al que se llama en la aplicación para inferir el modelo. Dependiendo de la arquitectura de su solución de IA general, el punto final podría estar en un fragmento de código, una función de e Python, un servicio de IA o un código desarrollado por su equipo.
Gestión de ModelOps con espacios de despliegue: Puede apoyar un flujo ModelOps mediante la creación de espacios de despliegue separados para las versiones de prueba, staging y producción de su solución. Puede gestionar el acceso a su solución de producción añadiendo los colaboradores adecuados a cada espacio.
Monitoring: De forma similar a la evaluación de su solución durante el desarrollo, puede supervisar el rendimiento y los riesgos de la solución, como la imparcialidad, la calidad y la explicabilidad. Puedes ver las tendencias a lo largo del tiempo y establecer umbrales para que te avisen cuando baje el rendimiento.
Comentarios de usuarios: Considere la posibilidad de implantar un mecanismo para recabar las opiniones de los usuarios y crear un proceso para recogerlas y mejorar su solución con ellas. Por ejemplo, si implementa un patrón RAG, puede añadir un mecanismo de retroalimentación para que los usuarios evalúen las respuestas a sus preguntas. Puede establecer un proceso para evaluar las respuestas incorrectas e inadecuadas y adaptar el patrón RAG o adaptar su contenido para ofrecer mejores respuestas.

Más información sobre entrega y mantenimiento

Más información

Comparación de las herramientas con el código

Tema principal: Planificación de una solución de IA generativa

¿Fue útil el tema?

0/1000

¿Cuál es su caso de uso?Copy link to section

A quién implicarCopy link to section

Cómo gestionar el riesgo y el cumplimientoCopy link to section

Más información sobre riesgo y cumplimientoCopy link to section

Cómo desarrollar su soluciónCopy link to section

Más información sobre los métodos de trabajoCopy link to section

Cómo elegir un modeloCopy link to section

Más información sobre cómo elegir un modelo de baseCopy link to section

Cómo preparar los datosCopy link to section

Más información sobre la preparación de datosCopy link to section

Cómo evaluar la calidad y mitigar los riesgosCopy link to section

Más información para evaluar la calidad y mitigar los riesgosCopy link to section

Cómo optimizar y gestionar los modelos de cimentaciónCopy link to section

Más información sobre la optimización y gestión de los modelos de cimentaciónCopy link to section

Cómo entregar y mantener su soluciónCopy link to section

Más información sobre entrega y mantenimientoCopy link to section

Más informaciónCopy link to section