0 / 0

Decisiones estratégicas iniciales

Última actualización: 23 abr 2025
Decisiones estratégicas iniciales

Antes de empezar a planificar su solución de IA generativa o aprendizaje automático, debe tomar algunas decisiones estratégicas clave. Su estrategia debe tener en cuenta los requisitos y prioridades de su organización, las habilidades y preferencias de su equipo de desarrollo, sus requisitos de datos y los requisitos de la solución.

Para establecer la estrategia de implantación de su solución de IA, tome las siguientes decisiones:

¿Cuál es su caso de uso?

Comprenda el objetivo de su solución, si ese objetivo es factible y valioso, y cómo puede determinar cuándo está lista su solución:

Tarea AI
¿Qué necesita que haga el modelo?
Viabilidad
Comprenda los límites de la IA para poder evaluar si su caso de uso es viable.
Por ejemplo, puede comprobar las puntuaciones de referencia del modelo de la fundación para el tipo de caso de uso que desea implementar.
Por ejemplo, para entrenar un modelo de aprendizaje automático (ML), se necesitan suficientes datos etiquetados de alta calidad para que un algoritmo pueda realizar predicciones o clasificaciones precisas.
Valor empresarial
Considere si los beneficios de la solución son mayores que el coste de su funcionamiento.
Criterios de éxito
Decidir cómo medir el éxito de la solución. Por ejemplo, puede basarse en las métricas de evaluación o en los comentarios de los usuarios objetivo.

Si implantar la IA genérica o el aprendizaje automático

El tipo de datos con los que piensa trabajar y lo que quiere hacer con ellos puede ayudarle a decidir si necesita aprendizaje automático o IA generativa.

Tipo de datos
El hecho de que los datos que desee procesar con IA sean estructurados o no estructurados puede indicar a menudo qué tipo de IA necesita:
  • Estructurados: Si dispone de conjuntos de datos etiquetados en formato tabular, probablemente necesite aprendizaje automático.
  • No estructurados: Si tienes grandes cantidades de documentos u otros tipos de datos no estructurados, probablemente necesites IA generativa.
Tipo de objetivo
Si desea analizar sus datos con algoritmos matemáticos o generar nuevos contenidos, eso indica qué tipo de IA necesita:
  • Analice o clasifique sus datos: Si quieres utilizar ecuaciones matemáticas y estadísticas para analizar datos estructurados, necesitas aprendizaje automático. Por ejemplo, con el aprendizaje automático se pueden hacer predicciones, detectar patrones y resolver problemas de optimización.
  • Generar contenidos: Si quieres generar contenidos no estructurados, necesitas IA generativa. Por ejemplo, con la IA gen se puede resumir, clasificar, traducir y generar texto o código.

Más información sobre la diferencia entre ML y gen AI

A quién implicar

Si involucra a las partes interesadas adecuadas desde el principio, correrá menos riesgo de tener que cambiar de dirección o repetir partes del proceso. Como mínimo, implique a las partes interesadas de estos equipos en el proceso de planificación:

Personas que definen las prioridades y los procesos de su organización
Necesita que estas personas le informen de los requisitos y restricciones que debe cumplir. Puede que necesite documentar información específica sobre su solución, seguir un flujo de trabajo para cumplir una normativa o seleccionar un modelo de base con un tipo de fuente específico. Por ejemplo, su organización puede exigirle que seleccione un modelo de base de código abierto.
Personas que utilizan la solución
Necesita a estas personas para definir los requisitos de la solución y para ayudar a probar y validar que la solución funciona en sus procesos.
Personas que crean la solución
Necesita que estas personas participen en el diseño y las decisiones operativas. Este equipo de colaboradores podría incluir diseñadores, ingenieros de datos, ingenieros de IA, científicos de datos y gestores de riesgos y cumplimiento.
Por ejemplo, si está implantando una solución de generación aumentada de recuperación en su documentación, considere la posibilidad de incluir a sus redactores de contenidos, que pueden adaptar el contenido para la IA.
Por ejemplo, si está implantando una solución de solicitud de hipotecas, asegúrese de implicar a los gestores de riesgos y cumplimiento.

Cómo gestionar el riesgo y el cumplimiento

Si comprende sus riesgos y necesidades de cumplimiento antes de empezar a desarrollar su solución, podrá estar mejor preparado para las auditorías posteriores.

Riesgos relacionados con la IA
Comprender las dimensiones clave del riesgo, como el riesgo de reputación, normativo y operativo. Muchos riesgos son los mismos para el uso de la IA generativa y los modelos de aprendizaje automático, pero algunos riesgos se ven amplificados por la IA generativa, y otros riesgos son específicos de la IA generativa.
Por ejemplo, un modelo fundacional puede generar resultados que contengan datos inexactos o falsos, lo que se denomina alucinar.
Por ejemplo, su modelo de aprendizaje automático podría mostrar una tendencia a proporcionar resultados favorables con más frecuencia para un grupo que para otro.
Cumplimiento legal y reglamentario
Determine qué leyes y normativas debe cumplir, los métodos de seguimiento del cumplimiento y los métodos para garantizarlo. Por ejemplo, su organización podría exigir una evaluación formal de riesgos o un flujo de trabajo de aprobación para las soluciones de IA.
Documentación de casos prácticos
Cree un caso de uso de IA para recopilar toda la información para gestionar un modelo o plantilla de solicitud desde la fase de solicitud, pasando por el desarrollo, hasta la producción. Documentar su caso de uso proporciona una forma práctica de realizar un seguimiento de su progreso, independientemente de que su organización lo exija o no con fines normativos.

Más información sobre riesgo y cumplimiento

Cuánto automatizar frente a codificar

Usted y su equipo de desarrollo pueden elegir entre diferentes herramientas y métodos en la interfaz de usuario de watsonx.ai o trabajar totalmente con código:

Lenguaje de codificación
Si quieres escribir código, puedes elegir entre API REST, Python y código Node.js. Los factores para elegir el lenguaje incluyen las preferencias y habilidades de sus desarrolladores, cómo quiere desplegar la solución y cuánto trabajo quiere hacer su equipo en su entorno de desarrollo interactivo (IDE) frente a la interfaz de usuario de watsonx.ai.
Nivel de automatización
Puede elegir qué parte del código de la solución se genera por usted:
  • Sin código: Puede completar todas las tareas de ingeniería rápida, ajuste de modelos e incrustación y vectorización de documentos con herramientas.
    • Por ejemplo, puede automatizar la búsqueda del mejor patrón RAG con AutoAI para RAG, crear una plantilla de aviso en Prompt Lab, y construir un agente AI en Agent Lab.
    • Por ejemplo, puede automatizar la búsqueda de los mejores algoritmos de datos, transformaciones y ajustes de parámetros con AutoAI para que el aprendizaje automático cree el mejor modelo predictivo. Puede desarrollar modelos predictivos en un lienzo gráfico con SPSS Modeler.
  • Algo de código: Puedes generar cuadernos Python con muchas herramientas y luego adaptar el código según sea necesario.
    • Por ejemplo, puede generar un cuaderno basado en una plantilla de avisos, para incrustar y vectorizar documentos, o para implementar un agente de IA.
    • Por ejemplo, puede resolver un problema de análisis prescriptivo con un cuaderno Decision Optimization.
  • Todo el código: Puedes escribir código con las API REST en tu IDE. Puedes escribir y ejecutar código con bibliotecas Python con el editor de cuadernos.
Funcionalidad
La mayor parte de la funcionalidad de watsonx.ai está disponible tanto con herramientas en la interfaz de usuario como con código, como API y SDK.

Más información sobre los métodos de trabajo

Cómo elegir un modelo de fundación para gen AI

No es necesario elegir un modelo de base antes de elaborar un plan para su solución gen AI. Sin embargo, si comprende qué criterios son los más importantes para usted y su organización, podrá reducir el riesgo de seleccionar un modelo de fundación inadecuado.

Tarea
La tarea que desea que realice el modelo de cimentación puede ser un factor limitante a la hora de elegir un modelo de cimentación. Para muchas tareas de IA genérica, puede elegir entre muchos modelos de base. Sin embargo, para otras tareas de IA genérica, como traducir o responder en un idioma distinto del inglés, tiene menos opciones.
Coste
El coste de la inferencia varía según los modelos de fundación. Si mantener bajos los costes de inferencia es una prioridad para usted, elija un modelo de base más barato, un modelo de base más pequeño, un modelo de base cuantizado o un modelo de base que pueda ajustar.
Impacto medioambiental
En general, los modelos más grandes tienen un mayor impacto ambiental tanto durante el entrenamiento como durante la inferencia. Los modelos de cimentación más pequeños y los cuantificados tienen un menor impacto ambiental.
Precisión y otras puntuaciones
Puede comparar los puntos de referencia de los modelos de cimentación y elegir el modelo de cimentación que tenga puntuaciones altas en las áreas más importantes para usted.
Indemnización y modelo de origen
Es posible que su organización tenga políticas sobre la elección de modelos de fundación que sean transparentes en cuanto a sus datos de formación, que sean de código abierto o que ofrezcan indemnizaciones.
Personalización
Puede personalizar un modelo de base para un dominio específico ajustándolo. Puede optar por sintonizar algunos modelos de cimientos que se proporcionan con watsonx.ai en la página Tuning Studio. Alternativamente, puede ajustar un modelo de cimentación en una herramienta externa e importar su modelo de cimentación personalizado a watsonx.ai.
Puede añadir conocimientos o habilidades a los modelos de IBM Granite con InstructLab.
Si desea implementar modelos de base en su propio centro de datos, puede adquirir e instalar el softwar watsonx.ai.

Más información sobre cómo elegir un modelo de base

Cómo preparar los datos para la IA gen

Los modelos Foundation se entrenan con grandes cantidades de datos, pero no con los datos internos de su empresa. Si necesita un modelo de base para conocer los datos de su empresa, debe decidir cómo proporcionarle sus datos al modelo.

Documentos de puesta a tierra
Si necesita una solución que responda a las preguntas basando el modelo en la información de sus documentos, puede configurar un patrón de generación aumentada por recuperación (RAG). En un patrón RAG, usted vectoriza sus documentos para una recuperación eficaz de los pasajes que responden a las preguntas de los usuarios.
Datos de ajuste y comprobación
Si necesita mejorar o adaptar el resultado para tareas de procesamiento del lenguaje natural como la clasificación, el resumen y la generación, puede ajustar el modelo base. Si desea comprobar la calidad de su mensaje, puede evaluarlo con métricas de IA generativa. Para ambas tareas, debe proporcionar un conjunto de ejemplos de entrada y salida validados. Si sus datos contienen información sensible, como información de identificación personal (IIP), asegúrese de conocer la política de su organización al respecto. Por ejemplo, puede que necesite enmascarar PII o generar datos sintéticos para ajustar o probar su modelo de base.
Conocimientos o competencias
Proporcionar conjuntos de datos que sirvan de base al modelo fundacional. Puede utilizar IntructLab para aumentar un modelo de base existente con las capacidades necesarias para su caso de uso. Usted proporciona ejemplos de semillas o datos de base que son la base para generar datos sintéticos para la instrucción que ajusta el modelo de base.

Más información sobre la preparación de datos para gen AI

Cómo evaluar la calidad y mitigar los riesgos

Debe decidir cómo medir la calidad y garantizar la seguridad.

Evaluación
Puede evaluar el rendimiento y los riesgos de la solución en función de las métricas estándar del sector. Estas métricas le ayudan a garantizar que las soluciones de IA están libres de sesgos, pueden ser explicadas y comprendidas fácilmente por los usuarios empresariales y son auditables en las transacciones comerciales.
Puede medir la precisión textual, la similitud y la calidad del resultado del modelo de la fundación. También puede evaluar la equidad, el rendimiento y la deriva de los resultados del modelo. Puede evaluar el rendimiento de varios activos simultáneamente y ver análisis comparativos de resultados para identificar las mejores soluciones.
Puede supervisar los resultados del despliegue de su modelo de aprendizaje automático en cuanto a equidad, calidad, desviación y explicabilidad.
Evaluación de riesgos
Puede identificar los riesgos potenciales completando un cuestionario de evaluación de riesgos.
Límites
Puede activar los guardarraíles para eliminar el contenido potencialmente dañino o el contenido PII tanto del texto de entrada como del de salida en los avisos.
Pruebas
Considere la posibilidad de crear un equipo rojo para emular ataques adversarios.

Más información para evaluar la calidad y mitigar los riesgos

Cómo optimizar y gestionar los modelos de cimentación

Puede optimizar un modelo de base para mejorar la precisión, el coste, la latencia de inferencia y el control del ciclo de vida del modelo.

Optimización por defecto
IBM proporciona un conjunto de modelos básicos que se despliegan en hardware multiarrendamiento. La inferencia se paga por ficha. IBM controla el ciclo de vida de los modelos actualizándolos y eliminándolos. Cuando un modelo queda obsoleto, debe actualizar su solución para inferir la nueva versión del modelo o un modelo diferente.
Optimizar la precisión y los costes
Si necesita mejorar la precisión de su pronóstico y reducir costes mediante la inferencia de un modelo de cimentación más pequeño, puede ajustar un modelo de cimentación proporcionado. Se despliega un modelo sintonizado en hardware multiusuario y se paga por inferencia por token.
Optimice la precisión y el control
Si has entrenado o ajustado un modelo externo a watsonx.ai para tu caso de uso, puedes importar y desplegar un modelo personalizado. Despliegue el modelo en hardware dedicado. Se paga por hora de alojamiento del modelo en lugar de por la inferencia. Usted controla el ciclo de vida del modelo.
Optimización de la latencia y el control
Si su solución debe dar soporte a un elevado número de usuarios simultáneos, puede desplegar un modelo de despliegue bajo demanda proporcionado por IBM en hardware dedicado. El hardware dedicado proporciona una latencia menor que el hardware multiusuario. Se paga por hora de alojamiento del modelo en lugar de por la inferencia. Usted controla el ciclo de vida del modelo.

Más información sobre la optimización y gestión de los modelos de cimentación

Cómo entregar y mantener su solución

Debe decidir cómo ofrecer su solución gen AI y ayudar a garantizar su calidad continua.

Implantar su solución
Usted despliega su activo de IA en un espacio de despliegue y luego recupera el punto final de despliegue para invocar su solución de IA en su aplicación.
Para inferir un modelo de base, el punto final para inferir el modelo puede estar en un fragmento de código, una función de Python, un servicio de IA o un código desarrollado por su equipo.
Para una solución de aprendizaje automático, el punto final puede ser un modelo de aprendizaje automático, una función Python, una aplicación R Shiny, un modelo NLP o un script.
Gestión de ModelOps con espacios de despliegue
Puede apoyar un flujo ModelOps mediante la creación de espacios de despliegue separados para las versiones de prueba, staging y producción de su solución. Puede gestionar el acceso a su solución de producción añadiendo los colaboradores adecuados a cada espacio.
Orquestación de canalizaciones de ML
Puede montar y configurar una canalización para crear, entrenar, desplegar y actualizar modelos de aprendizaje automático y scripts Python.
Monitoring
De forma similar a la evaluación de su solución durante el desarrollo, puede supervisar el rendimiento y los riesgos de la solución, como la imparcialidad, la calidad y la explicabilidad. Puedes ver las tendencias a lo largo del tiempo y establecer umbrales para que te avisen cuando baje el rendimiento.
Comentarios de los usuarios
Considere la posibilidad de implantar un mecanismo para recabar las opiniones de los usuarios y crear un proceso para recogerlas y mejorar su solución con ellas.
Por ejemplo, si implementas un patrón RAG, puedes añadir un mecanismo de feedback para que los usuarios evalúen las respuestas a sus preguntas. Puede establecer un proceso para evaluar las respuestas incorrectas e inadecuadas y adaptar el patrón RAG o adaptar su contenido para ofrecer mejores respuestas.

Más información sobre entrega y mantenimiento

Más información

Tema principal: Planificación de una solución de IA generativa