0 / 0
Volver a la versión inglesa de la documentación
watsonx.ai Planes de servicio en tiempo de ejecución
Última actualización: 05 dic 2024
watsonx.ai Planes de servicio en tiempo de ejecución

Los recursos de tiempo de ejecución de watsonx.ai, que se miden en unidades de capacidad horaria (CUH), se utilizan para entrenar modelos AutoAI, ejecutar modelos de aprendizaje automático o puntuar modelos desplegados. Cuando se ejecutan servicios de inferencia con modelos de la Fundación, se utilizan recursos de tiempo de ejecución de watsonx.ai, medidos por tokens consumidos o por una tarifa horaria. En este tema se describen los distintos planes que puede elegir, qué servicios se incluyen y cómo se calculan los recursos informáticos.

Nota: El servicio watsonx.ai Runtime se conocía anteriormente como servicio Watson Machine Learning.

'watsonx.ai Tiempo de ejecución en ' Cloud Pak for Data as a Service y ' watsonx

Importante:

El plan de tiempo de ejecución " watsonx.ai " incluye detalles para " watsonx.ai. Watsonx.ai es un estudio de herramientas integradas para trabajar con IA generativa, basada en modelos de base y modelos de aprendizaje automático. Si está utilizando Cloud Pak for Data as a Service, los detalles para trabajar con modelos de base y la inferencia de solicitud de medición utilizando Unidades de recurso no se aplican a su plan.

Si está habilitado para watsonx y Cloud Pak for Data as a Service, puede conmutar entre las dos plataformas.

Elegir un plan de tiempo de ejecución de watsonx.ai

los planes de tiempo de ejecución "watsonx.ai " regulan cómo se facturan los modelos que se entrenan y despliegan con el tiempo de ejecución " watsonx.ai " y los avisos que se utilizan con los modelos de la base. Seleccione un plan basado en sus necesidades:

  • Lite es un plan gratuito con capacidad limitada. Elija este plan si está evaluando watsonx.ai Runtime y desea probar sus capacidades. El plan Lite no da soporte a la ejecución de un experimento de ajuste de modelo base en watsonx.
  • Essentials es un plan de pago por uso que le proporciona la flexibilidad para crear, desplegar y gestionar modelos que se ajusten a sus necesidades.
  • Estándar es un plan empresarial de alta capacidad diseñado para dar soporte a todas las necesidades de aprendizaje automático de una organización. Las horas de unidad de capacidad se proporcionan a una tarifa plana, mientras que el consumo de unidad de recursos es de pago por uso.

Para más información sobre planes y precios, consulte " .

Seguimiento del consumo de recursos

A efectos de medición y facturación, los modelos de aprendizaje automático y los despliegues o modelos de cimentación se miden con estas métricas de carga:

  • Las medidas de capacidad por unidad de hora (CUH) calculan el consumo de recursos por unidad de hora a efectos de uso y facturación. CUH mide toda la actividad en tiempo de ejecución de watsonx.ai excepto la inferencia de Foundation Model.

  • La Unidad de Recurso (RU) mide el consumo de inferencia del modelo base. La inferencia es el proceso de llamar al modelo de base para generar salida en respuesta a una solicitud. Cada RU equivale a 1.000 señales. Una señal es una unidad básica de texto (normalmente 4 caracteres o 0.75 palabras) utilizada en la entrada o salida para una solicitud de modelo de base.

  • La tarifa por hora se utiliza para calcular los cargos de los modelos de base personalizados que importas a watsonx.ai y despliegas. La tarifa se basa en el tamaño de la configuración y se cobra mientras dure la implantación del modelo.

  • El índice de páginas se utiliza para calcular las tarifas de extracción de texto de los documentos. La tarifa por página se fija según el plan.

¿Qué se mide para el consumo de recursos?

Los recursos, ya sean medidos con horas de unidad de capacidad (CUH) o unidades de recurso (RU), se consumen para activos en ejecución, no para trabajar en herramientas. Es decir, no hay ningún cargo por consumo por definir un experimento enAutoAI, pero hay un cargo por ejecutar el experimento para entrenar los procesos del experimento. De forma similar, no hay ningún cargo por crear un espacio de despliegue o definir un trabajo de despliegue, pero hay un cargo por ejecutar un trabajo de despliegue o inferir en un activo desplegado. Los activos que se ejecutan de forma continua, como los cuadernos Jupyter, los activos de RStudio, los scripts Bash y los despliegues de modelos personalizados consumen recursos mientras están activos.

Nota: No se consumen tokens cuando se utiliza la aplicación de búsqueda y respuesta de IA generativa para este sitio de documentación.

watsonx.ai Detalles del plan de tiempo de ejecución

El plan Lite proporciona suficientes recursos gratuitos para evaluar las prestaciones de watsonx.ai. A continuación, puede elegir un plan de pago que coincida con las necesidades de su organización, basándose en las características y la capacidad del plan.

Tabla 1. Detalles del plan
Características del plan Lite Elementos básicos Standard
watsonx.ai Uso del tiempo de ejecución en CUH 20 CUH al mes Facturación de CUH basada en la tarifa de CUH multiplicada por horas de consumo 2500 CUH al mes
Inferencia de modelo de base en señales o unidades de recurso (RU) 50.000 señales al mes Facturado para uso (1000 señales = 1 RU) Facturado para uso (1000 señales = 1 RU)
Número máximo de trabajos por lotes paralelos de Decision Optimization por despliegue 2 5 100
Trabajos de despliegue retenidos por espacio 100 1000 3000
Tiempo de despliegue a desocupado 1 día 3 días 3 días
Soporte de HIPAA N/D N/D Sólo la región Dallas
Debe estar habilitada en su cuenta de IBM Cloud
Límite de velocidad por ID de plan 2 solicitudes de inferencia por segundo 8 solicitudes de inferencia por segundo 8 solicitudes de inferencia por segundo
Soporte para modelos de cimentación personalizados No disponible No disponible Facturación horaria por configuración
Extracción de textos de documentos No disponible Facturación por página Facturación por página

Nota: Si actualiza de Essentials a Standard, no puede volver a un plan Essentials. Debe crear un nuevo plan.

detalles de los precios de watsonx.ai Runtime

Para más información sobre las tarifas de facturación y cómo se calcula el consumo de recursos, consulte:

Más información

Tema principal: watsonx.ai Runtime

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información