0 / 0
Volver a la versión inglesa de la documentación
Gestión de especificaciones de hardware para despliegues
Última actualización: 06 dic 2024
Gestión de especificaciones de hardware para despliegues

Cuando despliega determinados activos en watsonx.ai Runtime, puede elegir el tipo, el tamaño y la potencia de la configuración de hardware que se ajuste a sus necesidades informáticas.

Creación de especificaciones de hardware para despliegues

Puede crear especificaciones de hardware para los despliegues de las siguientes maneras:

  • Biblioteca de cliente Python : utilice la función hardware_specifications.store de la biblioteca de cliente Python . Para obtener más información, consulte Referencia de biblioteca de clientePython
  • API de datos e inteligencia artificial: Utilice ' POST /v2/hardware_specifications de la lista Entornos en la API de Datos y AI Common Core para crear una especificación de hardware. Para obtener más información, consulte Referencia de API de entornos.

Tipos de despliegue que requieren especificaciones de hardware

La selección de una especificación de hardware está disponible para todos los tipos de despliegue por lotes . Para despliegues en línea, puede seleccionar una especificación de hardware específica si está desplegando:

  • Funciones de Python
  • Modelos Tensorflow
  • Modelos con especificaciones de software personalizadas

Configuraciones de hardware disponibles para desplegar activos

  • XS: 1x4 = 1 vCPU y 4 GB de RAM
  • S: 2x8 = 2 vCPU y 8 GB de RAM
  • M: 4x16 = 4 vCPU y 16 GB de RAM
  • L: 8x32 = 8 vCPU y 32 GB de RAM
  • XL: 16x64 = 16 vCPU y 64 GB de RAM

Puede utilizar la configuración de XS para desplegar:

  • Funciones de Python
  • Scripts Python
  • Scripts R
  • Modelos basados en bibliotecas personalizadas e imágenes personalizadas

Para despliegues de Decision Optimization , puede utilizar estas especificaciones de hardware:

  • S
  • M
  • L
  • XL

Especificaciones de hardware para la inferencia de GPU

A partir de la versión 4.8.5 de Cloud Pak for Data, puede seleccionar las especificaciones de hardware de GPU para las especificaciones de software CUDA desde la interfaz de usuario en la plataforma ' x86 ' al crear una implementación.

Utilice las siguientes especificaciones de hardware predefinidas para la inferencia de GPU:

Más información

Tema padre: Gestión de despliegues predictivos

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información