Cuando despliega determinados activos en watsonx.ai Runtime, puede elegir el tipo, el tamaño y la potencia de la configuración de hardware que se ajuste a sus necesidades informáticas.
Creación de especificaciones de hardware para despliegues
Puede crear especificaciones de hardware para los despliegues de las siguientes maneras:
- Biblioteca de cliente Python : utilice la función
hardware_specifications.store
de la biblioteca de cliente Python . Para obtener más información, consulte Referencia de biblioteca de clientePython - API de datos e inteligencia artificial: Utilice '
POST /v2/hardware_specifications
de la lista Entornos en la API de Datos y AI Common Core para crear una especificación de hardware. Para obtener más información, consulte Referencia de API de entornos.
Tipos de despliegue que requieren especificaciones de hardware
La selección de una especificación de hardware está disponible para todos los tipos de despliegue por lotes . Para despliegues en línea, puede seleccionar una especificación de hardware específica si está desplegando:
- Funciones de Python
- Modelos Tensorflow
- Modelos con especificaciones de software personalizadas
Configuraciones de hardware disponibles para desplegar activos
XS
: 1x4 = 1 vCPU y 4 GB de RAMS
: 2x8 = 2 vCPU y 8 GB de RAMM
: 4x16 = 4 vCPU y 16 GB de RAML
: 8x32 = 8 vCPU y 32 GB de RAMXL
: 16x64 = 16 vCPU y 64 GB de RAM
Puede utilizar la configuración de XS
para desplegar:
- Funciones de Python
- Scripts Python
- Scripts R
- Modelos basados en bibliotecas personalizadas e imágenes personalizadas
Para despliegues de Decision Optimization , puede utilizar estas especificaciones de hardware:
S
M
L
XL
Especificaciones de hardware para la inferencia de GPU
A partir de la versión 4.8.5 de Cloud Pak for Data, puede seleccionar las especificaciones de hardware de GPU para las especificaciones de software CUDA desde la interfaz de usuario en la plataforma ' x86
' al crear una implementación.
Utilice las siguientes especificaciones de hardware predefinidas para la inferencia de GPU:
Más información
Tema padre: Gestión de despliegues predictivos