La herramienta gráfica AutoAI analiza los datos y utiliza algoritmos de datos, transformaciones y valores de parámetros para crear el mejor modelo predictivo. AutoAI muestra varios modelos potenciales como interconexiones candidatas de modelo y los clasifica en un marcador para que pueda elegir.
- Servicio necesario
- tiempo de ejecución de watsonx.ai
- estudio watsonx.ai
- Credenciales requeridas
- Credenciales de tareas
- Formato de los datos
- Tabular: archivos CSV, con delimitador de coma (,) para todos los tipos de experimentos de AutoAI .
- Datos conectados desde IBM Cloud Object Storage.
- Tamaño de datos
- Hasta 1 GB o hasta 20 GB. Para obtener detalles, consulte Uso de datos deAutoAI.
Uso de datos de AutoAI
Los datos de entrenamiento y los datos de entrada de modelo están en un formato tabular. Los nombres de columna de la tabla deben ser exclusivos. Los nombres de columna duplicados generarán un error.
Estos límites se basan en la configuración de cálculo predeterminada de 8 CPU y 32 GB.
Experimentos de clasificación y regresión de AutoAI :
- Puede cargar un archivo hasta 1 GB para experimentos de AutoAI .
- Si se conecta a un origen de datos que supere 1 GB, sólo se utilizarán los primeros 1 GB de registros.
Experimentos de series temporales de AutoAI :
Si el origen de datos contiene una columna de indicación de fecha y hora, AutoAI muestrea los datos con una frecuencia uniforme. Por ejemplo, los datos pueden estar en incrementos de un minuto, una hora o un día. La indicación de fecha y hora especificada se utiliza para determinar la ventana de búsqueda para mejorar la precisión del modelo.
Nota:Si el tamaño del archivo es mayor que 1 GB, AutoAi ordena los datos en orden descendente y sólo se utiliza el primer 1 GB para entrenar el experimento.
Si el origen de datos no contiene una columna de indicación de fecha y hora, asegúrese de que AutoAI muestrea los datos a intervalos uniformes y ordena los datos en orden ascendente . Un orden de clasificación ascendente significa que el valor de la primera fila es el más antiguo y que el valor de la última fila es el más reciente.
Nota: Si el tamaño del archivo es mayor que 1 GB, trunque el tamaño del archivo para que sea menor que 1 GB.
Para obtener más información sobre cómo elegir la herramienta adecuada para el caso de datos y uso, consulte Elección de una herramienta.
Proceso de AutoAI
Con AutoAI, puede crear y desplegar un modelo de aprendizaje de máquina con sofisticadas características de formación sin tener que codificar. La herramienta hace la mayor parte del trabajo automáticamente.
Para ver el código que ha creado un experimento específico, o para interactuar con el experimento de forma programada, puede guardar un experimento como un cuaderno.
AutoAI ejecuta automáticamente las tareas siguientes para crear y evaluar interconexiones de modelos candidatas:
- Preproceso de datos
- Selección automática de modelos
- Ingeniería de características automatizada
- Optimización de hiperparámetros
Visión general del proceso de AutoAI
Para obtener más detalles sobre cada una de estas fases, incluyendo enlaces a documentos de investigación asociados y descripciones de los algoritmos aplicados para crear las interconexiones de modelo, consulte Detalles de la implementación de AutoAI.
Preproceso de datos
La mayoría de los conjuntos de datos contienen distintos formatos de datos y valores perdidos, pero los algoritmos de aprendizaje automático estándar sólo funcionan con números y sin valores perdidos. Por lo tanto, AutoAI aplica varios algoritmos o estimadores para analizar, limpiar y preparar los datos en bruto para el aprendizaje automático. Esta técnica detecta y categoriza automáticamente valores basados en características, como el tipo de datos: categórico o numérico. En función de la categorización, AutoAI utiliza la optimización de hiperparámetros para determinar la mejor combinación de estrategias para la imputación de valores perdidos, la codificación de características y el escalado de características para los datos.
Selección de modelos automática
AutoAI utiliza la selección de modelo automatizada para identificar el mejor modelo para los datos. Este nuevo enfoque compara los modelos potenciales con pequeños subconjuntos de datos y los clasifica en función de la precisión. A continuación, AutoAI selecciona los modelos más prometedores y aumenta el tamaño del subconjunto de datos hasta que identifica la mejor coincidencia. Este enfoque ahorra tiempo y mejora el rendimiento al reducir gradualmente los modelos potenciales en función de la precisión.
Para obtener información sobre cómo manejar interconexiones generadas automáticamente para seleccionar el mejor modelo, consulte Selección de un modelo de AutoAI.
Ingeniería de características automatizada
La ingeniería de características identifica el modelo más preciso transformando los datos sin formato en una combinación de características que representan mejor el problema. Este enfoque único explora varias opciones de construcción de características de una manera estructurada y no exhaustiva, al tiempo que maximiza progresivamente la precisión del modelo utilizando el aprendizaje de refuerzo. Esta técnica da como resultado una secuencia optimizada de transformaciones para los datos que mejor coinciden con los algoritmos del paso de selección de modelo.
Optimización de hiperparámetros
La optimización de hiperparámetros refina los modelos con mejor rendimiento. AutoAI utiliza un nuevo algoritmo de optimización de hiperparámetros para determinadas evaluaciones de función, como el entrenamiento y la puntuación de modelos, que son habituales en el aprendizaje automático. Este enfoque identifica rápidamente el mejor modelo a pesar de los largos tiempos de evaluación en cada iteración.
Próximos pasos
Pruebe la guía de aprendizaje Inicio rápido: Crear y desplegar un modelo de aprendizaje automático con AutoAI .
Tema padre: Análisis de datos y generación de modelos