AutoAI ofrece valores de experimento que puede utilizar para configurar y personalizar sus experimentos de clasificación o regresión.
Visión general de valores de experimento
Después de cargar los datos del experimento y seleccionar el tipo de experimento y qué predecir, AutoAI establece configuraciones y métricas predeterminadas para el experimento. Puede aceptar estos valores predeterminados y continuar con el experimento o pulsar Valores de experimento para personalizar las configuraciones. Al personalizar las configuraciones, puede controlar de forma precisa cómo el experimento crea las interconexiones del modelo candidato.
Utilice las tablas siguientes como guía para los valores de experimento para los experimentos de clasificación y regresión. Para obtener detalles sobre la configuración de un experimento de serie temporal, consulte Creación de un experimento de serie temporal.
Valores de predicción
La mayoría de los valores de predicción se encuentran en la página principal General . Revise o actualice los valores siguientes.
Valor | Descripción |
---|---|
Tipo de predicción | Puede cambiar o alterar temporalmente el tipo de predicción. Por ejemplo, si AutoAI sólo detecta dos clases de datos y configura un experimento de clasificación binaria, pero sabe que hay tres clases de datos, puede cambiar el tipo a multiclass. |
Clase positiva | Para experimentos de clasificación binaria optimizados para Precisión, Precisión media, Recuperacióno F1, se necesita una clase positiva. Confirme que la clase positiva es correcta o el experimento podría generar resultados inexactos. |
Métrica optimizada | Cambie la métrica para optimizar y clasificar las interconexiones candidatas del modelo. |
Selección de algoritmos optimizados | Elija cómo AutoAI selecciona los algoritmos que se utilizarán para generar las interconexiones candidatas del modelo. Puede optimizar para los alorías con la mejor puntuación, u optimizar para los algoritmos con la puntuación más alta en el tiempo de ejecución más corto. |
Algoritmos a incluir | Seleccione cuál de los algoritmos disponibles se debe evaluar cuando se ejecuta el experimento. La lista de algoritmos está basada en el tipo de predicción seleccionado. |
Algoritmos a utilizar | AutoAI prueba los algoritmos especificados y utiliza los mejores ejecutores para crear interconexiones de modelo. Elija cuántos de los mejores algoritmos se deben aplicar. Cada algoritmo genera de 4 a 5 interconexiones, lo que significa que si selecciona 3 algoritmos para utilizar, los resultados del experimento incluirán de 12 a 15 interconexiones clasificadas. Más algoritmos aumentan el tiempo de ejecución para el experimento. |
Valores de equidad de datos
Pulse el separador Equidad para evaluar la equidad del experimento en los resultados previstos. Para obtener detalles sobre cómo configurar la detección de equidad, consulte Aplicación de pruebas de equidad a experimentos de AutoAI.
Configuración del origen de datos
La pestaña General de los valores de origen de datos proporciona opciones para configurar cómo el experimento consume y procesa los datos para el entrenamiento y la evaluación del experimento.
Valor | Descripción |
---|---|
Datos ordenados | Especifique si los datos de entrenamiento se ordenan secuencialmente, según un índice de fila. Cuando los datos de entrada son secuenciales, el rendimiento del modelo se evalúa en los registros más recientes en lugar de en un muestreo aleatorio, y los datos reservados utilizan los últimos n registros del conjunto en lugar de n registros aleatorios. Los datos secuenciales son necesarios para los experimentos de series temporales, pero son opcionales para los experimentos de clasificación y regresión. |
Filas duplicadas | Para acelerar el entrenamiento, puede optar por omitir filas duplicadas en los datos de entrenamiento. |
Método de submuestreo de selección de interconexión | En el caso de un conjunto de datos grande, utilice un subconjunto de datos para el entrenamiento del experimento. Esta opción acelera los resultados pero puede afectar a la precisión. |
Refinamiento de características | Especifique cómo manejar las características sin ningún impacto en el modelo. Las opciones son eliminar siempre la característica, eliminarla cuando mejore la calidad del modelo o no eliminarla. Para obtener detalles sobre cómo se calcula la significación de la característica, consulte Detalles de implementación deAutoAI. |
Imputación de datos | Interpolar valores perdidos en el origen de datos. Para obtener detalles sobre la gestión de la imputación de datos, consulte Imputación de datos en experimentos de AutoAI. |
Ingeniería de características de texto | Cuando está habilitado, las columnas que se detectan como texto se transforman en vectores para analizar mejor la similitud semántica entre series. La habilitación de este valor puede aumentar el tiempo de ejecución. Para obtener más detalles, consulte Creación de un experimento de análisis de texto. |
Conjunto de datos de entrenamiento final | Seleccione qué datos utilizar para entrenar las interconexiones finales. Si elige incluir sólo datos de entrenamiento, los cuadernos generados incluyen una celda para recuperar los datos reservados que se utilizan para evaluar cada interconexión. |
Manejo de valores atípicos | Elija si AutoAI excluye los valores atípicos de la columna de destino para mejorar la precisión del entrenamiento. Si está habilitado, AutoAI utiliza el método de rango intercuartil (IQR) para detectar y excluir valores atípicos de los datos de entrenamiento finales, tanto si se trata de datos de entrenamiento como de datos de entrenamiento más datos reservados. |
Entrenamiento y método de retención | Los datos de formación se utilizan para formar el modelo y los datos de retención se retiran de la formación del modelo y se utilizan para medir el rendimiento del modelo. Puede dividir un único origen de datos en datos de entrenamiento y prueba (reserva), o puede utilizar un segundo archivo de datos específicamente para los datos de prueba. Si divide los datos de entrenamiento, especifique los porcentajes a utilizar para los datos de entrenamiento y los datos reservados. También puede especificar el número de pliegues, desde el valor predeterminado de tres pliegues hasta un máximo de 10. La validación cruzada divide los datos de entrenamiento en subconjuntos, o grupos, para probar el rendimiento del modelo. |
Seleccionar las características a incluir | Seleccione columnas del origen de datos que contengan datos que den soporte a la columna de predicción. La exclusión de columnas extrañas puede mejorar el tiempo de ejecución. |
Valores de entorno de ejecución
Revise los valores del experimento o cambie los recursos de cálculo asignados para ejecutar el experimento.
Próximos pasos
Configurar un experimento de análisis de texto
Tema padre: Creación de un modelo de AutoAI