Glosario de AutoAI
Aprenda los términos y conceptos que se utilizan en AutoAI para crear y desplegar modelos de aprendizaje automático.
puntuación agregada
La agregación de los cuatro tipos de anomalía: desplazamiento de nivel, tendencia, extremo localizado, varianza. Una puntuación más alta indica una puntuación más fuerte.
algorithm
Una fórmula aplicada a los datos para determinar formas óptimas de resolver problemas analíticos.
Experimento de AutoAI
Un proceso de entrenamiento automatizado que tiene en cuenta una serie de definiciones y parámetros de entrenamiento para crear un conjunto de interconexiones clasificadas como candidatos a modelos.
empleo por lotes
Procesa los datos de entrada de un archivo, conexión de datos o datos conectados en un grupo de almacenamiento y escribe la salida en un destino seleccionado.
detección de sesgo (aprendizaje automático)
Para identificar desequilibrios en los datos de entrenamiento o comportamiento de predicción del modelo.
clasificación binaria
Un modelo de clasificación con dos clases y sólo asigna muestras en una de las dos clases.
modelo de clasificación
Un modelo predictivo que predice datos en categorías distintas.
matriz de confusión
Una medida de rendimiento que determina la precisión entre los resultados pronosticados positivos y negativos de un modelo y los resultados reales positivos y negativos.
validación cruzada
Técnica que comprueba la eficacia de los modelos de aprendizaje automático. También se utiliza como procedimiento de remuestreo para modelos con datos limitados.
imputación de datos
Sustitución de valores perdidos en un conjunto de datos con valores estimados.
características exógenas
Características que pueden influir en el modelo de predicción pero que no pueden verse influenciadas a cambio. Consulte también: Características de soporte
equidad
Determina si un modelo produce resultados sesgados que favorecen a un grupo supervisado sobre un grupo de referencia. Las evaluaciones de equidad detectan si el modelo muestra una tendencia a proporcionar un resultado favorable o preferible más a menudo para un grupo que para otro. Las categorías típicas para monitorear son edad, sexo y raza.
correlación de características
La relación entre dos características. Por ejemplo, el código postal puede tener una fuerte correlación con los ingresos en algunos modelos.
codificación de características
Transformación de valores categóricos en valores numéricos.
importancia de característica
El impacto relativo que una columna o característica determinada tiene en la predicción o previsión del modelo.
escalado de características
Normalización del rango de variables o características independientes en un conjunto de datos.
selección de características
Identificar las columnas de datos que mejor soportan una predicción o puntuación precisa.
transformación de características
En AutoAI, una fase de creación de interconexiones que aplica algoritmos para transformar y optimizar los datos de entrenamiento para lograr el mejor resultado para el tipo de modelo.
datos reservados
Datos utilizados para probar o validar el rendimiento del modelo. Los datos reservados pueden ser una parte reservada de los datos de entrenamiento o pueden ser un archivo separado.
Optimización de hiperparámetros (HPO)
Proceso para establecer valores de hiperparámetros en los valores que proporcionan el modelo más preciso.
aprendizaje incremental
Proceso de entrenamiento de un modelo que utiliza datos que se actualizan continuamente sin olvidar los datos obtenidos de las tareas anteriores.
datos tabulares grandes
Datos estructurados que superan el límite en el proceso estándar y deben procesarse por lotes. Consulte el aprendizaje incremental.
datos etiquetados
Datos etiquetados para identificar los vectores de datos adecuados que se deben extraer para el entrenamiento del modelo.
grupo supervisado
Clase de datos supervisados para determinar si los resultados difieren significativamente de los resultados del grupo de referencia. Por ejemplo, en una aplicación de crédito, puede supervisar las aplicaciones en un rango de edad determinado y comparar los resultados con el rango de edad con mayor probabilidad de recibir un resultado positivo para evaluar si puede haber un sesgo en los resultados.
modelo de clasificación multiclase
Una tarea de clasificación con más de dos clases. Por ejemplo, cuando un modelo de clasificación binario predice valores yes o no , un modelo de varias clases predice yes, no, quizáso no aplicable.
serie temporal multivariante
Experimento de serie temporal que contiene dos o más variables cambiantes. Por ejemplo, un modelo de serie temporal que pronostica el uso de electricidad de tres clientes.
métrica optimizada
Métrica utilizada para medir el rendimiento del modelo. Por ejemplo, la precisión es la métrica típica que se utiliza para medir el rendimiento de un modelo de clasificación binario.
pipeline (conducto candidato de modelo)
Esquema de extremo a extremo que ilustra los steos en un flujo de trabajo.
clase positiva
La clase que está relacionada con la función objetivo.
grupo de referencia
Un grupo que se identifica como el más propenso a recibir un resultado positivo en un modelo predictivo. A continuación, puede comparar los resultados con un grupo supervisado para buscar un sesgo potencial en los resultados.
modelo de regresión
Un modelo que relaciona una variable dependiente con una o más variables independientes.
scoring
En el aprendizaje automático, el proceso de medir la confianza de un resultado previsto.
características de soporte
Características de entrada que pueden influir en el destino de predicción. Vea también: Características de Exogenus
clasificación de texto
Un modelo que identifica y clasifica automáticamente el texto en categorías distintas.
modelo de serie temporal (AutoAI)
Un modelo que realiza un seguimiento de los datos a lo largo del tiempo.
modelo entrenado
Un modelo que está listo para desplegarse.
entrenamiento
La etapa inicial de la creación de modelos, que implica un subconjunto de los datos de origen. A continuación, el modelo se puede probar en un subconjunto distinto para el que ya se conoce el resultado.
datos de entrenamiento
Datos utilizados para enseñar y entrenar el algoritmo de aprendizaje de un modelo.
serie temporal univariada
Experimento de serie temporal que contiene sólo una variable cambiante. Por ejemplo, un modelo de serie temporal que pronostica la temperatura tiene una única columna de predicción de la temperatura.