Glossaire AutoAI
Découvrez les termes et les concepts utilisés dans AutoAI pour la génération et le déploiement de modèles d'apprentissage automatique.
aggregate score
Agrégation des quatre types d'anomalie: décalage de niveau, tendance, extrême localisée, variance. Un score plus élevé indique un score plus élevé.
algorithme
Formule appliquée aux données pour déterminer les méthodes optimales de résolution des problèmes analytiques.
Expérimentation AutoAI
Un processus de formation automatisé qui tient compte d'une série de définitions et de paramètres de formation pour créer un ensemble de pipelines classés comme candidats modèles.
travail par lots
Traite les données d'entrée à partir d'un fichier, d'une connexion de données ou de données connectées dans un compartiment de stockage et écrit la sortie dans une destination sélectionnée.
Détection de biais (apprentissage automatique)
Permet d'identifier les déséquilibres dans les données d'apprentissage ou le comportement de prévision du modèle.
classification binaire
Modèle de classification avec deux classes et n'affecte des échantillons qu'à l'une des deux classes.
modèle de classification
Modèle prédictif qui prévoit les données dans des catégories distinctes.
matrice de confusion
Mesure des performances qui détermine l'exactitude entre les résultats positifs et négatifs prévus d'un modèle et les résultats réels positifs et négatifs.
validation croisée
Technique qui teste l'efficacité des modèles d'apprentissage automatique. Il est également utilisé comme procédure de ré-échantillonnage pour les modèles avec des données limitées.
imputation de données
Remplacement des valeurs manquantes dans un jeu de données par des valeurs estimées.
fonctions exogènes
Fonctions qui peuvent influencer le modèle de prévision mais qui ne peuvent pas être influencées en retour. Voir aussi: Fonctions de support
equité
Détermine si un modèle produit des résultats biaisés qui favorisent un groupe surveillé par rapport à un groupe de référence. Les évaluations de l'équité détectent si le modèle montre une tendance à fournir un résultat favorable ou préférable plus souvent pour un groupe par rapport à un autre. Les catégories typiques à surveiller sont l'âge, le sexe et la race.
feature correlation
Relation entre deux fonctions. Par exemple, le code postal peut avoir une forte corrélation avec le revenu dans certains modèles.
codage de fonction
Transformation des valeurs catégorielles en valeurs numériques.
importance des fonctions
Impact relatif d'une colonne ou d'une fonction particulière sur la prévision ou la prévision du modèle.
mise à l'échelle des fonctions
Normalisation de la plage de variables indépendantes ou de fonctions dans un jeu de données.
Sélection de fonction
Identification des colonnes de données qui prennent le mieux en charge une prévision ou un score précis.
Transformation de fonction
Dans AutoAI, phase de création de pipeline qui applique des algorithmes pour transformer et optimiser les données de formation afin d'obtenir le meilleur résultat pour le type de modèle.
holdout data
Données utilisées pour tester ou valider les performances du modèle. Les données restantes peuvent être une partie réservée des données d'apprentissage ou un fichier distinct.
Optimisation des hyperparamètres (HPO)
Processus de définition des valeurs d'hyperparamètres sur les paramètres qui fournissent le modèle le plus précis.
apprentissage incrémentiel
Processus d'entraînement d'un modèle qui utilise des données continuellement mises à jour sans oublier les données obtenues à partir des tâches précédentes.
données tabulaires volumineuses
Données structurées qui dépassent la limite du traitement standard et qui doivent être traitées par lots. Voir apprentissage incrémentiel.
données étiquetées
Données étiquetées pour identifier les vecteurs de données appropriés à extraire pour l'entraînement du modèle.
groupe surveillé
Classe de données surveillée pour déterminer si les résultats diffèrent de manière significative des résultats du groupe de référence. Par exemple, dans une application de crédit, vous pouvez surveiller des applications dans une tranche d'âge particulière et comparer les résultats à la tranche d'âge plus susceptible de recevoir un résultat positif pour évaluer s'il peut y avoir un biais dans les résultats.
Modèle de classification multiclasse
Tâche de classification comportant plus de deux classes. Par exemple, lorsqu'un modèle de classification binaire prévoit des valeurs yes ou no , un modèle multi-classe prévoit yes, no, peut-êtreou non applicable.
Série temporelle multivariée
Expérimentation de série temporelle qui contient au moins deux variables changeantes. Par exemple, un modèle de série temporelle qui prévoit la consommation d'électricité de trois clients.
mesure optimisée
Mesure utilisée pour mesurer les performances du modèle. Par exemple, la précision est l'indicateur type utilisé pour mesurer les performances d'un modèle de classification binaire.
pipeline (pipeline candidat modèle)
Structure de bout en bout qui illustre les stos d'un flux de travaux.
classe positive
Classe associée à votre fonction objectif.
groupe de référence
Groupe que vous identifiez comme le plus susceptible de recevoir un résultat positif dans un modèle prédictif. Vous pouvez ensuite comparer les résultats à un groupe surveillé pour rechercher un biais potentiel dans les résultats.
Modèle de régression
Modèle qui associe une variable dépendante à une ou plusieurs variables indépendantes.
scoring
Dans l'apprentissage automatique, processus de mesure de la confiance d'un résultat prévu.
fonctions de prise en charge
Fonctions d'entrée pouvant influencer la cible de prévision. Voir aussi: Exogenus caractéristiques
classification de texte
Modèle qui identifie et classifie automatiquement le texte en catégories distinctes.
modèle de séries temporelles (AutoAI)
Modèle qui effectue le suivi des données dans le temps.
Modèle entraîné
Modèle prêt à être déployé.
entraînement
L'étape initiale du modèle de génération, impliquant un sous-ensemble de données source. Le modèle peut être testé avec un autre sous-ensemble de données pour lequel l'issue est déjà connue.
données d'apprentissage
Données utilisées pour enseigner et entraîner l'algorithme d'apprentissage d'un modèle.
Série temporelle univariée
Expérimentation de série temporelle qui ne contient qu'une seule variable changeante. Par exemple, un modèle de série temporelle qui prévoit la température comporte une seule colonne de prévision de la température.