Glossar für AutoAI
Erlernen Sie Begriffe und Konzepte, die in AutoAI zum Erstellen und Bereitstellen von Modellen für maschinelles Lernen verwendet werden.
Aggregatbewertung
Die Aggregation der vier Anomalietypen: Stufenverschiebung, Trend, lokalisierte Extremwerte, Varianz. Ein höherer Score gibt einen stärkeren Score an.
Algorithmus
Eine Formel, die auf Daten angewendet wird, um optimale Methoden zur Lösung analytischer Probleme zu ermitteln
AutoAI-Experiment
Ein automatisierter Trainingsprozess, der eine Reihe von Trainingsdefinitionen und Parametern berücksichtigt, um eine Gruppe von eingestuften Pipelines als Modellkandidaten zu erstellen.
Stapelanstellung
Verarbeitet Eingabedaten aus einer Datei, Datenverbindung oder verbundenen Daten in einem Speicherbucket und schreibt die Ausgabe an ein ausgewähltes Ziel.
Verzerrungserkennung (maschinelles Lernen)
Zum Identifizieren von Unausgewogenheiten in den Trainingsdaten oder im Vorhersageverhalten des Modells.
Binärklassifikation
Ein Klassifikationsmodell mit zwei Klassen, das nur Stichproben einer der beiden Klassen zuordnet.
Klassifikationsmodell
Ein Vorhersagemodell, das Daten in unterschiedlichen Kategorien vorhersagt.
Fehlermatrix
Eine Leistungsmessung, die die Genauigkeit zwischen den positiven und negativen vorhergesagten Ergebnissen eines Modells zu positiven und negativen tatsächlichen Ergebnissen bestimmt.
Kreuzvalidierung
Ein Verfahren, das die Effektivität von Modellen für maschinelles Lernen testet. Es wird auch als Resampling-Prozedur für Modelle mit begrenzten Daten verwendet.
Datenimputation
Ersetzen fehlender Werte in einem Dataset durch geschätzte Werte.
exogene Merkmale
Merkmale, die das Vorhersagemodell beeinflussen können, aber im Gegenzug nicht beeinflusst werden können. Siehe auch: Unterstützende Features
fairness
Bestimmt, ob ein Modell verzerrte Ergebnisse erzeugt, die eine überwachte Gruppe gegenüber einer Referenzgruppe bevorzugen. Fairnessbewertungen erkennen, ob das Modell tendenziell ein günstigeres oder bevorzugtes Ergebnis für eine Gruppe gegenüber einer anderen Gruppe liefert. Typische zu überwachende Kategorien sind Alter, Geschlecht und Rasse.
Feature-Korrelation
Die Beziehung zwischen zwei Features. Beispielsweise kann die Postleitzahl in einigen Modellen eine starke Korrelation mit dem Einkommen aufweisen.
Merkmalcodierung
Transformieren kategorialer Werte in numerische Werte.
Merkmalsbedeutung
Die relative Auswirkung einer bestimmten Spalte oder eines bestimmten Merkmals auf die Vorhersage oder Vorhersage des Modells.
Merkmalskalierung
Normalisierung des Bereichs unabhängiger Variablen oder Merkmale in einem Dataset.
Featureauswahl
Ermitteln der Datenspalten, die eine genaue Vorhersage oder Bewertung am besten unterstützen.
Featuretransformation
In AutoAI eine Phase der Pipelineerstellung, in der Algorithmen zur Transformation und Optimierung der Trainingsdaten angewendet werden, um das beste Ergebnis für den Modelltyp zu erzielen.
Holdout-Daten
Daten zum Testen oder Validieren der Leistung des Modells. Holdout-Daten können ein reservierter Teil der Trainingsdaten oder eine separate Datei sein.
Hyperparameteroptimierung (HPO)
Der Prozess zum Festlegen von Hyperparameterwerten auf die Einstellungen, die das genaueste Modell bereitstellen.
Inkrementelles Lernen
Der Prozess des Trainings eines Modells, das Daten verwendet, die kontinuierlich aktualisiert werden, ohne dass Daten aus den vorherigen Tasks vergessen werden.
Große Tabellendaten
Strukturierte Daten, die den Grenzwert für die Standardverarbeitung überschreiten und in Batches verarbeitet werden müssen Siehe Inkrementelles Lernen.
beschriftete Daten
Daten, die beschriftet werden, um die geeigneten Datenvektoren zu identifizieren, die für das Modelltraining extrahiert wurden.
Überwachte Gruppe
Eine Klasse von Daten, die überwacht werden, um festzustellen, ob sich die Ergebnisse erheblich von den Ergebnissen der Referenzgruppe unterscheiden. Beispiel: In einer Kredit-App können Sie Anwendungen in einem bestimmten Altersbereich überwachen und Ergebnisse mit dem Altersbereich vergleichen, bei dem es wahrscheinlicher ist, ein positives Ergebnis zu erhalten, um zu bewerten, ob eine Verzerrung in den Ergebnissen vorliegt.
Klassifikationsmodell mit mehreren Klassen
Eine Klassifikationstask mit mehr als zwei Klassen. Beispiel: Wenn ein binäres Klassifikationsmodell ja oder nein Werte vorhersagt, sagt ein Modell mit mehreren Klassen ja, nein, vielleichtoder nicht zutreffendvoraus.
multivariate Zeitreihe
Zeitreihenexperiment mit mindestens zwei sich ändernden Variablen. Beispiel: Ein Zeitreihenmodell, das den Stromverbrauch von drei Kunden vorhersagt.
Optimierte Metrik
Die Metrik, die zum Messen der Leistung des Modells verwendet wird. Die Genauigkeit ist beispielsweise die typische Metrik, die zum Messen der Leistung eines binären Klassifikationsmodells verwendet wird.
Pipeline (Modellkandidaten-Pipeline)
End-to-End-Gliederung, die die Steos in einem Workflow veranschaulicht.
positive Klasse
Die Klasse, die sich auf Ihre Zielfunktion bezieht.
Referenzgruppe
Eine Gruppe, die Sie als Gruppe identifizieren, die am wahrscheinlichsten ein positives Ergebnis in einem Vorhersagemodell erhält. Anschließend können Sie die Ergebnisse mit einer überwachten Gruppe vergleichen, um nach potenziellen Verzerrungen in den Ergebnissen zu suchen.
Regressionsmodell
Ein Modell, das eine abhängige Variable mit einer oder mehreren unabhängigen Variablen in Beziehung setzt.
Scoring
Beim maschinellen Lernen der Prozess zum Messen der Konfidenz eines vorhergesagten Ergebnisses.
unterstützende Funktionen
Eingabefunktionen, die das Vorhersageziel beeinflussen können. Siehe auch: Exogenus-Merkmale
Textklassifikation
Ein Modell, das Text automatisch identifiziert und in eindeutige Kategorien klassifiziert.
Zeitreihenmodell (AutoAI)
Ein Modell, das Daten im Zeitverlauf verfolgt.
Trainiertes Modell
Ein Modell, das bereitgestellt werden kann.
Training
Die Anfangsphase der Modellerstellung mit einem Subset der Quellendaten. Das Modell kann dann anhand eines weiteren, anderen Subsets getestet werden, für das das Ergebnis bereits bekannt ist.
Trainingsdaten
Daten, die zum Lehren und Trainieren des Lernalgorithmus eines Modells verwendet werden.
univariate Zeitreihe
Zeitreihenexperiment, das nur eine sich ändernde Variable enthält Beispiel: Ein Zeitreihenmodell, das die Temperatur vorhersagt, verfügt über eine einzelne Vorhersagespalte der Temperatur.