Implementierungsdetails der Datenimputation für Zeitreihenexperimente
Die Experimenteinstellungen für die Datenimputation in Zeitreihenexperimenten.
Datenimputationsmethoden
Wenden Sie eine dieser Datenimputationsmethoden in Experimenteinstellungen an, um fehlende Werte in einem Dataset bereitzustellen.
Imputationsmethode | Beschreibung |
---|---|
FlattenIterative | Zeitreihendaten werden zuerst abgeflacht, dann werden fehlende Werte mit dem iterativen Imputer von Scikit-learn imputiert. |
Linear | Lineare Interpolationsmethode wird verwendet, um den fehlenden Wert zu imputieren. |
Kubisch | Kubische Interpolationsmethode wird verwendet, um den fehlenden Wert zu imputieren. |
Zurück | Fehlender Wert wird mit dem vorherigen Wert imputiert. |
Weiter | Fehlender Wert wird mit dem nächsten Wert imputiert. |
Füllung | Fehlender Wert wird mithilfe eines benutzerdefinierten Werts, eines Stichprobenmittelwerts oder eines Stichprobenmedian imputiert. |
Eingabeeinstellungen
Mit diesen Befehlen wird die Datenimputation für Zeitreihenexperimente in einem Notebook unterstützt.
Ihren Namen | Beschreibung | Wert | DefaultValue |
---|---|---|---|
use_imputation | Flag zum Ein-oder Ausschalten der Imputation. | True oder False | Ja |
imputer_list | Liste der zu durchsuchenden Imputernamen (Zeichenfolgen). Wird keine Liste angegeben, werden alle Standardimputer durchsucht. Wenn eine leere Liste übergeben wird, werden alle Imputer durchsucht. | "FlattenIterative", "Linear", "Cubic", "Previous", "Fill", "Next" | "FlattenIterative", "Linear", "Cubic", "Previous" |
imputer_fill_typ | Kategorien des Imputers "Fill" | "mean"/"median"/"value" | "wert" |
imputer_fill_value | Ein einzelner numerischer Wert, der für alle fehlenden Werte gefüllt werden soll. Gilt nur, wenn "imputer_fill_type" als "value" angegeben ist. Wird ignoriert, wenn "mean" oder "median" für "imputer_fill_type" angegeben ist. | (Negativ unendlich, Positive unendlich) | 0 |
imputation_threshold | Schwellenwert für die Imputation. Das Verhältnis fehlender Werte darf nicht größer als der Schwellenwert in einer Spalte sein. Andernfalls tritt ein Fehler auf. | (0, 1) | 0.25 |
Hinweise zur Verwendung von use_imputation
Wenn die Methode
use_imputation
alsTrue
angegeben ist und die Eingabedaten fehlende Werte enthalten:imputation_threshold
wird wirksam.- Imputer-Kandidaten in
imputer_list
werden für die Suche nach dem besten Imputer verwendet. - Wenn der beste Imputer
Fill
ist, werdenimputer_fill_type
undimputer_fill_value
angewendet; andernfalls werden sie ignoriert.
Wenn die Methode
use_imputation
alsTrue
angegeben ist und die Eingabedaten keine fehlenden Werte aufweisen:imputation_threshold
is ignored.- Imputer-Kandidaten in
imputer_list
werden für die Suche nach dem besten Imputer verwendet. Wenn der beste ImputerFill
ist, werdenimputer_fill_type
undimputer_fill_value
angewendet; andernfalls werden sie ignoriert.
Wenn die Methode
use_imputation
alsFalse
angegeben ist, die Eingabedaten jedoch fehlende Werte enthalten:use_imputation
wird mit einer Warnung aktiviert, dann folgt die Methode dem Verhalten für das erste Szenario.
Wenn die Methode
use_imputation
alsFalse
angegeben ist und die Eingabedaten keine fehlenden Werte enthalten, ist keine weitere Verarbeitung erforderlich.
Beispiel:
"pipelines": [
{
"id": "automl",
"runtime_ref": "hybrid",
"nodes": [
{
"id": "automl-ts",
"type": "execution_node",
"op": "kube",
"runtime_ref": "automl",
"parameters": {
"del_on_close": true,
"optimization": {
"target_columns": [2,3,4],
"timestamp_column": 1,
"use_imputation": true
}
}
}
]
}
]
Übergeordnetes Thema: Datenimputation in AutoAI -Experimenten