0 / 0
Zurück zur englischen Version der Dokumentation

Implementierungsdetails der Datenimputation für Zeitreihenexperimente

Letzte Aktualisierung: 04. Okt. 2024
Implementierungsdetails der Datenimputation für Zeitreihenexperimente

Die Experimenteinstellungen für die Datenimputation in Zeitreihenexperimenten.

Datenimputationsmethoden

Wenden Sie eine dieser Datenimputationsmethoden in Experimenteinstellungen an, um fehlende Werte in einem Dataset bereitzustellen.

Datenimputationsmethoden für Klassifizierungs-und Regressionsexperimente
Imputationsmethode Beschreibung
FlattenIterative Zeitreihendaten werden zuerst abgeflacht, dann werden fehlende Werte mit dem iterativen Imputer von Scikit-learn imputiert.
Linear Lineare Interpolationsmethode wird verwendet, um den fehlenden Wert zu imputieren.
Kubisch Kubische Interpolationsmethode wird verwendet, um den fehlenden Wert zu imputieren.
Zurück Fehlender Wert wird mit dem vorherigen Wert imputiert.
Weiter Fehlender Wert wird mit dem nächsten Wert imputiert.
Füllung Fehlender Wert wird mithilfe eines benutzerdefinierten Werts, eines Stichprobenmittelwerts oder eines Stichprobenmedian imputiert.

Eingabeeinstellungen

Mit diesen Befehlen wird die Datenimputation für Zeitreihenexperimente in einem Notebook unterstützt.

Datenimputationsmethoden für Zeitreihenexperimente
Ihren Namen Beschreibung Wert DefaultValue
use_imputation Flag zum Ein-oder Ausschalten der Imputation. True oder False Ja
imputer_list Liste der zu durchsuchenden Imputernamen (Zeichenfolgen). Wird keine Liste angegeben, werden alle Standardimputer durchsucht. Wenn eine leere Liste übergeben wird, werden alle Imputer durchsucht. "FlattenIterative", "Linear", "Cubic", "Previous", "Fill", "Next" "FlattenIterative", "Linear", "Cubic", "Previous"
imputer_fill_typ Kategorien des Imputers "Fill" "mean"/"median"/"value" "wert"
imputer_fill_value Ein einzelner numerischer Wert, der für alle fehlenden Werte gefüllt werden soll. Gilt nur, wenn "imputer_fill_type" als "value" angegeben ist. Wird ignoriert, wenn "mean" oder "median" für "imputer_fill_type" angegeben ist. (Negativ unendlich, Positive unendlich) 0
imputation_threshold Schwellenwert für die Imputation. Das Verhältnis fehlender Werte darf nicht größer als der Schwellenwert in einer Spalte sein. Andernfalls tritt ein Fehler auf. (0, 1) 0.25

Hinweise zur Verwendung von use_imputation

  • Wenn die Methode use_imputation als True angegeben ist und die Eingabedaten fehlende Werte enthalten:

    • imputation_threshold wird wirksam.
    • Imputer-Kandidaten in imputer_list werden für die Suche nach dem besten Imputer verwendet.
    • Wenn der beste Imputer Fillist, werden imputer_fill_type und imputer_fill_value angewendet; andernfalls werden sie ignoriert.
  • Wenn die Methode use_imputation als True angegeben ist und die Eingabedaten keine fehlenden Werte aufweisen:

    • imputation_threshold is ignored.
    • Imputer-Kandidaten in imputer_list werden für die Suche nach dem besten Imputer verwendet. Wenn der beste Imputer Fillist, werden imputer_fill_type und imputer_fill_value angewendet; andernfalls werden sie ignoriert.
  • Wenn die Methode use_imputation als False angegeben ist, die Eingabedaten jedoch fehlende Werte enthalten:

    • use_imputation wird mit einer Warnung aktiviert, dann folgt die Methode dem Verhalten für das erste Szenario.
  • Wenn die Methode use_imputation als False angegeben ist und die Eingabedaten keine fehlenden Werte enthalten, ist keine weitere Verarbeitung erforderlich.

Beispiel:

"pipelines": [
      {
        "id": "automl",
        "runtime_ref": "hybrid",
        "nodes": [
          {
            "id": "automl-ts",
            "type": "execution_node",
            "op": "kube",
            "runtime_ref": "automl",
            "parameters": {
              "del_on_close": true,
              "optimization": {
	          "target_columns": [2,3,4],
	          "timestamp_column": 1,
	          "use_imputation": true
              }
            }
          }
        ]
      }
    ]

Übergeordnetes Thema: Datenimputation in AutoAI -Experimenten