0 / 0
Go back to the English version of the documentation
Szczegóły implementacji imputacji danych dla eksperymentów szeregów czasowych
Last updated: 18 sie 2023
Szczegóły implementacji imputacji danych dla eksperymentów szeregów czasowych

Ustawienia eksperymentu używane do podstawiania danych w eksperymentach szeregów czasowych.

Metody imputacji danych

Zastosuj jedną z tych metod podstawiania danych w ustawieniach eksperymentu, aby dostarczyć brakujące wartości w zestawie danych.

Metody imputacji danych dla eksperymentów klasyfikacyjnych i regresyjnych
Metoda podstawiania Opis
FlattenIterative Dane szeregów czasowych są najpierw spłaszczone, a następnie brakujące wartości są podstawiane przez Scikit-naucz się iteracyjnego imputer.
Liniowy Metoda interpolacji liniowej jest używana do podstawiania brakującej wartości.
Sześcienna Metoda interpolacji sześciennej jest używana do podstawiania brakującej wartości.
Wstecz Brakująca wartość jest podstawiana za pomocą poprzedniej wartości.
Dalej Brakująca wartość jest podstawiana przy użyciu następnej wartości.
Wypełnienie Brakująca wartość jest podstawiana za pomocą wartości określonej przez użytkownika lub średniej próbki lub mediany próby.

Ustawienia wejściowe

Te komendy są używane do obsługi podstawiania danych w przypadku eksperymentów serii czasowych w notatniku.

Metody imputacji danych dla eksperymentów serii czasowych
Nazwa Opis Wartość DefaultValue
use_imputation Flaga włączania lub wyłączania imputacji przełączania. True lub False Prawda
lista_komputerów Lista nazw podstawianych (łańcuchów) do przeszukania. Jeśli lista nie jest określona, przeszukiwane są wszystkie domyślne elementy. Jeśli przekazywana jest pusta lista, przeszukiwane są wszystkie impasy. "FlattenIterative", "Linear", "Cubic", "Previous", "Fill", "Next" "FlattenIterative", "Liniowy", "Cubic", "Poprzedni"
imputer_fill_type Kategorie "Wypełnienie" "średnia"/"mediana"/"wartość" "wartość"
Wartość parametru imputer_fill_value Pojedyncza wartość liczbowa, która ma być wypełniona dla wszystkich brakujących wartości. Ma zastosowanie tylko wtedy, gdy wartość "imputer_fill_type" jest określona jako "wartość". Zignorowano, jeśli dla parametru "imputer_fill_type" określono "średnią" lub "medianę". (Ujemna Nieskończoność, Dodatnia Nieskończoność) 0
próg imputation_threshold Próg imputacji. Brakujący współczynnik wartości nie może być większy od progu w jednej kolumnie. W przeciwnym razie powoduje wystąpienie błędu. (0, 1) 0.25

Uwagi dotyczące użycia funkcji use_imputation

  • Jeśli metoda use_imputation jest określona jako True , a dane wejściowe nie mają wartości:

    • imputation_threshold jest aktywne.
    • Kandydaci do wyszukiwania w produkcie imputer_list będą mogli wyszukać najlepszą podwykonawcę.
    • If the best imputer is Fill, imputer_fill_type and imputer_fill_value are applied; otherwise, they are ignored.
  • Jeśli metoda use_imputation jest określona jako True , a dane wejściowe nie mają brakujących wartości:

    • imputation_threshold jest ignorowany.
    • Kandydaci do pracy z zewnątrz w produkcie imputer_list są używane do wyszukiwania najlepszego elementu imputer. If the best imputer is Fill, imputer_fill_type and imputer_fill_value are applied; otherwise, they are ignored.
  • Jeśli metoda use_imputation jest określona jako False , ale dane wejściowe nie mają wartości:

    • Produkt use_imputation jest włączony z ostrzeżeniem, a następnie metoda jest zgodna z zachowaniem pierwszego scenariusza.
  • Jeśli metoda use_imputation jest określona jako False , a dane wejściowe nie mają braków danych, dalsze przetwarzanie nie jest wymagane.

Na przykład:

"pipelines": [
      {
        "id": "automl",
        "runtime_ref": "hybrid",
        "nodes": [
          {
            "id": "automl-ts",
            "type": "execution_node",
            "op": "kube",
            "runtime_ref": "automl",
            "parameters": {
              "del_on_close": true,
              "optimization": {
	          "target_columns": [2,3,4],
	          "timestamp_column": 1,
	          "use_imputation": true
              }
            }
          }
        ]
      }
    ]

Temat nadrzędny: Imputacja danych w eksperymentach AutoAI

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more