0 / 0
Torna alla versione inglese della documentazione
Dettagli di implementazione dell'imputazione dei dati per esperimenti di serie temporali
Ultimo aggiornamento: 07 ott 2024
Dettagli di implementazione dell'imputazione dei dati per esperimenti di serie temporali

Le impostazioni di esperimento utilizzate per l'imputazione dei dati negli esperimenti di serie temporali.

Metodi di imputazione dei dati

Applicare uno di questi metodi di assegnazione dati nelle impostazioni dell'esperimento per fornire i valori mancanti in un dataset.

Metodi di imputazione dei dati per esperimenti di classificazione e regressione
Metodo di imputazione Descrizione
FlattenIterative I dati delle serie temporali vengono prima appiattiti, quindi i valori mancanti vengono assegnati con l'imputatore iterativo Scikit-learn.
Lineare Il metodo di interpolazione lineare è utilizzato per impadare il valore mancante.
Cubico Il metodo di interpolazione cubica è utilizzato per impadare il valore mancante.
Precedente Il valore mancante viene assegnato con il valore precedente.
Avanti Il valore mancante viene assegnato al valore successivo.
Riempi Il valore mancante viene assegnato utilizzando il valore specificato dall'utente, la media del campione o la mediana del campione.

Impostazioni di input

Questi comandi sono utilizzati per supportare l'imputazione dei dati per esperimenti di serie temporali in un notebook.

Metodi di imputazione dei dati per esperimenti di serie temporali
Nome Descrizione Valore DefaultValue
use_imputazione Indicatore per attivare o disattivare l'assegnazione. True o False Vero
imputer_list Elenco dei nomi di imputazione (stringhe) alla ricerca. Se non viene specificato un elenco, vengono ricercati tutti gli imputatori predefiniti. Se viene passato un elenco vuoto, vengono ricercati tutti gli impattatori. "FlattenIterative", "Lineare", "Cubico", "Precedente", "Riempimento", "Successivo" "FlattenIterative", "Lineare", "Cubico", "Precedente"
imputer_fill_type Categorie di "Fill" imputer "media" / "mediana" / "valore" "valore"
imputer_fill_value Un valore numerico unico da compilare per tutti i valori mancanti. Si applica solo quando "imputer_fill_type" viene specificato come "valore". Ignorato se viene specificato "medio" o "mediano" per " imputer_fill_type. (Infinito Negativo, Infinity positivo) 0
imputazione_soglia Soglia di imputazione. Il rapporto valore mancante non deve essere maggiore della soglia in una sola colonna. Altrimenti, i risultati in un errore. (0, 1) 0.25

Note per l'utilizzo di use_imputation

  • Se il metodo use_imputation è specificato come True e i dati di input hanno valori mancanti:

    • imputation_threshold prende effetto.
    • i candidati di imputazione in imputer_list sarebbero stati utilizzati per cercare il miglior imputato.
    • Se l'assegnazione migliore è Fill, imputer_fill_type e imputer_fill_value vengono applicati; altrimenti, vengono ignorati.
  • Se il metodo use_imputation è specificato come True e i dati di input non hanno valori mancanti:

    • imputation_threshold viene ignorato.
    • i candidati di imputazione in imputer_list sono utilizzati alla ricerca della migliore imputazione. Se il miglior imputato è Fill, imputer_fill_type e imputer_fill_value vengono applicati; altrimenti vengono ignorati.
  • Se il metodo use_imputation è specificato come False ma i dati di input hanno valori mancanti:

    • use_imputation viene attivato con un'avvertenza, quindi il metodo segue il comportamento per il primo scenario.
  • Se il metodo use_imputation è specificato come False e i dati di input non hanno valori mancanti, non è richiesta alcuna ulteriore elaborazione.

Ad esempio:

"pipelines": [
      {
        "id": "automl",
        "runtime_ref": "hybrid",
        "nodes": [
          {
            "id": "automl-ts",
            "type": "execution_node",
            "op": "kube",
            "runtime_ref": "automl",
            "parameters": {
              "del_on_close": true,
              "optimization": {
	          "target_columns": [2,3,4],
	          "timestamp_column": 1,
	          "use_imputation": true
              }
            }
          }
        ]
      }
    ]

Argomento principale: Assegnazione dati negli esperimenti AutoAI

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni