Dettagli di implementazione dell'imputazione dei dati per esperimenti di serie temporali
Le impostazioni di esperimento utilizzate per l'imputazione dei dati negli esperimenti di serie temporali.
Metodi di imputazione dei dati
Applicare uno di questi metodi di assegnazione dati nelle impostazioni dell'esperimento per fornire i valori mancanti in un dataset.
Metodo di imputazione | Descrizione |
---|---|
FlattenIterative | I dati delle serie temporali vengono prima appiattiti, quindi i valori mancanti vengono assegnati con l'imputatore iterativo Scikit-learn. |
Lineare | Il metodo di interpolazione lineare è utilizzato per impadare il valore mancante. |
Cubico | Il metodo di interpolazione cubica è utilizzato per impadare il valore mancante. |
Precedente | Il valore mancante viene assegnato con il valore precedente. |
Avanti | Il valore mancante viene assegnato al valore successivo. |
Riempi | Il valore mancante viene assegnato utilizzando il valore specificato dall'utente, la media del campione o la mediana del campione. |
Impostazioni di input
Questi comandi sono utilizzati per supportare l'imputazione dei dati per esperimenti di serie temporali in un notebook.
Nome | Descrizione | Valore | DefaultValue |
---|---|---|---|
use_imputazione | Indicatore per attivare o disattivare l'assegnazione. | True o False | Vero |
imputer_list | Elenco dei nomi di imputazione (stringhe) alla ricerca. Se non viene specificato un elenco, vengono ricercati tutti gli imputatori predefiniti. Se viene passato un elenco vuoto, vengono ricercati tutti gli impattatori. | "FlattenIterative", "Lineare", "Cubico", "Precedente", "Riempimento", "Successivo" | "FlattenIterative", "Lineare", "Cubico", "Precedente" |
imputer_fill_type | Categorie di "Fill" imputer | "media" / "mediana" / "valore" | "valore" |
imputer_fill_value | Un valore numerico unico da compilare per tutti i valori mancanti. Si applica solo quando "imputer_fill_type" viene specificato come "valore". Ignorato se viene specificato "medio" o "mediano" per " imputer_fill_type. | (Infinito Negativo, Infinity positivo) | 0 |
imputazione_soglia | Soglia di imputazione. Il rapporto valore mancante non deve essere maggiore della soglia in una sola colonna. Altrimenti, i risultati in un errore. | (0, 1) | 0.25 |
Note per l'utilizzo di use_imputation
Se il metodo
è specificato comeuse_imputation
e i dati di input hanno valori mancanti:True
prende effetto.imputation_threshold
- i candidati di imputazione in
sarebbero stati utilizzati per cercare il miglior imputato.imputer_list
- Se l'assegnazione migliore è
,Fill
eimputer_fill_type
vengono applicati; altrimenti, vengono ignorati.imputer_fill_value
Se il metodo
è specificato comeuse_imputation
e i dati di input non hanno valori mancanti:True
viene ignorato.imputation_threshold
- i candidati di imputazione in
sono utilizzati alla ricerca della migliore imputazione. Se il miglior imputato èimputer_list
,Fill
eimputer_fill_type
vengono applicati; altrimenti vengono ignorati.imputer_fill_value
Se il metodo
è specificato comeuse_imputation
ma i dati di input hanno valori mancanti:False
viene attivato con un'avvertenza, quindi il metodo segue il comportamento per il primo scenario.use_imputation
Se il metodo
è specificato comeuse_imputation
e i dati di input non hanno valori mancanti, non è richiesta alcuna ulteriore elaborazione.False
Ad esempio:
"pipelines": [ { "id": "automl", "runtime_ref": "hybrid", "nodes": [ { "id": "automl-ts", "type": "execution_node", "op": "kube", "runtime_ref": "automl", "parameters": { "del_on_close": true, "optimization": { "target_columns": [2,3,4], "timestamp_column": 1, "use_imputation": true } } } ] } ]
Argomento principale: Assegnazione dati negli esperimenti AutoAI