Le impostazioni di esperimento utilizzate per l'imputazione dei dati negli esperimenti di serie temporali.
Metodi di imputazione dei dati
Applicare uno di questi metodi di assegnazione dati nelle impostazioni dell'esperimento per fornire i valori mancanti in un dataset.
Metodo di imputazione | Descrizione |
---|---|
FlattenIterative | I dati delle serie temporali vengono prima appiattiti, quindi i valori mancanti vengono assegnati con l'imputatore iterativo Scikit-learn. |
Lineare | Il metodo di interpolazione lineare è utilizzato per impadare il valore mancante. |
Cubico | Il metodo di interpolazione cubica è utilizzato per impadare il valore mancante. |
Precedente | Il valore mancante viene assegnato con il valore precedente. |
Avanti | Il valore mancante viene assegnato al valore successivo. |
Riempi | Il valore mancante viene assegnato utilizzando il valore specificato dall'utente, la media del campione o la mediana del campione. |
Impostazioni di input
Questi comandi sono utilizzati per supportare l'imputazione dei dati per esperimenti di serie temporali in un notebook.
Nome | Descrizione | Valore | DefaultValue |
---|---|---|---|
use_imputazione | Indicatore per attivare o disattivare l'assegnazione. | True o False | Vero |
imputer_list | Elenco dei nomi di imputazione (stringhe) alla ricerca. Se non viene specificato un elenco, vengono ricercati tutti gli imputatori predefiniti. Se viene passato un elenco vuoto, vengono ricercati tutti gli impattatori. | "FlattenIterative", "Lineare", "Cubico", "Precedente", "Riempimento", "Successivo" | "FlattenIterative", "Lineare", "Cubico", "Precedente" |
imputer_fill_type | Categorie di "Fill" imputer | "media" / "mediana" / "valore" | "valore" |
imputer_fill_value | Un valore numerico unico da compilare per tutti i valori mancanti. Si applica solo quando "imputer_fill_type" viene specificato come "valore". Ignorato se viene specificato "medio" o "mediano" per " imputer_fill_type. | (Infinito Negativo, Infinity positivo) | 0 |
imputazione_soglia | Soglia di imputazione. Il rapporto valore mancante non deve essere maggiore della soglia in una sola colonna. Altrimenti, i risultati in un errore. | (0, 1) | 0.25 |
Note per l'utilizzo di use_imputation
Se il metodo
use_imputation
è specificato comeTrue
e i dati di input hanno valori mancanti:imputation_threshold
prende effetto.- i candidati di imputazione in
imputer_list
sarebbero stati utilizzati per cercare il miglior imputato. - Se l'assegnazione migliore è
Fill
,imputer_fill_type
eimputer_fill_value
vengono applicati; altrimenti, vengono ignorati.
Se il metodo
use_imputation
è specificato comeTrue
e i dati di input non hanno valori mancanti:imputation_threshold
viene ignorato.- i candidati di imputazione in
imputer_list
sono utilizzati alla ricerca della migliore imputazione. Se il miglior imputato èFill
,imputer_fill_type
eimputer_fill_value
vengono applicati; altrimenti vengono ignorati.
Se il metodo
use_imputation
è specificato comeFalse
ma i dati di input hanno valori mancanti:use_imputation
viene attivato con un'avvertenza, quindi il metodo segue il comportamento per il primo scenario.
Se il metodo
use_imputation
è specificato comeFalse
e i dati di input non hanno valori mancanti, non è richiesta alcuna ulteriore elaborazione.
Ad esempio:
"pipelines": [
{
"id": "automl",
"runtime_ref": "hybrid",
"nodes": [
{
"id": "automl-ts",
"type": "execution_node",
"op": "kube",
"runtime_ref": "automl",
"parameters": {
"del_on_close": true,
"optimization": {
"target_columns": [2,3,4],
"timestamp_column": 1,
"use_imputation": true
}
}
}
]
}
]
Argomento principale: Assegnazione dati negli esperimenti AutoAI