Paramètres d'expérimentation utilisés pour l'imputation de données dans les expériences de séries temporelles.
Méthodes d'imputation des données
Appliquez l'une de ces méthodes d'imputation de données dans les paramètres d'expérimentation pour fournir des valeurs manquantes dans un jeu de données.
Méthode d"imputation | Descriptif |
---|---|
FlattenIterative | Les données de séries temporelles sont d'abord aplaties, puis les valeurs manquantes sont imputées avec les valeurs itératives de Scikit-learn. |
Linéaire | La méthode d'interpolation linéaire est utilisée pour attribuer la valeur manquante. |
Cubique | La méthode d'interpolation cubique est utilisée pour imputer la valeur manquante. |
Précédent | La valeur manquante est imputée avec la valeur précédente. |
Suivant | La valeur manquante est imputée avec la valeur suivante. |
Compléter | La valeur manquante est imputée à l'aide de la valeur spécifiée par l'utilisateur, de la moyenne de l'échantillon ou de la médiane de l'échantillon. |
Paramètres d'entrée
Ces commandes sont utilisées pour prendre en charge l'imputation de données pour les expériences de séries temporelles dans un bloc-notes.
Nom | Descriptif | Valeur | DefaultValue |
---|---|---|---|
use_imputation | Indicateur d'activation ou de désactivation de l'imputation. | True ou False | Oui |
imputer_list | Liste des noms de noms (chaînes) à rechercher. Si aucune liste n'est spécifiée, tous les imputeurs par défaut sont recherchés. Si une liste vide est transmise, tous les imputeurs sont recherchés. | "FlattenIterative", "Linear", "Cubic", "Précédent", "Fill", "Suivant" | "FlattenIterative", "Linear", "Cubic", "Précédent" |
imputer_fill_type | Catégories de " remplissage " | " Moyenne " / " médiane " / " valeur " | "valeur" |
imputer_fill_value | Une valeur numérique unique à remplir pour toutes les valeurs manquantes. Ne s'applique que lorsque " imputer_fill_type " est indiqué comme " valeur ". Ignoré si " moyenne " ou " médiane " est spécifié pour " imputer_fill_type ". | (Infinity négatif, Infinity Positif) | 0 |
Seuil d'imputation | Seuil d'imputation. Le rapport de valeur manquante ne doit pas être supérieur au seuil dans une colonne. Sinon, cela génère une erreur. | (0, 1) | 0.25 |
Remarques relatives à l'utilisation de use_imputation
Si la méthode
use_imputation
est spécifiée en tant queTrue
et que les données d'entrée comportent des valeurs manquantes:imputation_threshold
prend effet.- Les candidats figurant dans
imputer_list
seront utilisés pour rechercher les meilleurs résultats. - Si le meilleur résultat est
Fill
,imputer_fill_type
etimputer_fill_value
sont appliqués ; dans le cas contraire, ils sont ignorés.
Si la méthode
use_imputation
est définie surTrue
et que les données d'entrée ne comportent pas de valeurs manquantes:imputation_threshold
est ignoré.- Les candidats à
imputer_list
sont utilisés pour rechercher les meilleurs candidats. Si le meilleur résultat estFill
,imputer_fill_type
etimputer_fill_value
sont appliqués ; dans le cas contraire, ils sont ignorés.
Si la méthode
use_imputation
est spécifiée commeFalse
mais que les données d'entrée comportent des valeurs manquantes:use_imputation
est activé avec un avertissement, puis la méthode suit le comportement du premier scénario.
Si la méthode
use_imputation
est spécifiée en tant queFalse
et que les données d'entrée ne comportent pas de valeurs manquantes, aucun traitement supplémentaire n'est requis.
Par exemple :
"pipelines": [
{
"id": "automl",
"runtime_ref": "hybrid",
"nodes": [
{
"id": "automl-ts",
"type": "execution_node",
"op": "kube",
"runtime_ref": "automl",
"parameters": {
"del_on_close": true,
"optimization": {
"target_columns": [2,3,4],
"timestamp_column": 1,
"use_imputation": true
}
}
}
]
}
]
Rubrique parent: Imputation de données dans les expérimentations AutoAI