0 / 0
Retourner à la version anglaise de la documentation
Détails de l'implémentation de l'imputation des données pour les expérimentations de série temporelle
Dernière mise à jour : 07 oct. 2024
Détails de l'implémentation de l'imputation des données pour les expérimentations de série temporelle

Paramètres d'expérimentation utilisés pour l'imputation de données dans les expériences de séries temporelles.

Méthodes d'imputation des données

Appliquez l'une de ces méthodes d'imputation de données dans les paramètres d'expérimentation pour fournir des valeurs manquantes dans un jeu de données.

Méthodes d'imputation des données pour les expériences de classification et de régression
Méthode d"imputation Descriptif
FlattenIterative Les données de séries temporelles sont d'abord aplaties, puis les valeurs manquantes sont imputées avec les valeurs itératives de Scikit-learn.
Linéaire La méthode d'interpolation linéaire est utilisée pour attribuer la valeur manquante.
Cubique La méthode d'interpolation cubique est utilisée pour imputer la valeur manquante.
Précédent La valeur manquante est imputée avec la valeur précédente.
Suivant La valeur manquante est imputée avec la valeur suivante.
Compléter La valeur manquante est imputée à l'aide de la valeur spécifiée par l'utilisateur, de la moyenne de l'échantillon ou de la médiane de l'échantillon.

Paramètres d'entrée

Ces commandes sont utilisées pour prendre en charge l'imputation de données pour les expériences de séries temporelles dans un bloc-notes.

Méthodes d'imputation de données pour les expériences de séries temporelles
Nom Descriptif Valeur DefaultValue
use_imputation Indicateur d'activation ou de désactivation de l'imputation. True ou False Oui
imputer_list Liste des noms de noms (chaînes) à rechercher. Si aucune liste n'est spécifiée, tous les imputeurs par défaut sont recherchés. Si une liste vide est transmise, tous les imputeurs sont recherchés. "FlattenIterative", "Linear", "Cubic", "Précédent", "Fill", "Suivant" "FlattenIterative", "Linear", "Cubic", "Précédent"
imputer_fill_type Catégories de " remplissage " " Moyenne " / " médiane " / " valeur " "valeur"
imputer_fill_value Une valeur numérique unique à remplir pour toutes les valeurs manquantes. Ne s'applique que lorsque " imputer_fill_type " est indiqué comme " valeur ". Ignoré si " moyenne " ou " médiane " est spécifié pour " imputer_fill_type ". (Infinity négatif, Infinity Positif) 0
Seuil d'imputation Seuil d'imputation. Le rapport de valeur manquante ne doit pas être supérieur au seuil dans une colonne. Sinon, cela génère une erreur. (0, 1) 0.25

Remarques relatives à l'utilisation de use_imputation

  • Si la méthode use_imputation est spécifiée en tant que True et que les données d'entrée comportent des valeurs manquantes:

    • imputation_threshold prend effet.
    • Les candidats figurant dans imputer_list seront utilisés pour rechercher les meilleurs résultats.
    • Si le meilleur résultat est Fill, imputer_fill_type et imputer_fill_value sont appliqués ; dans le cas contraire, ils sont ignorés.
  • Si la méthode use_imputation est définie sur True et que les données d'entrée ne comportent pas de valeurs manquantes:

    • imputation_threshold est ignoré.
    • Les candidats à imputer_list sont utilisés pour rechercher les meilleurs candidats. Si le meilleur résultat est Fill, imputer_fill_type et imputer_fill_value sont appliqués ; dans le cas contraire, ils sont ignorés.
  • Si la méthode use_imputation est spécifiée comme False mais que les données d'entrée comportent des valeurs manquantes:

    • use_imputation est activé avec un avertissement, puis la méthode suit le comportement du premier scénario.
  • Si la méthode use_imputation est spécifiée en tant que False et que les données d'entrée ne comportent pas de valeurs manquantes, aucun traitement supplémentaire n'est requis.

Par exemple :

"pipelines": [
      {
        "id": "automl",
        "runtime_ref": "hybrid",
        "nodes": [
          {
            "id": "automl-ts",
            "type": "execution_node",
            "op": "kube",
            "runtime_ref": "automl",
            "parameters": {
              "del_on_close": true,
              "optimization": {
	          "target_columns": [2,3,4],
	          "timestamp_column": 1,
	          "use_imputation": true
              }
            }
          }
        ]
      }
    ]

Rubrique parent: Imputation de données dans les expérimentations AutoAI

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus