0 / 0
Retourner à la version anglaise de la documentation
Noeud Ajustement de simulation
Dernière mise à jour : 04 juil. 2024
Nœud ajustement de simulation (SPSS Modeler)

Le noeud Ajustement de simulation ajuste un ensemble de distributions statistiques candidates à chaque champ figurant dans les données. L'ajustement de chaque distribution à un champ est évalué à l'aide d'un critère de qualité d'ajustement. Lors de l'exécution d'un noeud Ajustement de simulation, un noeud Générer une simulation est créé (ou un noeud existant est mis à jour). La distribution d'ajustement la mieux adaptée est affectée à chaque champ. Le noeud Générer une simulation peut ensuite être utilisé pour générer des données simulées pour chaque champ.

Bien que le noeud Ajustement de simulation soit un noeud terminal, il n'ajoute pas de sortie au panneau Sorties ou à des données d'exportation.

Remarque: Si les données d'historique sont clairsemées (c'est-à-dire qu'il existe de nombreuses valeurs manquantes), il peut être difficile pour le composant d'ajustement de trouver suffisamment de valeurs valides pour ajuster les distributions aux données. Lorsque les données sont éparpillées, vous devez, soit les retirer avant l'ajustement si elles ne sont pas requises, soit imputer les valeurs manquantes. A l'aide des options QUALITE du noeud Audit de données, vous pouvez afficher le nombre d'enregistrements complets, identifier les champs éparpillés et sélectionner une méthode d'imputation. Si le nombre d'enregistrements est insuffisant pour l'ajustement de distribution, vous pouvez utiliser un noeud Equilibrer pour augmenter le nombre d'enregistrements.

Utilisation d'un noeud Ajustement de simulation pour créer automatiquement un noeud Générer une simulation

Lors de la première exécution du noeud Ajustement de simulation, un noeud Générer une simulation est créé avec un lien de mise à jour vers le noeud Ajustement de simulation. Si le noeud Ajustement de simulation est réexécuté, un nouveau noeud Générer une simulation sera créé uniquement si le lien de mise à jour a été retiré. Vous pouvez également utiliser un noeud Ajustement de simulation pour mettre à jour un noeud Générer une simulation connecté. Le résultat varie suivant si les mêmes champs sont présents ou non dans les deux noeuds et si les champs sont déverrouillés ou non dans le noeud Générer une simulation. Pour plus d'informations, voir Noeud Sim Gen .

Un noeud Ajustement de simulation ne peut contenir qu'un lien de mise à jour vers un noeud Générer une simulation. Pour définir un lien de mise à jour vers un noeud Générer une simulation, procédez comme suit :

  1. Cliquez avec le bouton droit de la souris sur le noeud Ajustement de simulation et choisissez Définir le lien Mettre à jour.
  2. Cliquez sur le noeud Générer une simulation vers lequel vous souhaitez définir un lien de mise à jour.

Pour retirer un lien de mise à jour entre un noeud Ajustement de simulation et un noeud Générer une simulation, cliquez avec le bouton droit de la souris sur le lien de mise à jour et sélectionnez Retirer le lien.

Ajustement de distribution

Une distribution statistique représente la fréquence théorique de l'occurrence des valeurs qu'une variable peut prendre. Dans le noeud Ajustement de simulation, un ensemble de distributions statistiques théoriques est comparé à chaque champ de données. Les paramètres de la distribution théorique sont ajustés pour donner la meilleure adéquation aux données selon une mesure de la qualité d'ajustement, soit le critère Anderson-Darling , soit le critère Kolmogorov-Smirnov . Les résultats de l'ajustement de distribution par le noeud Ajustement de simulation indiquent quelles distributions ont été ajustées, les meilleures estimations de paramètres pour chaque distribution et la qualité d'ajustement de chaque distribution aux données. Lors de l'ajustement de distribution, les corrélations entre les champs dotés d'un type de stockage numérique et les contingences entre les champs dotés d'une distribution catégorielle sont également calculées. Les résultats de l'ajustement de distribution sont utilisés pour créer un noeud Générer une simulation.

Avant que les distributions soient ajustées à vos données, les 1 000 premiers enregistrements sont examinés à la recherche de valeurs manquantes. S'il manque trop de valeurs, l'ajustement de distribution n'est pas possible. Vous devez alors décider si l'une des options suivantes est adaptée :
  • Utiliser un noeud en amont pour retirer les enregistrements contenant des valeurs manquantes
  • Utiliser un noeud en amont pour imputer des valeurs pour les valeurs manquantes.
L'ajustement de distribution n'exclut pas les valeurs manquantes de l'utilisateur. Si vos données contiennent des valeurs manquantes de l'utilisateur et que vous souhaitez qu'elles soient exclues de l'ajustement de distribution, vous devez définir ces valeurs en tant que valeurs système manquantes.

Le rôle d'un champ n'est pas pris en compte lorsque les distributions sont ajustées. Par exemple, les champs dotés du rôle Cible sont traités de la même façon que ceux dotés des rôles Entrée, Aucun, Les deux, Partition, Scission, Fréquence et ID.

Les champs sont traités différemment au cours de l'ajustement de distribution, selon le type de stockage et le niveau de mesure. Le traitement des champs lors de l'ajustement de distribution est décrit dans le tableau ci-dessous.

Tableau 1. Ajustement de distribution en fonction du type de stockage et du niveau de mesure des champs
Type de stockage     Niveau de mesure      
  Continu Catégoriel Indicateur Sans effet Ordinaux Sans type
Chaîne Irréalisable   Les distributions catégorielles, dice et fixes sont ajustées      
Entier          
Réal          
Durée Toutes les distributions sont ajustées. Les corrélations et contingences sont calculées. La distribution catégorielle est ajustée. Les corrélations ne sont pas calculées.   Les distributions binomiales, binomiales négatives et de Poisson sont ajustées et les corrélations sont calculées. Le champ est ignoré et n'est pas transmis au noeud Générer une simulation.
Date :          
Horodatage          
Inconnu   Le type de stockage approprié est déterminé à partir des données.    

Les champs dotés du niveau de mesure ordinal sont traités comme des champs continus et sont inclus dans la table de corrélations dans le noeud Générer une simulation. Si vous voulez qu'une distribution qui n'est ni binomiale, ni binomiale négative, ni de Poisson soit ajustée sur un champ ordinal, vous devez modifier le niveau de mesure du champ en continu. Si vous avez défini au préalable un libellé pour chaque valeur d'un champ ordinal et que vous modifiez ensuite le niveau de mesure en continu, les libellés seront perdus.

Les champs dotés de valeurs uniques ne sont pas traités différemment des champs contenant plusieurs valeurs lors de l'ajustement de distribution. Les champs dont le type de stockage est Heure, Date ou Horodatage sont traités comme des champs numériques.

Ajustement des distributions aux champs de scission

Si vos données contiennent un champ de scission et que vous souhaitez que l'ajustement de distribution soit réalisé séparément pour chaque scission, vous devez transformer les données à l'aide d'un noeud Restructurer en amont. A l'aide du noeud Restructurer, générez un nouveau champ pour chaque valeur du champ de scission. Vous pouvez ensuite utiliser ces données restructurées pour l'ajustement de distribution dans le noeud Ajustement de simulation.

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus