Le noeud Ajustement de simulation ajuste un ensemble de distributions statistiques candidates à chaque champ figurant dans les données. L'ajustement de chaque distribution à un champ est évalué à l'aide d'un critère de qualité d'ajustement. Lors de l'exécution d'un noeud Ajustement de simulation, un noeud Générer une simulation est créé (ou un noeud existant est mis à jour). La distribution d'ajustement la mieux adaptée est affectée à chaque champ. Le noeud Générer une simulation peut ensuite être utilisé pour générer des données simulées pour chaque champ.
Bien que le noeud Ajustement de simulation soit un noeud terminal, il n'ajoute pas de sortie au panneau Sorties ou à des données d'exportation.
Utilisation d'un noeud Ajustement de simulation pour créer automatiquement un noeud Générer une simulation
Lors de la première exécution du noeud Ajustement de simulation, un noeud Générer une simulation est créé avec un lien de mise à jour vers le noeud Ajustement de simulation. Si le noeud Ajustement de simulation est réexécuté, un nouveau noeud Générer une simulation sera créé uniquement si le lien de mise à jour a été retiré. Vous pouvez également utiliser un noeud Ajustement de simulation pour mettre à jour un noeud Générer une simulation connecté. Le résultat varie suivant si les mêmes champs sont présents ou non dans les deux noeuds et si les champs sont déverrouillés ou non dans le noeud Générer une simulation. Pour plus d'informations, voir Noeud Sim Gen .
Un noeud Ajustement de simulation ne peut contenir qu'un lien de mise à jour vers un noeud Générer une simulation. Pour définir un lien de mise à jour vers un noeud Générer une simulation, procédez comme suit :
- Cliquez avec le bouton droit de la souris sur le noeud Ajustement de simulation et choisissez Définir le lien Mettre à jour.
- Cliquez sur le noeud Générer une simulation vers lequel vous souhaitez définir un lien de mise à jour.
Pour retirer un lien de mise à jour entre un noeud Ajustement de simulation et un noeud Générer une simulation, cliquez avec le bouton droit de la souris sur le lien de mise à jour et sélectionnez Retirer le lien.
Ajustement de distribution
Une distribution statistique représente la fréquence théorique de l'occurrence des valeurs qu'une variable peut prendre. Dans le noeud Ajustement de simulation, un ensemble de distributions statistiques théoriques est comparé à chaque champ de données. Les paramètres de la distribution théorique sont ajustés pour donner la meilleure adéquation aux données selon une mesure de la qualité d'ajustement, soit le critère Anderson-Darling , soit le critère Kolmogorov-Smirnov . Les résultats de l'ajustement de distribution par le noeud Ajustement de simulation indiquent quelles distributions ont été ajustées, les meilleures estimations de paramètres pour chaque distribution et la qualité d'ajustement de chaque distribution aux données. Lors de l'ajustement de distribution, les corrélations entre les champs dotés d'un type de stockage numérique et les contingences entre les champs dotés d'une distribution catégorielle sont également calculées. Les résultats de l'ajustement de distribution sont utilisés pour créer un noeud Générer une simulation.
- Utiliser un noeud en amont pour retirer les enregistrements contenant des valeurs manquantes
- Utiliser un noeud en amont pour imputer des valeurs pour les valeurs manquantes.
Le rôle d'un champ n'est pas pris en compte lorsque les distributions sont ajustées. Par exemple, les champs dotés du rôle Cible sont traités de la même façon que ceux dotés des rôles Entrée, Aucun, Les deux, Partition, Scission, Fréquence et ID.
Les champs sont traités différemment au cours de l'ajustement de distribution, selon le type de stockage et le niveau de mesure. Le traitement des champs lors de l'ajustement de distribution est décrit dans le tableau ci-dessous.
Type de stockage | Niveau de mesure | |||||
---|---|---|---|---|---|---|
Continu | Catégoriel | Indicateur | Sans effet | Ordinaux | Sans type | |
Chaîne | Irréalisable | Les distributions catégorielles, dice et fixes sont ajustées | ||||
Entier | ||||||
Réal | ||||||
Durée | Toutes les distributions sont ajustées. Les corrélations et contingences sont calculées. | La distribution catégorielle est ajustée. Les corrélations ne sont pas calculées. | Les distributions binomiales, binomiales négatives et de Poisson sont ajustées et les corrélations sont calculées. | Le champ est ignoré et n'est pas transmis au noeud Générer une simulation. | ||
Date : | ||||||
Horodatage | ||||||
Inconnu | Le type de stockage approprié est déterminé à partir des données. |
Les champs dotés du niveau de mesure ordinal sont traités comme des champs continus et sont inclus dans la table de corrélations dans le noeud Générer une simulation. Si vous voulez qu'une distribution qui n'est ni binomiale, ni binomiale négative, ni de Poisson soit ajustée sur un champ ordinal, vous devez modifier le niveau de mesure du champ en continu. Si vous avez défini au préalable un libellé pour chaque valeur d'un champ ordinal et que vous modifiez ensuite le niveau de mesure en continu, les libellés seront perdus.
Les champs dotés de valeurs uniques ne sont pas traités différemment des champs contenant plusieurs valeurs lors de l'ajustement de distribution. Les champs dont le type de stockage est Heure, Date ou Horodatage sont traités comme des champs numériques.
Ajustement des distributions aux champs de scission
Si vos données contiennent un champ de scission et que vous souhaitez que l'ajustement de distribution soit réalisé séparément pour chaque scission, vous devez transformer les données à l'aide d'un noeud Restructurer en amont. A l'aide du noeud Restructurer, générez un nouveau champ pour chaque valeur du champ de scission. Vous pouvez ensuite utiliser ces données restructurées pour l'ajustement de distribution dans le noeud Ajustement de simulation.