0 / 0
Retourner à la version anglaise de la documentation

noeud Fusionner

Dernière mise à jour : 12 févr. 2025
Noeud Fusionner (SPSS Modeler)

Le noeud Fusionner permet de créer à partir de plusieurs enregistrements d'entrée un seul enregistrement de sortie contenant la totalité ou une partie des champs d'entrée. Cette opération permet notamment de fusionner des données provenant de différentes sources, telles que les données client internes et les données démographiques acquises.

Vous pouvez fusionner des données des manières suivantes :

  • La fusion par Ordre concatène les enregistrements correspondants issus de toutes les sources dans l'ordre d'entrée, jusqu'à ce que la plus petite source de données soit épuisée. Si vous utilisez cette option, il est important d'avoir trié vos données à l'aide d'un noeud Trier.
  • Fusionner à l'aide d'un champ Clé, tel que Customer ID, pour spécifier comment faire correspondre les enregistrements d'une source de données avec des enregistrements de l'autre ou des autres sources de données. Plusieurs types de jointures sont disponibles, notamment les jointures interne, externe complète, externe partielle et anti-jointure.
  • La fusion par Condition signifie que vous pouvez spécifier une condition à remplir pour que la fusion ait lieu. La condition peut être spécifiée directement dans le noeud, ou il est possible de la générer à l'aide du Générateur de formules.

Types de jointures

Lorsque vous utilisez une champ clé pour la fusion de données, vous pouvez trouver utile de réfléchir aux enregistrements qui seront exclus et qui seront inclus. Il y a une variété de jointures, qui sont expliquées ici. Les deux principaux types de jointure sont appelés jointures internes et jointures externes. Ces méthodes sont fréquemment utilisées pour fusionner des tables à partir d'ensembles de données associés selon les valeurs communes d'un champ clé, tel que Customer ID. Les jointures internes permettent d'obtenir des fusions "propres", ainsi qu'un de l'ensemble de données de sortie n'incluant que les enregistrements complets. Les jointures externes comprennent également des enregistrements complets issus des données fusionnées, mais elles vous permettent également d'inclure des données uniques provenant d'une ou de plusieurs tables d'entrée.

Les types de jointures autorisés sont décrits plus en détail ci-après.

Jointure interne Une jointure interne n'inclut que les enregistrements dont la valeur du champ clé est commune à toutes les tables d'entrée. En d'autres mots, les enregistrements sans correspondance ne seront pas inclus dans l'ensemble de données de sortie.

Jointure externe complète Une jointure externe complète inclut tous les enregistrements, qu'ils correspondent ou non, des tables d'entrée. Les jointures externes de gauche et de droite sont appelées jointures externes partielles.

un "Jointure externe partielle A " jointure externe partielle comprend tous les enregistrements correspondant au champ clé ainsi que les enregistrements non correspondants des tables spécifiées. (Autrement dit, elle inclut tous les enregistrements de certaines tables et uniquement les enregistrements correspondants d'autres tables.) Vous pouvez sélectionner des tables (telles que A et B affichées ici) à inclure dans la jointure externe sous les options de fusion des propriétés du noeud. Les jointures partielles sont également appelées jointures externes gauche ou droite lorsque deux tables seulement sont fusionnées. Etant donné que SPSS Modeler permet la fusion de plus de deux tables, il s'agit d'une jointure externe partielle.

Anti-jointure Un anti-joint n'inclut que les enregistrements non appariés de la première table d'entrée (la table A présentée ici). Ce type de jointure est le contraire d'une jointure interne et n'inclut pas les enregistrements complets dans l'ensemble de données de sortie.

Par exemple, si un de l'ensemble de données contient des informations sur des fermes et qu'un autre comporte des déclarations de sinistre relatives aux fermes, vous pouvez mettre en correspondance les enregistrements de la première source et ceux de la seconde à l'aide des options de fusion. Pour déterminer si un client inclus dans cet exemple de fermes a émis une déclaration de sinistre, utilisez l'option de jointure interne pour renvoyer la liste des correspondances de tous les ID de ces deux jeux de données.

Figure 1 : Exemple de sortie pour une fusion réalisée par jointure interne
Exemple de sortie pour une fusion réalisée par jointure interne

L'option de jointure externe complète permet de renvoyer à partir des tables d'entrée les enregistrements avec et sans correspondance. La valeur système manquante ($null$) sera utilisée pour toutes les valeurs incomplètes.

Figure 2. Exemple de sortie pour une fusion réalisée par jointure externe complète
Exemple de sortie pour une fusion réalisée par jointure externe complète

Une jointure externe partielle inclut tous les enregistrements mis en correspondance à l'aide du champ-clé, ainsi que les enregistrements sans correspondance issus des tables spécifiées. Le tableau affiche tous les enregistrements mis en correspondance à partir du champ d'ID, ainsi que ceux mis en correspondance à partir du premier de l'ensemble de données.

Figure 3 Exemple de sortie pour une fusion réalisée par jointure externe partielle
Exemple de sortie pour une fusion réalisée par jointure externe partielle

Si vous utilisez l'option anti-jointure, la table renvoie uniquement les enregistrements sans correspondance pour la première table d'entrée.

Figure 4 Exemple de sortie pour une fusion réalisée par anti-jointure
Exemple de sortie pour une fusion réalisée par anti-jointure