0 / 0

propriétés de mergenode

Dernière mise à jour : 12 févr. 2025
propriétés de mergenode

Icône de noeud Fusionner Le noeud Fusionner permet de créer, à partir de plusieurs enregistrements d'entrée, un seul enregistrement de sortie contenant tout ou partie des champs d'entrée. Il est utile de fusionner les données de différentes sources, telles que les données internes des clients et les données démographiques achetées.

Exemple

node = stream.create("merge", "My node")
# assume customerdata and salesdata are configured database import nodes
stream.link(customerdata, node)
stream.link(salesdata, node)
node.setPropertyValue("method", "Keys")
node.setPropertyValue("key_fields", ["id"])
node.setPropertyValue("common_keys", True)
node.setPropertyValue("join", "PartialOuter")
node.setKeyedPropertyValue("outer_join_tag", "2", True)
node.setKeyedPropertyValue("outer_join_tag", "4", True)
node.setPropertyValue("single_large_input", True)
node.setPropertyValue("single_large_input_tag", "2") 
node.setPropertyValue("use_existing_sort_keys", True)
node.setPropertyValue("existing_sort_keys", [["id", "Ascending"]])
Tableau 1. Propriétés de mergenode
mergenodepropriétés Type de données Description de la propriété
method Order
Keys
Condition
Rankedcondition
Indique si les enregistrements font l'objet d'une fusion dans l'ordre dans lequel ils sont répertoriés dans les fichiers de données, si des champs-clés sont utilisés pour fusionner les enregistrements comportant des valeurs identiques dans ces champs-clés, si des enregistrements feront l'objet d'une fusion si une condition particulière est satisfaite ou si chaque ligne appariée dans l'ensemble de données principal et tous les jeux de données secondaires doit être fusionnée, en utilisant l'expression de classement pour trier les correspondances multiples par ordre croissant.
condition chaîne Si method est défini sur Condition, indique la condition d'inclusion ou de rejet des enregistrements.
key_fields list  
common_keys option  
join Inner
FullOuter
PartialOuter
Anti
 
outer_join_tag.n option Dans cette propriété, n est le nom de balise tel qu'il apparaît dans les propriétés du noeud. Remarque : vous pouvez indiquer plusieurs noms de balise, puisque n'importe quel nombre de jeux de données peut générer des enregistrements incomplets.
single_large_input option Indique si une fonction d'optimisation est utilisée lorsqu'une entrée est plus volumineuse que les autres.
single_large_input_tag chaîne Indique le nom de la balise tel qu'il apparaît dans les propriétés de la note. Notez que l'utilisation de cette propriété diffère légèrement de la propriété outer_join_tag (indicateur par rapport à la chaîne) car un seul jeu de données d'entrée peut être spécifié.
use_existing_sort_keys option Indique si les entrées sont déjà triées en fonction d'un ou de plusieurs champs-clés.
existing_sort_keys [['chaîne', 'Ascending'] \ ['chaîne'', 'Descending']] Indique les champs déjà triés ainsi que le sens du tri.
primary_dataset chaîne Si method est Rankedcondition, sélectionnez le fichier principal dans la fusion. Cet ensemble de données peut être considéré comme la partie de gauche d'une fusion de jointure externe.
rename_duplicate_fields Booléen Si method est Rankedcondition, et que cette valeur est définie sur Y, si le fichier fusionné résultant contient plusieurs champs portant le même nom à partir de différentes sources de données, les balises respectives des sources de données sont ajoutées au début des en-têtes de colonne de champ.
merge_condition chaîne  
ranking_expression chaîne  
Num_matches Integer Nombre de correspondances à renvoyer, en fonction de merge_condition et de ranking_expression. Minimum 1, maximum 100.
default_sort_order Ascending
Descending
Spécifiez si, par défaut, les enregistrements sont triés par ordre croissant ou décroissant de valeurs de clé de tri.