propriétés de mergenode
Dernière mise à jour : 12 févr. 2025
Le noeud Fusionner permet de créer, à partir de plusieurs enregistrements d'entrée, un seul enregistrement de sortie contenant tout ou partie des champs d'entrée. Il est utile de fusionner les données de différentes sources, telles que les données internes des clients et les données démographiques achetées.
Exemple
node = stream.create("merge", "My node")
# assume customerdata and salesdata are configured database import nodes
stream.link(customerdata, node)
stream.link(salesdata, node)
node.setPropertyValue("method", "Keys")
node.setPropertyValue("key_fields", ["id"])
node.setPropertyValue("common_keys", True)
node.setPropertyValue("join", "PartialOuter")
node.setKeyedPropertyValue("outer_join_tag", "2", True)
node.setKeyedPropertyValue("outer_join_tag", "4", True)
node.setPropertyValue("single_large_input", True)
node.setPropertyValue("single_large_input_tag", "2")
node.setPropertyValue("use_existing_sort_keys", True)
node.setPropertyValue("existing_sort_keys", [["id", "Ascending"]])
mergenode propriétés |
Type de données | Description de la propriété |
---|---|---|
method |
Order Keys Condition Rankedcondition |
Indique si les enregistrements font l'objet d'une fusion dans l'ordre dans lequel ils sont répertoriés dans les fichiers de données, si des champs-clés sont utilisés pour fusionner les enregistrements comportant des valeurs identiques dans ces champs-clés, si des enregistrements feront l'objet d'une fusion si une condition particulière est satisfaite ou si chaque ligne appariée dans l'ensemble de données principal et tous les jeux de données secondaires doit être fusionnée, en utilisant l'expression de classement pour trier les correspondances multiples par ordre croissant. |
condition |
chaîne | Si method est défini sur Condition , indique la condition d'inclusion ou de rejet des enregistrements. |
key_fields |
list | |
common_keys |
option | |
join |
Inner FullOuter PartialOuter Anti |
|
outer_join_tag.n |
option | Dans cette propriété, n est le nom de balise tel qu'il apparaît dans les propriétés du noeud. Remarque : vous pouvez indiquer plusieurs noms de balise, puisque n'importe quel nombre de jeux de données peut générer des enregistrements incomplets. |
single_large_input |
option | Indique si une fonction d'optimisation est utilisée lorsqu'une entrée est plus volumineuse que les autres. |
single_large_input_tag |
chaîne | Indique le nom de la balise tel qu'il apparaît dans les propriétés de la note. Notez que l'utilisation de cette propriété diffère légèrement de la propriété outer_join_tag (indicateur par rapport à la chaîne) car un seul jeu de données d'entrée peut être spécifié. |
use_existing_sort_keys |
option | Indique si les entrées sont déjà triées en fonction d'un ou de plusieurs champs-clés. |
existing_sort_keys |
[['chaîne', 'Ascending' ] \ ['chaîne'', 'Descending' ]] |
Indique les champs déjà triés ainsi que le sens du tri. |
primary_dataset |
chaîne | Si method est Rankedcondition , sélectionnez le fichier principal dans la fusion. Cet ensemble de données peut être considéré comme la partie de gauche d'une fusion de jointure
externe. |
rename_duplicate_fields |
Booléen | Si method est Rankedcondition , et que cette valeur est définie sur Y , si le fichier fusionné résultant contient plusieurs champs portant le même nom à partir de différentes sources de données, les balises respectives des sources de données sont ajoutées au début des en-têtes de colonne de champ. |
merge_condition |
chaîne | |
ranking_expression |
chaîne | |
Num_matches |
Integer | Nombre de correspondances à renvoyer, en fonction de merge_condition et de ranking_expression . Minimum 1, maximum 100. |
default_sort_order |
Ascending Descending |
Spécifiez si, par défaut, les enregistrements sont triés par ordre croissant ou décroissant de valeurs de clé de tri. |
La rubrique a-t-elle été utile ?
0/1000