0 / 0

propriétés de samplenode

Dernière mise à jour : 12 févr. 2025
propriétés de samplenode

Icône de noeud d'exemple Le noeud Echantillonner sélectionne un sous-ensemble d'enregistrements. Divers types d'échantillon sont pris en charge, notamment les échantillons stratifiés, en cluster et non aléatoires (structurés). L'échantillonnage peut être utile pour améliorer les performances et pour sélectionner des groupes d'enregistrements ou de transactions connexes à analyser.

Exemple

/* Create two Sample nodes to extract 
   different samples from the same data */

node = stream.create("sample", "My node") 
node.setPropertyValue("method", "Simple")
node.setPropertyValue("mode", "Include")
node.setPropertyValue("sample_type", "First")
node.setPropertyValue("first_n", 500)

node = stream.create("sample", "My node") 
node.setPropertyValue("method", "Complex")
node.setPropertyValue("stratify_by", ["Sex", "Cholesterol"])
node.setPropertyValue("sample_units", "Proportions")
node.setPropertyValue("sample_size_proportions", "Custom")
node.setPropertyValue("sizes_proportions", [["M", "High", "Default"], ["M", "Normal", "Default"],
 ["F", "High", 0.3], ["F", "Normal", 0.3]])
Tableau 1. Propriétés de samplenode
samplenodepropriétés Type de données Description de la propriété
method Complexe simple  
mode Include Discard Enlève ou isole les enregistrements qui correspondent à la condition indiquée.
sample_type First OneInN RandomPct Indique la méthode d'échantillonnage.
first_n Integer Les enregistrements jusqu'au point de césure indiqué sont inclus ou exclus.
one_in_n number Inclut ou exclut un enregistrement tous les n enregistrements.
rand_pct number Indique le pourcentage d'enregistrements à inclure ou à exclure.
use_max_size option Activez l'utilisation du paramètre maximum_size .
maximum_size Integer Indiquez la taille maximale des échantillons à inclure dans le flux de données ou à exclure du flux. Cette option est redondante et donc désactivée lorsque First et Include sont spécifiés.
set_random_seed option Active l'utilisation du paramètre de valeur de départ aléatoire.
random_seed Integer Indique la valeur utilisée en tant que valeur de départ aléatoire.
complex_sample_type Random Systematic  
sample_units Proportions Counts  
sample_size_proportions Fixed Custom Variable  
sample_size_counts Fixed Custom Variable  
fixed_proportions number  
fixed_counts Integer  
variable_proportions Zone  
variable_counts Zone  
use_min_stratum_size option  
minimum_stratum_size Integer Cette option s'applique uniquement lorsqu'un exemple complexe est pris avec Sample units=Proportions.
use_max_stratum_size option  
maximum_stratum_size Integer Cette option s'applique uniquement lorsqu'un exemple complexe est pris avec Sample units=Proportions.
clusters Zone  
stratify_by [field1 ... fieldN]  
specify_input_weight option  
input_weight Zone  
new_output_weight chaîne  
sizes_proportions [[string valeur de chaîne][string valeur de chaîne]…] Si sample_units=proportions et sample_size_proportions=Custom, spécifie une valeur pour chaque combinaison possible de valeurs de champs de stratification.
default_proportion number  
sizes_counts [[string valeur de chaîne][string valeur de chaîne]…] Spécifie une valeur pour chaque combinaison de valeurs possible pour les champs de stratification. L'utilisation ressemble à sizes_proportions mais spécifie un entier plutôt qu'une proportion.
default_count number