propriétés de samplenode
Dernière mise à jour : 12 févr. 2025
Le noeud Echantillonner sélectionne un sous-ensemble d'enregistrements. Divers types d'échantillon sont pris en charge, notamment les échantillons stratifiés, en cluster et non aléatoires (structurés). L'échantillonnage peut être utile pour améliorer les performances et pour sélectionner des groupes d'enregistrements ou de transactions connexes à analyser.
Exemple
/* Create two Sample nodes to extract
different samples from the same data */
node = stream.create("sample", "My node")
node.setPropertyValue("method", "Simple")
node.setPropertyValue("mode", "Include")
node.setPropertyValue("sample_type", "First")
node.setPropertyValue("first_n", 500)
node = stream.create("sample", "My node")
node.setPropertyValue("method", "Complex")
node.setPropertyValue("stratify_by", ["Sex", "Cholesterol"])
node.setPropertyValue("sample_units", "Proportions")
node.setPropertyValue("sample_size_proportions", "Custom")
node.setPropertyValue("sizes_proportions", [["M", "High", "Default"], ["M", "Normal", "Default"],
["F", "High", 0.3], ["F", "Normal", 0.3]])
samplenode propriétés |
Type de données | Description de la propriété |
---|---|---|
method |
Complexe simple | |
mode |
Include Discard |
Enlève ou isole les enregistrements qui correspondent à la condition indiquée. |
sample_type |
First OneInN RandomPct |
Indique la méthode d'échantillonnage. |
first_n |
Integer | Les enregistrements jusqu'au point de césure indiqué sont inclus ou exclus. |
one_in_n |
number | Inclut ou exclut un enregistrement tous les n enregistrements. |
rand_pct |
number | Indique le pourcentage d'enregistrements à inclure ou à exclure. |
use_max_size |
option | Activez l'utilisation du paramètre maximum_size . |
maximum_size |
Integer | Indiquez la taille maximale des échantillons à inclure dans le flux de données ou à exclure du flux. Cette option est redondante et donc désactivée lorsque First et Include sont spécifiés. |
set_random_seed |
option | Active l'utilisation du paramètre de valeur de départ aléatoire. |
random_seed |
Integer | Indique la valeur utilisée en tant que valeur de départ aléatoire. |
complex_sample_type |
Random Systematic |
|
sample_units |
Proportions Counts |
|
sample_size_proportions |
Fixed Custom Variable |
|
sample_size_counts |
Fixed Custom Variable |
|
fixed_proportions |
number | |
fixed_counts |
Integer | |
variable_proportions |
Zone | |
variable_counts |
Zone | |
use_min_stratum_size |
option | |
minimum_stratum_size |
Integer | Cette option s'applique uniquement lorsqu'un exemple complexe est pris avec Sample
units=Proportions . |
use_max_stratum_size |
option | |
maximum_stratum_size |
Integer | Cette option s'applique uniquement lorsqu'un exemple complexe est pris avec Sample
units=Proportions . |
clusters |
Zone | |
stratify_by |
[field1 ... fieldN] | |
specify_input_weight |
option | |
input_weight |
Zone | |
new_output_weight |
chaîne | |
sizes_proportions |
[[string valeur de chaîne][string valeur de chaîne]…] |
Si sample_units=proportions et sample_size_proportions=Custom , spécifie une valeur pour chaque combinaison possible de valeurs de champs de stratification. |
default_proportion |
number | |
sizes_counts |
[[string valeur de chaîne][string valeur de chaîne]…] |
Spécifie une valeur pour chaque combinaison de valeurs possible pour les champs de stratification. L'utilisation ressemble à sizes_proportions mais spécifie un entier plutôt qu'une proportion. |
default_count |
number |
La rubrique a-t-elle été utile ?
0/1000