Avec le nœud Extension Import, vous pouvez exécuter des scripts écrits en R, Python ou Python for Spark pour importer des données.
Après avoir ajouté le noeud à votre canevas, double-cliquez dessus pour ouvrir ses propriétés.
Onglet de syntaxe
Sélectionnez votre type de syntaxe - R, Python ou Python for Spark. Puis, entrez ou collez votre script personnalisé pour importer des données. Lorsque la syntaxe est prête, vous pouvez exécuter le noeud.
Onglet Sortie console
L'onglet Sortie console contient toute sortie reçue lors de l'exécution du script R ou du script Python (par exemple, si vous utilisez un script R, il affiche la sortie reçue de la console R lors de l'exécution du script R dans le champ Syntaxe R de l'onglet Syntaxe ). La sortie peut contenir des messages d'erreur ou d'avertissement R ou Python produits lors de l'exécution du script R ou Python. Elle peut être utilisée, principalement, pour déboguer le script. L'onglet Sortie de la console contient également le script à partir de la zone Syntaxe R ou Syntaxe Python.
Chaque fois que le script d'importation de l'extension est exécuté, le contenu de l'onglet Sortie de la console est remplacé par la sortie reçue de la console R ou Python. Vous ne pouvez pas éditer cette sortie.
Filtrage ou renommage des champs
Vous pouvez renommer ou exclure des champs à n'importe quel point d'un flux. Par exemple, en tant que chercheur en médecine, vous n'êtes peut-être pas intéressé par le niveau de potassium (données de niveau champ) des patients (données de niveau enregistrement) ; vous pouvez donc filtrer le champ K
correspondant.
- A l'aide d'un noeud Filtrer, vous pouvez renommer ou filtrer les champs à n'importe quel point du flux
- Vous pouvez utiliser un noeud Filtrer pour mapper les champs d'un noeud d'importation à ceux d'un autre
Affichage et paramétrage des informations sur les types
A partir du noeud Type, vous pouvez spécifier des métadonnées de zone et des propriétés qui sont inestimables pour la modélisation et d'autres travaux.- Spécification d'un type d'utilisation, tel qu'une plage, un ensemble, un ensemble ordonné ou un indicateur, pour chaque champ de vos données
- Définition des options de traitement des valeurs manquantes et des valeurs système nulles
- Définition du rôle d'un champ à des fins de modélisation
- Spécification des valeurs d'un champ et des options utilisées pour lire automatiquement des valeurs à partir de vos données
- Spécification de libellés de valeur