Avec le nœud Extension Output, vous pouvez exécuter des scripts écrits en R, Python ou Python for Spark pour produire des sorties.
Après avoir ajouté le noeud à votre canevas, double-cliquez dessus pour ouvrir ses propriétés.
Onglet de syntaxe
- Convertir les zones d'indicateur. Indique comment sont traités les champs indicateurs. Il existe deux options : chaînes à factoriser, entiers et réels à doubler et valeurs logiques (Vrai, Faux). Si vous sélectionnez Valeurs logiques (Vrai, Faux), les valeurs d'origine des zones d'indicateur sont perdues. Par exemple, si une zone a des valeurs
Male
etFemale
, elles sont remplacées parTrue
etFalse
. - Convertir les valeurs manquantes en valeur R 'non disponible' (NA). Lorsque cette option est sélectionnée, toutes les valeurs manquantes sont converties en RNAvaleur. La valeurNAest utilisé par R pour identifier les valeurs manquantes. Certaines fonctions R que vous utilisez peuvent avoir un argument qui peut contrôler le comportement de la fonction lorsque les données contiennentNA. Par exemple, la fonction peut vous permettre de choisir d'exclure automatiquement les enregistrements qui contiennentNA. Si cette option n'est pas sélectionnée, toutes les valeurs manquantes sont transmises à R sans modification et peuvent provoquer des erreurs lors de l'exécution de votre script R.
- Convertir les zones date / heure en classes R avec contrôle spécial pour les fuseaux horaires Lorsque cette option est sélectionnée, les variables avec des formats date ou date-heure sont converties en objets date / heure de R. Vous devez sélectionner l'une des options suivantes :
- R POSIXct. Les variables avec des formats de date ou de date-heure sont converties en RPOSIXctdes objets.
- R POSIXlt (liste). Les variables avec des formats de date ou de date / heure sont converties en RPOSIXltdes objets.
Remarque: Les formats POSIX sont des options avancées. Utilisez-les uniquement si votre script R indique que les champs de date/heure sont traités de manière à exiger ces formats. Les formats POSIX ne s'appliquent pas aux variables de format horaire.
Onglet Sortie console
L'onglet Sortie console contient toute sortie reçue lors de l'exécution du script R ou du script Python (par exemple, si vous utilisez un script R, il affiche la sortie reçue de la console R lors de l'exécution du script R dans le champ Syntaxe R de l'onglet Syntaxe ). Cette sortie peut inclure des messages d'erreur R ou Python ou des avertissements générés lorsque le script R ou le script Python est exécuté. La sortie peut être utilisée principalement pour déboguer le script. L'onglet Sortie de la console contient également le script à partir de la zone Syntaxe R ou Syntaxe Python.
Chaque fois que le script d'importation de l'extension est exécuté, le contenu de l'onglet Sortie de la console est remplacé par la sortie reçue de la console R ou Python. Vous ne pouvez pas éditer la sortie.