Con il nodo Extension Import è possibile eseguire script scritti in R, Python o Python for Spark per importare i dati.
Dopo aver aggiunto il nodo ai propri canvas, fare doppio clic sul nodo per aprire le sue proprietà.
Scheda Sintassi
Selezionare il tipo di sintassi: R, Python o Python for Spark. Poi inserire o incollare il proprio script personalizzato per importare i dati. Quando la sintassi è pronta, è possibile eseguire il nodo.
Scheda Output console
La scheda Output console contiene l'output ricevuto durante l'esecuzione dello script R o dello script Python (ad esempio, se si utilizza uno script R, mostra l'output ricevuto dalla console R quando viene eseguito lo script R nel campo Sintassi R della scheda Sintassi ). Questo output potrebbe includere messaggi di errore R o Python o avvertenze che vengono prodotte quando viene eseguito lo script R o Python. L'output può essere utilizzato principalmente per eseguire il debug dello script. La scheda Output console contiene inoltre lo script del campo R Syntax o Python Syntax.
Ogni volta che viene eseguito lo script Importazione estensioni, il contenuto della scheda Output console viene sovrascritto con l'output ricevuto dalla console R o Python. Non è possibile modificare l'output.
Campi Filtraggio o ridenominazione
È possibile rinominare o escludere campi in un qualsiasi punto del flusso. Per esempio, è possibile che un ricercatore medico non sia interessato al livello di potassio (dati a livello di campo) dei pazienti (dati a livello di record). Grazie a questo nodo il ricercatore può filtrare il campo K
(potassio).
- Utilizzando un nodo Filtro, è possibile ridenominare o filtrare i campi in qualsiasi punto del flusso
- È possibile utilizzare un nodo Filtro per associare i campi da un nodo di importazione ad un altro
Visualizzazione e impostazione delle informazioni sui tipi
Dal nodo Tipo, è possibile specificare proprietà e metadati di campo molto utili per la modellazione e altre operazioni.- Specifica di un tipo di utilizzo, ad esempio un intervallo, un insieme, un insieme ordinato o un indicatore per ogni campo dei dati
- Impostazione delle opzioni relative alla gestione dei valori mancanti e dei valori null di sistema
- Impostazione del ruolo di un campo per la modellazione
- Specifica dei valori di un campo e delle opzioni utilizzate per leggere automaticamente i valori dai dati
- Specifica delle etichette di valore