Con il nodo Extension Import è possibile eseguire script scritti in R, Python o Python for Spark per importare i dati.
Dopo aver aggiunto il nodo ai propri canvas, fare doppio clic sul nodo per aprire le sue proprietà.
Scheda Sintassi
Copy link to section
Selezionare il tipo di sintassi: R, Python o Python for Spark. Poi inserire o incollare il proprio script personalizzato per importare i dati. Quando la sintassi è pronta, è possibile eseguire il nodo.
Scheda Output console
Copy link to section
La scheda Output console contiene l'output ricevuto durante l'esecuzione dello script R o dello script Python (ad esempio, se si utilizza uno script R, mostra l'output ricevuto dalla console R quando viene eseguito lo script R nel campo Sintassi R della scheda Sintassi ). Questo output potrebbe includere messaggi di errore R o Python o
avvertenze che vengono prodotte quando viene eseguito lo script R o Python. L'output può essere utilizzato principalmente per
eseguire il debug dello script. La scheda Output console contiene inoltre
lo script del campo R Syntax o Python Syntax.
Ogni volta che viene eseguito lo script Importazione estensioni, il contenuto della scheda Output console viene sovrascritto con l'output ricevuto dalla console R o Python. Non è possibile modificare l'output.
Campi Filtraggio o ridenominazione
Copy link to section
È possibile rinominare o escludere campi in un qualsiasi punto del flusso. Per esempio, è possibile che un ricercatore medico non sia interessato al livello di potassio (dati a livello di campo) dei pazienti (dati a livello di record). Grazie a questo nodo il ricercatore può filtrare il campo K (potassio).
Utilizzando un nodo Filtro, è possibile ridenominare o filtrare i campi in qualsiasi punto del flusso
È possibile utilizzare un nodo Filtro per associare i campi da un nodo di importazione ad un altro
Visualizzazione e impostazione delle informazioni sui tipi
Copy link to section
Dal nodo Tipo, è possibile specificare proprietà e metadati di campo molto
utili per la modellazione e altre operazioni.
Queste proprietà includono:
Specifica di un tipo di utilizzo, ad esempio un intervallo, un insieme, un insieme ordinato o un
indicatore per ogni campo dei dati
Impostazione delle opzioni relative alla gestione dei valori mancanti e dei valori null di sistema
Impostazione del ruolo di un campo per la modellazione
Specifica dei valori di un campo e delle opzioni utilizzate per leggere automaticamente i valori
dai dati