Con el nodo Extension Import, puede ejecutar scripts escritos en R, Python o Python for Spark para importar datos.
Después de añadir el nodo al lienzo, pulse dos veces el nodo para abrir sus propiedades.
pestaña Sintaxis
Seleccione su tipo de sintaxis: R, Python o Python para Spark. A continuación, especifique o pegue el script personalizado para importar datos. Cuando la sintaxis esté lista, puede ejecutar el nodo.
Separador Salida de la consola
La pestaña Salida de consola contiene cualquier salida que se reciba cuando se ejecuta el script R o el script Python (por ejemplo, si se utiliza un script R, muestra la salida recibida de la consola R cuando se ejecuta el script R en el campo Sintaxis R de la pestaña Sintaxis ). Esta salida podría incluir mensajes de error o avisos de R o Python que se han producido cuando se ha ejecutado el script R o Python. La salida se puede utilizar, básicamente, para depurar el script. La pestaña Salida de la consola también contiene el script del campo Sintaxis R o Sintaxis Python.
Cada vez que se ejecuta el script Extension Import, el contenido de la pestaña Console Output se sobrescribe con la salida recibida de la consola de R o Python. No se puede editar la salida.
Filtrar o renombrar campos
Puede cambiar el nombre de los campos o excluirlos en cualquier punto de un flujo. Por
ejemplo, como investigador médico, es posible que no esté interesado en el nivel de potasio
(datos de nivel de campo) de los pacientes (datos de nivel de registro);
por ello, puede filtrar el campo K
(potasio).
- Si utiliza un nodo Filtrar, puede cambiar el nombre de los campos o filtrarlos en cualquier punto del flujo.
- Puede utilizar un nodo Filtrar para correlacionar campos de un nodo de importación a otro
Visualización y configuración de información acerca de los tipos
En el nodo Tipo, puede especificar los metadatos y las propiedades de los campos, que tienen un gran valor en el modelado y en otras tareas.- Especificación de un tipo de uso, como rango, conjunto, conjunto ordenado o etiqueta, para cada campo de los datos
- Establecimiento de opciones para manejar los valores perdidos y los nulos del sistema
- Establecimiento del rol de un campo para realizar el modelado
- Especificación de los valores de un campo y de las opciones utilizadas para leer automáticamente valores de los datos
- Especificación de etiquetas de valores