Puede añadir código generado automáticamente para cargar datos de activos de datos de proyecto en una celda de cuaderno. El tipo de activo puede ser un archivo o una conexión de base de datos.
Al pulsar en una celda de código vacía del cuaderno, al pulsar el icono Fragmentos de código () en la barra de herramientas del cuaderno, al seleccionar Leer datos y un activo del proyecto, puede:
Inserte las credenciales de acceso al origen de datos. Esta función está disponible para todos los activos de datos que se añaden a un proyecto. Con las credenciales, puede escribir su propio código para acceder al activo y cargar los datos en estructuras de datos de su elección.
Generar código que se añade a la celda del cuaderno. El código insertado sirve como guía para comenzar a trabajar rápidamente con un conjunto de datos o con una conexión. En el caso de sistemas de producción, debería revisar detenidamente el código insertado para determinar si debe escribir su propio código para que se ajuste mejor a sus necesidades.
Cuando ejecuta la celda de código, se accede a los datos y estos se cargan en la estructura de datos que ha seleccionado.
Notas:
- La capacidad de proporcionar código generado está inhabilitada para algunas conexiones si:
- Las credenciales de conexión son credenciales personales
- La conexión utiliza un enlace de pasarela segura
- Las credenciales de conexión se almacenan en cajas fuertes
- Si el tipo de archivo o la conexión de base de datos que está utilizando no aparece en las listas siguientes, puede seleccionar crear código genérico. Para Python es un objeto StreamingBody y para R es un objeto textConnection.
- La capacidad de proporcionar código generado está inhabilitada para algunas conexiones si:
Las tablas siguientes muestran qué conexiones de origen de datos (tipos de archivo y conexiones de base de datos) soportan la opción de generar código. Las opciones para generar código varían en función del origen de datos, el lenguaje de codificación del cuaderno y el cálculo del tiempo de ejecución del cuaderno.
Tipos de archivos soportados
Origen de datos | Lenguaje de codificación del cuaderno | Tipo del motor de cálculo | Soporte disponible para cargar datos |
---|---|---|---|
Archivos CSV | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasDataFrame | |
Con Spark | Cargar datos en pandasDataFrame y sparkSessionDataFrame | ||
Con Hadoop | Cargar datos en pandasDataFrame y sparkSessionDataFrame | ||
R | Distribución de Anaconda R | Cargar datos en el marco de datos R | |
Con Spark | Cargar datos en el marco de datos R y sparkSessionDataFrame | ||
Con Hadoop | Cargar datos en el marco de datos R y sparkSessionDataFrame | ||
Script de Python | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasStreamingBody | |
Con Spark | Cargar datos en pandasStreamingBody | ||
Con Hadoop | Cargar datos en pandasStreamingBody | ||
R | Distribución de Anaconda R | Cargar datos en rRawObject | |
Con Spark | Cargar datos en rRawObject | ||
Con Hadoop | Cargar datos en rRawObject | ||
Archivos JSON | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasDataFrame | |
Con Spark | Cargar datos en pandasDataFrame y sparkSessionDataFrame | ||
Con Hadoop | Cargar datos en pandasDataFrame y sparkSessionDataFrame | ||
R | Distribución de Anaconda R | Cargar datos en el marco de datos R | |
Con Spark | Cargar datos en el marco de datos R, rRawObject y sparkSessionDataFrame | ||
Con Hadoop | Cargar datos en el marco de datos R, rRawObject y sparkSessionDataFrame | ||
Archivos .xlsx y .xls | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasDataFrame | |
Con Spark | Cargar datos en pandasDataFrame | ||
Con Hadoop | Cargar datos en pandasDataFrame | ||
R | Distribución de Anaconda R | Cargar datos en rRawObject | |
Con Spark | Sin soporte de carga de datos | ||
Con Hadoop | Sin soporte de carga de datos | ||
Tipos de archivos octet-stream | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasStreamingBody | |
Con Spark | Cargar datos en pandasStreamingBody | ||
R | Distribución de Anaconda R | Cargar datos en rRawObject | |
Con Spark | Cargar datos en rDataObject | ||
Tipo de archivo PDF | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasStreamingBody | |
Con Spark | Cargar datos en pandasStreamingBody | ||
Con Hadoop | Cargar datos en pandasStreamingBody | ||
R | Distribución de Anaconda R | Cargar datos en rRawObject | |
Con Spark | Cargar datos en rDataObject | ||
Con Hadoop | Cargar datos en rRawData | ||
Tipo de archivo ZIP | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasStreamingBody | |
Con Spark | Cargar datos en pandasStreamingBody | ||
R | Distribución de Anaconda R | Cargar datos en rRawObject | |
Con Spark | Cargar datos en rDataObject | ||
Archivos de imágenes JPEG, PNG | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasStreamingBody | |
Con Spark | Cargar datos en pandasStreamingBody | ||
Con Hadoop | Cargar datos en pandasStreamingBody | ||
R | Distribución de Anaconda R | Cargar datos en rRawObject | |
Con Spark | Cargar datos en rDataObject | ||
Con Hadoop | Cargar datos en rDataObject | ||
Archivos binarios | |||
Python | Distribución de Anaconda Python | Cargar datos en pandasStreamingBody | |
Con Spark | Cargar datos en pandasStreamingBody | ||
Hadoop | Sin soporte de carga de datos | ||
R | Distribución de Anaconda R | Cargar datos en rRawObject | |
Con Spark | Cargar datos en rRawObject | ||
Hadoop | Cargar datos en rDataObject |
Conexiones de base de datos soportadas
Origen de datos | Lenguaje de codificación del cuaderno | Tipo del motor de cálculo | Soporte disponible para cargar datos |
---|---|---|---|
- Db2 Warehouse on Cloud - IBM Db2 on Cloud - IBM Db2 Database |
|||
Python | Distribución de Anaconda Python | Cargar datos en ibmdbpyIda y en ibmdbpyPandas | |
Con Spark | Cargar datos en ibmdbpyIda, ibmdbpyPandas y sparkSessionDataFrame | ||
Con Hadoop | Cargar datos en ibmdbpyIda, ibmdbpyPandas y sparkSessionDataFrame | ||
R | Distribución de Anaconda R | Cargar datos en ibmdbrIda e ibmdbrDataframe | |
Con Spark | Cargar datos en ibmdbrIda, ibmdbrDataFrame y sparkSessionDataFrame | ||
Con Hadoop | Cargar datos en ibmdbrIda, ibmdbrDataFrame y sparkSessionDataFrame | ||
- Db2 for z/OS |
|||
Python | Distribución de Anaconda Python | Cargar datos en ibmdbpyIda y en ibmdbpyPandas | |
Con Spark | Sin soporte de carga de datos | ||
- Amazon Simple Storage Services (S3) - Amazon Simple Storage Services (S3) con una política de acceso IAM |
|||
Python | Distribución de Anaconda Python | Cargar datos en pandasStreamingBody | |
Con Hadoop | Cargar datos en pandasStreamingBody y sparkSessionSetup | ||
R | Distribución Anaconda R | Cargar datos en rRawObject | |
Con Hadoop | Cargar datos en rRawObject y sparkSessionSetup | ||
- IBM Cloud Databases for PostgreSQL - Microsoft SQL Server |
|||
Python | Distribución de Anaconda Python | Cargar datos en pandasDataFrame | |
Con Spark | Cargar datos en pandasDataFrame | ||
R | Distribución de Anaconda R | Cargar datos en el marco de datos R | |
Con Spark | Cargar datos en el marco de datos R y sparkSessionDataFrame | ||
Python | Distribución de Anaconda Python | Load data into pandasDataFrame In the generated code: - Edit the path parameter in the last line of code - Remove the comment tagging To read data, see Lectura de datos de una fuente de datos To search data, see Búsqueda de objetos de datos To write data, see Escritura de datos en una fuente de datos |
|
Con Spark | Sin soporte de carga de datos | ||
R | Distribución de Anaconda R | Cargar datos en marco de datos R En el código generado: -Editar el parámetro de vía de acceso en la última línea de código -Eliminar el etiquetado de comentario Para leer datos, consulte Lectura de datos de un origen de datos Para buscar datos, consulte Búsqueda de objetos de datos Para escribir datos, consulte Escritura de datos en un origen de datos |
|
Con Spark | Sin soporte de carga de datos | ||
Python | Distribución de Anaconda Python | Cargar datos en pandasDataFrame | |
Con Spark | Cargar datos en pandasDataFrame | ||
R | Distribución de Anaconda R | Sin soporte de carga de datos | |
Con Spark | Sin soporte de carga de datos | ||
- Amazon RDS for MySQL |
|||
Python | Distribución de Anaconda Python | Cargar datos en pandasDataFrame | |
Con Spark | Cargar datos en pandasDataFrame | ||
R | Distribución de Anaconda R | Cargar datos en el marco de datos R y sparkSessionDataFrame | |
Con Spark | Sin soporte de carga de datos | ||
- HTTP - Apache Cassandra - Amazon RDS for PostgreSQL |
|||
Python | Distribución de Anaconda Python | Cargar datos en pandasDataFrame | |
Con Spark | Cargar datos en pandasDataFrame | ||
R | Distribución de Anaconda R | Cargar datos en el marco de datos R | |
Con Spark | Cargar datos en el marco de datos R |
Tema principal: Carga y acceso a los datos en un cuaderno