0 / 0
Volver a la versión inglesa de la documentación
Carga de datos a través de fragmentos de código generados
Última actualización: 04 oct 2024
Carga de datos a través de fragmentos de código generados

Puede añadir código generado automáticamente para cargar datos de activos de datos de proyecto en una celda de cuaderno. El tipo de activo puede ser un archivo o una conexión de base de datos.

Al pulsar en una celda de código vacía del cuaderno, al pulsar el icono Fragmentos de código (el icono Fragmentos de código) en la barra de herramientas del cuaderno, al seleccionar Leer datos y un activo del proyecto, puede:

  • Inserte las credenciales de acceso al origen de datos. Esta función está disponible para todos los activos de datos que se añaden a un proyecto. Con las credenciales, puede escribir su propio código para acceder al activo y cargar los datos en estructuras de datos de su elección.

  • Generar código que se añade a la celda del cuaderno. El código insertado sirve como guía para comenzar a trabajar rápidamente con un conjunto de datos o con una conexión. En el caso de sistemas de producción, debería revisar detenidamente el código insertado para determinar si debe escribir su propio código para que se ajuste mejor a sus necesidades.

    Cuando ejecuta la celda de código, se accede a los datos y estos se cargan en la estructura de datos que ha seleccionado.

    Notas:

    1. La capacidad de proporcionar código generado está inhabilitada para algunas conexiones si:
      • Las credenciales de conexión son credenciales personales
      • La conexión utiliza un enlace de pasarela segura
      • Las credenciales de conexión se almacenan en cajas fuertes
    2. Si el tipo de archivo o la conexión de base de datos que está utilizando no aparece en las listas siguientes, puede seleccionar crear código genérico. Para Python es un objeto StreamingBody y para R es un objeto textConnection.

Las tablas siguientes muestran qué conexiones de origen de datos (tipos de archivo y conexiones de base de datos) soportan la opción de generar código. Las opciones para generar código varían en función del origen de datos, el lenguaje de codificación del cuaderno y el cálculo del tiempo de ejecución del cuaderno.

Tipos de archivos soportados

Tabla 1. Tipos de archivos soportados
Origen de datos Lenguaje de codificación del cuaderno Tipo del motor de cálculo Soporte disponible para cargar datos
Archivos CSV
Python Distribución de Anaconda Python Cargar datos en pandasDataFrame
Con Spark Cargar datos en pandasDataFrame y sparkSessionDataFrame 
Con Hadoop Cargar datos en pandasDataFrame y sparkSessionDataFrame 
R Distribución de Anaconda R Cargar datos en el marco de datos R
Con Spark Cargar datos en el marco de datos R y sparkSessionDataFrame 
Con Hadoop Cargar datos en el marco de datos R y sparkSessionDataFrame 
Script de Python
Python Distribución de Anaconda Python Cargar datos en pandasStreamingBody
Con Spark Cargar datos en pandasStreamingBody
Con Hadoop Cargar datos en pandasStreamingBody
R Distribución de Anaconda R Cargar datos en rRawObject
Con Spark Cargar datos en rRawObject
Con Hadoop Cargar datos en rRawObject
Archivos JSON
Python Distribución de Anaconda Python Cargar datos en pandasDataFrame
Con Spark Cargar datos en pandasDataFrame y sparkSessionDataFrame 
Con Hadoop Cargar datos en pandasDataFrame y sparkSessionDataFrame 
R Distribución de Anaconda R Cargar datos en el marco de datos R
Con Spark Cargar datos en el marco de datos R, rRawObject y sparkSessionDataFrame
Con Hadoop Cargar datos en el marco de datos R, rRawObject y sparkSessionDataFrame
Archivos .xlsx y .xls
Python Distribución de Anaconda Python Cargar datos en pandasDataFrame
Con Spark Cargar datos en pandasDataFrame
Con Hadoop Cargar datos en pandasDataFrame
R Distribución de Anaconda R Cargar datos en rRawObject
Con Spark Sin soporte de carga de datos
Con Hadoop Sin soporte de carga de datos
Tipos de archivos octet-stream
Python Distribución de Anaconda Python Cargar datos en pandasStreamingBody
Con Spark Cargar datos en pandasStreamingBody
R Distribución de Anaconda R Cargar datos en rRawObject
Con Spark Cargar datos en rDataObject
Tipo de archivo PDF
Python Distribución de Anaconda Python Cargar datos en pandasStreamingBody
Con Spark Cargar datos en pandasStreamingBody
Con Hadoop Cargar datos en pandasStreamingBody
R Distribución de Anaconda R Cargar datos en rRawObject
Con Spark Cargar datos en rDataObject
Con Hadoop Cargar datos en rRawData
Tipo de archivo ZIP
Python Distribución de Anaconda Python Cargar datos en pandasStreamingBody
Con Spark Cargar datos en pandasStreamingBody
R Distribución de Anaconda R Cargar datos en rRawObject
Con Spark Cargar datos en rDataObject
Archivos de imágenes JPEG, PNG
Python Distribución de Anaconda Python Cargar datos en pandasStreamingBody
Con Spark Cargar datos en pandasStreamingBody
Con Hadoop Cargar datos en pandasStreamingBody
R Distribución de Anaconda R Cargar datos en rRawObject
Con Spark Cargar datos en rDataObject
Con Hadoop Cargar datos en rDataObject
Archivos binarios
Python Distribución de Anaconda Python Cargar datos en pandasStreamingBody
Con Spark Cargar datos en pandasStreamingBody
Hadoop Sin soporte de carga de datos
R Distribución de Anaconda R Cargar datos en rRawObject
Con Spark Cargar datos en rRawObject
Hadoop Cargar datos en rDataObject

Conexiones de base de datos soportadas

Tabla 2. Conexiones de base de datos soportadas
Origen de datos Lenguaje de codificación del cuaderno Tipo del motor de cálculo Soporte disponible para cargar datos
- Db2 Warehouse on Cloud
- IBM Db2 on Cloud
- IBM Db2 Database
Python Distribución de Anaconda Python Cargar datos en ibmdbpyIda y en ibmdbpyPandas
Con Spark Cargar datos en ibmdbpyIda, ibmdbpyPandas y sparkSessionDataFrame
Con Hadoop Cargar datos en ibmdbpyIda, ibmdbpyPandas y sparkSessionDataFrame
R Distribución de Anaconda R Cargar datos en ibmdbrIda e ibmdbrDataframe
Con Spark Cargar datos en ibmdbrIda, ibmdbrDataFrame y sparkSessionDataFrame
Con Hadoop Cargar datos en ibmdbrIda, ibmdbrDataFrame y sparkSessionDataFrame
- Db2 for z/OS
Python Distribución de Anaconda Python Cargar datos en ibmdbpyIda y en ibmdbpyPandas
Con Spark Sin soporte de carga de datos
- Amazon Simple Storage Services (S3)
- Amazon Simple Storage Services (S3) con una política de acceso IAM
Python Distribución de Anaconda Python Cargar datos en pandasStreamingBody
Con Hadoop Cargar datos en pandasStreamingBody y sparkSessionSetup
R Distribución Anaconda R Cargar datos en rRawObject
Con Hadoop Cargar datos en rRawObject y sparkSessionSetup
- IBM Cloud Databases for PostgreSQL
- Microsoft SQL Server
Python Distribución de Anaconda Python Cargar datos en pandasDataFrame
Con Spark Cargar datos en pandasDataFrame
R Distribución de Anaconda R Cargar datos en el marco de datos R
Con Spark Cargar datos en el marco de datos R y sparkSessionDataFrame 
Python Distribución de Anaconda Python Load data into pandasDataFrame

In the generated code:
- Edit the path parameter in the last line of code
- Remove the comment tagging

To read data, see Lectura de datos de una fuente de datos
To search data, see Búsqueda de objetos de datos
To write data, see Escritura de datos en una fuente de datos
Con Spark Sin soporte de carga de datos
R Distribución de Anaconda R Cargar datos en marco de datos R

En el código generado:
-Editar el parámetro de vía de acceso en la última línea de código
-Eliminar el etiquetado de comentario

Para leer datos, consulte Lectura de datos de un origen de datos
Para buscar datos, consulte Búsqueda de objetos de datos
Para escribir datos, consulte Escritura de datos en un origen de datos
Con Spark Sin soporte de carga de datos
Python Distribución de Anaconda Python Cargar datos en pandasDataFrame
Con Spark Cargar datos en pandasDataFrame
R Distribución de Anaconda R Sin soporte de carga de datos
Con Spark Sin soporte de carga de datos
- Amazon RDS for MySQL
Python Distribución de Anaconda Python Cargar datos en pandasDataFrame
Con Spark Cargar datos en pandasDataFrame
R Distribución de Anaconda R Cargar datos en el marco de datos R y sparkSessionDataFrame 
Con Spark Sin soporte de carga de datos
- HTTP
- Apache Cassandra
- Amazon RDS for PostgreSQL
Python Distribución de Anaconda Python Cargar datos en pandasDataFrame
Con Spark Cargar datos en pandasDataFrame
R Distribución de Anaconda R Cargar datos en el marco de datos R
Con Spark Cargar datos en el marco de datos R

Tema principal: Carga y acceso a los datos en un cuaderno

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información