Puede crear, editar y ejecutar Python y código R utilizando cuadernos Jupyter y scripts en editores de código, por ejemplo el editor de cuadernos o un entorno de desarrollo integrado (IDE), como RStudio.
- Cuadernos
- Un cuaderno de Jupyter es un entorno basado en web para los cálculos interactivos. Puede utilizar cuadernos para ejecutar pequeños fragmentos de código que procesan los datos, y puede ver inmediatamente los resultados del cálculo. Los cuadernos incluyen todos los bloques de construcción que necesita para trabajar con datos, es decir, los datos, los cálculos de código que procesan los datos, las visualizaciones de los resultados y el texto y los medios enriquecidos para mejorar la comprensión.
- Scripts
- Un script es un archivo que contiene un conjunto de mandatos y comentarios. El script se puede guardar y utilizar más adelante para volver a ejecutar los mandatos guardados. A diferencia de un cuaderno, los mandatos de un script sólo se pueden ejecutar de forma lineal.
Cuadernos
- Permisos necesarios
- Rol Editor o Admin en un proyecto
- Herramientas
- Editor de cuadernos
- Lenguajes de programación
- Python y R
- Formato de los datos
- Todos los tipos
- El soporte de código está disponible para cargar y acceder a datos desde activos de proyecto para:
- Activos de datos, como archivos CSV, JSON y .xlsx y .xls
- Conexiones de base de datos y activos de datos conectados
Consulte Soporte de carga de datos. para los tipos de archivo y base de datos soportados.
- Tamaño de datos
- 5 GB. Si sus archivos son más grandes, debe cargar los datos en varias partes.
Scripts
- Permisos necesarios
- Rol Editor o Admin en un proyecto
- Herramientas
- RStudio
- Lenguajes de programación
- R
- Formato de los datos
- Todos los tipos
- El soporte de código está disponible para cargar y acceder a datos desde activos de proyecto para:
- Activos de datos, como archivos CSV, JSON y .xlsx y .xls
- Conexiones de base de datos y activos de datos conectados
Consulte Soporte de carga de datos. para los tipos de archivo y base de datos soportados.
- Tamaño de datos
- 5 GB. Si sus archivos son más grandes, debe cargar los datos en varias partes.
Trabajar en el editor de cuadernos
El editor de cuadernos se utiliza en gran medida para la programación de análisis de datos y la visualización de datos interactivos y exploratorios. Sólo una persona puede editar un cuaderno a la vez. Todos los demás usuarios pueden acceder a los cuadernos abiertos solo en modalidad de vista, mientras están bloqueados.
Puede utilizar estos tipos de bibliotecas:
- Bibliotecas de código abierto preinstaladas que se proporcionan con los entornos de ejecución del cuaderno
- Bibliotecas de IBM proporcionadas sin coste adicional que se suministran con los entornos de ejecución del cuaderno
- Sus propias bibliotecas
Cuando los cuadernos estén listos, puede crear trabajos para ejecutar los cuadernos directamente desde el editor de cuadernos. Las configuraciones de trabajo pueden utilizar variables de entorno que se pasan a los cuadernos con distintos valores cuando se ejecutan los cuadernos.
Cómo trabajar en RStudio
RStudio es un entorno de desarrollo integrado para trabajar con scripts R o aplicaciones Shiny. Aunque el IDE de RStudio no se puede iniciar en un entorno de ejecución de entorno de Spark con R, puede utilizar Spark en los scripts R y las aplicaciones Shiny accediendo a los kernels de Spark mediante programación.
Los scripts R y las aplicaciones Shiny solo se pueden crear y utilizar en el IDE de RStudio. No puede crear trabajos para scripts R o despliegues R Shiny.
Más información
Tema padre: Análisis de datos y generación de modelos