È possibile creare, modificare ed eseguire Python e codice R utilizzando gli script e i notebook Jupyter negli editor di codice, ad esempio l'editor del notebook o un IDE (integrated development environment), come RStudio.
- Notebook
- Un notebook Jupyter è un ambiente basato sul web per il calcolo interattivo. È possibile utilizzare i notebook per eseguire piccole parti di codice che elaborano i dati ed è possibile visualizzare immediatamente i risultati del calcolo. I notebook includono tutti i blocchi di creazione necessari per lavorare con i dati, ovvero i dati, i calcoli di codice che elaborano i dati, le visualizzazioni dei risultati e il testo e i supporti per migliorare la comprensione.
- Script
- Uno script è un file che contiene una serie di comandi e commenti. Lo script può essere salvato e utilizzato successivamente per eseguire nuovamente i comandi salvati. Diversamente da un notebook, i comandi in uno script possono essere eseguiti solo in modo lineare.
Notebook
- Autorizzazioni richieste
- Ruolo Editor o Admin in un progetto
- Strumenti
- Editor notebook
- Linguaggi di programmazione
- Python e R
- Formato dei dati
- Tutti i tipi
- Il supporto codice è disponibile per il caricamento e l'accesso ai dati dagli asset del progetto per:
- Asset di dati, quali file CSV, JSON e .xlsx e .xls
- Connessioni al database e asset di dati connessi
Vedere Supporto caricamento dati. per i tipi di file e database supportati.
- Dimensione dati
- 5 GB. Se i file sono più grandi, è necessario caricare i dati in più parti.
Script
- Autorizzazioni richieste
- Ruolo Editor o Admin in un progetto
- Strumenti
- RStudio
- Linguaggi di programmazione
- R
- Formato dei dati
- Tutti i tipi
- Il supporto codice è disponibile per il caricamento e l'accesso ai dati dagli asset del progetto per:
- Asset di dati, quali file CSV, JSON e .xlsx e .xls
- Connessioni al database e asset di dati connessi
Vedere Supporto caricamento dati. per i tipi di file e database supportati.
- Dimensione dati
- 5 GB. Se i file sono più grandi, è necessario caricare i dati in più parti.
Utilizzo dell'editor del notebook
L'editor del notebook è ampiamente utilizzato per la programmazione di analisi dei dati esplorativa e interattiva e per la visualizzazione dei dati. Solo una persona può modificare un notebook alla volta. Tutti gli altri utenti possono accedere ai notebook aperti solo in modalità di visualizzazione, mentre sono bloccati.
È possibile utilizzare questi tipi di librerie:
- Librerie open source preinstallate fornite con gli ambienti di runtime del notebook
- Librerie IBM fornite senza costi aggiuntivi fornite con gli ambienti di runtime dei notebook
- Le proprie librerie
Quando i notebook sono pronti, è possibile creare lavori per eseguire i notebook direttamente dall'editor del notebook. Le configurazioni del lavoro possono utilizzare le variabili di ambiente che vengono passate ai notebook con valori diversi quando vengono eseguiti i notebook.
Lavorare in RStudio
RStudio è un ambiente di sviluppo integrato per lavorare con script R o app Shiny. Sebbene l'IDE RStudio non possa essere avviato in un runtime Spark con ambiente R, puoi utilizzare Spark nei tuoi script R e nelle tue applicazioni Shiny accedendo ai kernel Spark in modo programmatico.
Gli script R e le app Shiny possono essere creati e utilizzati solo nell'IDE RStudio. Non è possibile creare lavori per script R o distribuzioni R Shiny.
Ulteriori informazioni
Argomento principale Analisi di dati e creazione di modelli