Pianificazione dell'esperienza di notebook e script
Per creare un piano per l'utilizzo di notebook e script Jupyter, è necessario innanzitutto comprendere le scelte disponibili, le implicazioni di tali scelte e il modo in cui tali scelte influiscono sull'ordine delle attività di implementazione.
È possibile eseguire la maggior parte delle attività relative ai blocchi note e agli script con il ruolo di Editor o Admin in un progetto di analisi.
Prima di iniziare a lavorare con i notebook e gli script, considerare le seguenti domande poiché la maggior parte delle attività deve essere completata in un ordine particolare:
- In quale linguaggio di programmazione si desidera lavorare?
- Cosa faranno i tuoi notebook?
- Quali librerie si desidera utilizzare?
- Come puoi utilizzare il notebook o lo script in IBM watsonx?
Per creare un piano per l'utilizzo di notebook o script Jupyter, determinare quale delle seguenti attività è necessario completare.
Attività | Obbligatorio? | Tempistica |
---|---|---|
Creazione di un progetto | Sì | Questo deve essere il tuo primo compito |
Aggiunta di asset di dati al progetto | Sì | Prima di iniziare a creare i notebook |
Come scegliere un linguaggio di programmazione | Sì | Prima di selezionare lo strumento |
Selezione di uno strumento | Sì | Dopo aver selezionato la lingua |
Controllo dei package della libreria | Sì | Prima di selezionare un ambiente di runtime |
Selezione di un ambiente di runtime appropriato | Sì | Prima di aprire l'ambiente di sviluppo |
Gestione del ciclo di vita dei notebook e degli script | N | Quando il notebook o lo script è pronto |
Utilizzo per notebook e script dopo la creazione | N | Quando il notebook è pronto |
Creazione di un progetto
È necessario creare un progetto prima di poter iniziare a lavorare nei notebook.
Progetti È possibile creare un progetto vuoto, uno da un file o da un URL. In questo progetto:
- È possibile utilizzare Jupyter Notebook e RStudio.
- I notebook sono asset nel progetto.
- La collaborazione del notebook si basa sul blocco da parte dell'utente a livello di progetto.
- Gli script R e le applicazioni Shiny non sono risorse del progetto.
- Non c'è collaborazione su script R o applicazioni Shiny.
Scelta di un linguaggio di programmazione
È possibile scegliere di lavorare nelle seguenti lingue:
- Notebook
- Python e R
- Script
- Script R e applicazioni R Shiny
Selezione di uno strumento
In IBM watsonx, è possibile utilizzare notebook e script nel seguente strumento:
- Editor di notebook Jupyter
- Nell'editor Jupyter Notebook , è possibile creare notebook Python o R. I notebook sono asset in un progetto. La collaborazione è solo a livello di progetto. Il notebook è bloccato da un utente quando è aperto e può essere sbloccato solo dallo stesso utente o da un amministratore del progetto.
- RStudio
- In RStudio è possibile creare script R e applicazioni Shiny. Gli script R non sono asset in un progetto, il che significa che non esiste alcuna collaborazione a livello di progetto.
Verifica dei pacchetti della libreria
Quando si apre un notebook in un ambiente runtime, è possibile accedere a una vasta selezione di pacchetti di librerie di data science preinstallati. Molti ambienti includono anche librerie fornite da IBM senza costi aggiuntivi, come:
- La libreria Watson Natural Language Processing negli ambienti Python
- Librerie che consentono di accedere agli asset del progetto
- Librerie per serie temporali o analisi geospaziali in ambienti Spark
Per un elenco dei package della libreria e delle versioni incluse in un modello di ambiente, selezionare il modello sulla pagina Modelli dalla pagina Gestisci nella pagina Ambienti del progetto.
Se le librerie mancano in un modello, è possibile aggiungerle:
- Attraverso il notebook o lo script
- È possibile utilizzare i comandi di installazione del pacchetto familiari per l'ambiente. Ad esempio, nei notebook Python , puoi utilizzare
mamba
,conda
opip
. - Creando un modello di ambiente personalizzato
- Quando si crea un modello personalizzato, è possibile creare una personalizzazione software e aggiungere le librerie che si desidera includere. Per i dettagli, consultare Personalizzazione dei template ambiente.
Scelta di un ambiente di runtime
La scelta dell'ambiente di calcolo per il notebook dipende dalla quantità di dati che si desidera elaborare e dalla complessità dei processi di analisi dei dati.
watsonx.ai Studio offre molti modelli di ambiente predefiniti con diverse dimensioni di hardware e configurazioni software per aiutarvi a iniziare rapidamente, senza dover creare modelli personalizzati. Questi modelli inclusi sono elencati sulla pagina Modelli dalla scheda Gestisci nella pagina Ambienti del progetto. Per ulteriori informazioni sugli ambienti inclusi, consultare Ambienti.
Se i modelli disponibili non soddisfano le tue esigenze, puoi creare modelli personalizzati e determinare la dimensione hardware e la configurazione software. Per i dettagli, consultare Personalizzazione dei template ambiente.
Utilizzo dei dati
Per gestire i dati in un notebook:
- Aggiungere i dati al progetto, che trasforma i dati in un asset del progetto. Consultare Aggiunta di dati a un progetto per i diversi metodi per aggiungere dati a un progetto.
- Utilizzare il codice generato che carica i dati dall'asset a una struttura dati nel notebook. Per un elenco dei tipi di dati supportati, consultare Supporto caricamento dati.
- Scrivere il proprio codice per caricare i dati se l'origine dati non viene aggiunta come un asset di progetto o se il supporto per l'aggiunta del codice generato non è disponibile per l'asset di progetto.
Gestione del ciclo di vita di notebook e script
Dopo aver creato e verificato un notebook nello strumento, è possibile:
- Pubblicarlo in un catalogo in modo che altri membri del catalogo possano utilizzare il notebook nei propri progetti. Consultare Pubblicazione di asset da un progetto in un catalogo.
- Condividete una copia di sola lettura al di fuori di watsonx.ai Studio, in modo che le persone che non collaborano ai vostri progetti possano vederla e utilizzarla. Vedi Condivisione dei notebook con un URL.
- Pubblicarlo in un repository GitHub . Vedi Pubblicazione di notebook su GitHub.
- Pubblicarlo come un gist. Consultare Pubblicazione di un notebook come sintesi.
Gli script R e le applicazioni Shiny non possono essere pubblicati o condivisi utilizzando le funzionalità di un progetto.
Utilizzi per notebook e script dopo la creazione
Le opzioni per un notebook creato e pronto per l'uso in IBM watsonx includono:
Esecuzione come job in un progetto. Consultare Creazione e gestione dei job in un progetto.
Esecuzione come parte di un Pipelines. Vedi Configurazione dei nodi della pipeline.
Per garantire che un notebook possa essere eseguito come un lavoro o in una pipeline:
- Assicurarsi che nessuna cella richieda un input interattivo da parte di un utente.
- Verificare che il notebook registri informazioni dettagliate sufficienti per consentire la comprensione dell'avanzamento e degli eventuali errori esaminando il log.
- Utilizzare le variabili di ambiente nel codice per accedere alle configurazioni se un notebook o uno script le richiedono, ad esempio il file di dati di input o il numero di esecuzioni di addestramento.
Utilizzo del client Runtime Python di watsonx.ai per costruire, addestrare e distribuire i modelli. Vedere gli esempi di client Python runtime diwatsonx.ai.
Utilizzo dell'API REST di watsonx.ai Runtime per costruire, addestrare e distribuire i modelli.
Gli script R e le applicazioni Shiny possono essere creati e utilizzati solo nell'IDE RStudio di IBM watsonx. Non è possibile creare lavori per script R o distribuzioni R Shiny.
Argomento principale: Notebook e script