Pianificazione dell'esperienza di notebook e script
Ultimo aggiornamento: 10 apr 2025
Pianificazione dell'esperienza di notebook e script
Per creare un piano per l'utilizzo di notebook e script Jupyter, è necessario innanzitutto comprendere le scelte disponibili, le implicazioni di tali scelte e il modo in cui tali scelte influiscono sull'ordine delle attività di implementazione.
È possibile eseguire la maggior parte delle attività relative ai blocchi note e agli script con il ruolo di Editor o Admin in un progetto di analisi.
Prima di iniziare a lavorare con i notebook e gli script, considerare le seguenti domande poiché la maggior parte delle attività deve essere completata in un ordine particolare:
In quale linguaggio di programmazione si desidera lavorare?
Cosa faranno i tuoi notebook?
Quali librerie si desidera utilizzare?
Come puoi utilizzare il notebook o lo script in IBM watsonx?
Per creare un piano per l'utilizzo di notebook o script Jupyter, determinare quale delle seguenti attività è necessario completare.
È necessario creare un progetto prima di poter iniziare a lavorare nei notebook.
Progetti È possibile creare un progetto vuoto, uno da file o da URL. In questo progetto:
È possibile utilizzare i siti Jupyter Notebook e RStudio.
I notebook sono asset nel progetto.
La collaborazione del notebook si basa sul blocco da parte dell'utente a livello di progetto.
Gli script R e le applicazioni Shiny non sono risorse del progetto.
Non c'è collaborazione su script R o applicazioni Shiny.
Scelta di un linguaggio di programmazione
Copy link to section
È possibile scegliere di lavorare nelle seguenti lingue:
Notebook
Python e R
Script
Script R e applicazioni R Shiny
Selezione di uno strumento
Copy link to section
In IBM watsonx, è possibile utilizzare notebook e script nel seguente strumento:
Editor di notebook Jupyter
Nell'editor Jupyter Notebook , è possibile creare notebook Python o R. I notebook sono asset in un progetto. La collaborazione è solo a livello di progetto. Il notebook è bloccato da un utente quando è aperto e può essere sbloccato solo dallo stesso utente o da un amministratore del progetto.
RStudio
In RStudio è possibile creare script R e applicazioni Shiny. Gli script R non sono asset in un progetto, il che significa che non esiste alcuna collaborazione a livello di progetto.
Verifica dei pacchetti della libreria
Copy link to section
Quando si apre un notebook in un ambiente runtime, è possibile accedere a una vasta selezione di pacchetti di librerie di data science preinstallati. Molti ambienti includono anche librerie fornite da IBM senza costi aggiuntivi, come:
La libreria Watson Natural Language Processing negli ambienti Python
Librerie che consentono di accedere agli asset del progetto
Librerie per serie temporali o analisi geospaziali in ambienti Spark
Per un elenco dei package della libreria e delle versioni incluse in un modello di ambiente, selezionare il modello sulla pagina Modelli dalla pagina Gestisci nella pagina Ambienti del progetto.
Se le librerie mancano in un modello, è possibile aggiungerle:
Attraverso il notebook o lo script
È possibile utilizzare i comandi di installazione del pacchetto familiari per l'ambiente. Ad esempio, nei notebook Python , puoi utilizzare mamba, conda o pip.
Creando un modello di ambiente personalizzato
Quando si crea un modello personalizzato, è possibile creare una personalizzazione software e aggiungere le librerie che si desidera includere. Per i dettagli, consultare Personalizzazione dei template ambiente.
Scelta di un ambiente di runtime
Copy link to section
La scelta dell'ambiente di calcolo per il notebook dipende dalla quantità di dati che si desidera elaborare e dalla complessità dei processi di analisi dei dati.
watsonx.ai Studio offre molti modelli di ambiente predefiniti con diverse dimensioni di hardware e configurazioni software per aiutarvi a iniziare rapidamente, senza dover creare modelli personalizzati. Questi modelli inclusi sono elencati sulla pagina Modelli dalla scheda Gestisci nella pagina Ambienti del progetto. Per ulteriori informazioni sugli ambienti inclusi, consultare Ambienti.
Se i modelli disponibili non soddisfano le tue esigenze, puoi creare modelli personalizzati e determinare la dimensione hardware e la configurazione software. Per i dettagli, consultare Personalizzazione dei template ambiente.
Importante: verificare che l'ambiente disponga di memoria sufficiente per memorizzare i dati caricati nel notebook. Spesso questo significa che l'ambiente deve avere molta più memoria rispetto alla dimensione totale dei dati caricati sul notebook perché alcuni framework di dati, come i panda, possono contenere più copie dei dati in memoria.
Utilizzo dei dati
Copy link to section
Per gestire i dati in un notebook:
Aggiungere i dati al progetto, che trasforma i dati in un asset del progetto. Consultare Aggiunta di dati a un progetto per i diversi metodi per aggiungere dati a un progetto.
Utilizzare il codice generato che carica i dati dall'asset a una struttura dati nel notebook. Per un elenco dei tipi di dati supportati, consultare Supporto caricamento dati.
Scrivere il proprio codice per caricare i dati se l'origine dati non viene aggiunta come un asset di progetto o se il supporto per l'aggiunta del codice generato non è disponibile per l'asset di progetto.
Gestione del ciclo di vita di notebook e script
Copy link to section
Dopo aver creato e verificato un notebook nello strumento, è possibile:
Condividete una copia di sola lettura al di fuori di watsonx.ai Studio, in modo che le persone che non collaborano ai vostri progetti possano vederla e utilizzarla. Vedere Condivisione di notebook tramite URL.
Per garantire che un notebook possa essere eseguito come un lavoro o in una pipeline:
Assicurarsi che nessuna cella richieda un input interattivo da parte di un utente.
Verificare che il notebook registri informazioni dettagliate sufficienti per consentire la comprensione dell'avanzamento e degli eventuali errori esaminando il log.
Utilizzare le variabili di ambiente nel codice per accedere alle configurazioni se un notebook o uno script le richiedono, ad esempio il file di dati di input o il numero di esecuzioni di addestramento.
Utilizzo dell'API REST di watsonx.ai Runtime per costruire, addestrare e distribuire i modelli.
Gli script R e le applicazioni Shiny possono essere creati e utilizzati solo nell'IDE RStudio in IBM watsonx. Non è possibile creare lavori per script R o distribuzioni R Shiny.