0 / 0
Torna alla versione inglese della documentazione

Pianificazione dell'esperienza di notebook e script

Ultimo aggiornamento: 21 nov 2024
Pianificazione dell'esperienza di notebook e script

Per creare un piano per l'utilizzo di notebook e script Jupyter, è necessario innanzitutto comprendere le scelte disponibili, le implicazioni di tali scelte e il modo in cui tali scelte influiscono sull'ordine delle attività di implementazione.

È possibile eseguire la maggior parte delle attività relative ai blocchi note e agli script con il ruolo di Editor o Admin in un progetto di analisi.

Prima di iniziare a lavorare con i notebook e gli script, considerare le seguenti domande poiché la maggior parte delle attività deve essere completata in un ordine particolare:

  • In quale linguaggio di programmazione si desidera lavorare?
  • Cosa faranno i tuoi notebook?
  • Quali librerie si desidera utilizzare?
  • Come puoi utilizzare il notebook o lo script in IBM watsonx?

Per creare un piano per l'utilizzo di notebook o script Jupyter, determinare quale delle seguenti attività è necessario completare.

Attività Obbligatorio? Tempistica
Creazione di un progetto Questo deve essere il tuo primo compito
Aggiunta di asset di dati al progetto Prima di iniziare a creare i notebook
Come scegliere un linguaggio di programmazione Prima di selezionare lo strumento
Selezione di uno strumento Dopo aver selezionato la lingua
Controllo dei package della libreria Prima di selezionare un ambiente di runtime
Selezione di un ambiente di runtime appropriato Prima di aprire l'ambiente di sviluppo
Gestione del ciclo di vita dei notebook e degli script N Quando il notebook o lo script è pronto
Utilizzo per notebook e script dopo la creazione N Quando il notebook è pronto

Creazione di un progetto

È necessario creare un progetto prima di poter iniziare a lavorare nei notebook.

Progetti È possibile creare un progetto vuoto, uno da un file o da un URL. In questo progetto:

  • È possibile utilizzare Jupyter Notebook e RStudio.
  • I notebook sono asset nel progetto.
  • La collaborazione del notebook si basa sul blocco da parte dell'utente a livello di progetto.
  • Gli script R e le applicazioni Shiny non sono risorse del progetto.
  • Non c'è collaborazione su script R o applicazioni Shiny.

Scelta di un linguaggio di programmazione

È possibile scegliere di lavorare nelle seguenti lingue:

Notebook
Python e R
Script
Script R e applicazioni R Shiny

Selezione di uno strumento

In IBM watsonx, è possibile utilizzare notebook e script nel seguente strumento:

Editor di notebook Jupyter
Nell'editor Jupyter Notebook , è possibile creare notebook Python o R. I notebook sono asset in un progetto. La collaborazione è solo a livello di progetto. Il notebook è bloccato da un utente quando è aperto e può essere sbloccato solo dallo stesso utente o da un amministratore del progetto.
RStudio
In RStudio è possibile creare script R e applicazioni Shiny. Gli script R non sono asset in un progetto, il che significa che non esiste alcuna collaborazione a livello di progetto.

Verifica dei pacchetti della libreria

Quando si apre un notebook in un ambiente runtime, è possibile accedere a una vasta selezione di pacchetti di librerie di data science preinstallati. Molti ambienti includono anche librerie fornite da IBM senza costi aggiuntivi, come:

  • La libreria Watson Natural Language Processing negli ambienti Python
  • Librerie che consentono di accedere agli asset del progetto
  • Librerie per serie temporali o analisi geospaziali in ambienti Spark

Per un elenco dei package della libreria e delle versioni incluse in un modello di ambiente, selezionare il modello sulla pagina Modelli dalla pagina Gestisci nella pagina Ambienti del progetto.

Se le librerie mancano in un modello, è possibile aggiungerle:

Attraverso il notebook o lo script
È possibile utilizzare i comandi di installazione del pacchetto familiari per l'ambiente. Ad esempio, nei notebook Python , puoi utilizzare mamba, conda o pip.
Creando un modello di ambiente personalizzato
Quando si crea un modello personalizzato, è possibile creare una personalizzazione software e aggiungere le librerie che si desidera includere. Per i dettagli, consultare Personalizzazione dei template ambiente.

Scelta di un ambiente di runtime

La scelta dell'ambiente di calcolo per il notebook dipende dalla quantità di dati che si desidera elaborare e dalla complessità dei processi di analisi dei dati.

watsonx.ai Studio offre molti modelli di ambiente predefiniti con diverse dimensioni di hardware e configurazioni software per aiutarvi a iniziare rapidamente, senza dover creare modelli personalizzati. Questi modelli inclusi sono elencati sulla pagina Modelli dalla scheda Gestisci nella pagina Ambienti del progetto. Per ulteriori informazioni sugli ambienti inclusi, consultare Ambienti.

Se i modelli disponibili non soddisfano le tue esigenze, puoi creare modelli personalizzati e determinare la dimensione hardware e la configurazione software. Per i dettagli, consultare Personalizzazione dei template ambiente.

Importante: verificare che l'ambiente disponga di memoria sufficiente per memorizzare i dati caricati nel notebook. Spesso questo significa che l'ambiente deve avere molta più memoria rispetto alla dimensione totale dei dati caricati sul notebook perché alcuni framework di dati, come i panda, possono contenere più copie dei dati in memoria.

Utilizzo dei dati

Per gestire i dati in un notebook:

  • Aggiungere i dati al progetto, che trasforma i dati in un asset del progetto. Consultare Aggiunta di dati a un progetto per i diversi metodi per aggiungere dati a un progetto.
  • Utilizzare il codice generato che carica i dati dall'asset a una struttura dati nel notebook. Per un elenco dei tipi di dati supportati, consultare Supporto caricamento dati.
  • Scrivere il proprio codice per caricare i dati se l'origine dati non viene aggiunta come un asset di progetto o se il supporto per l'aggiunta del codice generato non è disponibile per l'asset di progetto.

Gestione del ciclo di vita di notebook e script

Dopo aver creato e verificato un notebook nello strumento, è possibile:

Gli script R e le applicazioni Shiny non possono essere pubblicati o condivisi utilizzando le funzionalità di un progetto.

Utilizzi per notebook e script dopo la creazione

Le opzioni per un notebook creato e pronto per l'uso in IBM watsonx includono:

  • Esecuzione come job in un progetto. Consultare Creazione e gestione dei job in un progetto.

  • Esecuzione come parte di un Pipelines. Vedi Configurazione dei nodi della pipeline.

    Per garantire che un notebook possa essere eseguito come un lavoro o in una pipeline:

    • Assicurarsi che nessuna cella richieda un input interattivo da parte di un utente.
    • Verificare che il notebook registri informazioni dettagliate sufficienti per consentire la comprensione dell'avanzamento e degli eventuali errori esaminando il log.
    • Utilizzare le variabili di ambiente nel codice per accedere alle configurazioni se un notebook o uno script le richiedono, ad esempio il file di dati di input o il numero di esecuzioni di addestramento.
  • Utilizzo del client Runtime Python di watsonx.ai per costruire, addestrare e distribuire i modelli. Vedere gli esempi di client Python runtime diwatsonx.ai.

  • Utilizzo dell'API REST di watsonx.ai Runtime per costruire, addestrare e distribuire i modelli.

Gli script R e le applicazioni Shiny possono essere creati e utilizzati solo nell'IDE RStudio di IBM watsonx. Non è possibile creare lavori per script R o distribuzioni R Shiny.

Argomento principale: Notebook e script