È possibile visualizzare ed eseguire una pipeline di esempio integrata che utilizza i dati di esempio per apprendere come automatizzare i flussi di machine learning in Orchestration Pipelines.
Cosa sta succedendo nella pipeline di esempio?
La pipeline di esempio ottiene i dati di addestramento, addestra un modello di machine learning utilizzando il tool AutoAI e seleziona la pipeline migliore da salvare come modello. Il modello viene quindi copiato in uno spazio di distribuzione in cui viene distribuito.
Il campione illustra come è possibile automatizzare un flusso end-to-end per rendere il ciclo di vita più facile da eseguire e monitorare.
Il pipeline di esempio sembra questo:
Il tutorial ti passi attraverso questo processo:
Prerequisiti
Per eseguire questo esempio, è necessario prima creare:
- Un progetto, in cui puoi eseguire la pipeline di esempio.
- Uno spazio di distribuzione, in cui è possibile visualizzare e verificare i risultati. Lo spazio di distribuzione è richiesto per eseguire la pipeline di esempio.
Anteprima della creazione e dell'esecuzione della pipeline di esempio
Guarda questo video per vedere come creare ed eseguire una pipeline di esempio.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Creazione della pipeline di esempio
Crea la pipeline di esempio nell'editor Pipelines.
Aprire il progetto in cui si desidera creare la pipeline.
Dalla scheda Asset , fare clic su New asset> Automate model lifecycle.
Fare clic sulla scheda Esempio hub di risorse e selezionare Orchestrate an AutoAI experiment.
Immettere un nome per la pipeline. Ad esempio, inserire campione di marketing bancario.
Fare clic su Crea per aprire il canvas.
Esecuzione della pipeline di esempio
Per eseguire la pipeline di esempio:
Fare clic su Esegui pipeline nella barra degli strumenti dell'area, quindi scegliere Esegui di prova.
Seleziona uno spazio di distribuzione quando ti viene chiesto di fornire un valore per il parametro pipeline deployment_space .
Fare clic su Seleziona spazio.
Espandere la sezione Spazi .
Seleziona il tuo spazio di distribuzione.
Fare clic su Scegli.
Fornire una chiave API se è la prima volta che si esegue una pipeline. Gli asset pipeline utilizzano la tua chiave API IBM Cloud personale per eseguire le operazioni in modo sicuro senza interruzioni.
Se hai una chiave API esistente, fai clic su Utilizza chiave API esistente, incolla la chiave API e fai clic su Salva.
Se non hai una chiave API esistente, fai clic su Genera nuova chiave API, fornisci un nome e fai clic su Salva. Copia la chiave API e salva la chiave API per un utilizzo futuro. Al termine, fare clic su Chiudi.
Clicca su Esegui per avviare la pipeline.
Revisione dei risultati
Una volta completata la pipeline, è possibile visualizzare l'output per vedere i risultati.
Apri lo spazio di distribuzione che hai specificato come parte della pipeline. Vedi la nuova distribuzione nello spazio:
Se si desidera verificare la distribuzione, utilizzare la pagina Test dello spazio di distribuzione per inoltrare i dati del payload in formato JSON e ottenere un punteggio di ritorno. Ad esempio, fai clic sulla scheda JSON e immetti questi dati di input:
{"input_data": [{"fields": ["age","job","marital","education","default","balance","housing","loan","contact","day","month","duration","campaign","pdays","previous","poutcome"],"values": [["30","unemployed","married","primary","no","1787","no","no","cellular","19","oct","79","1","-1","0","unknown"]]}]}
Quando si fa clic su Previsione, il modello genera un output con un punteggio di confidenza per la previsione se un cliente sottoscrive una promozione deposito a termine.
In questo caso, la previsione di "no" è accompagnata da un punteggio di confidenza vicino al 95%, prevedendo che il cliente molto probabilmente non sottoscriverà un deposito a termine.
Esplorazione della configurazione e dei nodi di esempio
Ottieni una comprensione più approfondita di come i nodi di esempio sono configurati per funzionare di concerto nell'esempio della pipeline con la seguente procedura.
- Visualizzazione del parametro pipeline
- Caricamento dei dati di addestramento per l'esperimento AutoAI
- Creazione dell'esperimento AutoAI
- Esecuzione dell'esperimento AutoAI
- Distribuzione del modello a un servizio Web
Visualizzazione del parametro pipeline
Un parametro pipeline specifica un'impostazione per l'intero pipeline. Nella pipeline di esempio, un parametro della pipeline viene utilizzato per specificare uno spazio di distribuzione in cui il modello salvato dall'esperimento AutoAI viene memorizzato e distribuito. Ti viene chiesto di selezionare lo spazio di distribuzione a cui si collega il parametro della pipeline.
Fare clic sull'icona Oggetti globali sulla barra degli strumenti del canvas per visualizzare o creare i parametri della pipeline. Nella pipeline di esempio, il parametro pipeline è denominato deployment_space ed è di tipo Space. Clicca sul nome del parametro pipeline per visualizzare i dettagli. Nell'esempio, il parametro pipeline viene utilizzato con il nodo Crea file di dati e il nodo Crea esperimento AutoAI .
Caricamento dei dati di addestramento per l'esperimento AutoAI
In questo passo, un nodo Crea file dati è configurato per accedere ai dati impostati per l'esperimento. Clicca sul nodo per visualizzare la configurazione. Il file di dati è bank-marketing-data.csv
, che fornisce dati di esempio per prevedere se un cliente della banca si registra per un deposito a termine. I dati si trovano in un bucket Cloud Object Storage e possono essere aggiornati per mantenere aggiornata la formazione del modello.
Opzione | Valore |
---|---|
File | La posizione dell'asset di dati per l'addestramento dell'esperimento AutoAI . In questo caso, il file dei dati è in un progetto. |
Percorso file | Il nome dell'asset, bank-marketing-data.csv . |
Ambito di destinazione | Per questo esempio, l'obiettivo è uno spazio di distribuzione. |
Creazione dell'esperimento AutoAI
Il nodo per Creare l'esperimento AutoAI è configurato con questi valori:
Opzione | Valore |
---|---|
Nome esperimento AutoAI | onimbarco - banca - marketing - previsione |
Ambito | Per questo esempio, l'obiettivo è uno spazio di distribuzione. |
Tipo di previsione | binario |
Colonna di previsione (etichetta) | y |
Classe positiva | sì |
Formazione dei dati di formazione | 0.9 |
Algoritmi da includere | GradientBoostingClassifierEstimator XGBClassifierEstimator |
Algoritmi da utilizzare | 1 |
Metrica da ottimizzare | ROC AUC |
Ottimizza metrica (facoltativo) | Valore predefinito |
Specifica hardware (facoltativo) | Valore predefinito |
Descrizione dell'esperimento AutoAI | Questo esperimento utilizza un file di esempio, che contiene dati di testo raccolti dalle chiamate telefoniche a una banca portoghese in risposta a una campagna di marketing. L'obiettivo di classificazione è quello di prevedere se un cliente sottoscrive un deposito a termine, rappresentato dalla variabile y. |
Tag di esperimento AutoAI (facoltativo) | Nessuno |
Modalità di creazione (facoltativo) | Valore predefinito |
Quelle opzioni definiscono un esperimento che utilizza i dati di marketing della banca per prevedere se un cliente rischia di iscrivi in una promozione.
Esecuzione dell'esperimento AutoAI
In questo passo, il nodo Esegui esperimento AutoAI esegue l'esperimento AutoAI onboarding - bank - marketing - prediction, addestra le pipeline e salva il modello migliore.
Opzione | Valore |
---|---|
Esperimento AutoAI | Prende l'output dal nodo Crea AutoAI come input per eseguire l'esperimento. |
Asset dei dati di addestramento | Prende l'output dal nodo Crea file di dati come input dei dati di formazione per l'esperimento. |
Conteggio modelli | 1 |
Conteggio modelli (facoltativo) | 3 |
Asset di dati di holdout (facoltativo) | Nessuno |
Nome esecuzione (facoltativo) | Nessuno |
Prefisso nome modello (facoltativo) | Nessuno |
Descrizione esecuzione (facoltativo) | Nessuno |
Esegui tag (facoltativo) | Nessuno |
Modalità di creazione (facoltativo) | Valore predefinito |
Politica di errore (facoltativo) | Valore predefinito |
Distribuzione del modello a un servizio web
Il nodo Crea distribuzione Web crea una distribuzione online denominata onboarding - bank - marketing - prediction - deployment in modo da poter consegnare i dati e ottenere le previsioni in tempo reale dall'endpoint API REST.
Opzione | Valore |
---|---|
Asset di ML | Utilizza l'output del modello migliore dal nodo Esegui AutoAI come input per creare la distribuzione. |
Nome distribuzione | onboarding - banca - marketing - prediction - deployment |
Argomento principale: IBM Orchestration Pipelines