Questa esercitazione si concentra su un caso di utilizzo di esempio nel settore finanziario. Golden Bank deve eseguire un'analisi delle anomalie azionarie per aumentare la produttività e aumentare l'accuratezza del lavoro di un analista azionario nell'investment banking.
- Servizi richiesti
- watsonx.ai
- Watson Machine Learning
Scenario: processo di analisi delle anomalie delle scorte
Per raggiungere questo obiettivo, il tipico processo potrebbe essere il seguente:
- Un banchiere o un gestore di investimenti chiede all'analista di azioni di ricercare le azioni di una società.
- L'analista azionario scarica i dati azionari della società.
- Ricercano manualmente i dati delle azioni per individuare le anomalie nel modo in cui il prezzo delle azioni ha funzionato.
- Spiegano le anomalie ricercando manualmente il web per gli articoli di notizie rilevanti intorno alle date specifiche.
- L'analista riassume il ragionamento dietro le anomalie utilizzando gli articoli di notizie.
- Fanno ricerche di follow-up su specifici pezzi di informazioni e date.
- Inviano la relazione al banchiere d'investimento per fare ulteriori analisi al fine di prendere una decisione d'investimento.
Flusso di lavoro attività di base utilizzando watsonx.ai
Watsonx.ai può aiutare a completare ogni fase di questo processo. Il flusso di lavoro di base include le seguenti attività:
- Aprire un progetto. I progetti sono dove è possibile collaborare con altri per lavorare con i dati.
- Aggiungere dati al progetto. È possibile aggiungere file CSV o dati da un'origine dati remota tramite una connessione.
- Addestrare un modello. È possibile utilizzare una varietà di strumenti, come ad esempio AutoAI, SPSS Modeler o notebook Jupyter per addestrare il modello.
- Distribuire e verificare il modello.
- Trasformare i dati.
- Richiedere un modello di base.
- Ottimizzare il modello di base.
Informazioni su watsonx.ai
Per trasformare i tuoi processi di business con soluzioni basate sull'intelligenza artificiale, la tua azienda deve integrare sia il machine learning che l'intelligenza artificiale generativa nel tuo framework operativo. Watsonx.ai fornisce i processi e le tecnologie per consentire alla tua azienda di sviluppare e distribuire modelli di machine learning e soluzioni AI generative.
Guarda un video su watsonx.ai
Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Prova un'esercitazione per watsonx.ai
In questa esercitazione, verranno completate le seguenti attività:
- Attività 1: creare un progetto di esempio
- Attività 2: visualizzazione dei dati
- Attività 3: addestrare il modello
- Attività 4: distribuzione del modello
- Attività 5: raccolta di articoli di notizie pertinenti
- Attività 6: richiesta del modello di base
Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.
Utilizzare il video immagine - in - immagine
La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:
Ottieni aiuto nella community
Se hai bisogno di aiuto con questa esercitazione, puoi fare una domanda o trovare una risposta nel forum di discussione della comunitàwatsonx.
Configurare le finestre del browser
Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.
Attività 1: creare un progetto di esempio
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 00:00.
Questa esercitazione utilizza un progetto di esempio che contiene dataset, notebook e modelli di prompt per eseguire l'analisi. Per creare un progetto basato su un esempio, attenersi alla seguente procedura:
Accedere al progetto Analisi delle anomalie di stock nell'hub risorse.
Fare clic su Crea progetto.
Accettare i valori predefiniti per il nome del progetto e fare clic su Crea.
Fare clic su Visualizza nuovo progetto quando il progetto viene creato correttamente.
Associa un servizio Watson Machine Learning al progetto:
Quando il progetto si apre, fai clic sulla scheda Manage e seleziona la pagina Services and integrations .
Sulla scheda ServiziIBM , fai clic su Associa.
Selezionare l'istanza di Watson Machine Learning . Se non hai ancora eseguito il provisioning di un'istanza del servizio Watson Machine Learning , attieniti alla seguente procedura:
Fare clic su Nuovo servizio.
Selezionare Watson Machine Learning.
Fare clic su Crea.
Selezionare la nuova istanza del servizio dall'elenco.
Fare clic su Associa servizio.
Se necessario, fare clic su Annulla per tornare alla pagina Servizi & Integrazioni .
Fare clic sulla scheda Asset nel progetto per visualizzare gli asset di esempio.
Per ulteriori informazioni o per guardare un video, consultare Creazione di un progetto.
Per ulteriori informazioni sui servizi associati, consultare Aggiunta di servizi associati.
Controlla i tuoi progressi
La seguente immagine mostra la scheda Asset del progetto. Ora è possibile visualizzare i dati di addestramento.
Attività 2: visualizzazione dei dati
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 01:27.
I tre dataset nel progetto di esempio contengono dati sintetici generati utilizzando i dati di stock pubblici da Yahoo! Sito web di finanza come base. I dati di addestramento per un modello di previsione delle anomalie delle serie temporali devono essere strutturati e sequenziali. In questo caso, i dati sintetici sono strutturati e sequenziale. Attenersi alla seguente procedura per visualizzare gli asset di dati nel progetto di esempio:
- Aprire la serie di dati historical_data.csv . Questo dataset contiene le prestazioni dei prezzi azionari cronologici da maggio 2012 a maggio 2016.
- Tornare alla scheda Asset del progetto e aprire il data set test_data.csv . Questo dataset contiene le prestazioni cronologiche del prezzo delle azioni nel Q1 2023.
- Tornare alla scheda Asset del progetto e aprire il dataset training_data.csv . Questo dataset contiene le prestazioni cronologiche del prezzo delle azioni nel 2023.
- Fare clic sulla scheda Visualizzazione .
- Selezionare la colonna Data e fare clic su Visualizza dati. Viene visualizzato il primo tipo di grafico suggerito, un istogramma.
- Selezionare il tipo di grafico Linea .
- Per l' asse X, selezionare la colonna Data .
- Per Asse Y, selezionare la colonna Adj Close . Mostra il prezzo di chiusura rettificato per data. La colonna di destinazione per l'analisi delle anomalie è il prezzo di chiusura rettificato.
Controlla i tuoi progressi
La seguente immagine mostra una visualizzazione del file training_data.csv . Ora è possibile creare il modello utilizzando questi dati di addestramento.
Attività 3: addestrare il modello
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 02:13.
È possibile utilizzare una varietà di strumenti, come ad esempio AutoAI, SPSS Modeler o notebook Jupyter per addestrare il modello. In questa esercitazione, verrà adattato il modello di previsione delle anomalie dell'analisi delle serie temporali con AutoAI. Seguire questa procedura per creare l'esperimento AutoAI :
Tornare alla scheda Asset del progetto e fare clic su Nuovo asset> Crea modelli di machine learning automaticamente.
Nella pagina Crea automaticamente i modelli di machine learning , immettere il nome:
Stock anomaly experiment
Fare clic su Crea.
Nella pagina Aggiungi origine dati , aggiungere i dati di addestramento:
Fare clic su Seleziona dati dal progetto.
Selezionare Asset dati> training_data.csve fare clic su Seleziona asset.
Impostare le impostazioni di analisi delle serie temporali:
Selezionare Sì se viene richiesto di creare un esperimento di serie temporali.
Selezionare Previsione anomalie.
Selezionare Adj Close per Feature columns.
Fai clic su Run experiment. Mentre il modello si allena, viene visualizzata un'infografica che mostra il processo di creazione delle pipeline.
Per un elenco di algoritmi, o stimatori, disponibili con ciascuna tecnica di machine learning in AutoAI, Vedere: AutoAI dettaglio di implementazione.
Una volta completata l'esecuzione dell'esperimento, è possibile visualizzare e confrontare le pipeline classificate in una classifica.
È possibile fare clic su Confronto pipeline per visualizzare le differenze.
Fai clic sulla pipeline con il rango più alto per visualizzare i dettagli della pipeline.
Esaminare la pagina Valutazione del modello per visualizzare le metriche di valutazione dettagliate relative alle prestazioni del modello.
Lo strumento AutoAI considera un'ampia gamma di criteri per individuare le anomalie. Nella tabella, è possibile vedere la valutazione in base a metriche differenti, come Precisione media e Area sotto ROC, per ciascuno dei tipi di anomalia.
Tipi di anomalie Tipo di anomalia Descrizione Anomalia di tendenza Un segmento di serie temporali, che ha una variazione di tendenza rispetto alle serie temporali prima del segmento. Anomalia della varianza Un segmento di serie storica in cui viene modificata la varianza di una serie storica. Anomalia estrema localizzata Un punto dati insolito in una serie temporale, che si discosta in modo significativo dai punti dati che lo circondano. Anomalia di spostamento del livello Un segmento in cui viene modificato il valore medio di una serie temporale. Salvare il modello.
Fare clic su Salva con nome.
Selezionare Modello.
Per il nome del modello, immettere:
Anomaly Prediction Model
Fare clic su Crea. Ciò salva la pipeline come modello nel tuo progetto.
Una volta salvato il modello, fare clic sul collegamento Visualizza nel progetto nella notifica per visualizzare il modello nel progetto. In alternativa, è possibile passare alla scheda Asset nel progetto e fare clic sul nome del modello nella sezione Modelli .
Controlla i tuoi progressi
La seguente immagine mostra il modello.
Attività 4: distribuzione del modello
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 03:30.
L'attività successiva consiste nel promuovere i dati di test e il modello a uno spazio di distribuzione e quindi creare una distribuzione in linea.
Attività 4a: promuovere i dati di test nello spazio di distribuzione
Il progetto di esempio include i dati di test. Si promuovono tali dati di test in uno spazio di distribuzione, in modo da poter utilizzare i dati di test per verificare il modello distribuito. Attenersi alla seguente procedura per promuovere i dati di test in uno spazio di distribuzione:
Tornare alla scheda Asset del progetto.
Fare clic sul menu Overflow per l'asset di dati test_data.csv e scegliere Promuovi allo spazio.
Scegliere uno spazio di distribuzione esistente. Se non si dispone di uno spazio di distribuzione:
Fare clic su Crea un nuovo spazio di distribuzione.
Per il nome, immettere:
Anomaly Prediction Space
Selezionare un servizio di archiviazione.
Selezionare un servizio di machine learning.
Fare clic su Crea.
Chiudere la notifica quando lo spazio è pronto.
Selezionare il nuovo spazio di distribuzione dall'elenco.
Fare clic su Promuovi.
Controlla i tuoi progressi
La seguente immagine mostra la pagina Promuovi allo spazio .
Attività 4b: Promuovere il modello in uno spazio di distribuzione
Prima di poter distribuire il modello, è necessario promuoverlo in uno spazio di distribuzione. Attenersi alla seguente procedura per promuovere il modello a uno spazio di distribuzione:
Dalla scheda Asset , fare clic sul menu Overflow del modello Modello previsione anomalie e scegliere Promuovi allo spazio.
Selezionare lo stesso spazio di distribuzione dall'elenco.
Seleziona l'opzione Vai al modello nello spazio dopo averlo promosso .
Fare clic su Promuovi.
Controlla i tuoi progressi
La seguente immagine mostra il modello nello spazio di installazione.
Attività 4c: creare e verificare una distribuzione del modello
Ora che il modello è nello spazio di distribuzione, attenersi alla seguente procedura per creare la distribuzione del modello:
Con il modello aperto, fare clic su Nuova distribuzione.
Selezionare In linea come Tipo di distribuzione.
Per il nome distribuzione, immettere:
Anomaly Prediction Model Deployment
Fare clic su Crea.
Una volta completata la distribuzione, fare clic sul nome della distribuzione per visualizzare la pagina dei dettagli della distribuzione.
Esaminare l'endpoint di calcolo del punteggio, che è possibile utilizzare per accedere a questo modello in modo programmatico nelle applicazioni.
Verificare il modello.
Fare clic sulla scheda Test .
Per individuare i dati di test, fare clic su Cerca nello spazio.
Selezionare Asset dati> test_data.csv.
Fare clic su Conferma.
Fare clic su Previsioneed esaminare le previsioni per 62 record nei dati di test.
Controlla i tuoi progressi
La seguente immagine mostra i risultati del test dal modello distribuito.
Task 5: raccogliere articoli di attualità pertinenti
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 05:07.
Sebbene il Prompt Lab possa lavorare con testo strutturato e non strutturato, è essenziale assicurarsi di immettere i dati corretti che il modello può elaborare. In questo caso di utilizzo, è necessario elaborare il testo dell'articolo di notizie in base alle date di anomalia ottenute dalla previsione delle anomalie. È possibile integrare un'API di notizie esterna per estrarre le notizie rilevanti durante tali date per semplificare il processo di raccolta dei dati. Puoi eseguire questa operazione in un notebook Jupyter con codice Python .
Poiché i modelli di base hanno un limite sul numero di token che possono elaborare in un singolo prompt (noto come finestra di contesto), i dati potrebbero dover essere raggruppati o riepilogati per rientrare in questo limite. Questo passo garantisce che i dati di input siano in un formato che il modello di base può elaborare in modo efficace senza perdere le informazioni essenziali.
Attenersi alla seguente procedura per eseguire il notebook:
- Dal Menu di navigazione , scegliere Progetti> Visualizza tutti i progetti.
- Aprire il progetto Analisi delle anomalie stock .
- Fai clic sulla scheda Assets.
- Fare clic sul menu Overflow per il blocco appunti Estrazione e porzione di testo dagli articoli di Notizie e scegliere Modifica.
- Completare la sezione Configurazione .
- Fare clic su Esegui per la prima cella per importare le librerie.
- Ottenere le chiavi API necessarie:
- Segui il collegamento per creare un account e una chiave API su TheNewsAPI.
- Incolla la chiave API nella variabile
thenewsapi_key
. - Segui il collegamento per creare un account e una chiave API in ArticlExtractor.
- Incolla la chiave API nella variabile
extract_key
.
- Eseguire la cella per impostare le due variabili chiave API.
- Eseguire le celle nella sezione Definire la funzione per ottenere gli URL degli articoli di notizie .
- La prima cella definisce una funzione da cui ottenere i dati TheNewsAPI's Notizie principali e imposta i parametri per assicurarti di ricevere notizie pertinenti.
- La seconda cella definisce una funzione per ottenere solo un elenco di URL basati sulla risposta.
- Eseguire le celle nella sezione Definire la funzione per estrarre il testo delle notizie .
- La prima cella definisce una funzione per estrarre il testo delle notizie da uno specifico URL di notizie utilizzando l'API ArticlExtractor .
- La seconda cella definisce una funzione per combinare il testo delle notizie da tutti gli URL degli articoli ottenuti TheNewsAPI.
- Eseguire la cella nella sezione Definire la funzione per suddivide in blocchi il testo delle notizie . Per garantire che il modello di base LLM possa acquisire le informazioni dal testo, è necessario assicurarsi che il token non superi le limitazioni della finestra del token di contesto. In questo esempio, si definisce una funzione per utilizzare LangChain per suddividere il testo del carattere tenendo conto del contesto del testo delle notizie.
- Eseguire la cella nella sezione Esegui le funzioni . Nella risposta, è possibile vedere che l'output finale dei dati è pronto per essere inserito nel Prompt Lab. LangChain’s il divisore di testo divide il testo lungo in blocchi o frasi semanticamente significativi e li combina nuovamente come un intero testo da elaborare. È possibile regolare la dimensione massima dei blocchi.
Controlla i tuoi progressi
La seguente immagine mostra il notebook completato. Ora si dispone del testo suddiviso in blocchi da utilizzare per richiedere il modello di base.
Attività 6: Richiedi il modello di base
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 07:17.
Ora che l'articolo di notizie pertinente è opportunamente suddiviso in blocchi, è possibile creare i propri modelli di prompt in Prompt Lab oppure è possibile utilizzare i modelli di prompt di esempio nel progetto di esempio. Il progetto di esempio include modelli di prompt di esempio per attività di riepilogo e di risposta alle domande. Seguire questa procedura per richiedere il modello di base in Prompt Lab.
Attività di riepilogo
Tornare alla scheda Asset del progetto.
Fare clic sul modello di prompt Riepiloga articoli di notizie . Questo apre il modello di prompt in Prompt Lab.
Fare clic su Modifica per aprire il modello di prompt in modalità di modifica.
Per l'attività di riepilogazione, utilizzare il testo dell'articolo di notizie suddiviso in blocchi come esempio di input e notare che l'analista di azioni di solito scrive manualmente per spiegare le anomalie come esempio di output. Questo per garantire che l'output sia simile a quello che l'analista azionario potrebbe scrivere da solo.
Fare clic su Genera per visualizzare i risultati di riepilogo.
Prova con un testo di input e output diverso dall'articolo di notizie suddiviso in parti nel notebook.
Attività di risposta alla domanda
Fare clic su Prompt salvati per visualizzare il prompt salvato dal progetto.
Fare clic sul modello di prompt Articoli di notizie della risposta alla domanda dall'elenco di prompt salvati.
Fare clic su Modifica per aprire il modello di prompt in modalità di modifica.
Per l'attività di risposta alle domande, utilizzare le domande come esempio di input e le risposte nel livello di dettaglio richiesto e nel formato preferito come esempio di output.
Fare clic su Genera per visualizzare i risultati di riepilogo.
Sperimentare con un testo di input e output diverso.
Regola i parametri del modello
In Prompt Lab, è possibile regolare le impostazioni di decodifica per ottimizzare l'output del modello per l'attività specifica:
- Decodifica
- Greedy: seleziona sempre le parole con la probabilità più alta
- Campionamento: personalizza la variabilità della selezione delle parole
- Penalità di ripetizione: quanta ripetizione è consentita
- Criteri di arresto: una o più stringhe che causeranno l'arresto della creazione del testo se prodotto
Questa flessibilità consente un alto grado di personalizzazione, garantendo che il modello operi con parametri più adatti alle esigenze e ai vincoli dell'attività.
In Prompt Lab, è possibile impostare le limitazioni del token per garantire che le attività rimangano nell'ambito operativo del modello. Questa impostazione consente di bilanciare l'esaustività della risposta con i limiti tecnici del modello, garantendo un'elaborazione efficiente ed efficace delle attività.
Controlla i tuoi progressi
La seguente immagine mostra il Prompt Lab.
Passi successivi
Prova con i notebook di prompt
Da Prompt Lab, è possibile salvare il lavoro in formato notebook:
- Caricare un modello di prompt salvato.
- Fare clic su Salva lavoro> Salva con nome.
- Selezionare Notebook.
- Immettere un nome.
- Fare clic su Salva, quindi esplorare il blocco appunti della richiesta.
- Ripetere questi passi per l'altro modello di prompt.
Ottimizzazione di un modello di base
È possibile ottimizzare il modello di base per migliorare le prestazioni del modello rispetto alla sola progettazione di prompt o ridurre i costi distribuendo un modello più piccolo che funziona in modo simile a un modello più grande. Vedi l'esercitazione Ottimizza un modello di base .
Ulteriori risorse
Prova queste esercitazioni aggiuntive per ottenere più esperienza pratica con watsonx.ai:
Guarda altri video.
Trova dataset e notebook di esempio per ottenere dati di perfezionamento pratici nell' hub di risorse.
Argomento principale: Esercitazioni introduttive