Creare un gruppo di funzioni per conservare un insieme di colonne di un asset di dati insieme ai metadati associati da utilizzare con i modelli di watsonx.ai Runtime. Pubblicare i gruppi di funzioni su IBM Knowledge Catalog, in modo da poterlo utilizzare come archivio di funzioni. I gruppi di funzioni in IBM Knowledge Catalog possono essere ricercati e riutilizzati da altri senza che questi debbano accedere al vostro progetto.
Requisiti e restrizioni
È possibile visualizzare un gruppo di funzioni per gli asset nelle seguenti circostanze.
- Servizio richiesto
watsonx.ai Studio (per i progetti)
- Autorizzazioni richieste
Per visualizzare questa pagina, è possibile disporre di qualsiasi ruolo in un progetto o in un catalogo.
Per modificare o aggiornare le informazioni in questa pagina, è necessario disporre del ruolo Editor o Admin nel progetto o nel catalogo.
- Aree di lavoro
È possibile visualizzare il gruppo di funzioni dell'asset in questi spazi di lavoro:
- Progetti
- Cataloghi
- Tipi di asset
Questi tipi di asset possono avere un gruppo di funzioni:
- Tabulare: File CSV, TSV, Parquet, XLS, XSLX, AVRO, TXT, JSON
- Tipi di dati collegati che sono strutturati e supportati sia nello Studio 'watsonx.ai che nel 'IBM Knowledge Catalog
- Dimensione dati
Nessun limite
Gruppi di funzioni (beta)
Utilizzate IBM Knowledge Catalog come archivio di funzioni, dove potete salvare e annotare le risorse di dati da utilizzare nella vostra organizzazione. Creare un gruppo di funzioni per conservare un insieme di colonne di un particolare asset di dati insieme ai metadati utilizzati per watsonx.ai Runtime. Ad esempio, se si dispone di una serie di funzioni per un modello di approvazione del credito, è possibile conservare le funzioni utilizzate per addestrare il modello, nonché alcuni metadati, inclusa la colonna utilizzata come obiettivo di previsione e le colonne utilizzate per il rilevamento della distorsione. I gruppi di funzioni rendono semplice conservare i metadati per le funzioni utilizzate per preparare un modello di machine learning in modo che altri data scientist possano utilizzare le stesse funzioni. È possibile visualizzare la scheda del gruppo di funzioni quando si visualizza l'anteprima di un particolare asset.
- Creazione di un gruppo di funzioni
- Modifica di un gruppo di funzioni
- Eliminazione di funzioni o di un gruppo di funzioni
- Condivisione del gruppo di funzioni con il catalogo
- Utilizzo della API Python per i gruppi di funzioni
Creazione di un gruppo di funzioni in un progetto
Prima di iniziare
Se si crea un Profilo per l'asset di dati prima di creare un gruppo di funzioni, è possibile selezionare i metadati del profilo per aggiungere valori alla funzione.
Crea un gruppo di funzioni
È possibile selezionare particolari colonne di asset di dati per formare un gruppo funzioni.
Nella scheda Asset del progetto, fare clic sul nome dell'asset pertinente per aprire l'anteprima e selezionare la scheda Gruppo di funzioni . Qui è possibile creare un gruppo di funzioni o visualizzarne e modificarne uno esistente. Un asset può avere un solo gruppo di funzioni. Fare clic su Nuovo gruppo di funzioni.
Selezionare le colonne che si desidera utilizzare nel gruppo di funzioni. Selezionare la casella di spunta Nome per includere tutte le colonne come funzioni.
È anche possibile creare un gruppo di caratteristiche per le risorse di dati in IBM Knowledge Catalog. Consultare Risorse del catalogo per ulteriori informazioni.
Modifica di un gruppo di funzioni
Dopo aver selezionato le colonne dell'asset di dati da usare nel gruppo di caratteristiche, è possibile visualizzare ogni caratteristica e modificarla per specificare il ruolo che avrà nei modelli watsonx.ai Runtime.
Fare clic sul nome di una funzione e fare clic su Modifica questa funzione. Si apre una finestra che visualizza le seguenti schede:
Dettagli - fornire le seguenti informazioni sulla funzione.
Selezionare un Ruolo da assegnare alla funzione:
Input
: la caratteristica può essere utilizzata come input per l'addestramento di un modello watsonx.ai Runtime.Target
: la caratteristica da usare come target di predizione quando i dati vengono usati per addestrare un modello watsonx.ai Runtime.Identifier
: la chiave primaria, come l'ID cliente, utilizzata per identificare i dati di input.
Immettere una Descrizione, Ricetta (qualsiasi metodo o formula utilizzata per creare i valori per la funzione) e qualsiasi Tag.
Descrizioni dei valori
Le descrizioni dei valori consentono di chiarire il significato di valori specifici. Ad esempio, considerare una colonna "valutazione del credito" con i valori -1, 0 e 1. È possibile utilizzare le descrizioni dei valori per fornire un significato per questi valori. Ad esempio, -1 potrebbe significare "valutazione rifiutata". È possibile immettere descrizioni per valori particolari. Per i valori numerici, è anche possibile specificare un intervallo. Per specificare un intervallo di valori numerici, immettere il seguente testo [ n, m] dove n è l'inizio e m è la fine dell'intervallo, racchiuso tra parentesi e fare clic su Aggiungi. Ad esempio, per descrivere tutti i valori di età compresi tra 18 e 24 come "millenials", immettere [ 18,24] come valore e millenials come descrizione. Se si dispone di un profilo definito, i valori del profilo vengono visualizzati nell'elenco delle descrizioni dei valori. Da qui è possibile selezionare uno o più valori.
Informazioni sulla correttezza
È possibile definire
Monitor
oReference
gruppi di valori per il monitoraggio della distorsione. I valori che sono più a rischio di risultati distorti possono essere inseriti nel gruppo Monitor. Questi valori vengono quindi confrontati con i valori nel gruppo Riferimento. Per specificare un intervallo di valori numerici, immettere il seguente testo [ n, m] dove n è l'inizio e m è la fine dell'intervallo, racchiuso tra parentesi. Ad esempio, per monitorare tutti i valori di età compresi tra 18 e 35, immettere [ 18,35]. Quindi selezionare Monitor o Riferimento e fare clic su Aggiungi. È inoltre possibile specificare Risultati favorevoli. Consultare Correttezza negli esperimenti AutoAI per ulteriori informazioni sulla correttezza.
Una volta modificata la funzione, fare clic su Salva. Ora è possibile visualizzare le modifiche nella finestra Dettagli funzione . Chiudere questa finestra per tornare al gruppo di funzioni.
Rimozione di funzioni da un gruppo
Per rimuovere una funzione da un gruppo:
Visualizzare l'anteprima dell'asset nel progetto e selezionare la scheda Gruppo di funzioni .
Nella tabella Funzioni visualizzata, selezionare la funzione (o le funzioni) che si desidera rimuovere.
Nella barra degli strumenti visualizzata, selezionare Rimuovi dal gruppo.
La funzione, o il gruppo di funzioni, se sono state selezionate tutte le funzioni, viene rimossa.
Ricerca di un gruppo di funzioni
È possibile ricercare asset o colonne in tutti i cataloghi e progetti. Per filtrare i risultati della ricerca per trovare gli asset con un gruppo di funzioni, selezionare Dati per vedere le opzioni di filtro e selezionare Gruppo di funzioni. Gli asset contenenti un gruppo di funzioni verranno quindi elencati nei risultati della ricerca.
Utilizzo dell'API Python per creare e utilizzare i gruppi di funzioni
Puoi anche utilizzare la libreria Python assetframe - lib nei notebook per creare e modificare gruppi di funzioni. Questa libreria consente inoltre di utilizzare i metadati della funzione, come le informazioni sulla correttezza, quando si creano i modelli di machine learning.
Ulteriori informazioni
Per esempi su come creare e utilizzare gruppi di funzioni nei notebook:
- progetto campione Creare e utilizzare i dati del Feature Store nell'hub delle risorse
Vedere anche:
- Ricerca di risorse nel IBM Knowledge Catalog
- Ricerca di asset in tutti cataloghi e progetti
- Visualizzazione di asset nei cataloghi
- Modifica di asset nei cataloghi
- Pubblicazione di asset di progetti in un catalogo
Argomento principale Preparazione dei dati