Créer un groupe de fonctionnalités pour préserver un ensemble de colonnes d'une ressource de données avec les métadonnées associées pour une utilisation avec les modèles d'exécution watsonx.ai Publier des groupes de fonctionnalités dans IBM Knowledge Catalog pour qu'il puisse être utilisé comme magasin de fonctionnalités. Les groupes de fonctionnalités d'IBM Knowledge Catalog peuvent être recherchés et réutilisés par d'autres personnes sans qu'elles aient besoin d'accéder à votre projet.
Exigences et restrictions
Vous pouvez afficher un groupe de fonctions pour les actifs dans les cas suivants.
- service requis
watsonx.ai Studio (pour les projets)
- Autorisations requises
Pour afficher cette page, vous pouvez avoir n'importe quel rôle dans un projet ou un catalogue.
Pour éditer ou mettre à jour des informations sur cette page, vous devez disposer du rôle Editeur ou Administrateur dans le projet ou le catalogue.
- Espaces de travail
Vous pouvez afficher le groupe de fonctions de l'actif dans les espaces de travail suivants:
- Projets
- Catalogues
- Types d'actifs
Ces types d'actifs peuvent avoir un groupe de fonctions:
- Tabulaire : Fichiers CSV, TSV, Parquet, XLS, XSLX, AVRO, TXT, JSON
- Les types de données connectés qui sont structurés et pris en charge à la fois par watsonx.ai Studio et IBM Knowledge Catalog
- Taille des données
Aucune limite
Groupes de fonctions (bêta)
Utilisez IBM Knowledge Catalog comme un magasin de fonctionnalités, où vous pouvez enregistrer et annoter des ressources de données pour les utiliser dans votre organisation. Créez un groupe d'éléments pour préserver un ensemble de colonnes d'une ressource de données particulière avec les métadonnées utilisées pour watsonx.ai Runtime. Par exemple, si vous disposez d'un ensemble de fonctions pour un modèle d'approbation de crédit, vous pouvez conserver les fonctions utilisées pour entraîner le modèle, ainsi que certaines métadonnées, y compris la colonne utilisée comme cible de prévision et les colonnes utilisées pour la détection de biais. Les groupes de fonctions simplifient la conservation des métadonnées pour les fonctions utilisées pour entraîner un modèle d'apprentissage automatique afin que d'autres spécialistes des données puissent utiliser les mêmes fonctions. Vous pouvez voir l'onglet de groupe de fonctions lorsque vous prévisualisez un actif particulier.
- Création d'un groupe de fonctions
- Edition d'un groupe de fonctions
- Retrait de fonctions ou d'un groupe de fonctions
- Partage du groupe de fonctions avec le catalogue
- Utilisation de l'API Python pour les groupes de fonctions
Création d'un groupe de fonctions dans un projet
Avant de commencer
Si vous créez un profil pour l'actif de données avant de créer un groupe de fonctions, vous pouvez sélectionner des métadonnées de profil pour ajouter des valeurs à la fonction.
Créer un groupe de fonctions
Vous pouvez sélectionner des colonnes particulières d'actifs de données pour former un groupe de fonctions.
Dans l'onglet Actifs du projet, cliquez sur le nom de l'actif approprié pour ouvrir l'aperçu et sélectionnez l'onglet Groupe de fonctions . Ici, vous pouvez créer un groupe de fonctions ou afficher et éditer un groupe de fonctions existant. Un actif ne peut avoir qu'un seul groupe de fonctions. Cliquez sur Nouveau groupe de fonctions.
Sélectionnez les colonnes à utiliser dans le groupe de fonctions. Cochez la case Nom pour inclure toutes les colonnes en tant que fonctions.
Vous pouvez également créer un groupe de fonctionnalités pour les ressources de données dans IBM Knowledge Catalog. Pour plus d'informations, voir Ressources de catalogue .
Edition d'un groupe de fonctions
Lorsque vous avez sélectionné les colonnes de la ressource de données à utiliser dans le groupe de fonctionnalités, vous pouvez alors visualiser chaque fonctionnalité et la modifier pour spécifier le rôle qu'elle aura dans les modèles d'exécution watsonx.ai
Cliquez sur un nom de fonction, puis sur Editer cette fonction. Une fenêtre s'ouvre avec les onglets suivants:
Détails -fournissez les informations suivantes sur la fonction.
Sélectionnez un Rôle à affecter à la fonction:
Input
: la caractéristique peut être utilisée comme entrée pour l'entraînement d'un modèle d'exécution watsonx.aiTarget
: la caractéristique à utiliser comme cible de prédiction lorsque les données sont utilisées pour former un modèle watsonx.ai Runtime.Identifier
: clé primaire, telle que l'ID client, utilisée pour identifier les données d'entrée.
Entrez une Description, Recette (toute méthode ou formule utilisée pour créer des valeurs pour la fonction) et des balises.
Descriptions de valeur
Les descriptions de valeur vous permettent de clarifier la signification de valeurs spécifiques. Par exemple, considérons une colonne "évaluation de crédit" avec les valeurs -1, 0 et 1. Vous pouvez utiliser des descriptions de valeur pour fournir une signification pour ces valeurs. Par exemple, -1 peut signifier "évaluation rejetée". Vous pouvez entrer des descriptions pour des valeurs particulières. Pour les valeurs numériques, vous pouvez également spécifier une plage. Pour spécifier une plage de valeurs numériques, entrez le texte suivant [ n, m ] où n est le début et m la fin de la plage, entre crochets, puis cliquez sur Ajouter. Par exemple, pour décrire toutes les valeurs d'âge comprises entre 18 et 24 comme "millenials", entrez [ 18,24 ] comme valeur et millenials comme description. Si un profil est défini, les valeurs de profil sont affichées dans la liste des descriptions de valeurs. A partir de là, vous pouvez sélectionner une valeur ou plusieurs valeurs.
Informations sur l'équité
Vous pouvez définir des groupes de valeurs
Monitor
ouReference
pour la surveillance du biais. Les valeurs les plus à risque de résultats biaisés peuvent être placées dans le groupe de surveillance. Ces valeurs sont ensuite comparées aux valeurs du groupe de référence. Pour spécifier une plage de valeurs numériques, entrez le texte suivant [ n, m ] où n est le début et m la fin de la plage, entre crochets. Par exemple, pour surveiller toutes les valeurs d'âge comprises entre 18 et 35, entrez [ 18,35 ]. Sélectionnez ensuite Moniteur ou Référence et cliquez sur Ajouter. Vous pouvez également spécifier des résultats favorables. Pour plus d'informations sur l'équité, voir Equité dans les expérimentations AutoAI .
Une fois la fonction éditée, cliquez sur Sauvegarder. Vous pouvez maintenant voir vos modifications dans la fenêtre Détails de la fonction . Fermez cette fenêtre pour revenir au groupe de fonctions.
Suppression de fonctions d'un groupe
Pour supprimer une fonction d'un groupe:
Prévisualisez l'actif dans le projet et sélectionnez l'onglet Groupe de fonctions .
Dans le tableau Fonctions qui s'affiche, sélectionnez la ou les fonctions que vous souhaitez supprimer.
Dans la barre d'outils qui s'affiche, sélectionnez Supprimer du groupe.
La fonction ou le groupe de fonctions si vous avez sélectionné toutes les fonctions est supprimé.
Recherche d'un groupe de fonctions
Vous pouvez rechercher des actifs ou des colonnes dans tous les catalogues et projets. Pour filtrer vos résultats de recherche afin de rechercher des actifs avec un groupe de fonctions, sélectionnez Données pour afficher les options de filtre et sélectionnez Groupe de fonctions. Les actifs contenant un groupe de fonctions seront ensuite répertoriés dans les résultats de la recherche.
Utilisation de l'API Python pour créer et utiliser des groupes de fonctions
Vous pouvez également utiliser la bibliothèque Python assetframe-lib dans des blocs-notes pour créer et éditer des groupes de fonctions. Cette bibliothèque permet également d'utiliser des métadonnées de fonction telles que les informations d'équité lors de la création de modèles d'apprentissage automatique.
En savoir plus
Pour des exemples de création et d'utilisation de groupes de fonctions dans des blocs-notes:
- projet d'exemple Création et utilisation des données de la base de données des caractéristiques dans le centre de ressources
Voir aussi :
- Recherche d'actifs dans IBM Knowledge Catalog
- Recherche d'actifs dans tous les catalogues et projets
- Affichage des actifs dans les catalogues
- Edition d'actifs dans des catalogues
- Publication d'actifs de projet dans un catalogue
Rubrique parent : Préparation des données