Erstellen Sie eine Feature-Gruppe, um einen Satz von Spalten eines Daten-Assets zusammen mit den zugehörigen Metadaten für die Verwendung mit watsonx.ai Runtime-Modellen zu erhalten. Veröffentlichen Sie Merkmalsgruppen im IBM Knowledge Catalog, damit dieser als Merkmalspeicher verwendet werden kann. Feature-Gruppen im IBM Knowledge Catalog können von anderen Personen durchsucht und wiederverwendet werden, ohne dass diese Zugriff auf Ihr Projekt haben müssen.
Anforderungen und Einschränkungen
Sie können eine Featuregruppe für Anlagen unter den folgenden Umständen anzeigen:
- Erforderlicher Service
watsonx.ai Studio (für Projekte)
- Erforderliche Berechtigungen
Um diese Seite anzuzeigen, können Sie eine beliebige Rolle in einem Projekt oder Katalog haben.
Um Informationen auf dieser Seite bearbeiten oder aktualisieren zu können, benötigen Sie die Rolle Editor oder Administrator im Projekt oder Katalog.
- Arbeitsbereiche
Sie können die Assetmerkmalgruppe in den folgenden Arbeitsbereichen anzeigen:
- Projekte
- Kataloge
- Arten von Assets
Diese Typen von Assets können eine Featuregruppe haben:
- Tabellarisch: CSV, TSV, Parquet, XLS, XSLX, AVRO, TXT, JSON-Dateien
- Verbundene Datentypen, die sowohl in watsonx.ai Studio als auch im IBM Knowledge Catalog strukturiert und unterstützt sind
- Data Size
Keine Begrenzung
Funktionsgruppen (Beta)
Verwenden Sie IBM Knowledge Catalog als Feature Store, in dem Sie Datenbestände zur Verwendung in Ihrem Unternehmen speichern und mit Anmerkungen versehen können. Erstellen Sie eine Feature-Gruppe, um eine Reihe von Spalten eines bestimmten Datenbestands zusammen mit den für watsonx.ai Runtime verwendeten Metadaten zu erhalten. Wenn Sie beispielsweise über eine Gruppe von Merkmalen für ein Kreditgenehmigungsmodell verfügen, können Sie die Merkmale, die zum Trainieren des Modells verwendet werden, sowie einige Metadaten beibehalten, einschließlich der Spalte, die als Vorhersageziel verwendet wird, und der Spalten, die für die Verzerrungserkennung verwendet werden. Featuregruppen vereinfachen die Beibehaltung der Metadaten für die Features, die zum Trainieren eines Modells für maschinelles Lernen verwendet werden, sodass andere Data-Scientists dieselben Features verwenden können. Sie können die Registerkarte "Featuregruppe" anzeigen, wenn Sie eine Vorschau einer bestimmten Anlage anzeigen.
- Featuregruppe erstellen
- Komponentengruppe bearbeiten
- Features oder eine Featuregruppe entfernen
- Featuregruppe mit Katalog gemeinsam nutzen
- Verwenden der Python -API für Featuregruppen
Featuregruppe in einem Projekt erstellen
Vorbereitende Schritte
Wenn Sie ein Profil für das Datenasset erstellen, bevor Sie eine Featuregruppe erstellen, können Sie Profilmetadaten auswählen, um dem Feature Werte hinzuzufügen.
Featuregruppe erstellen
Sie können bestimmte Spalten von Datenassets auswählen, um eine Featuregruppe zu bilden.
Klicken Sie auf der Registerkarte Assets des Projekts auf den Namen des relevanten Assets, um die Voranzeige zu öffnen und die Registerkarte Featuregruppe auszuwählen. Hier können Sie eine Featuregruppe erstellen oder eine vorhandene Gruppe anzeigen und bearbeiten. Eine Anlage kann nur eine Featuregruppe haben. Klicken Sie auf Neue Featuregruppe.
Wählen Sie die Spalten aus, die in der Featuregruppe verwendet werden sollen. Wählen Sie das Kontrollkästchen Name aus, um alle Spalten als Features einzuschließen.
Sie können auch eine Merkmalsgruppe für Datenbestände in IBM Knowledge Catalog erstellen. Weitere Informationen finden Sie unter Katalogassets .
Featuregruppe bearbeiten
Wenn Sie die Spalten des Datenbestands ausgewählt haben, die in der Feature-Gruppe verwendet werden sollen, können Sie jedes Feature anzeigen und bearbeiten, um die Rolle festzulegen, die es in den watsonx.ai Runtime-Modellen haben soll.
Klicken Sie auf einen Komponentennamen und dann auf Dieses Feature bearbeiten. Es wird ein Fenster mit den folgenden Registerkarten geöffnet:
Details -Geben Sie die folgenden Informationen zur Funktion an.
Wählen Sie eine Rolle aus, die dem Feature zugeordnet werden soll.
Input
: das Merkmal kann als Eingabe für das Training eines watsonx.ai Runtime-Modells verwendet werden.Target
: das Merkmal, das als Vorhersageziel verwendet werden soll, wenn die Daten zum Trainieren eines watsonx.ai Runtime-Modells verwendet werden.Identifier
: Der Primärschlüssel, z. B. die Kunden-ID, mit dem die Eingabedaten identifiziert werden.
Geben Sie eine Beschreibung, Rezept (beliebige Methode oder Formel zum Erstellen von Werten für das Feature) und Tagsein.
Wertbeschreibungen
Mithilfe von Wertbeschreibungen können Sie die Bedeutung bestimmter Werte verdeutlichen. Betrachten Sie zum Beispiel eine Spalte "Kreditauswertung" mit den Werten -1, 0 und 1. Sie können Wertbeschreibungen verwenden, um Bedeutung für diese Werte anzugeben. -1 könnte beispielsweise "Bewertung abgelehnt" bedeuten. Sie können Beschreibungen für bestimmte Werte eingeben. Für numerische Werte können Sie auch einen Bereich angeben. Um einen Bereich von numerischen Werten anzugeben, geben Sie den folgenden Text ein: [n, m] . Hierbei steht n für den Anfang und m für das Ende des Bereichs, eingeschlossen in Klammern, und klicken Sie auf Hinzufügen. Um beispielsweise alle Alterswerte zwischen 18 und 24 als "millenials" zu beschreiben, geben Sie [18,24] als Wert und millenials als Beschreibung ein. Wenn Sie ein Profil definiert haben, werden die Profilwerte in der Werteliste angezeigt. Hier können Sie einen oder mehrere Werte auswählen.
Informationen zur Fairness
Sie können
Monitor
-oderReference
-Wertegruppen für die Überwachung von Verzerrungen definieren. Die Werte, bei denen ein erhöhtes Risiko von verzerrten Ergebnissen besteht, können in die Überwachungsgruppe aufgenommen werden. Diese Werte werden dann mit Werten in der Referenzgruppe verglichen. Um einen Bereich numerischer Werte anzugeben, geben Sie den folgenden Text ein: [n, m] . Dabei steht n für den Anfang und m für das Ende des Bereichs, eingeschlossen in eckige Klammern. Wenn Sie beispielsweise alle Alterswerte zwischen 18 und 35 überwachen wollen, geben Sie [18,35]ein. Wählen Sie dann Monitor oder Reference aus und klicken Sie auf Hinzufügen. Sie können auch Positiv-Ergebnisseangeben. Weitere Informationen zur Fairness finden Sie unter Fairness in AutoAI -Experimenten .
Klicken Sie nach der Bearbeitung des Features auf Speichern. Ihre Änderungen werden jetzt im Fenster Featuredetails angezeigt. Schließen Sie dieses Fenster, um zur Featuregruppe zurückzukehren.
Features aus einer Gruppe entfernen
So entfernen Sie ein Feature aus einer Gruppe:
Zeigen Sie eine Vorschau des Assets im Projekt an und wählen Sie die Registerkarte Featuregruppe aus.
Wählen Sie in der angezeigten Tabelle Features die Features aus, die Sie entfernen möchten.
Wählen Sie in der daraufhin angezeigten Symbolleiste Aus Gruppe entfernenaus.
Das Feature bzw. die Featuregruppe, wenn Sie alle Features ausgewählt haben, wird entfernt.
Nach einer Featuregruppe suchen
Sie können in allen Katalogen und Projekten nach Assets oder Spalten suchen. Um Ihre Suchergebnisse zu filtern, um Assets mit einer Featuregruppe zu finden, wählen Sie Daten aus, um die Filteroptionen anzuzeigen, und wählen Sie Featuregruppeaus. Assets, die eine Featuregruppe enthalten, werden dann in den Suchergebnissen aufgelistet.
Mit der API Python Featuregruppen erstellen und verwenden
Sie können auch die Python-Bibliothek assetframe-lib Python in Notebooks verwenden, um Featuregruppen zu erstellen und zu bearbeiten. Diese Bibliothek ermöglicht Ihnen auch die Verwendung von Funktionsmetadaten wie Fairnessinformationen beim Erstellen von Modellen für maschinelles Lernen.
Weitere Informationen
Beispiele zum Erstellen und Verwenden von Featuregruppen in Notebooks:
- beispielprojekt Erstellen und Verwenden von Feature-Store-Daten in der Ressourcendrehscheibe
Siehe auch:
- Suche nach Assets im IBM Knowledge Catalog
- Assets in allen Katalogen und Projekten suchen
- Assets in Katalogen anzeigen
- Assets in Katalogen bearbeiten
- Projektassets in einem Katalog veröffentlichen
Übergeordnetes Thema: Daten vorbereiten