Cree un grupo de características para conservar un conjunto de columnas de un activo de datos junto con los metadatos asociados para su uso con modelos watsonx.ai Runtime. Publique grupos de características en IBM Knowledge Catalog para que pueda utilizarse como almacén de características. Otros usuarios pueden buscar y reutilizar grupos de funciones en IBM Knowledge Catalog sin necesidad de acceder a su proyecto.
Requisitos y restricciones
Puede ver un grupo de características para activos en las circunstancias siguientes.
- Servicio necesario
watsonx.ai Studio (para proyectos)
- Permisos necesarios
Para ver esta página, puede tener cualquier rol en un proyecto o catálogo.
Para editar o actualizar información en esta página, debe tener el rol Editor o Admin en el proyecto o catálogo.
- Espacios de trabajo
Puede ver el grupo de características de activo en estos espacios de trabajo:
- Proyectos
- Catálogos
- Tipos de activos
Estos tipos de activos pueden tener un grupo de características:
- Tabular: Archivos CSV, TSV, Parquet, XLS, XSLX, AVRO, TXT, JSON
- Tipos de datos conectados estructurados y compatibles tanto en watsonx.ai Studio como en IBM Knowledge Catalog
- Tamaño de datos
Sin límite
Grupos de características (beta)
Utilice IBM Knowledge Catalog como almacén de funciones, donde puede guardar y anotar activos de datos para utilizarlos en su organización. Cree un grupo de características para conservar un conjunto de columnas de un activo de datos concreto junto con los metadatos utilizados para watsonx.ai Runtime. Por ejemplo, si tiene un conjunto de características para un modelo de aprobación de crédito, puede conservar las características utilizadas para entrenar el modelo, así como algunos metadatos, incluyendo qué columna se utiliza como destino de predicción y qué columnas se utilizan para la detección de sesgo. Los grupos de características simplifican la conservación de los metadatos para las características utilizadas para entrenar un modelo de aprendizaje automático para que otros científicos de datos puedan utilizar las mismas características. Puede ver la pestaña de grupo de funciones al obtener una vista previa de un activo determinado.
- Creación de un grupo de características
- Edición de un grupo de características
- Eliminación de características o un grupo de características
- Compartir grupo de características con catálogo
- Utilización de la API de Python para grupos de características
Creación de un grupo de características en un proyecto
Antes de empezar
Si crea un perfil para el activo de datos antes de crear un grupo de características, puede seleccionar metadatos de perfil para añadir valores a la característica.
Crear un grupo de características
Puede seleccionar columnas concretas de activos de datos para formar un grupo de características.
En la pestaña Activos del proyecto, pulse el nombre del activo relevante para abrir la vista previa y seleccione la pestaña Grupo de características . Aquí puede crear un grupo de características o ver y editar uno existente. Un activo sólo puede tener un grupo de funciones. Pulse Nuevo grupo de características.
Seleccione las columnas que desea utilizar en el grupo de características. Seleccione el recuadro de selección Nombre para incluir todas las columnas como características.
También puede crear un grupo de características para activos de datos en IBM Knowledge Catalog. Consulte Activos de catálogo para obtener más información.
Edición de un grupo de características
Cuando haya seleccionado las columnas del activo de datos que se utilizarán en el grupo de características, podrá ver cada característica y editarla para especificar la función que tendrá en los modelos watsonx.ai Runtime.
Pulse un nombre de característica y pulse Editar esta característica. Se abre una ventana que muestra las pestañas siguientes:
Detalles : proporcione la siguiente información sobre la característica.
Seleccione un Rol para asignarlo a la característica:
Input
: la característica se puede utilizar como entrada para entrenar un modelo watsonx.ai Runtime.Target
: la característica que se utilizará como objetivo de predicción cuando los datos se utilicen para entrenar un modelo watsonx.ai Runtime.Identifier
: la clave primaria, como el ID de cliente, que se utiliza para identificar los datos de entrada.
Especifique una Descripción, Receta (cualquier método o fórmula utilizada para crear valores para la característica) y cualquier Etiquetas.
Descripciones de valores
Las descripciones de valores le permiten aclarar el significado de valores específicos. Por ejemplo, considere una columna "evaluación de crédito" con los valores -1, 0 y 1. Puede utilizar descripciones de valores para proporcionar significado para estos valores. Por ejemplo, -1 puede significar "evaluación rechazada". Puede especificar descripciones para valores concretos. Para valores numéricos, también puede especificar un rango. Para especificar un rango de valores numéricos, especifique el texto siguiente [n, m] donde n es el inicio y m es el final del rango, entre corchetes y pulse Añadir. Por ejemplo, para describir todos los valores de edad entre 18 y 24 como "millenials", especifique [18,24] como el valor y millenials como la descripción. Si tiene un perfil definido, los valores del perfil se muestran en la lista de descripciones de valores. Desde aquí puede seleccionar un valor o varios valores.
Información de imparcialidad
Puede definir grupos de valores
Monitor
oReference
para supervisar el sesgo. Los valores que están en mayor riesgo de resultados sesgados se pueden colocar en el grupo Monitor. A continuación, estos valores se comparan con los valores del grupo Referencia. Para especificar un rango de valores numéricos, especifique el texto siguiente [n, m] donde n es el inicio y m es el final del rango, entre corchetes. Por ejemplo, para supervisar todos los valores de edad entre 18 y 35, especifique [18,35]. A continuación, seleccione Supervisor o Referencia y pulse Añadir. También puede especificar Resultados favorables. Consulte Equidad en experimentos de AutoAI para obtener más información sobre equidad.
Cuando haya editado la característica, pulse Guardar. Ahora puede ver los cambios en la ventana Detalles de característica . Cierre esta ventana para volver al grupo de características.
Eliminación de características de un grupo
Para eliminar una característica de un grupo:
Obtenga una vista previa del activo en el proyecto y seleccione la pestaña Grupo de características .
En la tabla Características que se muestra, seleccione la característica (o características) que desea eliminar.
En la barra de herramientas que aparece, seleccione Eliminar del grupo.
La característica, o grupo de características si ha seleccionado todas las características, se elimina.
Búsqueda de un grupo de características
Puede buscar activos o columnas en todos los catálogos y proyectos. Para filtrar los resultados de la búsqueda para buscar activos con un grupo de características, seleccione Datos para ver las opciones de filtro y seleccione Grupo de características. Los activos que contienen un grupo de características se listarán en los resultados de la búsqueda.
Utilización de la API de Python para crear y utilizar grupos de características
También puede utilizar la biblioteca assetframe-lib Python en cuadernos para crear y editar grupos de características. Esta biblioteca también le permite utilizar metadatos de características como la información de equidad al crear modelos de aprendizaje automático.
Más información
Para ver ejemplos sobre cómo crear y utilizar grupos de características en cuadernos:
- proyecto de ejemplo Creación y utilización de datos del almacén de características " en el Centro de recursos
Consulte también:
- Búsqueda de activos en IBM Knowledge Catalog
- Búsqueda de activos en todos los catálogos y proyectos
- Visualización de activos en catálogos
- Edición de activos en catálogos
- Publicación de activos de proyecto en un catálogo
Tema principal: Preparación de datos