创建一个特征组,以保存数据资产的列集和相关元数据,供watsonx.aiRuntime 模型使用。 将功能组发布到IBM Knowledge Catalog,以便将其用作功能存储。 其他人可以搜索和重复使用IBM Knowledge Catalog中的功能组,而无需访问您的项目。
要求和限制
在以下情况下,您可以查看资产的功能部件组。
- 必需服务
watsonx.aiStudio(用于项目)
- 所需许可权
要查看此页面,您可以在项目或目录中具有任何角色。
要编辑或更新此页面上的信息,您必须在项目或目录中具有 编辑者 或 管理员 角色。
- 工作空间
您可以在以下工作空间中查看资产功能部件组:
- 项目
- 目录
- 资产类型
这些类型的资产可以具有功能部件组:
- 表格:CSV、TSV、Parquet、XLS、XSLX、AVRO、TXT、JSON 文件
- watsonx.aiStudio 和IBM Knowledge Catalog中结构化并支持的连接数据类型
- 数据大小
无限制
功能部件组 (Beta)
将IBM Knowledge Catalog用作功能存储库,您可以在其中保存和注释数据资产,供您的组织使用。 创建特征组,以保存特定数据资产的列集以及watsonx.aiRuntime 使用的元数据。 例如,如果您有一组用于信用核准模型的特征,那么可以保留用于训练模型的特征以及一些元数据,包括用作预测目标的列以及用于偏差检测的列。 功能部件组使保留用于训练机器学习模型的功能部件的元数据变得简单,以便其他数据研究员可以使用相同的功能部件。 预览特定资产时,可以看到 "功能部件组" 选项卡。
在项目中创建功能部件组
准备工作
如果在创建功能部件组之前为数据资产创建 概要文件 ,那么可以选择概要文件元数据以向该功能部件添加值。
创建功能部件组
您可以选择数据资产的特定列以构成功能部件组。
在项目 资产 选项卡中,单击相关资产的名称以打开预览并选择 功能部件组 选项卡。 您可以在此处创建功能部件组或查看和编辑现有功能部件组。 一个资产只能有一个功能部件组。 单击 新建功能部件组。
选择要在功能部件组中使用的列。 选中 名称 复选框以包含所有列作为功能部件。
您还可以在IBM Knowledge Catalog 中为数据资产创建功能组。 请参阅 目录资产 以获取更多信息。
编辑功能部件组
选择要在特征组中使用的数据资产列后,就可以查看每个特征并对其进行编辑,以指定其在watsonx.aiRuntime 模型中的作用。
单击功能部件名称,然后单击 编辑此功能部件。 将打开一个窗口,其中显示以下选项卡:
详细信息 -提供有关功能部件的以下信息。
选择要分配给功能部件的 角色 :
Input
:该特征可用作训练watsonx.aiRuntime 模型的输入。Target
:当数据用于训练watsonx.ai运行时模型时,用作预测目标的特征。Identifier
: 用于标识输入数据的主键,例如客户标识。
输入 描述, 食谱 (用于为功能部件创建值的任何方法或公式) 和任何 标记。
值描述
值描述允许您阐明特定值的含义。 例如,考虑值为 -1, 0 和 1的列 "信用评估"。 您可以使用值描述来提供这些值的含义。 例如, -1 可能表示 "求值被拒绝"。 您可以输入特定值的描述。 对于数字值,还可以指定范围。 要指定数值范围,请输入以下文本 [n , m] ,其中 n 是开始, m 是范围的结束,用方括号括起,然后单击 添加。 例如,要将 18 到 24 之间的所有年龄值描述为 "千禧一代" ,请输入 [18,24] 作为值,并输入 千禧一代 作为描述。 如果定义了 概要文件 ,那么概要文件值将显示在值描述列表中。 您可以从此处选择一个值或多个值。
公平性信息
您可以定义
Monitor
或Reference
组值以监视偏差。 更有可能产生有偏差结果的值可以放在 Monitor 组中。 然后将这些值与 "参考" 组中的值进行比较。 要指定数字值的范围,请输入以下文本 [n , m] ,其中 n 是开始, m 是范围的结束,用方括号括起。 例如,要监视 18 到 35 之间的所有年龄值,请输入 [18,35]。 然后选择 "监视器" 或 "引用" ,并单击 添加。 您还可以指定 有利结果。 有关公平性的更多信息,请参阅 AutoAI 实验中的公平性 。
编辑该功能部件后,单击 保存。 现在,您可以在 " 功能部件详细信息 " 窗口中查看更改。 关闭此窗口以返回到功能部件组。
从组中除去功能部件
要从组中除去功能部件,请执行以下操作:
预览项目中的资产,然后选择 功能部件组 选项卡。
在显示的 功能部件 表中,选择要除去的功能部件。
在显示的工具栏中,选择 从组中除去。
将除去功能部件或功能部件组 (如果选择了所有功能部件)。
搜索功能部件组
您可以 在所有目录和项目中搜索资产或列。 要过滤搜索结果以查找具有功能部件组的资产,请选择 数据 以查看过滤器选项,然后选择 功能部件组。 然后,将在搜索结果中列出包含功能部件组的资产。
使用 Python API 创建和使用功能部件组
您还可以在 Notebook 中使用 assetframe-lib Python 库 来创建和编辑功能部件组。 此库还允许您在创建机器学习模型时使用功能元数据 (例如公平性信息)。
了解更多信息
有关如何在 Notebook 中创建和使用功能部件组的示例:
- 在资源中心创建和使用功能存储数据示例项目
另请参阅:
父主题: 准备数据