Check back each week to learn about new features and updates for Cloud Pak for Data as a Service and services such as watsonx.ai Studio (formerly Watson Studio), watsonx.ai Runtime (formerly Watson Machine Learning), DataStage, and IBM Knowledge Catalog.
截至 2024 年 12 月 20 日的一周
部署转换为 ONNX 格式的模型
2024 年 12 月 20 日
现在,您可以部署转换为 ONNX 格式的机器学习和生成式人工智能模型,并使用端点进行推理。 这些模型也可适用于动态轴。 有关更多信息,请参阅部署覆盖为 ONNX 格式的模型。
部署多源 SPSS Modeler 流程
2024 年 12 月 20 日
现在,您可以为使用多个输入流向模型提供数据的 SPSS Modeler 流程创建部署。 有关详细信息,请参阅部署多源 SPSS Modeler 流程。
截至 2024 年 12 月 13 日的一周
导入世系元数据的新数据源
2024 年 12 月 12 日
现在,您可以从以下数据源导入世系元数据。 导入数据后,您可以在世系图上直观地看到这些数据。 如需了解更多信息,请参阅 " 支持的数据源整理和数据质量 "。
数据质量监控和补救工作流 IBM Knowledge Catalog
2024 年 12 月 12 日
为了将质量改进工作的重点放在对企业最重要的数据上,您需要确定关键数据元素,定义质量预期,并确保对数据质量问题进行补救。
您现在可以建立数据质量 SLA 规则,以便
- 根据特定的质量标准监控关键数据的质量,作为元数据充实的一部分。
- 如果质量不符合预期,触发补救工作流程。 您可以使用默认修复工作流程或创建自定义工作流程。
您可以在受监控数据资产的 " 数据质量 "页面上查看有关 SLA 规则合规性或违反情况以及补救任务状态的信息。
有关更多信息,请参阅:
从元数据丰富结果中删除建议名称和描述 IBM Knowledge Catalog
2024 年 12 月 12 日
在元数据丰富结果中,现在可以批量删除使用 " 扩展元数据 "选项运行丰富时建议的显示名称或描述。 请参阅对元数据丰富结果进行批量更改。
使用数据源定义管理和保护通过连接访问的数据
2024 年 12 月 12 日
数据源定义是一种新的资产类型,是根据连接或连接数据资产的端点定义的。 创建数据源定义时,可以监控多个项目、目录或多节点数据源的数据存储位置。 您还可以根据数据源定义应用正确的保护解决方案(执行引擎)。 有关详情,请参阅使用数据源定义的数据保护。
现在,所有地区都可以使用这些新的数据源定义功能。
使用保护解决方案定义数据源定义IBM Knowledge Catalog
2024 年 12 月 09 日
保护解决方案是一种在受管目录中或通过深度执行解决方案执行数据保护规则的方法。
要使用深度执行解决方案配置平台,可以创建数据源定义来设置数据源类型。 数据源类型决定了数据源定义可关联的连接类型以及可用的保护解决方案选项。 有关详情,请参阅数据源定义的保护解决方案。
现在,所有地区都可以使用这些新的数据源定义功能。
屏蔽流程功能的停用
2024 年 12 月 11 日
以下功能已过时,现已删除:
- 现在删除了用于混淆数据的可逆选项,以后可以逆转掩码来恢复原始值。
- 通过创建掩码流和灵活合规的单向散列标记化,可逆加密已不再适用于创建数据副本。
- 解密可逆屏蔽数据不再可用。
更新 SPSS Modeler 教程
2024 年 12 月 11 日
通过试用 15 个更新的 SPSS Modeler 教程 ,亲身体验 SPSS Modeler 。
IBM Knowledge Catalog在悉尼地区提供
2024 年 12 月 09 日
IBM Knowledge Catalog现在也可在悉尼数据中心使用。 注册时,您可以选择悉尼作为首选地区。
有关悉尼地区可用产品功能的更多信息,请参阅服务和功能的地区可用性。
IBM DataStage可在悉尼地区使用
2024 年 12 月 09 日
DataStage现已在悉尼数据中心全面投入使用。 注册时,您可以选择悉尼作为首选地区。
有关悉尼地区可用产品功能的更多信息,请参阅服务和功能的地区可用性。
IBM watsonx.governance适用于悉尼地区
2024 年 12 月 9 日
IBM watsonx.governance现已在悉尼数据中心全面投入使用。 注册时,您可以选择悉尼作为首选地区。
有关悉尼地区可用产品功能的更多信息,请参阅服务和功能的地区可用性。
截至 2024 年 12 月 06 日的一周
导入世系元数据的新数据源
2024 年 12 月 06 日
现在,您可以从以下数据源导入世系元数据。 导入数据后,您可以在世系图上直观地看到这些数据。 如需了解更多信息,请参阅 " 支持的数据源整理和数据质量 "。
停用IBM Cloud Object Storage精简版计划IBM Knowledge Catalog
2024 年 12 月 05 日
您在 2024 年 7 月 1 日之前配置的无限期Cloud Object StorageLite 计划已停用,并可能在 2024 年 12 月 15 日之后移除。 要保留您的数据和其他资产,您必须在 2024 年 12 月 15 日之前将Cloud Object Storage服务升级到标准计划。 如果您不将Cloud Object Storage计划升级为标准计划,您的工作空间可能会在 2024 年 12 月 15 日后无法访问,您的数据可能会被永久删除。 更多信息,请参阅精简版计划(已废弃)。
Decision Optimization中的 OPL 模型不再使用 Microsoft Excel 文件
2024 年 12 月 05 日
Microsoft Excel 工作簿(.xls 和 .xlsx)文件现已不再用于Decision OptimizationOPL 模型的直接输入和输出。 要连接 Excel 文件,请使用数据连接器。 数据连接器可将 Excel 文件转换为 .csv 文件。 更多信息,请参阅参考数据。
增强元数据充实工作的调度IBM Knowledge Catalog
2024 年 12 月 05 日
现在,您可以为元数据丰富作业配置执行窗口,以平衡工作负载。 然后,任务只能在配置的时间范围内运行。 有关更多信息,请参阅管理强化作业的调度。
根据列值对数据资产进行细分,以便关注您所需的信息IBM Knowledge Catalog
2024 年 12 月 05 日
现在,您可以根据选定的列值将数据资产分块为更小的数据资产,从而帮助您只访问感兴趣的数据。 更多信息,请参阅通过分割列数据创建数据资产。
用于部署转换为 ONNX 格式的模型的新样本笔记本
2024 年 12 月 03 日
现在,您可以部署转换为 ONNX 格式的机器学习和生成式人工智能模型,并使用端点进行推理。 这些模型也可适用于动态轴。 请参阅以下笔记本样本:
更多信息,请参阅watsonx.aiRuntimePython客户端示例。
截至 2024 年 11 月 29 日的一周
改进了有关Data Refinery写入选项的文档
2024 年 11 月 28 日
导出数据流的写入选项和表格选项取决于您的连接。 现对这些选项进行说明,以便更好地指导您选择目标表格选项。 有关详细信息,请参阅 Data Refinery的目标连接选项。
2024 年 11 月 25 日的一周
Watson Query服务名称变更
2024 年 11 月 25 日
Watson Query服务更名为Data Virtualization。
截至 2024 年 11 月 22 日的一周
Watson Studio和Watson Machine Learning服务更名
2024 年 11 月 21 日
以下服务重新命名:
- Watson Machine Learning现在被命名为watsonx.aiRuntime。
- Watson Studio现已更名为watsonx.aiStudio。
一些视频、笔记本和代码示例可能会继续使用这些服务的旧名称。
悉尼地区Cloud Pak for Data as a Service
2024 年 11 月 21 日
现在,Cloud Pak for Data as a Service与 "watsonx.aiRuntime 和 "watsonx.aiStudio 服务一起在悉尼数据中心普遍可用。 注册时,您可以选择悉尼作为首选地区。
悉尼地区尚未提供所有服务。 有关悉尼地区可用产品功能的更多信息,请参阅服务和功能的地区可用性。
增强对元数据充实工作的监控IBM Knowledge Catalog
2024 年 11 月 21 日
在新的运行度量仪表板上,您可以监控活动元数据丰富任务运行的各个丰富任务的进度。 此外,您还可以查看已完成作业运行的运行信息,以确定是否以及在哪里出现了问题。 有关更多信息,请参阅监控浓缩作业的运行。
将SPSS Modeler流程推广到部署空间
2024 年 11 月 19 日
现在,您可以直接将SPSS Modeler流程从项目推广到部署空间,而无需先导出项目,然后再将其导入部署空间。 有关详细信息,请参阅推广SPSS Modeler流程和模型。
截至 2024 年 11 月 15 日的一周
现在需要任务凭证才能从部署空间部署资产和运行作业
2024 年 11 月 11 日
为提高运行部署作业的安全性,必须输入任务凭据才能从部署空间部署以下资产:
- 提示模板
- AI 服务
- 模型
- Python 函数
- 脚本
此外,您必须输入任务凭据,才能从部署空间创建以下部署:
- 联机
- 批处理
您还必须使用任务凭证从部署空间创建和管理部署作业。
要了解如何设置任务凭证和生成 API 密钥,请参阅 添加任务凭证。
自定义属性的编辑器模式IBM Knowledge Catalog
2024 年 11 月 14 日
在查看治理工件时,现在可以打开自定义属性的编辑器模式。 如果在 "详细信息"部分关闭了 "编辑值"切换开关,则只能看到为工件定义了值的自定义属性。 打开编辑器模式,就可以查看所有可用的自定义属性并编辑其值。 更多信息,请参阅自定义属性、关系和资产类型。
截至 2024 年 11 月 8 日的一周
使用SPSS Modeler连接新数据源
2024 年 11 月 7 日
现在,您可以将SPSS Modeler连接到 Databricks 和Microsoft AzureSynapse Analytics,而且SPSS Modeler可以读写这两个数据源。 有关详细信息,请参阅Microsoft AzureDatabricks 连接和Microsoft AzureSynapse Analytics 连接。
截至 2024 年 11 月 1 日的一周
停用IBMRuntime23.1
2024 年 10 月 28 日
IBMRuntime23.1已过时。 自 2024 年 11 月 21 日起,您将无法使用23.1运行时创建新笔记本或自定义环境。 此外,您不能使用基于23.1运行时的软件规格创建新的部署。 为确保无缝体验并利用最新功能和改进,请切换到IBMRuntime24.1。
截至 2024 年 10 月 25 日的一周
比较Decision Optimization实验中的表格,查看不同方案之间的差异
2024 年 10 月 23 日
现在,您可以在"准备数据"或"探索解决方案"视图中比较 "Decision Optimization实验中的表格。 这种比较有助于查看相邻显示方案之间的数据值差异。
更多信息,请参阅比较方案表格。
截至 2024 年 10 月 18 日的一周
默认启用账户资源范围
2024 年 10 月 17 日
您账户的 "Resource scope
设置现在默认设置为 "ON
。 但是,如果之前将资源范围设置值设置为 "ON
或 "OFF
,则当前设置不会更改。
启用资源范围设置后,您将无法访问当前所选IBM Cloud帐户中没有的项目。 如果您属于多个IBM Cloud帐户,您可能无法看到所有项目一起列出。 例如,您可能无法在 "所有项目页面上看到所有项目。 您必须切换账户才能看到其他账户中的项目。
截至 2024 年 10 月 11 日的一周
利用文本分析功能在SPSS Modeler中分析日语文本数据
2024 年 10 月 9 日
现在,您可以使用SPSS Modeler 中的文本分析节点(如文本链接分析节点和文本挖掘节点)来分析以日语书写的文本数据。
截至 2024 年 10 月 4 日的一周
介绍IBM Manta Data Lineage:为您的数据提供数据脉络的新服务
2024 年 10 月 04 日
IBM Manta Data Lineage是一种数据沿袭服务,可提高数据管道的透明度,从而确定整个业务模型和系统的数据准确性。 有关数据行的信息,请参阅数据行。
此服务需要IBM Knowledge Catalog服务,并在您的IBM Cloud帐户上启用数据行。 请参阅 "启用数据序列"。 仅在达拉斯地区提供。
您可以在新的工作区 "数据序列"中访问导入的序列,也可以通过 "目录"或 "项目"页面查看特定资产的序列。
您可以从以下来源导入世系元数据:
- Microsoft Azure SQL Database 连接
- Microsoft SQL Server 连接
- Microsoft Power BI(Azure)连接
- Snowflake 连接
- InfoSphere DataStage
- IBM DataStage for Cloud Pak for Data
有关元数据导入的更多信息,请参阅导入元数据。
改进了治理工件的草稿选项卡IBM Knowledge Catalog
2024 年 10 月 3 日
现在,您可以在 "草稿"选项卡中查看每种工件类型的所有可用草稿。 要查看它,请从主菜单中选择工件类型,然后单击 "草稿"。 只有在您拥有所需权限且有草稿的情况下,该选项卡才可见。 在标签页中查看所有草稿时,可以选择多个草稿,然后使用批量操作菜单一次性编辑或处理它们。 请注意,主菜单中已不再提供 "所有草稿"页面。 更多信息,请参阅管理治理工件。
对目录资产进行批量操作IBM Knowledge Catalog
2024 年 10 月 3 日
现在,您可以同时编辑和删除目录中多个资产的分类和自定义属性。
自动更新数据资产的共同属性IBM Knowledge Catalog
2024 年 10 月 3 日
有了全局资产标识,即使数据资产位于不同的项目或目录中,也能确保具有相同资源密钥并引用相同物理资源的数据资产的共同属性保持一致。 这样,您就可以正确、一致地管理这些数据资产。 更多信息,请参阅Globla 资产识别。
将用户组指定为资产成员IBM Knowledge Catalog
2024 年 10 月 3 日
现在,您可以将用户组指定为资产成员。 以前,您只能将单个目录用户添加为资产成员。
批量上传和更新资产IBM Knowledge Catalog
2024 年 10 月 3 日
要批量上传和更新多个资产,现在可以导入和导出包含资产元数据详情或资产关系详情或两者的 CSV 文件。 有关更多信息,请参阅 从 CSV 文件向目录添加和更新资产和资产元数据)。
在法兰克福地区提供watsonx.governance计划,淘汰OpenScale传统计划
2024 年 10 月 3 日
The watsonx.governance legacy plan to provision Watson OpenScale in the Frankfurt region is deprecated. IBM Watson OpenScale将不再接受新的订阅或提供新的实例。 如需OpenScale功能,请订阅watsonx.governanceEssentials计划,该计划现已在法兰克福和达拉斯推出。
- 要查看计划详细信息,请参阅 watsonx.governance 计划。
- 要开始使用,请参阅 供应和启动 watsonx.governance。
备注信息:
- 现有的遗留计划实例将继续运行,并将一直支持到支持结束日期,具体日期待定。
- IBM Watson OpenScale上的现有客户可以继续使用IBM Watson OpenScale 打开支持票单。
更新环境和软件规格
2024 年 10 月 3 日
IBMRuntime23.1中包含的Tensorflow和Keras库现已更新到其较新版本。 这可能会影响代码在笔记本中的执行方式。 详情请参阅watsonx.aiStudio(原WatsonStudo)运行时包含的库包。
Runtime23.1将于今年晚些时候停用,取而代之的是IBMRuntime24.1。 为避免重复中断,我们建议您现在就切换到IBMRuntime24.1,并使用相关软件规范进行部署。
使用数据源定义管理和保护通过连接访问的数据
2024 年 10 月 04 日
数据源定义是一种新的资产类型,是根据连接或连接数据资产的端点定义的。 创建数据源定义时,可以监控多个项目、目录或多节点数据源的数据存储位置。 您还可以根据数据源定义应用正确的保护解决方案(执行引擎)。 有关详情,请参阅使用数据源定义的数据保护。
这些新的数据源定义功能仅适用于达拉斯地区。
使用保护解决方案定义数据源定义IBM Knowledge Catalog
2024 年 10 月 04 日
保护解决方案是一种在受管目录中或通过深度执行解决方案执行数据保护规则的方法。
要使用深度执行解决方案配置平台,可以创建数据源定义来设置数据源类型。 数据源类型决定了数据源定义可关联的连接类型以及可用的保护解决方案选项。 有关详情,请参阅数据源定义的保护解决方案。
这些新的数据源定义功能仅适用于达拉斯地区。
在电子表格IBM Knowledge Catalog)中审查和管理数据类别和学期任务
2024 年 10 月 04 日
如果您在审查和更新元数据丰富结果时更喜欢使用熟悉的电子表格程序,现在可以为 Microsoft Excel 安装审查元数据插件。 将产品提供的电子表格模板与插件结合使用:
- 下载特定项目的丰富数据资产和元数据。
- 审查和更新为这些数据资产建议和指定的数据类别和术语。
- 将更新的数据资产上传到项目。
有关更多信息,请参阅在外部程序中审查和更新增益结果。
截至 2024 年 9 月 27 日的一周
移除 Spark 3.3 运行时
2024 年 9 月 23 日
到 2024 年 10 月 29 日,IBM Analytics Engine 中对 Spark 3.3 运行时的支持将被移除,默认版本将更改为 Spark 3.4 运行时。 为确保无缝体验并利用最新功能和改进,请切换到 Spark 3.4。
自 2024 年 10 月 29 日起,您将无法使用 Spark 3.3 运行时创建或运行笔记本或自定义环境。 此外,您不能使用基于 Spark 3.3 运行时的软件规范创建或运行部署。
截至 2024 年 9 月 20 日的一周
分组数据质量规则IBM Knowledge Catalog
2024 年 9 月 20 日
现在,您可以将某些类型的数据质量规则分组到单个 DataStage 流程中,然后一起运行。 有关更多信息,请参阅 分组规则。
截至 2024 年 9 月 13 日的一周
为部署空间中的 SPSS Modeler 流量创建批处理作业
2024 年 9 月 10 日
现在,您可以在部署空间中为 SPSS Modeler 流量创建批处理作业。 每次从流程中创建批处理作业时,流程可让您灵活决定运行哪个终端节点。 为流程安排批处理作业时,批处理作业会使用您在流程中指定的数据源和输出目标。 如果数据源和目标也在部署空间中,这些数据源和输出的映射会自动进行。 有关从流程创建批处理作业的更多信息,请参阅 为 SPSS Modeler 流程创建部署作业。
有关部署空间中的流程和模型的更多信息,请参阅 Deploying SPSS Modeler flow and models。
截至 2024 年 8 月 30 日的一周
更改管道节点形状
2024 年 8 月 30 日
现在,您可以更改管道节点的外观,将其从统一的卡片样式转变为更紧凑的形状,以反映节点的类型。 有关更多信息,请参阅 管道设置。
创建全局参数集
2024 年 8 月 30 日
现在,您可以在管道参数集中添加 PROJDEF 参数。 参数可在同一项目级别的 DataStage 和 Orchestration Pipelines 流程中引用。 有关详细信息,请参阅 为协调管道配置全局对象。
截至 2024 年 8 月 23 日的一周
将用户组添加为项目和空间的合作者
2024 年 8 月 22 日
如果IBM Cloud帐户包含 IAM 访问组,您现在可以在项目和空间中将用户组添加为协作者。 您的 IBM Cloud 帐户管理员可以创建访问组,然后将其作为项目中的用户组。 创建项目时,必须启用 "限制协作者 "选项,才能将用户组添加为协作者。 有关详细信息,请参阅 使用 IAM 访问组。
AutoAI时间序列实验中异常预测功能的支持结局
2024 年 8 月 19 日
在AutoAI时间序列模型预测中预测异常值(离群值)的功能(目前处于测试阶段)已被弃用,并将于 2024 年 9 月 23 日移除。 仍然完全支持标准 AutoAI 时间序列实验。 有关详情,请参阅 构建时间序列实验。
在元数据充实IBM Knowledge Catalog)中指定分类
2024 年 8 月 22 日
现在,您可以在元数据充实中为数据资产和列分配分类,可以根据术语或数据类别分配自动分配,也可以在充实结果中手动分配。 请参阅 设计元数据充实:指定术语和分类。
截至 2024 年 8 月 16 日的一周
项目和空间的存档和解档
2024 年 8 月 16 日
项目和空间在闲置 90 天后将被归档,以保护资源。 要重新使用这些项目或空间,请直接在项目或空间页面上打开它们,取消它们的存档。 根据项目或空间的大小,取消存档可能需要不同的时间。
配置资产移除
2024 年 8 月 16 日
现在,在创建新目录时,还可以决定如何配置删除资产。 您可以选择在删除后立即或在删除后 30 天自动清除资产。 对于以前创建的目录,可以在目录 设置页面上更改资产移除设置。
有关更多信息,请参阅:
在部署空间中运行作业现在需要任务凭证
2024 年 8 月 15 日
为了提高运行部署作业的安全性,必须输入任务凭据才能在部署空间中运行作业。 有关详细信息,请参阅 在部署空间中创建作业。
要了解如何设置任务凭证和生成 API 密钥,请参阅 添加任务凭证。
2024 年 7 月 26 日结束的一周
暂停元数据充实IBM Knowledge Catalog
2024 年 7 月 25 日
您现在可以暂停和恢复元数据丰富作业运行。 有关详细信息,请参阅暂停和恢复丰富作业运行。
宣布支持Python 3.11和R4.3运行时的框架和软件规范24.1
2024 年 7 月 25 日
您现在可以使用IBMRuntime24.1其中包括基于Python 3.11和 R4.3 的最新数据科学框架)运行Jupyter笔记本和 R 脚本,并训练模型。 从 7 月 29 日开始,您还可以运行部署。 更新您的资产和部署,以使用IBMRuntime24.1框架和软件规范。
增强版Jupyter Notebook编辑器现已可用
2024 年 7 月 25 日
如果你在基于运行时的环境中运行笔记本24.1 ,您可以使用这些增强功能来处理您的代码:
- 自动调试代码
- 自动生成笔记本的目录
- 切换代码旁边的行号
- 折叠单元格内容并使用并排视图查看代码和输出,以提高工作效率
有关详细信息,请参阅 Jupyter 笔记本编辑器。
运行时支持的自然语言处理器转换器嵌入模型24.1
2024 年 7 月 25 日
在新的运行时中24.1环境中,您现在可以使用自然语言处理 (NLP) 转换器嵌入模型来创建文本嵌入,以捕捉句子或段落的含义,以帮助完成检索增强生成任务。 有关详细信息,请参阅For more information, see嵌入。
Runtime 中提供了新的专门的 NLP 模型24.1
2024 年 7 月 25 日
Runtime 中现已包含以下新的、专门的 NLP 模型24.1环境:
- 一种能够检测和识别文本内容中的仇恨、辱骂或亵渎内容 (HAP) 的模型。 有关详细信息,请参阅For more information, see HAP检测。
- 三个预先训练的模型,能够解决与金融、网络安全和生物医药相关的主题。 有关详细信息,请参阅For more information, see使用自定义分类模型对文本进行分类。
使用关键点摘要从大量文本中提取详细见解
2024 年 7 月 25 日
现在,您可以在笔记本中使用 "关键点汇总 "功能,从代表人们观点的大量文本集合(如产品评论、调查答案或社交媒体上的评论)中提取详细而可行的见解。 结果以有组织的、分层的、易于处理的方式呈现。 有关详细信息,请参阅For more information, see要点总结
RStudio版本更新
2024 年 7 月 25 日
为了在私有云和公有云上提供一致的用户体验,Cloud Pak for Data as a Service RStudioIDE 将于 2024 年 7 月 29 日更新为RStudioServer2024.04.1和 R4.3.1。 新版RStudio提供了大量增强功能和安全修复。 更多信息,请参阅RStudioServer2024.04.1发布说明。 虽然预计不会出现重大的兼容性问题,但用户应该注意下表中描述的一些软件包的版本变化。
升级后从项目启动RStudioIDE 时,请重置RStudio工作区,以确保RStudio服务器接收 R4.3.1软件包的库路径。
截至 2024 年 7 月 12 日的一周
跟踪数据保护规则的执行决定
2024 年 7 月 9 日
现在,当从 管理规则设置页面选择 将策略评估发送到审计日志复选框时,您可以将执行决策作为审计事件进行跟踪。
2024 年 7 月 5 日结束的一周
按数据源类型分组的连接器
2024 年 7 月 5 日
创建连接时,连接器现在按数据源类型分组,这样就更容易找到和选择连接器。 例如,MongoDB 数据源类型包括 IBM Cloud Databases for MongoDB 和 MongoDB 连接器。
此外,一个新的 Recents 类别会显示您用来创建连接的六个最新连接器。
有关说明,请参阅 在项目中为数据源添加连接 或 在目录中为数据源添加连接。
批量编辑治理项目属性
2024 年 7 月 5 日
您现在可以一次更改多个治理工件的主要或次要类别。 更新关系时也可以进行批量编辑。 有关更多信息,请参阅 管理监管工件。
为关系分析结果设置赋值阈值IBM Knowledge Catalog
2024 年 7 月 5 日
您现在还可以设置何时自动分配关系分析结果的阈值。 您可以设置项目默认值,但每次运行分析时都会覆盖该设置。 有关详细信息,请参阅识别关系。
更改Cloud Object Storage精简计划
2024 年 7 月 1 日
自 2024 年 7 月 1 日起,Cloud Object Storage当您注册 30 天试用版时,将自动配置精简版计划Cloud Pak for Data as a Service试用期结束后失效。 您可以升级您的Cloud Object Storage在 30 天试用期内,您可以随时使用免费套餐选项将精简版实例升级到标准计划。
现存的Cloud Object Storage您在 2024 年 7 月 1 日之前配置的精简版计划的服务实例将保留到 2024 年 12 月 15 日。 你必须升级你的Cloud Object Storage2024 年 12 月 15 日之前将其服务转为标准计划。
截至 2024 年 6 月 21 日的一周
向项目添加目录资产
2024 年 6 月 20 日
添加了 "将目录资产添加到项目" 用户许可权。 现在,要向项目添加资产,您必须具有 "向项目添加目录资产" , "目录中的管理员" , "编辑者" 或 "查看者" 角色,并且必须是资产所有者或编辑者。 必须明确授予不具有 "管理目录" 或 "访问目录" 许可权的 现有角色 的用户 "将目录资产添加到项目" 许可权。
Cognos Dashboard 移除已延迟
2024 年 6 月 20 日
您使用 Cognos Dashboards 嵌入式服务创建的任何现有仪表板现在将继续工作到 2024 年 9 月 30 日。 您无法再供应 Cognos Dashboards 嵌入式服务的实例。 您可以使用 Cognos Analytics on Cloud On-Demand 作为 Cognos Dashboards Embedded 的替代项。 有关更多信息,请参阅 IBM Cognos Analytics 定价计划。
部署作业请求将需要任务凭证
2024 年 6 月 19 日
为了提高运行部署作业的安全性,将要求请求作业的用户以 API 密钥的形式提供任务凭证。 该要求将从 2024 年 8 月 15 日起执行。 有关生成 API 密钥的详细信息,请参阅 添加任务凭证 。
IBM Knowledge Catalog 中的增强数据扩充功能
2024 年 6 月 20 日
除现有功能外,元数据扩充现在还提供了用于语义和 AI 扩充数据扩充的选项:
- 根据收集的元数据和预定义词汇表推荐表和列的描述性名称。
- 根据周围的列和表的上下文,建议并分配表和列的内容的语义描述。
- 完成表和列的语义术语分配。
有关详细信息,请参阅 设计元数据扩充项。
这些基于 AI 的新元元数据扩充功能仅在达拉斯地区可用。
IBM Federated Learning Python 客户机更改
2024 年 6 月 20 日
Federated Learning 的 Python 客户机库已与 watsonx.ai 库合并。 必须使用最新的 Python 客户机更新代码样本。 请参阅 连接到聚集器。
连接到新数据源DataStage:IBMPlanning Analytics
2024 年 6 月 14 日
现在,您可以在 DataStage 流中包含来自 IBM Planning Analytics 数据源的数据。
有关 DataStage 连接器的完整列表,请参阅 DataStage中支持的数据源。
截至 7 2024 年 6 月的一周
对监管工件进行批量编辑
7 2024 年 6 月
现在,当您想要编辑标记或元数据管理员时,可以一次对多个监管工件进行更改。 有关更多信息,请参阅 管理监管工件。
更改个别工件的父类别
7 2024 年 6 月
查看工件详细信息时,现在可以通过从三点操作菜单中选择 移至 来更改父类别。
项目中不再实施数据保护规则
7 2024 年 6 月
现在,仅在受管目录中或通过深度实施解决方案来实施数据保护规则。 深度实施解决方案 是一种保护解决方案,用于在数据源与以下某个服务集成时对 Cloud Pak for Data 外部的数据实施规则:
- IBM Data Virtualization
- IBM watsonx.data
从受控目录添加到项目中的资产不再受数据保护规则的预览、下载或剖析限制,除非你配置了深度执行解决方案。
在您执行以下操作时,将会提醒您已修订的数据保护规则实施协议:
- 创建数据保护规则。
- 将资产从受管目录复制到项目
有关详细信息,请参阅 接受用于实施数据保护规则的修订协议。
管理报告设置
6 2024 年 6 月
IBM Cloud 帐户所有者或管理员现在可以在 " 帐户 " 页面上管理报告设置。 有关更多信息,请参阅 管理帐户设置。
截至 2024 年 5 月 31 日的一周
IBM Watson Pipelines 现在是 IBM Orchestration Pipelines
2024 年 5 月 30 日
新服务名称反映了将部分 AI 生命周期编排为可重复流的功能。
标记项目以方便检索
2024 年 5 月 31 日
现在,您可以将标记分配给项目,以使其更易于分组或检索。 创建新项目时或从所有项目的列表中分配标记。 按标记过滤项目列表以检索相关的项目集。 有关更多信息,请参阅 创建项目。
连接到新的数据源 Milvus
2024 年 5 月 31 日
使用 Milvus 连接存储和确认你的凭据和连接细节的准确性,以访问 Milvus 向量存储。 有关信息,请参阅 Milvus 连接。
截至 2024 年 5 月 24 日的一周
资产用户和角色
2024 年 5 月 24 日
已更新目录的资产成员资格角色。 现在,用户可以拥有资产所有者,资产编辑者或资产查看者角色。 资产编辑者角色已替换资产成员角色。 现在,要完成任何与资产相关的操作,您必须是资产所有者或资产编辑器。
此外,资产现在可能有多个所有者。
通过从 角色 下拉菜单中选择角色,可以在资产的 " 访问权 " 控制页面上更改资产用户角色。
对目录资产执行批量操作
2024 年 5 月 24 日
现在,您可以同时编辑和删除多达 20 个目录资产上的商业条款、所有者或标签。
截至 2024 年 5 月 10 日的一周
丰富结果的新筛选器IBM Knowledge Catalog
2024 年 5 月 10 日
现在,您可以对扩充项结果应用其他过滤器:
- 已分配,建议或无业务术语
- 已分配,建议或无数据类
DataStage 连接和连接器的名称更改
2024 年 5 月 10 日
以下 DataStage 连接和连接器具有新名称:
- “Apache Cassandra(优化)”现在是“Apache Cassandra为了DataStage" 。
- “IBMDb2 (优化)现在是“IBMDb2为了DataStage" 。
- “IBMNetezza Performance Server(优化)”现在是“IBMNetezza Performance Server为了DataStage" 。
- “Oracle(优化)”现在是“Oracle Database为了DataStage" 。
- “Salesforce.com (优化)”现在是“SalesforceAPI 适用于DataStage" 。
- “Teradata (优化)”现在是“Teradata数据库DataStage" 。
连接,连接器及其关联作业的先前设置保持不变。 仅更改了连接和连接器名称。
截至 2024 年 4 月 26 日的一周
IBM Watson Query 连接的名称更改
2024 年 4 月 26 日
"IBM Watson Query" 连接已重命名为 "IBM Data Virtualization"。 该连接的先前设置保持不变。 只有连接名称发生更改。
DataStage IBM Watson Query 连接器的名称更改
2024 年 4 月 26 日
DataStage "IBM Watson Query" 连接器名称已更改为 "IBM Data Virtualization"。 此更改与连接名称更改一致。 连接,连接器和关联作业的先前设置保持不变。 仅更改了连接和连接器名称。
掩蔽watsonx.data在IBM Knowledge Catalog
2024 年 4 月 26 日
您可以保护敏感数据watsonx.data通过使用掩蔽功能IBM Knowledge Catalog。 有关详细信息,请参阅For more information, see掩蔽watsonx.data资产IBM Knowledge Catalog。
截至 2024 年 4 月 19 日的一周
目录中的增强项目列表视图
2024 年 4 月 18 日
现在,将资产从目录添加到项目时,可以在项目列表页面中查看 100 多个项目,并一次最多向项目添加 50 个资产。 有关更多信息,请参阅 从目录中添加资产。
评估空间中的机器学习部署
2024 年 4 月 18 日
在部署空间中配置 watsonx.governance 评估,以获取有关机器学习模型性能的洞察。 例如,评估部署是否存在偏差,或者监视部署是否存在漂移。 配置评估时,可以直接在空间中分析评估结果和对事务记录建模。
有关更多信息,请参阅 评估空间中的部署。
2024 年 4 月 19 日
截至 2024 年 4 月 12 日的一周
跨 Cloud Pak for Data 修订了数据保护规则实施协议
2024 年 4 月 12 日
现在,已在 Cloud Pak for Data上实施了数据保护规则实施协议的修订版本。 当您位于受管目录中并单击 Add to project
时,将显示有关新的数据保护规则实施协议的信息。 您必须确认此操作才能继续。
不推荐使用 Cognos Dashboards 嵌入式服务
2024 年 4 月 11 日
您无法再供应 Cognos Dashboards 嵌入式服务的实例。 但是,使用 Cognos Dashboards 嵌入式服务创建的任何现有仪表板将继续工作到 2024 年 6 月 20 日。 您可以使用 Cognos Analytics on Cloud On-Demand 作为 Cognos Dashboards Embedded 的替代项。 有关更多信息,请参阅 IBM Cognos Analytics 定价计划。
截至 5 2024 年 4 月的一周
使用透视表来显示在 Decision Optimization 实验中聚集的数据
5 2024 年 4 月
现在,您可以使用透视表来显示在 Decision Optimization 试验的 " 可视化 " 视图中聚集的输入和输出数据。 有关更多信息,请参阅 Decision Optimization 实验中的可视化窗口小部件。
从用户界面访问连接 API 属性列表
2024 年 4 月 5 日
以前,查看连接属性的唯一方法是在https://dataplatform.cloud.ibm.com/connections/docs 上打开一个新网页。 现在,您可以从 "数据">"连接性"访问相同的信息。 展开 连接资源,然后选择 连接属性。
您可以使用这些属性来创建与 Watson 数据 API 中的连接的连接。 例如,如果以编程方式在 Notebook 中创建连接,那么可以使用此信息来标识所需的属性。
截至 2024 年 3 月 22 日的一周
创建连接数据的动态视图IBM Knowledge Catalog
2024 年 3 月 21 日
新类型的已连接数据资产提供对来自支持 SQL 查询的数据源的数据的过滤访问,以便您只能访问相关数据。 在项目中,提供 SQL 查询以从一个或多个表创建特定列或行的视图。 您可以像任何其他已连接的数据资产一样,在元数据扩充和数据质量分析中使用这些数据资产。
有关更多信息,请参阅 向项目添加已连接数据的动态视图。
在 Amazon S3 和 Apache HDFS 连接器中使用 Delta Lake 或 Apache Iceberg 表格式
2024 年 3 月 22 日
Amazon S3 和 Apache HDFS 连接器现在包含 Delta Lake 和 Apache Iceberg 表格式的属性。 这些表格式是数据湖的组成部分,这些数据湖提供了用于管理大数据量的集中存储库。 数据湖是收集和分析原始格式的结构化,半结构化和非结构化数据的基础,用于长期存储,并推动洞察力和预测。
表格式属性包含在受支持工具的交互属性中。 例如,在 DataStage中的连接器 阶段属性 中。
截至 2024 年 2 月 23 日的一周
从 DataStax Enterprise 访问数据
2024 年 2 月 23 日
现在可以使用 DataStax Enterprise中的数据。
截至 2024 年 2 月 16 日的一周
IBM Knowledge Catalog 中的参考数据集中的区分大小写代码
2024 年 2 月 16 日
参考数据值至少由两列组成: 代码和值。 对于所有新的参考数据集,代码列现在区分大小写。 将值添加到新的参考数据集时,将完全按照您输入的内容保存代码。 请注意,在引入此更改之前创建的任何参考数据集都将保持不区分大小写,并且在其中添加的任何新值都将以大写形式保存。 这些参考数据集在 UI 中使用 不区分大小写 标记进行标记。 有关详细信息,请参阅 区分大小写的代码。
改进了 IBM Knowledge Catalog 中参考数据集的搜索,过滤和排序选项
2024 年 2 月 16 日
查看参考数据值列表时,可以使用以下方法更快地查找所需值:
- 使用搜索栏来输入对代码,值或定制列值的查询。
- 使用其中一个 6 高级过滤器选项。
- 使用排序功能。
可以组合搜索,过滤和排序选项。 有关详细信息,请参阅 查看参考数据集。
截至 2024 年 2 月 9 日的一周
用于运行 Data Refinery 流作业的新 Spark 3.4 环境
2024 年 2 月 09 日
为 Data Refinery 流作业选择环境时,现在可以选择 缺省 Spark 3.4 和 R 4.2,这包括来自 Spark 的增强功能。
不推荐使用 Default Spark 3.3 & R 4.2 环境,将在将来的更新中除去此环境。
更新 Data Refinery 流作业以使用新的 缺省 Spark 3.4 和 R 4.2 环境。 有关详细信息,请参阅 计算项目中 Data Refinery 的资源选项。
更多面向任务的 Decision Optimization 文档
2024 年 2 月 09 日
现在,您可以更轻松地找到用于创建和配置 Decision Optimization 实验的正确信息。 请参阅 Decision Optimization 实验及其子部分。
用于将资产发布到目录的分页视图功能
2024 年 2 月 8 日
将项目资产发布到目录时,现在可以使用分页视图在每个页面上查看 20 个目录和资产。 以前,您可以在列表中查看资产。 请参阅 将资产发布到目录。
法兰克福地区提供元数据充实中的高级分析类型IBM Knowledge Catalog
2024 年 2 月 09 日
除了达拉斯地区外,法兰克福地区现在也提供了高级主键和关系分析以及高级概要分析。
IBM Cloud Data Engine连接已废弃
2024 年 2 月 8 日
IBM Cloud Data Engine连接已被弃用,并将在未来版本中停止使用。 有关重要日期和详细信息,请参阅数据引擎停用。
截至 2024 年 2 月 2 日的一周
保存对目录资产的搜索
2024 年 2 月 02 日
现在,每个用户最多可以在其每个目录中保存 25 个搜索。 在目录中保存搜索的用户是唯一可以查看,运行,编辑和除去搜索的用户。 有关更多信息,请参阅 保存对目录资产的搜索。
库已重命名为资源中心
2024 年 2 月 02 日
将 "库" 重命名为 "资源中心"。 资源中心包含样本项目,数据集和 Notebook。 请参阅 资源中心 (Resource hub)。
IBM Cloud Databases for DataStax 连接已终止
2024 年 2 月 02 日
IBM Cloud Databases for DataStax 连接已从 Cloud Pak for Data as a Service 中删除。
Dremio 连接需要更新
2024 年 2 月 02 日
先前, Dremio 连接使用了 JDBC 驱动程序。 现在,连接使用基于 "箭头飞行" 的驱动程序。
重要信息: 更新连接属性。 不同的更改适用于 Dremio 软件 (内部部署) 实例或 Dremio 云实例的连接。
Dremio 软件: 更新端口号。
飞行所使用的新缺省端口号为 32010
。 您可以在 dremio.conf 文件中确认端口号。 有关信息,请参见通过dremio.conf进行配置。
此外,Dremio 不再支持与 IBM Cloud Satellite 的连接。
Dremio Cloud: 更新认证方法和主机名。
- 登录到 Dremio 并生成个人访问令牌。 有关说明,请参阅个人访问令牌。
- 在 " 创建连接: Dremio " 表单中的 Cloud Pak for Data as a Service 中,将认证类型更改为 个人访问令牌 并添加令牌信息。 (无法再使用 用户名和密码 认证来连接到 Dremio Cloud 实例。)
- 选择 端口已启用 SSL。
如果将缺省主机名用于 Dremio 云实例,那么需要对其进行更改:
- 将
sql.dremio.cloud
更改为data.dremio.cloud
- 将
sql.eu.dremio.cloud
更改为data.eu.dremio.cloud
元数据扩充中的其他分析类型 (IBM Knowledge Catalog)
2024 年 1 月 31 日
现在,元数据扩充提供了以下附加分析选项:
主键分析,用于检测数据中唯一标识数据资产中每个记录的主键。
选择 概要文件数据 扩充选项时,将自动包含浅层分析。 可以对扩充项结果中的所选资产运行高级分析。
用于识别数据资产之间的关系或在列中查找重叠和冗余数据的关系分析。
选择新的 设置关系 扩充选项时,将运行浅键关系分析。 可以对扩充项结果中的所选资产运行高级分析。
高级概要分析,用于获取特定度量的更准确结果,例如,列中值的频率分布和唯一性。
可以对扩充项结果中的所选资产运行高级概要分析。
高级主键和关系分析以及高级概要分析需要 DataStage 服务以及 IBM Knowledge Catalog 服务,并且仅在达拉斯区域中可用。
截至 2024 年 1 月 26 日的一周
AutoAI 支持所有实验的有序数据
2024 年 1 月 25 日
现在,您可以为所有 AutoAI 实验指定有序数据,而不仅仅是时间序列实验。 指定是否根据行索引按顺序对训练数据进行排序。 当输入数据是连续的时,将根据最新记录而不是随机抽样来评估模型性能,并且保留数据将使用集合的最后 n 条记录而不是 n 条随机记录。 时间序列实验需要顺序数据,但分类和回归实验可选。
设置为深色主题
2024 年 1 月 25 日
现在,您可以将 Cloud Pak for Data as a Service 用户界面设置为深色主题。 单击您的头像,然后选择 概要文件和设置 以打开您的帐户概要文件。 然后,将 Dark 主题开关设置为 on。 RStudio和Jupyter笔记本不支持暗色主题。 有关管理概要文件的信息,请参阅 管理设置。
截至 2024 年 1 月 19 日的一周
在详细信息面板中查看资产列的本机类型信息
2024 年 1 月 19 日
现在,您可以直接在列详细信息面板中查看标准化数据类型和本机数据类型。 要查看本机类型信息,请从资产的 " 概述 " 页面中单击资产列名。
规则操作优先顺序的新选项 (IBM Knowledge Catalog)
2024 年 1 月 18 日
规则操作优先顺序使您能够指定在数据集上有多个具有不同操作的规则时如何应用规则。 您可以使用新的 分层实施 选项来配置数据保护规则的两层评估。
- 第一层评估
Allow
或Deny
操作的规则,而不考虑任何屏蔽操作。 此第一层的决策必须是允许访问权移至第二层。 - 第二层评估
Transform
操作的规则。
您可以从用户界面或 access_decision_precedence
API设置此选项。
有关更多信息,请参阅 管理规则设置。
存储数据质量分析的结果 (IBM Knowledge Catalog)
2024 年 1 月 18 日
现在,您可以选择将作为元数据扩充的一部分运行的预定义数据质量检查的输出写入数据库。 例如,您可能想要存储此数据,以便可以使用这些表来跟踪质量问题以及作为补救过程的输入。 有关更多信息,请参阅 创建元数据扩充项。
连接到新数据源DataStage:Tableau
2024 年 1 月 18 日
现在,您可以在 DataStage 流中包含来自 Tableau 数据源的数据。
有关 DataStage 连接器的完整列表,请参阅 DataStage中支持的数据源。
截至 2024 年 1 月 12 日的一周
watsonx.aiRuntime(前身为Watson Machine Learning)中已弃用对IBMRuntime22.2的支持
2024 年 1 月 11 日
不推荐使用 IBM Runtime 22.2 ,将于 2024 年 4 月 11 日除去。 从 7 2024 年 3 月开始,无法使用 22.2 运行时创建 Notebook 或定制环境。 此外,您无法使用基于 22.2 运行时的软件规范来训练新模型。 在 7 2024 年 3 月之前更新资产和部署以使用 IBM Runtime 23.1 。
- 要了解有关将资产迁移到受支持的框架和软件规范的更多信息,请参阅 管理过时的软件规范或框架。
- 要了解有关 Notebook 环境的更多信息,请参阅 计算项目中 Notebook 编辑器的资源选项。
- 要了解有关更改环境的更多信息,请参阅 更改 Notebook 的环境。
截至 2023 年 12 月 15 日的一周
在详细信息面板中查看目录的数据源信息
2023 年 12 月 15 日
如果单击相关项网格中的资产,那么可以直接在资产详细信息面板中查看数据源信息。
为作业和其他操作创建用户 API 密钥
2023 年 12 月 15 日
Cloud Pak for Data as a Service中的某些运行时操作 (例如作业和模型训练) 需要 API 密钥作为安全授权的凭证。 通过用户 API 密钥,您现在可以根据需要在 Cloud Pak for Data as a Service 中直接生成和轮换 API 密钥,以帮助确保操作顺利运行。 API 密钥在 IBM Cloud中进行管理,但您可以方便地在 Cloud Pak for Data as a Service中创建和轮换 API 密钥。
用户 API 密钥是特定于帐户的密钥,根据帐户概要文件下的 概要文件和设置 创建。
有关更多信息,请参阅 管理用户 API 密钥。
由于不活动而导致新的登录会话到期和注销
2023 年 12 月 15 日
由于会话到期,您现在已从 IBM Cloud 中签出。 您的会话可能由于登录会话到期 (缺省情况下为 24 小时) 或不活动 (缺省情况下为 2 小时) 而到期。 您可以在 IBM Cloud中的 Access (IAM) 设置中更改缺省持续时间。 有关更多信息,请参阅 设置登录会话到期。
访问连接 API 属性的列表
2023 年 12 月 15 日
您现在可以在以下网址查看连接器的完整列表及其各自属性https://dataplatform.cloud.ibm.com/connections/docs
您可以使用这些属性来创建与 Watson 数据 API 中的连接的连接。 例如,如果以编程方式在 Notebook 中创建连接,那么可以使用此信息来标识所需的属性。
将项目资产组织到文件夹中
2023 年 12 月 14 日
现在,您可以在项目中创建文件夹以组织资产。 项目的管理员必须启用文件夹,管理员和编辑者可以创建和管理文件夹。 文件夹处于 Beta 版中,尚不支持在生产环境中使用。 有关更多信息,请参阅 使用文件夹组织资产 (Beta)。
IBM Cloud Databases for DataStax 连接器已废弃
2023 年 12 月 15 日
IBM Cloud Databases for DataStax 连接器已废弃,并将在未来版本中停用。
截至 2023 年 12 月 8 日的一周
Db2 连接中用于工作负载管理的新客户机属性
2023 年 12 月 8 日
现在可以在以下字段中指定属性以用于监视: 应用程序名称, 客户机记帐信息, 客户机主机名和 客户机用户。 这些字段是可选的,可用于以下连接:
连接到 DataStage: Google Looker 中的新数据源
2023 年 12 月 8 日
现在,您可以在 Google Looker 数据流中包含来自 DataStage 数据源的数据。 (只能将此连接用于源数据。)
有关 DataStage 连接器的完整列表,请参阅 DataStage中支持的数据源。
Data Virtualization的新功能和增强功能
2023 年 12 月 8 日
Data Virtualization提供以下新功能和增强功能:
使用 IBM Knowledge Catalog 数据保护规则来过滤虚拟化表中的行
您可能有一个数据源,其中包含组合了政府,企业和零售客户数据的表。 例如,计费表可能包含所有客户的数据,其中某些行用于政府客户,而某些行用于非政府客户。 记帐表中未指示客户机的类型。 现在,您可以使用下列其中一种方法来过滤客户机记录列表。
您可以使用单独的表来标识作为政府客户的客户。 此表中的标识可用于过滤开票表中的行。 当您过滤掉行时,屏蔽的表不包含具有政府客户数据的行。
您可以使用阻止的客户标识表作为参考表。 将从结果集中过滤掉计费表中具有客户标识包含在被阻止客户集中的行的任何行。
Data Virtualization支持根据IBM Knowledge Catalog中定义的数据保护规则屏蔽虚拟化数据中的列。 现在,您可以创建数据保护规则,以在虚拟化数据中包含或排除行,从而避免公开敏感数据。
有关详细信息,请参阅 Data Virtualization中的使用数据保护规则管理虚拟数据。
对虚拟化数据使用高级数据屏蔽
现在,您可以使用Data Virtualization中的高级数据屏蔽选项来避免暴露敏感数据。
有关更新的屏蔽行为的更多信息,请参阅 Data Virtualization中的屏蔽虚拟数据。
改进了查询性能和数据保护规则的实施
Data Virtualization现在可以在策略执行点 (PEP) 缓存中存储和缓存来自IBM Knowledge Catalog的数据保护规则,以避免每次查询对象时都要评估规则。 此高速缓存通过减少调用 IBM Knowledge Catalog 以访存规则的次数来提高先前执行的查询的性能。 但是,在将新添加或更新的数据保护规则应用于查询之前,您可能会注意到最多 10 秒的延迟。 您可以使用 Web 客户机来配置 PEP 高速缓存设置,例如高速缓存大小和高速缓存生存时间。
有关详细信息,请参阅 Data Virtualization中启用数据保护规则的执行。
格式化并保存格式化查询存取方案以进行性能调整
现在,您可以格式化和保存格式化的访问计划,以便在Data Virtualization中进行性能调整。 在Data Virtualization中运行 SQL 查询时,可以使用 Web 客户端来格式化生成查询访问计划时 EXPLAIN 信息的显示方式。 然后,可以从 Web 客户机运行 db2exfmt 命令,以轻松生成并下载文本文件中的 EXPLAIN 输出。
使用通配符来过滤数据源
现在,创建虚拟化表时,可以使用以下通配符来定制过滤器以查找所需的数据源:
- % (percent): 表示零个或多个字符
- _ (下划线): 表示单个字符
有关详细信息,请参阅 Data Virtualization中的过滤数据。
Data Virtualization用户可发布自己的虚拟对象
在Data Virtualization中具有用户角色的用户现在可以将他们创建的虚拟对象发布到管理的目录中。
有关详细信息,请参阅使用Data Virtualization将虚拟数据发布到目录。
管理可以访问单个数据源并对其执行操作的人员
通过数据源访问限制,您可以显式管理对使用共享凭证的各个数据源连接的访问。 您可以将用户和角色指定为数据源连接的合作者。 只有这些合作者才能访问数据源连接。 您可以将特定特权分配给合作者,以管理他们可以对数据源执行的操作。 这使您能够将特权与角色分开,以便被分配角色 (例如 "管理者") 的某些用户可以访问其他 "管理者" 用户的不同数据源连接并对其执行操作。
有关详细信息,请参阅 Data Virtualization中的数据源连接访问限制。
通用 S3 和 Microsoft Azure Data Lake Storage Gen2 数据湖中的查询数据
现在,您可以连接到通用 S3 和 Microsoft Azure Data Lake Storage Gen2 数据源。 有关详细信息,请参阅 Data Virtualization中支持的数据源。
选择查询方式以确定性能或一致性的优先级
现在,您可以选择在 "最大 Pushdown" 方式或 "最大一致性" 方式下运行查询。
- 最大下推模式忽略了Data Virtualization和单一数据源查询的数据源之间的语义差异。 因此,可能会将更多单一源查询完全推送到数据源,从而提高查询性能。 在此方式下,查询结果与完全下推查询的数据源语义一致。 最大下推方式不会影响多源查询。
- 最大一致性模式遵循Data Virtualization语义,以评估操作是否可以向下推送到数据源。 如果在数据源上执行的操作会产生与Data Virtualization相同的结果,则可以向下推送该操作。 如果远程数据源具有与Data Virtualization相同的语义,这种模式下的查询可能会被完全下推。
使用 "探索" 选项卡快速查找和虚拟化表
现在,您可以快速找到要虚拟化的表。 在 "虚拟化" 页面上,可以使用 "探索" 选项卡来浏览已连接的数据源中的数据库,模式和可用表。 "列表" 选项卡显示所有已连接的数据源中的所有可用表。 在 "数据源" 页面上,您可以对数据源进行过滤,以在 "列表" 选项卡中快速装入减少的可用表列表。
有关详细信息,请参阅 Data Virtualization中的创建虚拟对象。
通过使用数据采样来改进虚拟化表的统计信息收集
数据采样通过减少收集统计信息所需的资源来改进统计信息收集。 通过在 Web 客户机中选择远程查询收集方法来收集统计信息时,将使用缺省采样率 20%。 要优化统计信息收集,请选择 "启用表采样" ,并选择 1% 到 99% 之间的采样率。
如果使用 DVSYS.COLLECT_STATISTICS 过程来收集统计信息,那么在收集统计信息时,可以使用带有远程查询统计信息收集类型的 TABLESAMPLE 选项来对数据进行采样。 有关提示,请参阅 "使用说明"。
您还可以使用 DVSYS.COLLECT_STATISTICS 过程,用于通过平面文件收集虚拟化表的统计信息。
有关详细信息,请参阅 Data Virtualization中的 COLLECT_STATISTICS 存储过程。
使用平台凭据访问Data Virtualization连接
使用平台连接访问Data Virtualization时,系统会提示您输入凭据。 您可以选择 "使用我的平台登录凭证" ,而不是输入用于连接的个人凭证。 连接使用当前会话 JSON Web 令牌 (JWT)。
对象存储器中数据源的改进
- 现在,您可以为对象存储器中的通用 S3 数据源创建连接和虚拟化文件:
- 现在,您可以从存储在对象存储器中的外部压缩 CSV 或 TSV 文件创建虚拟化表。 有关更多信息,请参阅 "从对象存储器中的文件创建虚拟表"。
- 现在,您可以在包含列标题的云对象存储器中虚拟化平面文件。
有关详细信息,请参阅 Data Virtualization中的从云对象存储中的文件创建虚拟表。
谓词下推改进以及对更多数据源上的谓词下推的支持
谓词下推是减少查询时间和内存使用的优化。 此发行版包含对谓词下推的以下改进:
- 现在,可以使用 Teradata, Netezza®, Microsoft SQL Server, Db2® for z/OS®和 Db2 数据库数据源的尾部空白比较规则来下推包含 COUNT (DISTINCT) 或 GROUP BY 子句的查询。
- 包含针对 Teradata 数据源的 CHAR 或 VARCHAR 数据的字符串比较操作 (例如 GROUP BY 或 WHERE 谓词) 以处理区分大小写的查询。
- 带有 LIKE 谓词的 SQL 语句现在被下推:Db2® ,SAP HANA ,Oracle,PostgreSQL,Apache Hive,MySQL,Microsoft SQL Server,雪花,Netezza® Performance Server, 和Teradata 。
- 现在,将针对 Db2, Db2 for z/OS, Apache Derby, Oracle, Amazon Redshift, Google BigQuery和 Salesforce.com 数据源下推带有 Fetch 子句的 SQL 语句。
- 现在,将向下推送具有字符串比较过滤器的 SQL 语句: Db2, Microsoft SQL Server, Teradata, Netezza Performance Server和 Apache Derby 数据源。
- 现在将针对 Db2 和 Netezza Performance Server 数据源下推具有 OLAP 函数的 SQL 语句。
- Greenplum 数据源现在支持下推谓词。
- MySQL (My SQL Community Edition 和 My SQL Enterprise Edition) 数据源现在支持下推谓词。
- Cloudera Impala 数据源现在支持下推谓词。
- Data Virtualization Manager for z/OS®数据源现在支持谓词下推。
有关详细信息,请参阅 Data Virtualization中支持的数据源。
默认情况下,Data Virtualization连接现在可在平台连接中使用
您可以从平台连接向目录和项目添加Data Virtualization连接,而无需手动填充连接详细信息。
管理多个用户和角色 (如果您是管理者) 的访问权
作为Data Virtualization Manager,您现在可以同时授予和撤销多个用户和角色的访问权限。
有关详细信息,请参阅 Data Virtualization中的管理对虚拟对象的访问。
Data Virtualization管理器现在可以让所有用户都能看到虚拟对象
现在,管理者可以选择通过使现有虚拟对象从 "虚拟化数据" 页面可见,为用户提供更全面的内容视图。 这些对象内的数据访问继续遵守Data Virtualization授权和数据保护规则。 要启用此功能,管理者需要从服务设置中禁用 "限制可视性" 设置。
有关详细信息,请参阅 Data Virtualization中的管理虚拟对象的可见性。
新建高速缓存 API
可以通过高速缓存服务公开的 REST API 来管理高速缓存条目。 这些 API 可由任何应用程序调用。 您可以使用新的高速缓存 API 来执行以下任务:
- 创建高速缓存
- 列出特定高速缓存
- 删除高速缓存
- 启用高速缓存
- 禁用高速缓存
- 刷新高速缓存
- 编辑高速缓存
不推荐使用以下高速缓存 API:
- 列出高速缓存
- 列出高速缓存
- 访存高速缓存存储器
有关详细信息,请参阅Data Virtualization 2.0.0API 文档中的缓存。
新建发布 API
您可以使用以下 API 将虚拟数据发布到目录:
不推荐使用以下 API:
截至 1 2023 年 12 月的一周
作为 watsonx.governance 的一部分, Watson OpenScale 的新计划
1 2023 年 12 月
Watson OpenScale 现在是 watsonx.governance的一部分。 从 IBM Cloud 目录供应 watsonx.governance 将安装 Watson OpenScale。 在 Cloud Pak for Data as a Service上, Watson OpenScale 继续提供用于评估预测机器学习模型的服务。 在 watsonx上,供应 watsonx.governance 扩展了 Watson OpenScale 的监管功能,以评估基础模型资产以及机器学习资产。 您可以定义 AI 用例来解决业务问题,然后在概况介绍中跟踪资产数据以支持合规性和监管目标。 Watsonx.governance 套餐和功能部件仅在达拉斯区域中可用。 Watson OpenScale 旧套餐在法兰克福区域可用。
- 要查看计划详细信息,请参阅 watsonx.governance 计划。
- 要开始使用,请参阅 供应和启动 watsonx.governance。
IBM Watson Knowledge Catalog 现在是 IBM Knowledge Catalog
1 2023 年 12 月
IBM Watson Knowledge Catalog 已重命名为 IBM Knowledge Catalog。 仅更改了名称,服务产品套餐和产品功能保持不变。
IBM Knowledge Catalog 中用于元数据导入的新数据源
1 2023 年 12 月
您可以从以下数据源将元数据导入到 IBM Knowledge Catalog :
- IBM Match 360
- SingleStoreDB
有关更多信息,请参阅 元数据导入,元数据扩充和数据质量规则支持的数据源。
截至 2023 年 11 月 17 日的一周
用户和用户组类型的新定制属性
2023 年 11 月 17 日
现在,您可以创建用户和用户组类型的定制属性,并向其分配特定用户或用户组。 有关更多信息,请参阅 创建定制属性。
定制关系类型的任一端上的多个源
2023 年 11 月 17 日
您可以使用源端和目标端上的多种类型来扩展定制关系类型集。 使用许多工件,资产和列类型以获取更详细的关系定义。 有关更多信息,请参阅 创建定制关系。
IBM Knowledge Catalog 中数据质量的新许可权
2023 年 11 月 17 日
现在,您可以向用户分配以下许可权,以更好地控制如何在 IBM Knowledge Catalog中建立数据质量:
- 管理数据质量资产
- 执行数据质量规则
- 向下钻取问题详细信息
缺省情况下,新许可权包含在以下角色中:
- 管理员
- CloudPak 数据质量分析员,这是一个新角色
为需要管理数据质量定义和规则以及运行数据质量规则的用户更新角色分配和您可能具有的任何定制角色。
有关详细信息,请参阅 IBM Knowledge Catalog和watsonx.aiStudio 的用户角色和权限。
导出和导入数据保护规则
2023 年 11 月 17 日
现在,您可以使用 API 在 Cloud Pak for Data as a Service的多个实例中导出和导入数据保护规则。 导出数据保护规则时,将维护指向词汇表工件,目录,资产和用户的链接。
有关更多信息,请参阅 迁移数据保护规则。
以抽取,装入和变换 (ELT) 运行方式 (Beta) 运行 DataStage 流
2023 年 11 月 13 日
ELT 流程不同于传统的 "抽取,变换和装入" (ETL) 流程,因为它在目标数据库中运行流程的变换部分,这可以更高效且经济有效。 此功能目前在 Beta 版中提供,不支持用于生产。
除去某些预定义关系类型 (2023 年 12 月 13 日)
2023 年 11 月 13 日
2023 年 12 月 13 日,将除去不常用的资产-资产和资产-工件关系的预定义关系类型。
以下关系类型将受影响:
Defines - Is defined by
将替换为Contains - Is contained in
Is owner of - Is owned by
将替换为Contains - Is contained in
Has for parent entity - Is relationship child of
将替换为Is parent of - Is child of
Is supertype of - Is subtype of
将替换为Is parent of - Is child of
现在需要执行的操作如下:
- 如果您未使用这些关系类型,那么无需执行任何操作。
- 如果您正在使用这些关系类型并同意替换关系类型,那么无需执行任何操作。
- 如果您正在使用这些关系类型,并且想要分配不同的关系类型,请除去当前关系并使用其他预定义或 定制关系类型创建新关系。
如果您有任何与替换这些关系类型相关的问题或顾虑,那么可以 开具支持凭单。
截至 2023 年 11 月 10 日的一周
从列的详细信息面板中除去资源键
2023 年 11 月 10 日
资源键以列级别显示在详细信息面板中,尽管该信息不适用于列。 现在,将在列级别从详细信息面板中除去资源键。 在资产级别仍需要此信息。 例如,可以在导入沿袭映射 CSV 文件中使用资产资源键。
部署DataStage远程运行时引擎本地DataStage-aaS任何地方
9 2023 年 11 月
现在,您可以部署 DataStage 远程运行时引擎,以在本地或任何数据中心或云上运行数据集成作业。
DataStage 运行时引擎是在本地环境中部署的容器化产品,用于增强性能和安全性。 在 DataStage 中设计 ETL 和 ELT 管道,并在引擎上本地运行数据集成任务。 管理员可以启动一个或多个远程运行时引擎。 为了安全起见,一旦为项目启用了 DSaaS Anywhere ,就无法将执行样式还原回 IBM Cloud 无服务器运行时,但 IBM Cloud 无服务器运行时仍可用于其他项目。
有关更多信息,请参阅 DataStage 环境。
在运行时 23.1 上发布对 Python 3.10 和 R4.2 框架及软件规范的支持
9 2023 年 11 月
You can now use IBM Runtime 23.1, which includes the latest data science frameworks based on Python 3.10 and R 4.2, to run Jupyter notebooks and R scripts, train models, and run deployments. 更新您的资产和部署,以使用IBMRuntime23.1框架和软件规范。
- 有关 IBM Runtime 23.1 发行版以及包含的 Python 3.10 和 R 4.2环境的信息,请参阅 更改 Notebook 环境。
- 有关部署框架的详细信息,请参阅 管理框架和软件规范。
使用 Apache Spark 3.4 来运行 Notebook 和脚本
Spark3.4与Python 3.10和 R4.2现在支持作为项目中笔记本和RStudio脚本的运行时。 有关可用笔记本环境的详细信息,请参阅项目中笔记本编辑器的计算资源选项和项目中RStudio的计算资源选项。
截至 2023 年 10 月 27 日的一周
从 DataStage 中的复杂平面文件访问数据
2023 年 10 月 27 日
现在,您可以在 DataStage 流中使用 "复杂平面文件" 连接器。
有关 DataStage 连接器的完整列表,请参阅 DataStage中支持的数据源。
使用全局搜索栏时保存搜索查询
2023 年 10 月 27 日
现在,您可以保存搜索条件以供以后使用。 在搜索栏中输入时,已保存的搜索将在下拉列表中列出。 您还可以编辑或删除已保存的搜索。 请参阅 保存搜索。
连接到 DataStage 中的更多数据源
2023 年 10 月 27 日
现在,您可以在 DataStage 流中包含来自这些数据源的数据:
- Apache Derby
- IBM Cloud Data Engine
- IBM Cloud Databases for DataStax
- IBM watsonx.data Presto
有关 DataStage 连接器的完整列表,请参阅 DataStage中支持的数据源。
使用 Satellite 连接器连接到内部部署数据库
2023 年 10 月 26 日
使用新的 Satellite 连接器连接到无法通过因特网 (例如,防火墙后) 访问的数据库。 Satellite Connector 使用基于 Docker的轻量级通信,用于创建从本地环境到 IBM Cloud的安全且可审计的通信。 有关指示信息,请参阅 连接到防火墙后的数据。
不推荐使用 Secure Gateway
2023 年 10 月 26 日
IBM Cloud 已宣布不推荐使用 Secure Gateway。 有关信息,请参阅概述和时间表。
如果您当前具有使用 Secure Gateway设置的连接,请计划使用备用通信方法。 在 Cloud Pak for Data as a Service中,可以使用 Satellite 连接器作为 Secure Gateway的替代项。 请参阅 连接到防火墙后的数据。
在 DataStage 中使用 NLS 整理
2023 年 10 月 27 日
现在,您可以在 DataStage 流中使用本地语言支持来整理数据。
截至 2023 年 10 月 20 日的一周
使用新的 IBM watsonx.data Presto 连接访问 Lakehouse 数据
2023 年 10 月 20 日
您可以使用 IBM watsonx.data Presto 连接连接到部署在 Cloud Pak for Data 或 IBM Cloud 上的 watsonx.data 实例中的数据库。 IBMwatsonx.data是一个开放、混合和受治理的数据湖泊,通过查询引擎对所有数据和人工智能工作负载进行优化。
有关信息,请参阅 IBM watsonx.data Presto 连接。
截至 2023 年 10 月 13 日的一周
已翻译为首选语言的定制枚举属性名称 (IBM Knowledge Catalog)
2023 年 10 月 13 日
现在,定制属性所有者可以允许将定制枚举类型属性名称转换为首选语言。
资产或列的定制枚举类型属性的所有者必须先定义该属性的定义,然后才能选择以浏览器的语言查看定制枚举属性名称。 有关更多信息,请参阅 创建定制属性。
Decision Optimization 中的中间解法
2023 年 10 月 12 日
现在,您可以选择在 Decision Optimization 试验运行时查看中间解的样本。 这对于调试或查看求解器的进度很有用。 对于需要更长时间求解的大型模型,通过中间解,您现在可以快速轻松地识别求解的任何潜在问题,而不必等待求解完成。 您可以在运行配置中配置中间解决方案交付参数,并为这些解决方案选择一个频率。 有关更多信息,请参阅 中间解决方案 和 运行配置参数。
新建 Decision Optimization 保存的模型对话框
从 Decision Optimization 用户界面保存要部署的模型时,现在可以查看输入和输出模式,更轻松地选择要包含的表。 您还可以添加,修改或删除运行配置参数,复审环境以及所使用的模型文件。 所有这些项都显示在同一 另存为模型以进行部署 对话框中。 有关更多信息,请参阅 使用用户界面部署 Decision Optimization 模型。
不推荐对非结构化数据进行概要分析 (IBM Knowledge Catalog)
2023 年 10 月 10 日
截至目前,无法再对包含非结构化数据的数据资产进行概要分析。
查看 DataStage 作业的运行时度量
9 2023 年 10 月
现在,您可以在画布和作业运行详细信息页面上查看 DataStage 作业的运行时度量。 有关更多信息,请参阅 创建和管理 DataStage 作业。
批量向新阶段添加键和属性
9 2023 年 10 月
现在,您可以将键和属性批量添加到 DataStage 流中的以下阶段: "排序" , "合并" , "连接" , "除去重复项" , "差异" , "变更捕获" , "变更应用" , "组合记录" , "漏斗" , "比较" , "查找文件集" , "写入范围映射" 和 "Bloom" 过滤器。
截至 6 2023 年 10 月的一周
控制新列在 Concatenate 操作 (Data Refinery) 中的位置
6 2023 年 10 月
现在有两个选项用于指定 Concatenate 操作产生的新列的位置: 作为数据集中最右边的列或位于原始列旁边。
先前,新列放置在数据集的开头。
编辑任何现有 Data Refinery 流中的 Concatenate 操作以指定新的列位置。 否则,流可能会失败。
有关 Data Refinery 操作的信息,请参阅 Data Refinery中的 GUI 操作。
截至 2023 年 9 月 29 日的一周
将表达式构建器中的新功能用于 DataStage 中的 Modify 阶段
2023 年 9 月 25 日
您可以在 DataStage 流的 Modify 阶段的表达式构建器中使用转换函数。
截至 2023 年 9 月 22 日的一周
Decision Optimization Java 模型
2023 年 9 月 20 日
Decision OptimizationJava 模型现在可以部署在watsonx.aiRuntime(原Watson Machine Learning)中。 通过使用 Java 工作程序 API ,可以使用 OPL , CPLEX 和 CP Optimizer Java API 创建优化模型。 You can now easily create your models locally, package them and deploy them on watsonx.ai Runtime by using the boilerplate that is provided in the public Java 工人 "GitHub. 有关详细信息,请参阅为Decision Optimization部署 Java 模型。
截至 2023 年 9 月 8 的一周
提示: 将停用非结构化数据的 Watson Knowledge Catalog 概要分析
8 2023 年 9 月
从 2023 年 10 月 10 日开始,将不再支持对非结构化数据资产进行概要分析。
截至 2023 年 9 月 1 的一周
不推荐使用 Notebook 中的注释
2023 年 8 月 31 日
截至目前,无法从 Notebook 操作栏向 Notebook 添加注释。 已除去任何现有注释。
在 DataStage 中使用新环境变量
2023 年 8 月 28 日
现在,您可以将环境变量 APT_SHOW_METRICS 添加到 DataStage 流的流参数中。
截至 2023 年 8 月 25 日的一周
快速查找具有名称和日期排序的目录
2023 年 8 月 24 日
现在,您可以通过在 " 查看所有目录 " 页面上按名称或创建日期对目录列表进行排序来查找目录。 单击 名称 头以按名称字母顺序对目录进行排序。 单击 创建日期 头以按日期升序或降序对目录进行排序。
IBM Knowledge Catalog 中的数据质量概览
2023 年 8 月 22 日
数据质量信息有了新家。 对于目录或项目中的每个数据资产,将使用来自预定义数据质量检查和数据质量规则的质量信息来填充 数据质量 页面。 您可以查看适用的数据质量维度以及各个质量检查的结果。 您可以向下钻取到每个检查的结果,甚至可以向下钻取到每个列的结果。
有关更多信息,请参阅 数据质量。
元数据扩充结果中提供了类似的信息。
现在,所有数据质量分析都在元数据扩充或数据质量规则的上下文中运行。 从项目或目录中的 " 概要文件 " 页面运行概要分析时,不再分析数据质量,并且不会生成数据质量评分。
可用于 Watson Pipelines 的其他高速缓存增强功能
2023 年 8 月 21 日
有更多选项可用于定制管道流设置。 现在,您可以对何时将高速缓存用于管道运行进行更大的控制。 有关详细信息,请参阅 管理缺省设置。
截至 2023 年 8 月 18 日的一周
watsonx.aiRuntime(原Watson Machine Learning)服务的计划名称更新
2023 年 8 月 18 日
从即日起,IBM watsonx.aiRuntime 服务的计划名称将更新如下:
v2 标准套餐现在是 Essentials 套餐。 该计划旨在为您的组织提供开始使用基础模型和机器学习资产所需的资源。
v2 Professional 套餐现在是 标准 套餐。 此计划提供资源,旨在通过创建资产以实现生产性使用来支持大多数组织。
更改套餐名称不会更改您的服务条款。 即,如果您已注册使用 v2 Standard 套餐,那么它现在将命名为 Essentials,但所有套餐详细信息都将保持不变。 同样,如果您已注册使用 v2 Professional 套餐,那么除了套餐名称更改为 Standard之外,没有其他更改。
有关每个计划所含内容的详细信息,请参阅watsonx.aiRuntime 计划。 有关定价信息,请在IBM Cloud目录中的watsonx.aiRuntime 计划页面查找您的计划。
连接到 DataStage 中的更多数据源
2023 年 8 月 18 日
现在,您可以在 DataStage 流中包含来自这些数据源的数据:
- Cloudera Impala
- Presto
有关 DataStage 连接器的完整列表,请参阅 DataStage中支持的数据源。
使用 ODBC (DataStage) 连接到 Google BigQuery 数据
2023 年 8 月 18 日
ODBC 连接现在包含 Google BigQuery 数据源。
有关可用数据源的完整列表ODBC连接DataStage,看ODBC联系。
截至 2023 年 8 月 11 日的一周
在 DataStage Transformer 阶段中使用新功能
8 2023 年 8 月
- 现在,您可以在 Transformer 阶段中使用数据屏蔽,加密和正则表达式功能作为 DataStage 流的一部分。
- 现在,可以在 Transformer 阶段的 "输出" 选项卡上拖放列。
- 现在,您可以从 "输入" 选项卡批量编辑 Transformer 阶段中的列。
不推荐使用 Notebook 中的注释
7 2023 年 8 月
在 2023 年 8 月 31 日,您将无法再从 Notebook 操作栏向 Notebook 添加注释。 将除去以该方式添加的任何现有注释。
截至 4 2023 年 8 月的一周
定制文本分析模板 (SPSS Modeler)
4 2023 年 8 月
对于 SPSS Modeler,现在可以将定制文本分析模板上载到项目。 这使您能够以上下文特有的方式更灵活地捕获和抽取关键概念。
截至 2023 年 7 月 28 日的一周
增强了使用 Watson OpenScale 评估模型的功能
2023 年 7 月 25 日
使用这些新功能来监视和评估模型部署并解释结果。
使用新的指导式设置来配置部署
提供了新的设置向导来帮助您将部署添加到 Watson OpenScale Insights 仪表板并提供模型详细信息。 有关更多信息,请参阅 添加部署以进行评估。
配置新的漂移评估以提供更多洞察
您可以在 Watson OpenScale 中配置新版本的漂移评估,以生成以下新度量值:
- 输出漂移
- 特征漂移
- 模型质量漂移
有关更多信息,请参阅 配置漂移 v2 评估。
通过模型运行状况评估了解模型性能
Watson OpenScale 现在缺省情况下提供新的模型运行状况评估,以帮助您了解模型处理事务的效率。 有关更多信息,请参阅 模型运行状况监视器评估指标。
在 Watson OpenScale 中添加多目标预测模型
在 Watson OpenScale中添加部署时,现在可以指定多个预测列以提供有关用于配置质量评估的模型输出的详细信息。 有关更多信息,请参阅 提供模型详细信息。
使用非结构化数据运行公平性评估
现在,您可以对非结构化数据类型启用公平性评估以识别偏差。 有关更多信息,请参阅 配置公平性评估。
截至 2023 年 7 月 14 日的一周
管理目录中的资产列关系
2023 年 7 月 14 日
管理员现在可以在目录中创建和管理资产列关系。 可以在列与资产,列与工件之间或者在列之间创建列关系。
要添加列关系,请单击资产的 " 概述 " 页面上的列行。 在侧窗格中,单击 相关项 溢出菜单。 从下拉列表中选择其中一种关系类型以添加关系。
要了解有关创建关系的更多信息,请参阅 目录中的资产关系。
不推荐使用 IBM Knowledge Catalog 中对非结构化数据的概要分析支持
2023 年 7 月 12 日
不推荐对包含非结构化数据 (例如 Microsoft Word , PDF , HTML 和纯文本文档) 的数据资产进行概要分析。 支助将于 2023 年 10 月 10 日停止。 在此之前,在添加到项目或目录时,将继续自动对受支持类型的非结构化数据资产进行概要分析。 从 2023 年 10 月 11 日开始,将不再对新添加的非结构化数据资产进行概要分析。 当相应的数据资产位于项目或目录中时,现有概要文件将可用。
Microsoft Azure SQL Database 连接支持 Azure Active Directory 认证 (Azure AD)
2023 年 7 月 14 日
现在,您可以为 Microsoft Azure SQL Database 连接选择 Active Directory 。 Active Directory 认证是 SQL Server 认证的替代方法。 通过此增强功能,管理员可以集中管理用户对 Azure的许可权。 有关更多信息,请参阅 Microsoft Azure SQL Database 连接。
截至 2023 年 7 月 7 的一周
切换到 IBM watsonx.ai
7 2023 年 7 月
如果您拥有 "watsonx.aiStudio(前身为 "Watson Studio)和 "watsonx.ai"Runtime(前身为 "Watson Machine Learning)服务,您现在可以访问 "IBM"watsonx.ai。 您可以从Cloud Pak for Data as a Service切换到watsonx,并在Prompt Lab工具或笔记本中使用基础模型。
请参阅 在平台之间切换。
更新watsonx.aiRuntime(原Watson Machine Learning)计划
7 2023 年 7 月
所有watsonx.aiRuntime 计划现在都包含基础模型推理。 基础模型推断仅在 watsonx.ai上可用。 您可以切换到watsonx.ai,使用新的Prompt Lab工具,或使用笔记本访问基础模型。 You use the same watsonx.ai Runtime service instance on watsonx.ai as you use on Cloud Pak for Data as a Service.
如果您拥有watsonx.aiRuntime Lite 计划,每月最多可使用 25,000 个代币进行基础模型推理。
如果您拥有watsonx.aiRuntimev2标准版或v2专业版计划,当您的账户用户在Prompt Lab或笔记本中执行基础模型推理时,您的账户将产生费用。
有关如何跟踪基础模型推理并计费的详细信息,请参阅watsonx.aiRuntime plan。 有关基础模型推断的定价,请在IBM Cloud目录中的watsonx.aiRuntime 计划页面查找您的计划。
在运行时 23.1 中增强了自然语言处理功能
7 2023 年 7 月
运行时 23.1 包含 Watson Natural Language Processing 库 4.1 和一组新的预训练模型。 NLP 库包含以下增强功能和更新:
- 许多包含的型号现在都是基于变压器的。 这些模型是在由 IBM创建的 Slate 大语言模型 (LLM) 上训练的。 这些模型有两个版本可用:
- 针对仅限 CPU 的环境进行了优化
- 对于具有 GPU 或 CPU 的环境
- 许多包含用于不同 NLP 任务的模型现在都是基于工作流程的模型,而不是基于块的模型,因此您可以直接在输入文本上应用模型,而不必担心预处理步骤。
NLP 包含可用于微调 NLP 任务的 Slate 基础模型。 您可以使用 Slate 模型或来自 Hug Face 的任何基于变压器的模型作为基础,以使用 Watson NLP 来构建自己的模型。
现在, IBM 提供的所有模型都专门针对无偏见的数据进行训练,针对仇恨,偏见和脏话进行最先进的过滤。
这些功能当前在以下环境中可用:
- Python 上的 NLP 运行时 23.1 3.10
- Python 3.10 上的 GPU V100 运行时 23.1
- Python 上的 GPU 2xV100 Runtime 23.1 3.10
您可以将这些环境用于 NLP 处理,但不能用于常规模型开发。 watsonx.aiRuntime(原Watson Machine Learning)尚不支持这些环境中使用的数据科学库。
有关更多信息,请参阅 Watson Natural Language Processing。
截至 2023 年 6 月 30 日的一周
Knowledge Accelerators (IBM Knowledge Catalog) 中增强的 Data Privacy 内容
2023 年 6 月 28 日
Knowledge Accelerator for Cross Industry 现在具有 Data Privacy 内容,其中包含一组分类的业务术语和数据类,以加速个人信息的发现和监管。 此外,样本数据隐私策略和规则可用于描述与处理个人信息相关的活动。
业务术语和数据类有分类来指导个人信息 (PI) 和敏感个人信息 (SPI) 的识别。 您可以在 IBM Knowledge Catalog 中使用元数据扩充来将业务术语分配给导入的数据资产,以识别包含个人数据的资产。
现在可用于定制资产的报告 (IBM Knowledge Catalog)
2023 年 6 月 28 日
现在,您可以根据项目或目录中任何资产的定制定义属性来创建查询,报告和仪表板。 您可以为资产定义新的定制属性,以扩展任何提供的资产类型或定制资产类型,然后根据这些关系创建报告。 例如,您可以创建有关数据质量规则和工件关系的报告,以推断数据的准确性。 有关更多信息,请参阅 设置报告。
报告数据质量规则的改进 (IBM Knowledge Catalog)
2023 年 6 月 28 日
现在,您可以通过以下方式监视数据质量规则:
- 接收和管理目录或项目中每个数据资产的数据质量问题报告。
- 通过使用针对数据质量得分和数据质量维度得分的报告,监视项目和目录中数据资产的持续数据质量。 数据质量得分基于数据质量维度得分的加权平均值。 数据质量维度评分基于相关数据质量检查的结果。
- 对于包含多个规则定义的数据质量规则,请参阅 BI 报告模式中按规则定义列出的数据质量检查统计信息 (结果)。
有关更多信息,请参阅 数据模型。
截至 2023 年 6 月 23 日的一周
通过 AI Factsheets 的增强功能,更有效地监管模型
2023 年 6 月 23 日
AI Factsheets 现在为您提供了更多方法来跟踪业务问题的解决方案,管理更广泛的资产,使用 Factsheet 附件捕获更多信息以及生成改进的报告。
使用方法跟踪不同的模型用例解决方案
在用例中跟踪模型时,现在可以创建一个或多个 方法 来跟踪用于解决业务问题的不同方法和模型版本。 例如,您可以在用例中创建两种不同的方法,以比较不同的算法如何影响模型性能,从而找到最佳解决方案。 有关详细信息,请参阅 在用例中管理模型版本。
用于管理外部模型的增强选项
现在,您可以使用 AI Factsheets 来管理更广泛的外部模型,包括在非 Cloud Pak for Data as a Service平台上开发,部署和监视的模型。 除了针对外部模型跟踪更全面的元数据外, Python 客户机和 API 命令还提供了更多功能,用于将模型和部署移至不同环境,以更准确地跟踪这些资产的生命周期。 有关详细信息,请参阅 向模型库存添加外部模型。
对附件进行更多控制
模型库存管理员可以创建附件组和创建附件定义,以便用户可以更有组织地查看附件,并以核准的格式上载附件。 有关详细信息,请参阅 添加和管理fact工作表的附件。
向 AI Factsheets 报告添加品牌形象
通过添加品牌信息和徽标,定制用于从外观表创建报告的报告模板。 有关更多信息,请参阅 "针对概况介绍和模型用例生成报告"。 有关详细信息,请参阅 针对概况介绍和模型用例生成报告。
宣布支持用于笔记本的Python 3.10Spark3.3运行时watsonx.aiStudio 前身为WatsonStudo)
2023 年 6 月 23 日
Python 3.10 Spark 3.3 现在支持作为 Notebook 的运行时。 不推荐使用 Python 3.9 Spark 3.3 ,将于 2023 年 7 月 20 日停用。 从 2023 年 7 月 6 开始,将限制您使用 Python 3.9 Spark 3.3 环境创建 Notebook ,但现有 Notebook 将继续运行到 2023 年 7 月 30 日。 在除去不推荐使用的环境之前,请将 Notebook 环境更改为使用 Python 3.10 Spark 3.3 。 有关 Notebook 环境的详细信息,请参阅 计算项目中 Notebook 编辑器的资源选项。
截至 2023 年 6 月 16 日的一周
即将到来: AutoAI 实验中时间序列异常预测的一般可用性
2023 年 6 月 15 日
创建时间序列异常预测试验,以在模型根据新数据预测结果时训练可检测异常或意外结果的模型。 AutoAI 的此功能当前在 Beta 中提供,并且不支持用于生产。 一旦该功能普遍可用并得到全面支持,作为watsonx.aiRuntime 计划的一部分,时间序列异常预测实验的训练将消耗容量单位小时 (CUH)。
自定义Decision Optimization实验的引擎参数watsonx.aiStudio(原Watson Studio
2023 年 6 月 15 日
现在,您可以在 Decision Optimization 试验中添加引擎设置文件。 通过此文件,您可以在新的可视编辑器中查看和定制用于对模型求解的引擎参数。 您还可以导入引擎设置文件并搜索现有设置。
请参阅 Python 模型引擎设置。
截至 2023 年 6 月 2 的一周
使用 cpdctl 工具管理 AI 生命周期事件
2 2023 年 6 月
现在,您可以使用 Cloud Pak for Data 命令行界面工具 (cpdctl) 来管理和自动化托管在 Cloud Pak for Data as a Service 上的资产。 使用 IBM Cloud 中的自动配置可轻松地使用 cpdctl API 命令进行连接。 有关详细信息和示例,请参阅以下资源:
- IBM Cloud Pak for Data命令行界面文档。
- 导出空间资产 ,以获取使用 cpdctl 管理资产的示例。
- IBMcpdctl CLI onIBM Cloud博文,了解从Cloud Pak for Data as a Service 连接到 cpdctl 的详细信息。
通过搜索轻松查找目录
1 2023 年 6 月
通过更新后的 " 目录 " 页面,您现在可以按名称搜索目录,并在该页面上查看更多目录以方便扫描。
截至 2023 年 5 月 19 日的一周
提示: Python 3.9 和 R 3.6 上运行时 22.1 的支持即将结束
2023 年 5 月 15 日
IBM Runtime 22.1 on Python 3.9 和 R 3.6 环境将于 2023 年 6 月 15 日移除。 您不能再使用 22.1 运行时或 R 3.6来创建新的 Notebook 或创建定制环境,也不能使用 Python 3.9 软件规范来训练新模型。 更新资产和部署以在 2023 年 6 月 15 日之前在 Python 3.10 或 R 4.2 上使用 IBM Runtime 22.2 。
- 有关将资产迁移到受支持的框架和软件规范的详细信息,请参阅 管理框架和软件规范。
- 有关 Notebook 环境的详细信息,请参阅 计算项目中 Notebook 编辑器的资源选项。
- 有关更改环境的信息,请参阅 更改 Notebook 的环境。
- 有关 R 版本的库和包的详细信息,请参阅 CRAN 发行说明。
为高级用户引入键值搜索
2023 年 5 月 18 日
现在,通过在搜索栏中使用 key:value
对,您可以在资产和工件属性 (例如描述,标记,定制属性,列名等) 中进行搜索。 请参阅 搜索属性。
IBM Cloud Compose for MySQL 连接的名称更改
2023 年 5 月 18 日
IBM Cloud Compose for MySQL 连接已更名为 IBM Cloud Databases for MySQL。 该连接的先前设置保持不变。 只有连接名称发生更改。
已停用的连接
2023 年 5 月 18 日
以下连接已停用,并且已从 Cloud Pak for Data as a Service中除去:
- IBM Db2 Event Store
- IBM Db2 Hosted
重命名数据资产还会重命名项目中的文件附件
2023 年 5 月 19 日
使用上载到项目中的文件附件更改数据资产的名称时,还会重命名文件附件。 但是,更改从目录导入的数据资产的名称不会重命名任何附件。 必须将对基于代码的资产 (例如 Notebook) 中的数据资产的任何引用更新为新的数据资产名称,否则,基于代码的资产将不会运行。 请参阅有关 管理项目中的资产的更多信息。
截至 2023 年 5 月 12 日的一周
新的 UI 功能,用于创建定制资产和管理列的定制属性
2023 年 5 月 11 日
具有 "管理员" 或 "编辑者" 角色的目录合作者现在可以从 Web 客户机完成以下任务:
- 从目录创建定制资产。 要添加定制资产,请从 "添加到目录" 下拉菜单中选择 "定制资产"。
- 管理数据资产列的定制属性。 要管理定制属性,请在 "资产概述" 中选择列,然后在侧窗格中编辑属性。
要了解有关数据资产的定制属性的更多信息,请参阅 定制资产类型,属性和关系。
截至 2023 年 5 月 5 的一周
从 "代码片段" 窗格添加生成的代码
4 2023 年 5 月
向笔记本工具栏添加了新的 "代码片段" 图标。 单击该图标将打开 "代码片段" 窗格,您可以从该窗格中读取已添加到项目的文件或连接中的数据。 用于生成将数据装入到 Notebook 单元格的代码的现有 "插入到代码中" 函数逻辑已移至 "读取数据" 下。 先前的 "查找和装入数据" 窗格现在只能用于将数据上载到项目。 请参阅在 Notebook 中装入和访问数据。
截至 2023 年 4 月 28 日的一周
现在,编排管道通常可用于自动执行 AI 生命周期活动
2023 年 4 月 27 日
Orchestration Pipeline 提供了一个图形界面,用于编排从创建到部署的端到端资产流。 组装和配置管道,以自动执行围绕数据整理,训练,部署和更新机器学习模型的任务。 实时或按调度运行管道作业。 有关创建管道的详细信息,请参阅 编排管道。
此更新中的新增功能是创建定制管道组件以执行您使用 Python 函数编写的脚本。 您可以使用定制组件在管道之间共享可复用脚本。 创建定制组件作为项目资产,然后在您在该项目中创建的管道中使用这些组件。 有关详细信息,请参阅 创建定制组件。
编排管道是watsonx.aiStudio(原Watson Studio)的一项功能。 但是,您必须具有管道中使用的资产和流程的服务套餐。 例如,要在管道中运行DataStage流程,必须有一个 Data Stage 服务实例。 编排管道根据管道中使用的资产和流程使用资源。 如果您的管道训练了一个AutoAI模型,您的账户将被收取用于训练模型的watsonx.aiRuntime(原Watson Machine Learning)容量单位/小时 (CUH)。 同样,如果管道包含DataStage流程,那么在协调管道中执行该流程的费用将由DataStage计划支付。 运行管道组件和 bash 脚本需要消耗watsonx.aiStudio CUH 资源。 有关供应服务实例和套餐的详细信息,请参阅 服务和集成。
使用新的 Presto 连接访问更多数据
2023 年 4 月 27 日
现在,您可以使用 Presto 数据源中的数据。 有关信息,请参阅 Presto 连接。
截至 2023 年 4 月 21 日的一周
向下钻取到概要分析结果的详细信息 (IBM Knowledge Catalog)
2023 年 4 月 20 日
现在,您可以从元数据扩充项内或从项目或目录中资产的 概要文件 选项卡访问详细的概要分析信息。 对于每个列,查看有关列数据的统计信息,有关数据类,数据类型和格式以及列中值的频率分布的信息。 对于统计信息,您还可以在多种类型的可视化之间进行选择。 要为现有概要文件填充这些视图,请更新概要文件。
有关详细信息,请参阅 列级别概要文件详细信息。
截至 2023 年 4 月 14 日的一周
已更新缺省 Python 和 CPLEX 版本 (Decision Optimization)
2023 年 4 月 13 日
Decision Optimization 用户的缺省 Python 现在为 3.10 ,缺省 CPLEX 版本为 22.1。 缺省情况下,在创建新试验时将使用这些版本。 不推荐使用 Python 3.9 ,不久将会将其除去。 要更新环境,请参阅 配置环境。 要更新现有已部署的模型,请参阅 模型部署。
数据质量规则的增强功能 (IBM Knowledge Catalog)
2023 年 4 月 13 日
现在,您还可以从以下数据源对数据资产运行数据质量规则:
- Amazon S3 (仅 CSV 文件)
- Apache Cassandra
- SAP ASE
配置具有外部管理的绑定的数据质量规则时,现在可以为关联的 DataStage 流中的输出链接选择其他内容。 有关更多信息,请参阅 根据数据质量定义创建规则。
截至 2023 年 4 月 7 的一周
新增: 时间序列异常检测实验 (Beta)
7 2023 年 4 月
使用AutoAI训练一个时间序列异常预测模型,当该模型根据新数据预测结果时,可以检测到异常或意外结果。 试验生成的模型候选管道将根据它们通过优化度量测量的性能进行排名。 将模型另存为 Notebook 以查看代码,或者保存并部署模型以检测新数据中的潜在异常。
过滤项目中的资产活动
6 2023 年 4 月
在项目的 " 概述 " 选项卡上的 " 资产 " 窗格中,可以通过使用下拉列表选择 按您 或 按全部 来过滤资产。 按您 列出由您编辑的资产,按顶部最新的资产排序。 按全部 列出由其他人编辑的资产以及由您编辑的资产 (按最新的顶部排序)。
在watsonx.aiStudio(原WatsonStudo)中使用 R4.2升级至 Spark
3 2023 年 4 月
"火花 R "3.6环境中的 "watsonx.ai工作室升级为 R "4.2。 现在不推荐使用所有 Spark R 3.6 环境,将于 2023 年 6 月 15 日移除这些环境。 从 2023 年 5 月 11 日开始,您无法再使用 Spark R 3.6创建新的 Notebook 或新的 Data Refinery 流。 此外,您将无法创建新的 Spark R 3.6 定制环境。 届时,您可能需要为 Notebook 更新一些软件包版本和脚本。 必须在 2023 年 6 月 15 日之前更新资产和部署,以将 Spark 与 R 4.2 配合使用。
请参阅 更改 Notebook 的环境。 有关 R 版本的库和包的详细信息,请参阅 CRAN 发行说明。
具有 R 4.2 的新 Spark 环境,用于运行 Data Refinery 流作业
3 2023 年 4 月
现在,您可以在为 Data Refinery 流作业选择环境时选择 Default Spark 3.3 & R 4.2 。 新环境使用与其他缺省环境相同的容量单位小时 (CUH)。
不推荐使用 Default Spark 3.2 & R 3.6 环境,在将来的更新中将不再使用该环境。 更改 Data Refinery 流作业以使用新的 缺省 Spark 3.3 和 R 3.6 环境。
有关 Data Refinery环境的信息,请参阅 计算项目中 Data Refinery 的资源选项。
环境更改会影响两个 GUI 操作。 如果您具有包含这些 GUI 操作的现有 Data Refinery 流,那么必须更新 Data Refinery 流。
- 拆分
- 标记化
要更新流,请将其打开并保存。 有关详细信息,请参阅 管理 Data Refinery 流。
截至 2023 年 3 月 31 日的一周
从目录创建定制资产
2023 年 3 月 31 日
管理员和编辑者现在可以在目录 UI 中创建定制资产。 要添加新的定制资产,请从 添加到目录 下拉菜单中选择 定制资产 。 要了解有关定制资产的更多信息,请参阅 将资产添加到目录 (Watson Knowledge Catalog)中的 "定制资产类型,属性和关系"。
Data Virtualization的改进和增强
2023 年 3 月 29 日
Data Virtualization已更新,可提供以下功能:
- 通过异步虚拟化,您可以随时在 " 虚拟化数据 " 页面上查看虚拟化作业的状态详细信息。 如果虚拟化表较大且作业耗时较长,那么您可以在作业完成时处理其他任务,例如虚拟化更多表。
- 通过 " 虚拟化数据 " 页面上的异步发布和分配,您可以在发布和分配作业完成时处理其他任务。
- 您可以使用 Web 客户机中的作业来收集有关虚拟化表的统计信息。 有关更多信息,请参阅 Data Virtualization中的在 Web 客户端中收集统计数据。
- 您可以在 " Virutualized data " 页面上查看对象的发布或分配历史记录。 单击列表中的对象行以在 " 虚拟化数据 " 页面的右侧面板中查看其发布和分配历史记录。
截至 2023 年 3 月 24 日的一周
Federated Learning 在具有 M 系列芯片的 Mac 计算机上运行
2023 年 3 月 23 日
在最新运行时的 M1 Mac 和 M2 Mac 计算机上运行 Federated Learning 试验。 有关需求,请参阅 设置系统。
截至 2023 年 3 月 17 日的一周
在参考数据集中定义组合键 (IBM Knowledge Catalog)
2023 年 3 月 17 日
现在,您可以指定多个列来为参考数据集创建组合键。 如果没有组合键,那么集合中的参考数据值由代码列中的唯一字符串标识。 组合键是代码列与参考数据集中最多 5 个定制列的组合。 组合键用于唯一地标识每个参考数据值。 使用组合键时,代码列中的值不再需要唯一。 仅当组合了所有指定列的值时,才保证唯一性。 有关详细信息,请参阅 设计参考数据集。
截至 2023 年 3 月 10 日的一周
根据定制关系创建查询,报告或仪表板 (IBM Knowledge Catalog)
9 2023 年 3 月
在资产与监管工件之间创建定制关系时,可以将它们同步到 IBM Knowledge Catalog Reporting Data Mart ,以便可以创建报告。 例如,可以使用报告的定制关系来执行以下操作:
- 获取各种粒度级别的质量分析 (按域,按元数据,按用户,按团队)
- 验证数据的数据质量
- 计算具有特定隐私属性的资产数量
要了解如何创建定制关系,请参阅 监管工件和目录资产的定制属性和关系 (IBM Knowledge Catalog)。
要了解如何创建报告,请参阅 设置 IBM Knowledge Catalog的报告。
watsonx.aiStudio(原Watson Studio)和watsonx.aiRuntime(原Watson Machine Learning)在Python 3.9上的运行时22.1过时
9 2023 年 3 月
IBM Runtime 22.1 现在已不推荐使用,将在 2023 年 6 月 15 日移除。 从 2023 年 5 月 11 日开始,您无法再使用 22.1 运行时创建新的 Notebook 或创建定制环境。 您还将无法使用 Python 3.9 软件规范来训练新模型。 更新资产和部署以在 2023 年 6 月 15 日之前在 Python 3.10 上使用 IBM Runtime 22.2 :
- 有关将资产迁移到受支持的框架和软件规范的详细信息,请参阅 管理框架和软件规范。
- 有关 Notebook 环境的详细信息,请参阅 计算项目中 Notebook 编辑器的资源选项。
- 有关更改环境的信息,请参阅 更改 Notebook 的环境。
对其他数据源运行数据质量规则 (IBM Knowledge Catalog)
9 2023 年 3 月
现在,您可以从以下数据源对数据资产运行数据质量规则:
- IBM Data Virtualization
- Microsoft Azure Data Lake Storage
- Snowflake
用于绑定数据质量规则中的变量的新选项 (IBM Knowledge Catalog)
9 2023 年 3 月
现在,您还可以使用作业参数将规则变量绑定到数据列,并在项目中集中管理这些参数。 因此,例如,当您想要将绑定更改为其他列时,您不需要更新规则。 请参阅 根据数据质量定义创建规则。
截至 3 2023 年 3 月的一周
增强AI Factsheetswatsonx.aiRuntime,前身为Watson Machine Learning
3 2023 年 3 月
现在,您可以将文件和图像附加到 Factsheet。 有关详细信息,请参阅 定制概况介绍的详细信息。 Fact工作表还显示来自可解释性和定制监视器的其他 Watson OpenScale 度量。 有关详细信息,请参阅 查看外观表。
创建、存储和共享机器学习功能(测试版)watsonx.aiStudio 前身为WatsonStudo)
2 2023 年 3 月
现在,您可以通过创建和共享功能部件来加速机器学习模型的开发。 您可以将功能部件组添加到项目中的数据资产,以标识该数据集的功能部件。 您可以通过将数据资产发布到充当功能部件商店的目录来与组织共享功能部件。 请参阅 管理功能部件组。
截至 2023 年 2 月 24 日的一周
管理定制关系 (IBM Knowledge Catalog)
2023 年 2 月 24 日
现在,您可以在资产的 " 概述 " 页面中管理目录资产与监管工件之间的定制关系。
要了解如何创建定制关系,请参阅 监管工件和目录资产的定制属性和关系 (IBM Knowledge Catalog)。
截至 2023 年 2 月 17 日的一周
Data Refinery 计算操作在 "日期" 列上的工作
2023 年 2 月 17 日
现在,可以对 "日期" 数据类型列使用 计算 操作来添加或减去日期或月份值。
有关 GUI 操作的信息,请参阅 Data Refinery中的 GUI 操作。
在watsonx.aiStudio(原WatsonStudo)中访问项目资产的新库
2023 年 2 月 17 日
ibm-watson-studio-lib
库包含一系列函数,可帮助您与watsonx.aiStudio 项目和项目资产进行交互。 该库可以在 Notebook 编辑器中创建的 Notebook 中使用,并且可用于 Python 和 R。 它是 project_lib
库的后继。 有关详细信息,请参阅 使用 ibm-watson-studio-lib。
"Default Spark 3.2 & R 3.6 " environment discontinued (Data Refinery)
2023 年 2 月 17 日
Default Spark 3.2 & R 3.6 环境将从 2023 年 2 月 17 日起不再可用。
如果使用 Default Spark 3.2 & R 3.6 环境或使用 Spark 3.0的定制环境设置了任何 Data Refinery 流作业,那么这些作业将失败。 将环境更改为 Default Spark 3.3 & R 3.6 或 缺省 Data Refinery XS ,或者更改为不使用 Spark 3.0的定制环境。
有关 Data Refinery环境的信息,请参阅 计算项目中 Data Refinery 的资源选项。
数据质量规则的新功能 (IBM Knowledge Catalog)
2023 年 2 月 16 日
以下新功能可用:
- 在单个数据质量规则中使用多个数据质量定义。 此外,可以多次包含单个定义以将同一定义应用于不同的列。 有关详细信息,请参阅 根据数据质量定义创建规则。
- 将规则输出下载为 CSV 文件。 如果为规则定义了输出表,那么您现在还可以从规则的运行历史记录 (例如,用于电子表格程序) 以 CSV 文件形式下载规则输出。
- 对来自 Amazon Redshift 和 Greenplum 数据源的数据运行规则。 请参阅 元数据导入,元数据扩充和数据质量规则支持的数据源。
- 导出和导入数据质量资产。 将项目资产导出到桌面时,现在可以包含数据质量资产。 请参阅 导出项目。
截至 2023 年 2 月 10 日的一周
将资产从项目或空间导入现有空间watsonx.aiRuntime,前身为Watson Machine Learning
9 2023 年 2 月
现在,您可以将部署空间或项目 (.zip 格式) 导入到现有部署空间中。 向空间添加资产或更新现有资产。 例如,可以将模型替换为较新版本。 有关详细信息,请参阅 将空间和项目导入现有空间。
在 DataStage 中使用更多宏
2023 年 2 月 10 日
您可以将 DSJobController 宏添加到登台属性或在变换器函数中。
宏充当 DataStage 函数并输出数据而不需要参数,从而简化了 DataStage 作业和流的设置。
有关更多信息,请参阅 宏。
截至 3 2023 年 2 月的一周
在 DataStage 中使用更多宏
6 2023 年 2 月
您可以将以下宏添加到登台属性或在变换器函数中:
- DSProjectId
- DSJobRunId
- DSJobId
这些宏充当 DataStage 函数和输出数据,而不需要参数,从而简化了 DataStage 作业和流的设置。
有关更多信息,请参阅 宏。
截至 2023 年 1 月 20 日的一周
在 DataStage 阶段中编辑输入列
2023 年 1 月 20 日
现在,您可以通过 DataStage中阶段的 "输入" 选项卡来编辑列。 您的更改将传播到流中的前一个阶段。
元数据导入的新选项 (IBM Knowledge Catalog)
2023 年 1 月 19 日
为了确保元数据导入的目标项目或目录不包含旧数据,现在可以配置导入以清除无法重新导入的数据资产。 选择此选项以在重新运行元数据导入时从导入目标中删除数据源中不再可用的资产和/或从导入作用域中除去的资产。 请参阅导入元数据。
将数据从 Decision Optimization 实验导出到项目
2023 年 1 月 18 日
现在,您可以从 Decision Optimization 试验中的 "准备数据" 或 "探索解决方案" 视图将表导出到项目。 这使您能够在其他模型或服务中复用数据。 您还可以使用 Decision Optimization Python 客户机导出数据。
请参阅从Decision Optimization实验中导出数据。
截至 2023 年 1 月 13 日的一周
更新的数据光纤网用例
2023 年 1 月 12 日
将更新数据光纤网用例,以更好地反映您如何使用我们的产品:
- 数据集成: 此用例现在包含 Pipeline。
- 数据监管: 此用例现在包含 Match 360。
- AI 治理: 此用例现在专注于监控,维护,自动化和管理生产中的 AI 模型。
- Data Science and MLOps: 这个新的用例说明了如何操作数据分析和模型创建。
请参阅 数据光纤网用例。
定制 Web 浏览器以支持您的品牌
2023 年 1 月 12 日
作为管理员,您可以添加定制产品名称,徽标和其他图形,以定制 Cloud Pak for Data as a Service的 Web 浏览器标记。
请参阅 定制 Web 浏览器的品牌形象。
截至 6 2023 年 1 月的一周
连接到 DataStage 中的更多数据源
6 2023 年 1 月
现在,您可以在 DataStage 流中包含来自这些数据源的数据:
- Dremio
- SingleStoreDB
有关 DataStage 连接器的完整列表,请参阅 DataStage 连接器。