Cloud Pak for Data as a Service 是一个云服务平台,用于执行所有数据监管,数据工程,数据分析和 AI 生命周期任务。 Cloud Pak for Data as a Service 实现了一个数据结构解决方案,以便您可以向组织提供对可信数据的即时安全访问,自动执行流程和合规性,并在应用程序中交付值得信赖的 AI。
Cloud Pak for Data 即服务是一个完全受管的云服务平台,具有以下优势:
- 无需安装、管理或更新软件或硬件
- 易于扩展或缩小
- 安全且合规
- 可组合服务架构
- 预订或基于使用量的每月计费
观看此视频以查看 Cloud Pak for Data as a Service 的概述
此视频提供了一种可视方法来学习本文档中的概念和任务。
Cloud Pak for Data as a Service 数据光纤网解决方案
数据光纤网体系结构使您的企业能够在混合多云数据环境中发掘数据的价值。 迁移到数据光纤网体系结构将转变企业集成,管理和使用数据以进行分析,数据科学,客户主数据和合规性的方式。
借助数据光纤网,您可以采用安全一致的方法来访问来自不同来源的数据。 您可以消除低效,重复且手动的数据访问和集成过程。 数据光纤网体系结构可弥合源之间的差距,并提供业务就绪数据以支持贵公司的需求。 您可以在混合云和多云环境中处理来自各种来源的数据,同时通过全面的集成数据管理功能确保数据的安全性和可信性。
您的数据工程师需要工具来准备,转换和虚拟化数据。 您的数据质量分析人员需要工具来衡量数据的质量。 治理团队需要工具来控制,保护和丰富数据。 您的数据使用者 (例如,业务分析人员和数据科学家) 需要各种工具来协作开发洞察和模型。 借助集成工具的 Cloud Pak for Data 平台,您的组织可以高效地协同工作,使用您的数据来改善业务。
数据光纤网体系结构实施主动元数据管理,该管理使用机器学习来自动执行元数据处理。 元数据分析的结果有助于自动化数据发现,提高对数据的信心,支持大规模的数据保护和数据治理。
服务和平台架构
通过供应服务,将功能部件和工具添加到 Cloud Pak for Data as a Service 平台。 将一组核心服务集成到公共平台中。 其他关联服务使用该平台,但在其外部运行。 根据您注册 Cloud Pak for Data as a Service的方式,您可以从表示单个数据光纤网解决方案用例的核心服务子集开始。
您可以从 Cloud Pak for Data as a Service 服务目录供应以下类型的服务:
核心服务
核心服务无缝集成,并向平台 UI 添加工具,工作空间或计算能力:- watsonx.ai数据分析工作室
- 用于构建和部署模型的watsonx.ai运行时
- 用于评估模型的 Watson OpenScale
- IBM Knowledge Catalog ,用于管理和编目数据和其他资产
- 用于集成数据的 DataStage
- Data Virtualization,用于虚拟化和查询数据
- Match 360 以创建主数据
- 用于复制数据的 Data Replication
- Cognos Dashboard Embedded ,用于可视化数据
关联服务
IBM Cloud 数据库服务,可用于从平台内访问数据,但在平台外存储和管理数据。具有自己的 UI 或提供用于分析数据的 API 的 Watson 服务。
工作空间和资产
Cloud Pak for Data as a Service 组织为一组协作工作空间,您可以在其中与团队或组织协作。 每个工作空间都有一组具有角色的成员,这些角色提供执行操作的许可权。 大多数用户使用资产,这些资产是用户添加到平台的项。 数据资产包含表示数据的元数据,而您在工具 (例如数据管道和模型) 中创建的资产运行代码以处理数据。 下图显示了主要工作空间,其用途以及资产和其他项在平台上的移动方式。
项目
项目是数据科学,数据工程或数据管理团队处理数据以创建资产 (例如, Notebook ,仪表板,模型,数据管道或丰富的数据资产) 的位置。 项目工具由大多数核心服务提供:
- watsonx.aiStudioData Refinery、Jupyter笔记本编辑器、SPSS Modeler、Decision Optimization、管道和RStudio工具
- watsonx.aiRuntime 提供AutoAI和联合学习工具
- IBM Knowledge Catalog 提供了 Data Refinery, Metadata import,元数据扩充和屏蔽流工具
- DataStage 提供 DataStage 数据管道编辑器
- Cognos Dashboard Embedded 提供仪表板编辑器
- Data Replication 提供 Data Replication 工具
- Match 360 提供主数据配置工具
下图显示了项目的 " 概述 " 页面的外观。
目录
目录是贵组织查找和存储高质量可信数据以及其他资产 (例如模型外观表) 的位置。 您可以在目录中查找数据资产,并将其移动到项目中以处理数据。 或者,您可以在项目中组织数据,并将高质量数据资产发布到目录以供其他人使用。 目录需要 IBM Knowledge Catalog 服务。
下图显示了目录的 " 资产 " 页面的外观。
部署空间
在部署空间中, ModelOps 团队将模型和其他可部署资产部署到生产环境,然后测试和管理生产环境中的部署。 在项目中构建模型和可部署资产后,将其提升到部署空间。
下图显示了部署空间的 " 概述 " 页面的外观。
类别
类别是监管团队在其中创建和管理监管工件以丰富目录中的数据资产的位置。 类别需要 IBM Knowledge Catalog 服务。
下图显示了类别的外观。
其他工作空间
您可以在其他工作空间中创建专用数据资产,并将其移至项目和目录:
- Data Virtualization服务提供了一个工作区,用于虚拟化多个数据源的数据资产。
- Match360 服务提供了一个工作空间,用于配置和浏览客户数据的 360 度视图。
资源中心
该平台包含一个集成的资源中心,用于提供样本数据资产,笔记本和项目。 样本笔记本提供了数据科学和机器学习代码的示例。 样本项目 (包括行业加速器) 包含数据集,模型,其他资产以及有关如何解决特定业务问题的详细指示信息。 资源中心还提供 Knowledge Accelerators,其中包含一组监管工件,您可以导入这些工件来为特定行业提供业务词汇表。
下图显示了资源中心的外观。
观看此视频以查看资源中心的教程。
此视频提供了一种可视方法来学习本文档中的概念和任务。