La plataforma proporciona espacios de trabajo y herramientas de colaboración, y proporciona el contenido a la plataforma, en forma de activos. Un activo es un elemento que contiene información sobre datos, otra información valiosa o código que funciona con datos.
Puede añadir activos importándolos o creándolos con herramientas. Puede trabajar con activos en espacios de trabajo colaborativos. El espacio de trabajo que utilice depende de las tareas.
Proyectos Donde colabora con otros para trabajar con datos y crear activos. La mayoría de las herramientas están en proyectos y ejecuta activos que contienen código en proyectos. Por ejemplo, puede importar datos, preparar datos, analizar datos o crear modelos en proyectos. Consulte Proyectos.
Catálogos Donde almacena los elementos para compartirlos con su organización o para buscar los activos con los que necesita trabajar. Puede copiar activos de catálogos en proyectos o publicar activos de proyectos en el catálogo. Puede editar propiedades y metadatos de activos en un catálogo, pero no puede ejecutar activos. Consulte Catálogos.
Espacios de despliegue Donde despliega y ejecuta activos que están listos para pruebas o producción. Puede mover activos de proyectos a espacios de despliegue y, a continuación, crear despliegues a partir de esos activos. Puede supervisar y actualizar los despliegues según sea necesario. Consulte Espacios de despliegue.
Puede buscar cualquier activo en cualquiera de los espacios en los que colabora buscándolo en la barra de búsqueda global. Consulte Buscar activos en la plataforma.
Para crear la mayoría de los tipos de activos, debe utilizar una herramienta específica. La mayoría de las herramientas las proporcionan uno o más servicios. Las herramientas para crear activos de datos y activos de conexión las proporciona la plataforma y no requieren ningún servicio específico.
Para ver qué servicios necesita para qué herramientas, abra la correlación de herramientas y servicios.
La tabla siguiente lista los tipos de activos que puede crear, las herramientas que necesita para crearlos y los espacios de trabajo donde puede añadirlos.
Muestra las visualizaciones de un activo de datos.
Página Visualización en activos de datos
Proyectos
Propiedades comunes para activos
Copy link to section
Los activos acumulan información en las propiedades cuando las crea, las utiliza o cuando las actualizan los procesos automatizados. Algunas propiedades las proporcionan los usuarios y las pueden editar los usuarios. El sistema proporciona automáticamente otras propiedades. Los usuarios no pueden editar la mayoría de las propiedades proporcionadas por el sistema.
El campo Última modificación de un activo realiza un seguimiento de las acciones de usuario y del sistema. Las acciones del sistema a menudo se producen en segundo plano y pueden implicar sólo cambios en los metadatos internos del activo.
Propiedades comunes para activos en todas partes
Copy link to section
La mayoría de los tipos de activos tienen las propiedades que se listan en la tabla siguiente en todos los espacios de trabajo donde existen estos tipos de activos.
Propiedades comunes para activos
Propiedad
Descripción
¿editable?
Nombre
El nombre del activo. Puede contener hasta 255 caracteres. Da soporte a caracteres de varios bytes. No puede estar vacío, contener caracteres de control de Unicode, o contener espacios en blanco. Los nombres de activos no necesitan ser exclusivos dentro de un proyecto o espacio de despliegue. Si los nombres de activos deben ser exclusivos en un catálogo depende del método de manejo de duplicados establecido para el catálogo.
Sí
Descripción
Opcional. Da soporte a caracteres de varios bytes y a hiperenlaces.
Sí
Fecha de creación
La indicación de fecha y hora de cuando se creó o importó el activo.
Nee
Creador o propietario
Nombre de usuario o dirección de correo electrónico de la persona que ha creado o importado el activo.
Nee
Fecha de última modificación
Indicación de fecha y hora de la última modificación del activo.
Nee
Último editor
Nombre de usuario o dirección de correo electrónico de la persona que ha modificado por última vez el activo.
Nee
Propiedades comunes para activos en catálogos
Copy link to section
Además de las propiedades comunes que tienen todos los activos, los activos de los catálogos tienen las propiedades y las páginas que se listan en la tabla siguiente.
Establecido en público de forma predeterminada. Este valor puede restringir el acceso a un activo de un catálogo cuando se establece en privado. Solo los propietarios y miembros del activo pueden ver y utilizar los activos privados.
Sí
Página Acceso
El propietario y los miembros del activo. De forma predeterminada, el propietario del activo es el usuario que ha añadido el activo al catálogo. Los miembros del activo pueden ver y utilizar el activo cuando está marcado como privado. Consulte Control del acceso a un activo.
Sí
Página Calificaciones
Opcional. Los colaboradores del catálogo pueden valorar y revisar activos.
Sí
Etiquetas
Opcional. Etiquetas de texto que los colaboradores del catálogo crean para simplificar la búsqueda. Una etiqueta consta de una serie de hasta 255 caracteres. Puede contener espacios, letras, números, signos de subrayado, guiones y los símbolos # y @.
Sí
Relaciones
Opcional. Las relaciones que aparecen en la sección Elementos relacionados de la página Visión general del activo son informativas y no tienen otros efectos en el activo. Puede estar entre activos en el mismo espacio de trabajo o en distintos espacios de trabajo. Por ejemplo, puede añadir una relación entre un activo de un catálogo y un activo de un proyecto. Puede estar entre un activo y un artefacto. Por ejemplo, puede añadir una relación entre un activo y una política. Los administradores pueden crear relaciones personalizadas para activos. Consulte Adición de relaciones de activos.
Sí
Artefactos de gobernabilidad
Opcional. Términos empresariales y clasificación que los usuarios han asignado al activo. Estas asignaciones pueden afectar al activo. Por ejemplo, un término de negocio asignado puede desencadenar la aplicación de una regla de protección de datos.
Sí
Puede crear propiedades personalizadas para tipos de activos. Las propiedades personalizadas se muestran en la sección Detalles de la pestaña Visión general del activo en el catálogo. Consulte Propiedades y relaciones personalizadas.
Propiedades comunes para activos que se ejecutan en herramientas
Copy link to section
Algunos activos están asociados con la ejecución de una herramienta. Por ejemplo, un activo de experimento de AutoAI se ejecuta en la herramienta AutoAI . Los activos que se ejecutan en herramientas también se conocen como activos operativos. Cada vez que ejecuta activos en herramientas, inicia un trabajo. Puede supervisar y planificar trabajos. Los trabajos utilizan recursos de cálculo. Los recursos de cálculo se miden en horas de unidad de capacidad (CUH) y se rastrean. Dependiendo de sus planes de servicio, usted puede tener una cantidad limitada de CUH por mes, o pagar por el CUH que usted usa cada mes.
Para muchos activos que se ejecutan en herramientas, tiene la opción de utilizar la configuración del entorno de cálculo. Normalmente, las configuración de entorno más rápidas consumen recursos de cálculo con más rapidez.
Además de las propiedades básicas, la mayoría de los activos que se ejecutan en herramientas contienen los siguientes tipos de información en proyectos:
Propiedades de activos en proyectos
Propiedades
Descripción
¿editable?
Espacios de trabajo
Definición de entorno
Plantilla de entorno, especificación de hardware y especificación de software para ejecutar el activo. Consulte Entornos.
Sí
Proyectos, espacios
Valores
Información que define cómo se ejecuta el activo. Específico de cada tipo de activo.
Sí
Proyectos
Activos de datos asociados
Los datos en los que está trabajando el activo.
Sí
Proyectos
Trabajos
Información sobre cómo ejecutar el activo, incluida la definición de entorno, la planificación y las opciones de notificación. Consulte Trabajos.
Sí
Proyectos, espacios
Tipos de activos de datos y sus propiedades
Copy link to section
Los tipos de activos de datos contienen metadatos y otra información sobre los datos, incluido cómo acceder a los datos.
Cómo crea un activo de datos depende de la ubicación en la que se encuentran sus datos:
Si sus datos están en un archivo, cargue el archivo del sistema local en un proyecto, catálogo o espacio de despliegue.
Si los datos están en un origen de datos remoto, primero creará un activo de conexión que defina la conexión con ese origen de datos. A continuación, cree un activo de datos seleccionando la conexión, la vía de acceso u otra estructura, y la tabla o archivo que contiene los datos. Este tipo de activo de datos se denomina activo de datos conectado.
Para los orígenes de datos que dan soporte a consultas SQL, también puede crear vistas dinámicas, que son activos de datos del tipo Consulta. Para crear un activo de este tipo, seleccione la conexión y proporcione una consulta SQL que recupere sólo los datos que necesite.
El gráfico siguiente ilustra cómo los activos de datos de los archivos apuntan a los archivos cargados en Cloud Object Storage. Los activos de datos conectados requieren un activo de conexión y apuntan a datos en un origen de datos remoto.
Puede crear los siguientes tipos de activos de datos en un proyecto, catálogo o espacio de despliegue:
Activo de datos de un archivo Representa un archivo que ha cargado desde el sistema local. El archivo se almacena en el contenedor de almacenamiento de objetos de la instancia IBM Cloud Object Storage asociada al espacio de trabajo. El contenido del archivo puede incluir datos estructurados, datos textuales no estructurados, imágenes y otros tipos de datos. Puede crear un activo de datos con un archivo de cualquier formato. Sin embargo, puede realizar más acciones en archivos CSV que en otros tipos de archivo. Consulte Propiedades de activos de datos.
Puede crear un activo de datos a partir de un archivo cargando un archivo en un espacio de trabajo. También puede crear archivos de datos con herramientas y convertirlos en activos. Por ejemplo, puede crear activos de datos a partir de archivos con las herramientas Data Refinery, Jupyter notebook y RStudio.
Activo de datos conectado Representa una tabla, archivo o carpeta a la que se accede a través de una conexión con un origen de datos remoto. La conexión se define en el activo de conexión asociado al activo de datos conectado. Puede crear un activo de datos conectado para cada conexión soportada. Cuando accede a un activo de datos conectado, los datos se recuperan dinámicamente desde el origen de datos. Consulte Propiedades de activos de datos.
Puede importar activos de datos conectados desde un origen de datos con la herramienta de datos conectados en un espacio de trabajo. Si desea importar conjuntos de activos de datos conectados, por ejemplo un esquema de base de datos completo, utilice la herramienta de importación de metadatos en los proyectos. Puede crear tablas virtuales que compilen datos de varios orígenes de datos con Data Virtualization en el espacio de trabajo Data virtualization .
En proyectos, puede crear vistas dinámicas que contengan datos filtrados de una o más tablas de un origen de datos utilizando la herramienta de acceso a datos de consulta.
Activo de carpeta Representa una carpeta en IBM Cloud Object Storage. Un activo de datos de carpeta es un caso especial de un activo de datos conectado. Puede crear un activo de datos de carpeta especificando la vía de acceso a la carpeta en el activo de conexión de IBM Cloud Object Storage. Puede ver los archivos y subcarpetas que comparten la vía de acceso con el activo de datos de carpeta. Los archivos que puede ver en el activo de datos de carpeta no son en sí mismos activos de datos. Por ejemplo, puede crear un activo de datos de carpeta para una vía de acceso que contiene nuevos canales de información que se actualizan de forma continuada. Consulte Propiedades de activos de datos.
Puede importar activos de carpetas desde IBM Cloud Object Storage con la herramienta de datos conectados en un espacio de trabajo.
Activo de conexión Contiene la información necesaria para crear una conexión con un origen de datos. Consulte Propiedades de activos de conexión.
Puede crear conexiones con la herramienta de conexión en un espacio de trabajo.
Más información sobre la creación e importación de activos de datos:
Propiedades de activos de datos de archivos y activos de datos conectados
Copy link to section
Además de las propiedades básicas y las propiedades de catálogo comunes, los activos de datos de los archivos y los activos de datos conectados tienen las propiedades o páginas que se listan en la tabla siguiente.
Propiedades de activos de datos de archivos y activos de datos conectados
Propiedad o página
Descripción
¿editable?
Espacios de trabajo
Columnas
Un resumen de las propiedades de las columnas en el activo de datos. Incluye la puntuación de calidad, la descripción, las clases de datos asignadas y los términos empresariales asignados para cada columna. Las clases de datos y los términos empresariales asignados pueden afectar al activo. Por ejemplo, un término de negocio asignado puede desencadenar la aplicación de una norma de protección de datos.
Información sobre claves primarias y relaciones entre claves: - Una columna que se establece como clave primaria se identifica mediante un icono de clave (. Una clave primaria también se muestra en el panel lateral de activos. - Si existen relaciones clave para el activo, puede pulsar el enlace Ver relaciones clave . En el separador Padre de , verá todas las relaciones para la clave primaria. En la pestaña Hijo de , verá todas las relaciones para las que el activo contiene una clave foránea.
Nee
Catálogos
Etiquetas
Opcional. Etiquetas de texto que los usuarios crean para simplificar la búsqueda. Una etiqueta consta de una serie de hasta 255 caracteres. Puede contener espacios, letras, números, signos de subrayado, guiones y los símbolos # y @.
Sí
Proyectos, Catálogos
Formato
El tipo MIME de un archivo. Se detecta automáticamente.
Sí
Proyectos, Catálogos, Espacios
Detalles de activo
Información sobre el tamaño de los datos, el número de columnas y filas y la versión de activo. En los proyectos, también se muestra el tipo de tabla de datos relacionales.
Nee
Proyectos, Catálogos, Espacios
Origen
Información sobre el archivo de datos en el almacenamiento o el origen de datos y la conexión.
Nee
Catálogos, espacios
Consulta
Consulta SQL que genera el activo. Sólo vistas dinámicas.
Sí
Proyectos
Detalles de la conexión
Para los activos de datos conectados, la vía de acceso, el nombre de conexión, el tipo de conector y el propietario de la conexión. Para las vistas dinámicas, sólo se muestran el nombre de conexión y el tipo de conector.
Nee
Proyectos
Panel Actividades
El historial de acciones realizadas en el activo en todos los espacios de trabajo. Consulte Actividades.
Nee
Proyectos, Catálogos
Página Vista previa de activo o Activo
Una vista previa de los datos que incluye un conjunto limitado de columnas y filas del origen de datos original. Consulte Contenido de activo o vistas previas.
Nee
Proyectos, Catálogos, Espacios
Página Perfil
Metadatos y estadísticas sobre el contenido de los datos. Por ejemplo, cuando se publica un activo enriquecido en un catálogo, también se publican los metadatos ampliados, y en esta página aparecen Nombre para mostrar y Descripción, que puede ser una versión generada por la IA o una versión editada. Esta información también aparece en la página Descripción general. Véase Perfil.
Sí
Proyectos, Catálogos
Página Calidad de datos
Información sobre la calidad de datos de un activo y sus columnas, y las comprobaciones de calidad de datos que se han aplicado. Véase calidad de datos.
Diagramas y gráficos que los usuarios crean para comprender los datos. Consulte Visualizaciones.
Sí
Proyectos
Página Grupo de características
Información sobre qué columnas del activo de datos se utilizan como características en los modelos. Consulte Gestión de grupos de características.
Sí
Proyectos, Catálogos, Espacios
Propiedades de activos de conexión
Copy link to section
Las propiedades de los activos de conexión dependen del origen de datos que seleccione al crear una conexión. Consulte Tipos de conexión. Los activos de conexión para la mayoría de los orígenes de datos tienen las propiedades que se listan en la tabla siguiente.
Propiedades de activos de conexión
Propiedades
Descripción
¿editable?
Espacios de trabajo
Detalles de la conexión
La información que identifica el origen de datos. Por ejemplo, el nombre de la base de datos, el nombre de host, la dirección IP, el puerto, el ID de instancia, el bucket, el endpoint URL, etc.
Sí
Proyectos, Catálogos, Espacios
Valor de credencial
Si las credenciales se comparten en la plataforma (valor predeterminado) o si cada usuario debe especificar sus credenciales personales. No todos los orígenes de datos dan soporte a credenciales personales.
Sí
Proyectos, Catálogos, Espacios
Método de autenticación
El formato de la información de credenciales. Por ejemplo, una clave de API o un nombre de usuario y contraseña.
Sí
Proyectos, Catálogos, Espacios
Credenciales
El nombre de usuario y la contraseña, la clave de API u otras credenciales, según requiera el origen de datos y el método de autenticación especificado.
Sí
Proyectos, Catálogos, Espacios
Certificados
Indica si el puerto de origen de datos está configurado para aceptar conexiones SSL y otra información sobre el certificado SSL.
Use this interactive map to learn about the relationships between your tasks, the tools you need, the services that provide the tools, and where you use the tools.
Select any task, tool, service, or workspace
You'll learn what you need, how to get it, and where to use it.
Some tools perform the same tasks but have different features and levels of automation.
Jupyter notebook editor
Prepare data
Visualize data
Build models
Deploy assets
Create a notebook in which you run Python, R, or Scala code to prepare, visualize, and analyze data, or build a model.
AutoAI
Build models
Automatically analyze your tabular data and generate candidate model pipelines customized for your predictive modeling problem.
SPSS Modeler
Prepare data
Visualize data
Build models
Create a visual flow that uses modeling algorithms to prepare data and build and train a model, using a guided approach to machine learning that doesn’t require coding.
Decision Optimization
Build models
Visualize data
Deploy assets
Create and manage scenarios to find the best solution to your optimization problem by comparing different combinations of your model, data, and solutions.
Data Refinery
Prepare data
Visualize data
Create a flow of ordered operations to cleanse and shape data. Visualize data to identify problems and discover insights.
Orchestration Pipelines
Prepare data
Build models
Deploy assets
Automate the model lifecycle, including preparing data, training models, and creating deployments.
RStudio
Prepare data
Build models
Deploy assets
Work with R notebooks and scripts in an integrated development environment.
Federated learning
Build models
Create a federated learning experiment to train a common model on a set of remote data sources. Share training results without sharing data.
Deployments
Deploy assets
Monitor models
Deploy and run your data science and AI solutions in a test or production environment.
Catalogs
Catalog data
Governance
Find and share your data and other assets.
Metadata import
Prepare data
Catalog data
Governance
Import asset metadata from a connection into a project or a catalog.
Metadata enrichment
Prepare data
Catalog data
Governance
Enrich imported asset metadata with business context, data profiling, and quality assessment.
Data quality rules
Prepare data
Governance
Measure and monitor the quality of your data.
Masking flow
Prepare data
Create and run masking flows to prepare copies of data assets that are masked by advanced data protection rules.
Governance
Governance
Create your business vocabulary to enrich assets and rules to protect data.
Data lineage
Governance
Track data movement and usage for transparency and determining data accuracy.
AI factsheet
Governance
Monitor models
Track AI models from request to production.
DataStage flow
Prepare data
Create a flow with a set of connectors and stages to transform and integrate data. Provide enriched and tailored information for your enterprise.
Data virtualization
Prepare data
Create a virtual table to segment or combine data from one or more tables.
OpenScale
Monitor models
Measure outcomes from your AI models and help ensure the fairness, explainability, and compliance of all your models.
Data replication
Prepare data
Replicate data to target systems with low latency, transactional integrity and optimized data capture.
Master data
Prepare data
Consolidate data from the disparate sources that fuel your business and establish a single, trusted, 360-degree view of your customers.
Services you can use
Services add features and tools to the platform.
watsonx.ai Studio
Develop powerful AI solutions with an integrated collaborative studio and industry-standard APIs and SDKs. Formerly known as Watson Studio.
watsonx.ai Runtime
Quickly build, run and manage generative AI and machine learning applications with built-in performance and scalability. Formerly known as Watson Machine Learning.
IBM Knowledge Catalog
Discover, profile, catalog, and share trusted data in your organization.
DataStage
Create ETL and data pipeline services for real-time, micro-batch, and batch data orchestration.
Data Virtualization
View, access, manipulate, and analyze your data without moving it.
Watson OpenScale
Monitor your AI models for bias, fairness, and trust with added transparency on how your AI models make decisions.
Data Replication
Provide efficient change data capture and near real-time data delivery with transactional integrity.
Match360 with Watson
Improve trust in AI pipelines by identifying duplicate records and providing reliable data about your customers, suppliers, or partners.
Manta Data Lineage
Increase data pipeline transparency so you can determine data accuracy throughout your models and systems.
Where you'll work
Collaborative workspaces contain tools for specific tasks.
Project
Where you work with data.
> Projects > View all projects
Catalog
Where you find and share assets.
> Catalogs > View all catalogs
Space
Where you deploy and run assets that are ready for testing or production.
> Deployments
Categories
Where you manage governance artifacts.
> Governance > Categories
Data virtualization
Where you virtualize data.
> Data > Data virtualization
Master data
Where you consolidate data into a 360 degree view.