Después de crear un proyecto, el paso siguiente es añadirle activos de datos para que pueda trabajar con los datos. Todos los colaboradores del proyecto obtienen una autorización automática para acceder a los datos del proyecto.
Distintos tipos de activos pueden tener nombres duplicados. Sin embargo, no puede añadir un tipo de activo con el mismo nombre varias veces.
Puede utilizar los métodos siguientes para añadir activos de datos a proyectos:
Método | Cuándo se va a utilizar |
---|---|
Adición de archivos locales | Tiene datos en CSV o archivos similares en el sistema local. |
Añadir conjuntos de datos de concentrador de recursos | Desea utilizar conjuntos de datos de ejemplo. |
Añadir conexiones de base de datos | Debe conectarse a un origen de datos remoto. |
Añadir datos desde una conexión | Necesita una o más tablas o archivos de un origen de datos remoto. |
Añadir una vista dinámica | Necesita una vista que contenga un subconjunto de los datos en una o más tablas de un origen de datos remoto. |
Importar metadatos desde una conexión | Necesita muchas tablas o archivos de un origen de datos remoto. Desea planificar y volver a ejecutar el proceso de importación. |
Añadir activos de carpeta conectados desde IBM Cloud Object Storage | Necesita una carpeta en IBM Cloud Object Storage que contenga un conjunto dinámico de archivos, como un canal de información de noticias. |
Añadir activos de catálogo | Necesita uno o más activos de un catálogo. |
Convertir archivos en almacenamiento de proyecto en activos | Desea convertir los archivos que ha creado en el proyecto en activos de datos. |
Adición de archivos locales
Puede añadir un archivo desde el sistema local como un activo de datos en un proyecto.
- Permisos necesarios
Debe tener el rol de Editor o de Administrador en el proyecto.
- Restricciones
- El archivo no puede estar vacío.
- El nombre de archivo no puede superar los 255 caracteres.
- El tamaño máximo de los archivos que puede cargar con la interfaz de usuario es de 5 GB. Puede cargar archivos de mayor tamaño en un proyecto con las API.
Para añadir archivos de datos a un proyecto:
En la página Activos del proyecto, pulse el icono Cargar activo en proyecto . También puede pulsar el mismo icono desde un cuaderno o lienzo.
En el panel que se abre, busque los archivos o arrástrelos al panel. Debe permanecer en la página hasta que se complete la carga.
Los archivos se guardan en el almacenamiento de objetos asociado con el proyecto y se muestran como activos de datos en la página Activos del proyecto.
Cuando pulsa el nombre del activo de datos, puede ver esta información acerca de los activos de datos desde los archivos:
- El nombre y la descripción del activo
- Las etiquetas para el activo
- El nombre de la persona que ha creado el activo
- El tamaño de los datos
- La fecha en que se ha añadido el activo al proyecto
- La fecha en que se ha modificado el activo por última vez
- Un vista preliminar de los datos, para archivos CSV, Avro, Parquet, TSV, Microsoft Excel, PDF, texto, JSON e imagen
- Un perfil de los datos, para archivos CSV, Avro, Parquet, TSV y Microsoft Excel
Puede actualizar el contenido de un activo de datos desde un archivo añadiendo un archivo con el mismo nombre y formato al proyecto y luego eligiendo sustituir el activo de datos existente.
Puede eliminar el activo de datos seleccionando la opción Suprimir en el menú de acciones situado junto al nombre del activo. Elija la opción Preparar datos para refinar los datos con Data Refinery.
Añadir conjuntos de datos de concentrador de recursos
Puede añadir conjuntos de datos del concentrador de recursos al proyecto:
- En Concentrador de recursos, busque la tarjeta para el conjunto de datos que desea añadir.
- Pulse el icono Añadir al proyecto en la barra de acciones, seleccione el proyecto y pulse Añadir.
Visualice este breve vídeo para ver cómo cargar y analizar conjuntos de datos públicos.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Transcripción de vídeo Hora Transcripción 00:00 Este vídeo muestra cómo acceder a conjuntos de datos públicos en la galería Cloud Pak for Data as a Service . 00:06 Inicie en el concentrador de recursos y utilice los filtros para ver sólo los conjuntos de datos. 00:13 Aquí, encontrará algunos conjuntos de datos enriquecidos que puede utilizar en el análisis. 00:17 Por ejemplo, puede buscar "economía" o "población" o "tiempo" o "trabajos". 00:28 Esto parece un conjunto de datos interesante. 00:30 Ábralo y obtenga una vista preliminar de los datos. 00:34 Desde aquí, puede compartir el conjunto de datos en redes sociales, obtener un enlace directo al conjunto de datos o descargar el conjunto de datos. 00:45 También puede copiar el conjunto de datos en un proyecto específico. 00:52 Ahora, vaya a ese proyecto. 00:55 Y en la pestaña "Activos", verá que el conjunto de datos se ha añadido a la sección de activos de datos. 01:01 A continuación, añada un nuevo cuaderno. 01:05 El título de este cuaderno será "Tasas de desempleo". 01:09 Seleccione un entorno de ejecución y un idioma. 01:14 Cuando esté listo, cree el cuaderno. 01:20 Cuando el cuaderno se cargue, acceda a los orígenes de datos y localice el archivo de desempleo. 01:27 Pulse "Insertar en código" y elija cómo desea insertar los datos. 01:33 Las opciones de este recuadro desplegable dependen del idioma utilizado en este cuaderno. 01:38 Observe que el código insertado incluye las credenciales que necesitará para leer el archivo de datos de la instancia de Object Storage. 01:45 Al ejecutar el código, se muestran las cinco primeras filas. 01:50 Ahora, está preparado para empezar a analizar cualquiera de los conjuntos de datos enriquecidos en el centro de recursos. 01:56 Busque más vídeos en la documentación de Cloud Pak for Data as a Service.
Convertir archivos en almacenamiento de proyecto en activos
El almacenamiento del proyecto contiene los activos de datos que ha cargado en el proyecto, pero también puede contener otros archivos. Por ejemplo, puede guardar un DataFrame en un cuaderno en el almacenamiento del entorno de proyecto. Puede convertir los archivos del almacenamiento del proyecto en activos.
Para convertir archivos en almacenamiento de proyecto en activos:
- En el separador Activos del proyecto, pulse Importar activo.
- Seleccione Archivos de proyecto.
- Seleccione la carpeta data_asset .
- Seleccione el activo y pulse Importar.
Próximos pasos
Más información
Tema principal: Preparación de datos