Para acceder a los datos desde un servicio de almacenamiento que sea compatible con la API de Amazon S3, cree un activo de conexión para el mismo.
Crear una conexión de S3 genérica
Para crear el activo de conexión, necesita estos detalles de conexión:
- URL de punto final: El URL de punto final para acceder a S3
- Bucket(opcional): el nombre del grupo que contiene los archivos
- Región (opcional): Región de S3. Especifique una región que coincida con el punto final regional.
- Clave de acceso: La clave de acceso (nombre de usuario) que autoriza el acceso a S3
- Clave secreta: La contraseña asociada al ID de Clave de acceso que autoriza el acceso a S3
- El certificado SSL del host de confianza. El certificado es necesario cuando el certificado de host no está firmado por una entidad emisora de certificados conocida.
- Inhabilitar codificación fragmentada: Seleccione esta opción si el almacenamiento no da soporte a la codificación fragmentada.
- Habilitar acceso de grupo global: Consulte la documentación del origen de datos S3 para saber si se debe seleccionar esta propiedad.
- Habilitar acceso de estilo de vía de acceso: Consulte la documentación del origen de datos S3 para ver si desea seleccionar esta propiedad.
Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma
- En un proyecto
- Pulse Activos > Nuevo activo > Conectar a un origen de datos. Consulte Adición de una conexión a un proyecto.
- En un espacio de despliegue
- Pulse Importar activos > Acceso a datos > Conexión. Consulte Adición de activos de datos a un espacio de despliegue.
- En el catálogo de activos de la plataforma
- Pulse Nueva conexión. Consulte Adición de conexiones de plataforma.
Paso siguiente: Añadir activos de datos desde la conexión
Dónde puede utilizar esta conexión
Puede utilizar la conexión Generic S3 en los siguientes espacios de trabajo y herramientas:
Proyectos
- Data Refinery
- Decision Optimization
Catálogos
- Platform assets catalog
Configuración de la conexión Generic S3
Para obtener información de configuración, consulte la documentación del origen de datos S3-compatible al que se está conectando.
Tipos de archivos soportados
La conexión Generic S3 da soporte a estos tipos de archivo: Avro, CSV, texto delimitado, Excel, JSON, ORC, Parquet, SAS, SAV, SHP y XML.
Formatos de tabla
Además del archivo sin formato, la conexión S3 genérica da soporte a estos formatos de tabla de Data Lake: Delta Lake e Iceberg.
Conexión relacionada: Amazon S3
Tema principal: Conexiones soportadas