Para acceder a los datos en Microsoft Azure Data Lake Storage, cree un activo de conexión para el mismo.
Azure Data Lake Storage (ADLS) es un servicio de almacenamiento y análisis de datos escalable que se aloja en Azure, la nube pública de Microsoft. La conexión Microsoft Azure Data Lake Storage da soporte al acceso a los repositorios Gen1 y Gen2 Azure Data Lake Storage.
Cree una conexión con Microsoft Azure Data Lake Storage
Para crear el activo de conexión, necesita estos detalles de conexión:
Microsoft Entra ID es un servicio de gestión de identidades y accesos basado en la nube. Para obtener los valores de conexión para el método de autenticación Entra ID, inicie sesión en el portal Microsoft Azure y vaya a su cuenta de almacenamiento. Para obtener información sobre Microsoft Entra ID, consulte ¿Qué es Microsoft Entra ID?.
Credencial de secreto de cliente de ID de Entra
- ID de inquilino: El ID de inquilino de Microsoft Entra. Para encontrar el ID de inquilino, vaya a Propiedades de Microsoft Entra ID>. Desplácese hacia abajo hasta el campo ID de arrendatario. Para obtener más información, consulte Cómo encontrar su ID de arrendatario de Microsoft Entra.
- ID de cliente: El ID de cliente para autorizar el acceso a Microsoft Azure Data Lake Storage. Para encontrar el ID de cliente de su aplicación, seleccione ID de Microsoft Entra. En Registros de aplicaciones, seleccione su aplicación. Haga clic en Copiar para copiar el ID de cliente de su aplicación. Para obtener más información, consulte Registro de una aplicación Microsoft Entra y creación de una entidad de seguridad de servicio.
- Secreto de cliente: La clave de autenticación que se asocia al ID de cliente para autorizar el acceso a Microsoft Azure Data Lake Storage. Para encontrar el secreto de Cliente para su aplicación, seleccione Microsoft Entra ID. En Registros de aplicaciones, seleccione su aplicación. Vaya a Certificados & secretos > Secretos de cliente. Haga clic en Copiar para copiar el secreto de Cliente existente o haga clic en Nuevo secreto de Cliente para crear un nuevo secreto de Cliente y copiarlo. Para obtener más información, consulte Registro de una aplicación Microsoft Entra y creación de una entidad de seguridad de servicio.
- URL de la cuenta de almacenamiento: URL de la cuenta de almacenamiento.
Credencial de contraseña de nombre de usuario de ID de Entra
- ID de cliente: El ID de cliente para autorizar el acceso a Microsoft Azure Data Lake Storage. Para encontrar el ID de cliente de su aplicación, seleccione ID de Microsoft Entra. En Registros de aplicaciones, seleccione su aplicación. Haga clic en Copiar para copiar el ID de cliente de su aplicación. Para obtener más información, consulte Registro de una aplicación Microsoft Entra y creación de una entidad de seguridad de servicio.
- Nombre de usuario y Contraseña: Nombre de usuario y contraseña de la cuenta Microsoft Azure Data Lake Storage. Necesitas permiso para acceder al archivo sin autenticación multifactor.
- URL de la cuenta de almacenamiento: URL de la cuenta de almacenamiento.
- URL de WebHDFS: URL de WebHDFS para acceder a HDFS.
Para conectarse a un ADLS de Gen 2, utilice el formato,https://<account-name>.dfs.core.windows.net/<file-system>
Donde<account-name>
es el nombre que ha utilizado al crear la instancia de ADLS.
Para<file-system>
, utilice el nombre del contenedor que ha creado. Para obtener más información, consulte la documentación de Microsoft Data Lake Storage Gen2 .
- ID de arrendatario: ID de arrendatario de Azure Active Directory
- ID de cliente: el ID de cliente para autorizar el acceso a Microsoft Azure Data Lake Storage
- Secreto de cliente: la clave de autenticación asociada con el ID de cliente para autorizar el acceso a Microsoft Azure Data Lake Storage
Seleccione Proxy de servidor para acceder al origen de datos Azure Data Lake Storage a través de un servidor proxy. En función de su configuración, un servidor proxy puede proporcionar equilibrio de carga, mayor seguridad y privacidad. Los valores del servidor proxy son independientes de las credenciales de autenticación y de la selección de credenciales personales o compartidas.
- Host de proxy: el URL de proxy. Por ejemplo,
https://proxy.example.com
. - Número de puerto de proxy: el número de puerto para conectarse al servidor proxy. Por ejemplo,
8080
o8443
. - La selección de Protocolo proxy para HTTP o HTTPS es opcional.
Para Conectividad privada, para conectarse a una base de datos que no se exterioriza a Internet (por ejemplo, detrás de un cortafuegos), debe configurar una conexión segura.
Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma
- En un proyecto
- Pulse Activos > Nuevo activo > Conectar a un origen de datos. Consulte Adición de una conexión a un proyecto.
- En un espacio de despliegue
- Pulse Importar activos > Acceso a datos > Conexión. Consulte Adición de activos de datos a un espacio de despliegue.
- En el catálogo de activos de la plataforma
- Pulse Nueva conexión. Consulte Adición de conexiones de plataforma.
Paso siguiente: Añadir activos de datos desde la conexión
Dónde puede utilizar esta conexión
Puede utilizar conexiones de Microsoft Azure Data Lake Storage en los siguientes espacios de trabajo y herramientas:
Proyectos
- Decision Optimization
- SPSS Modeler
- Synthetic Data Generator
Catálogos
- Platform assets catalog
Configuración de autenticación de Azure Data Lake Storage
Para configurar la autenticación, necesita un ID de arrendatario, ID de cliente (o aplicación), y un secreto de cliente.
- Gen1:
- Cree una aplicación web Azure Active Directory (Azure AD), obtenga un ID de aplicación, una clave de autenticación y un ID de arrendatario.
- A continuación, debe asignar la aplicación Azure AD a la carpeta o archivo de cuenta de Azure Data Lake Storage. Siga los pasos 1, 2 y 3 en Autenticación de servicio a servicio con Azure Data Lake Storage mediante Azure Active Directory .
- Gen2:
- Siga las instrucciones en Adquirir un token de Azure AD para autorizar solicitudes desde una aplicación cliente . Estos pasos crean una nueva identidad. Después de crear la identidad, establezca los permisos para otorgar acceso a la aplicación a su ADLS. La conexión de Microsoft Azure Data Lake Storage utilizará el ID de cliente, el secreto de cliente y el ID de arrendatario asociados para la aplicación.
- Otorgue acceso a la aplicación Azure al contenedor de almacenamiento utilizando Storage Explorer. Para obtener instrucciones, consulte Usar Azure Storage Explorer para administrar directorios y archivos en Azure Data Lake Storage Gen2 .
Tipos de archivos soportados
La conexión Microsoft Azure Data Lake Storage da soporte a estos tipos de archivo: Avro, CSV, texto delimitado, Excel, JSON, ORC, Parquet, SAS, SAV, SHP y XML.
Formatos de tabla
Además del archivo plano, la conexión de Microsoft Azure Data Lake Storage da soporte a estos formatos de tabla de Data Lake: Delta Lake e Iceberg.
Más información
Tema principal: Conexiones soportadas