Translation not up to date
Aby uzyskać dostęp do danych w Microsoft Azure Data Lake Storage, utwórz dla nich zasób połączenia.
Azure Data Lake Storage (ADLS) to skalowalna pamięć masowa danych i usługa analityczna udostępniana w chmurze publicznej firmy Microsoft Azure. Połączenie Microsoft Azure Data Lake Storage obsługuje dostęp do repozytoriów Gen1 i Gen2 Azure Data Lake Storage.
Utwórz połączenie z Microsoft Azure Data Lake Storage
Aby utworzyć zasób połączenia, potrzebne są następujące szczegóły połączenia:
- Adres URL WebHDFS : adres URL WebHDFS służący do uzyskiwania dostępu do systemu HDFS.
Aby połączyć się z usługą ADLS pokolenia 2, użyj formatuhttps://<account-name>.dfs.core.windows.net/<file-system>
, gdzie<account-name>
jest nazwą używaną podczas tworzenia instancji usługi ADLS.
W przypadku systemu<file-system>
należy użyć nazwy utworzonego kontenera. Więcej informacji na ten temat zawiera dokumentacja produktu Microsoft Data Lake Storage Gen2.
- Identyfikator najemcy: identyfikator najemcy Azure Active Directory
- Identyfikator klienta: identyfikator klienta na potrzeby autoryzowania dostępu do Microsoft Azure Data Lake Storage
- Klucz tajny klienta: klucz uwierzytelniania powiązany z identyfikatorem klienta w celu autoryzowania dostępu do Microsoft Azure Data Lake Storage
Wybierz opcję Serwer proxy , aby uzyskać dostęp do źródła danych Azure Data Lake Storage za pośrednictwem serwera proxy. W zależności od konfiguracji serwer proxy może zapewnić równoważenie obciążenia, większe bezpieczeństwo i prywatność. Ustawienia serwera proxy są niezależne od referencji uwierzytelniających i wyboru osobistych lub współużytkowanych referencji.
- Host proxy: adres URL serwera proxy. Na przykład:
https://proxy.example.com
. - Numer portu serwera proxy: Numer portu używany do nawiązywania połączenia z serwerem proxy. Na przykład
8080
lub8443
. - Opcja Protokół proxy dla protokołu HTTP lub HTTPS jest opcjonalna.
W przypadku opcji Połączenia prywatne, aby nawiązać połączenie z bazą danych, która nie jest objęta kontrolą zewnętrzną w Internecie (na przykład za firewallem), należy skonfigurować bezpieczne połączenie.
Wybierz metodę tworzenia połączenia na podstawie miejsca, w którym znajduje się platforma
- W projekcie
- Kliknij opcję Zasoby > Nowe zadanie > Połącz ze źródłem danych. Więcej informacji na ten temat zawiera sekcja Dodawanie połączenia do projektu.
- W obszarze wdrażania
- Kliknij opcję Dodaj do obszaru > Połączenie. Patrz sekcja Dodawanie połączeń do obszaru wdrażania.
- W katalogu zasobów platformy Platform assets catalog
- Kliknij opcję Nowe połączenie.
Następny krok: dodawanie zasobów danych z połączenia
- Patrz sekcja Dodawanie danych z połączenia w projekcie.
Miejsce, w którym można użyć tego połączenia
Połączeń Microsoft Azure Data Lake Storage można używać w następujących obszarach roboczych i narzędziach:
Projekty
- Decision Optimization
- SPSS Modeler
Katalogi
- Platform assets catalog
Konfiguracja uwierzytelniania w produkcie Azure Data Lake Storage
Aby skonfigurować uwierzytelnianie, potrzebny jest identyfikator najemcy, klient (lub aplikacja) Identyfikator i klucz tajny klienta.
- Gen1:
- Utwórz aplikację WWW Azure Active Directory (Azure AD), pobierz identyfikator aplikacji, klucz uwierzytelniania i identyfikator najemcy.
- Następnie należy przypisać aplikację Azure AD do pliku lub folderu konta Azure Data Lake Storage. Wykonaj kroki 1, 2 i 3 opisane w sekcji Service-to-service authentication with Azure Data Lake Storage using Azure Active Directory.
- Gen2:
- Postępuj zgodnie z instrukcjami w sekcji Uzyskiwanie znacznika z usługi Azure AD w celu autoryzowania żądań z aplikacji klienckiej. Te kroki umożliwiają utworzenie nowej tożsamości. Po utworzeniu tożsamości należy ustawić uprawnienia do nadawania aplikacji dostępu do usług ADLS. Połączenie Microsoft Azure Data Lake Storage będzie używać powiązanego identyfikatora klienta, klucza tajnego klienta i identyfikatora najemcy dla aplikacji.
- Przyznaj aplikacji Azure dostęp do kontenera pamięci masowej za pomocą Eksploratora pamięci masowej. Odpowiednie instrukcje zawiera sekcja Używanie programu Azure Storage Explorer do zarządzania katalogami i plikami w Azure Data Lake Storage Gen2.
Obsługiwane typy plików:
Połączenie Microsoft Azure Data Lake Storage obsługuje następujące typy plików: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP i XML.
Więcej inform.
Temat nadrzędny: Obsługiwane połączenia