Translation not up to date
Aby uzyskać dostęp do danych w produkcie Microsoft Azure Data Lake Storage, należy utworzyć dla niego zasób połączenia.
Azure Data Lake Storage (ADLS) to skalowalna pamięć masowa danych i usługa analityczna udostępniana w chmurze publicznej firmy Microsoft Azure. Połączenie z jeziorem danych Microsoft Azure Data Lake Storage obsługuje dostęp zarówno do repozytoriów Gen1 , jak i Gen2 Azure Data Lake Storage.
Utwórz połączenie z produktem Microsoft Azure Data Lake Storage
Aby utworzyć zasób połączenia, potrzebne są następujące szczegóły połączenia:
- Adres URL WebHDFS : adres URL WebHDFS służący do uzyskiwania dostępu do systemu HDFS.
Aby połączyć się z usługą ADLS pokolenia 2, użyj formatuhttps://<account-name>.dfs.core.windows.net/<file-system>
, gdzie<account-name>
jest nazwą używaną podczas tworzenia instancji usługi ADLS.
W przypadku systemu<file-system>
należy użyć nazwy utworzonego kontenera. Więcej informacji na ten temat zawiera dokumentacja produktu Microsoft Data Lake Storage Gen2.
- Identyfikator najemcy: identyfikator najemcy Azure Active Directory
- Identyfikator klienta: identyfikator klienta do autoryzowania dostępu do pamięci masowej Microsoft Azure Data Lake Storage
- Klucz tajny klienta: klucz uwierzytelniania, który jest powiązany z identyfikatorem klienta na potrzeby autoryzowania dostępu do pamięci masowej Microsoft Azure Data Lake Storage
Wybierz opcję Serwer proxy , aby uzyskać dostęp do źródła danych Azure Data Lake Storage za pośrednictwem serwera proxy. W zależności od konfiguracji serwer proxy może zapewnić równoważenie obciążenia, większe bezpieczeństwo i prywatność. Ustawienia serwera proxy są niezależne od referencji uwierzytelniających i wyboru osobistych lub współużytkowanych referencji.
- Host proxy: adres URL serwera proxy. Na przykład:
https://proxy.example.com
. - Numer portu serwera proxy: Numer portu używany do nawiązywania połączenia z serwerem proxy. Na przykład
8080
lub8443
. - Opcja Protokół proxy dla protokołu HTTP lub HTTPS jest opcjonalna.
W przypadku opcji Połączenia prywatne, aby nawiązać połączenie z bazą danych, która nie jest objęta kontrolą zewnętrzną w Internecie (na przykład za firewallem), należy skonfigurować bezpieczne połączenie.
Wybierz metodę tworzenia połączenia na podstawie miejsca, w którym znajduje się platforma
- W projekcie
- Kliknij opcję Zasoby > Nowy zasób > Narzędzia dostępu do danych > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączenia do projektu.
- W katalogu
- Kliknij opcję Dodaj do katalogu > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie zasobu aplikacyjnego połączenia do katalogu.
- W obszarze wdrażania
- Kliknij opcję Dodaj do obszaru > Połączenie. Patrz sekcja Dodawanie połączeń do obszaru wdrażania.
- W katalogu zasobów platformy Platform assets catalog
- Kliknij opcję Nowe połączenie. Patrz sekcja Dodawanie połączeń platformy.
Następny krok: dodawanie zasobów danych z połączenia
Patrz sekcja Dodawanie danych z połączenia w projekcie.
Patrz sekcja Dodawanie danych z połączenia w katalogu.
Miejsce, w którym można użyć tego połączenia
Połączeń z jeziorem danych Microsoft Azure można używać w następujących obszarach roboczych i narzędziach:
Projekty
- Reguły jakości danych (Watson Knowledge Catalog)
- DataStage (usługaDataStage ). Patrz sekcja Nawiązywanie połączenia ze źródłem danych w programie DataStage.
- Decision Optimization (Watson Studio i Watson Machine Learning)
- Wzbogacanie metadanych (Watson Knowledge Catalog)
- Metadata import (Watson Knowledge Catalog)
- SPSS Modeler (Watson Studio)
Katalogi
Platform assets catalog
Inne katalogi (Watson Knowledge Catalog)
Konfiguracja uwierzytelniania w produkcie Azure Data Lake Storage
Aby skonfigurować uwierzytelnianie, potrzebny jest identyfikator najemcy, klient (lub aplikacja) Identyfikator i klucz tajny klienta.
- Gen1:
- Utwórz aplikację WWW Azure Active Directory (Azure AD), pobierz identyfikator aplikacji, klucz uwierzytelniania i identyfikator najemcy.
- Następnie należy przypisać aplikację Azure AD do pliku lub folderu konta Azure Data Lake Storage. Wykonaj kroki 1, 2 i 3 opisane w sekcji Service-to-service authentication with Azure Data Lake Storage using Azure Active Directory.
- Gen2:
- Postępuj zgodnie z instrukcjami w sekcji Uzyskiwanie znacznika z usługi Azure AD w celu autoryzowania żądań z aplikacji klienckiej. Te kroki umożliwiają utworzenie nowej tożsamości. Po utworzeniu tożsamości należy ustawić uprawnienia do nadawania aplikacji dostępu do usług ADLS. Połączenie z usługą Microsoft Azure Data Lake Storage będzie używać powiązanego identyfikatora klienta, klucza tajnego klienta i identyfikatora najemcy dla aplikacji.
- Przyznaj aplikacji Azure dostęp do kontenera pamięci masowej za pomocą Eksploratora pamięci masowej. Odpowiednie instrukcje zawiera sekcja Używanie programu Azure Storage Explorer do zarządzania katalogami i plikami w Azure Data Lake Storage Gen2.
Obsługiwane typy plików:
Połączenie Microsoft Azure Data Lake Storage obsługuje następujące typy plików: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP i XML.
Więcej inform.
Temat nadrzędny: Obsługiwane połączenia