0 / 0
Go back to the English version of the documentation
Połączenie z produktem Microsoft Azure Data Lake Storage
Last updated: 20 paź 2023
Połączenie z produktem Microsoft Azure Data Lake Storage

Aby uzyskać dostęp do danych w produkcie Microsoft Azure Data Lake Storage, należy utworzyć dla niego zasób połączenia.

Azure Data Lake Storage (ADLS) to skalowalna pamięć masowa danych i usługa analityczna udostępniana w chmurze publicznej firmy Microsoft Azure. Połączenie z jeziorem danych Microsoft Azure Data Lake Storage obsługuje dostęp zarówno do repozytoriów Gen1 , jak i Gen2 Azure Data Lake Storage.

Utwórz połączenie z produktem Microsoft Azure Data Lake Storage

Aby utworzyć zasób połączenia, potrzebne są następujące szczegóły połączenia:

  • Adres URL WebHDFS : adres URL WebHDFS służący do uzyskiwania dostępu do systemu HDFS.
    Aby połączyć się z usługą ADLS pokolenia 2, użyj formatu https://<account-name>.dfs.core.windows.net/<file-system>
    , gdzie <account-name> jest nazwą używaną podczas tworzenia instancji usługi ADLS.
    W przypadku systemu <file-system>należy użyć nazwy utworzonego kontenera. Więcej informacji na ten temat zawiera dokumentacja produktu Microsoft Data Lake Storage Gen2.

  • Identyfikator najemcy: identyfikator najemcy Azure Active Directory
  • Identyfikator klienta: identyfikator klienta do autoryzowania dostępu do pamięci masowej Microsoft Azure Data Lake Storage
  • Klucz tajny klienta: klucz uwierzytelniania, który jest powiązany z identyfikatorem klienta na potrzeby autoryzowania dostępu do pamięci masowej Microsoft Azure Data Lake Storage

Wybierz opcję Serwer proxy , aby uzyskać dostęp do źródła danych Azure Data Lake Storage za pośrednictwem serwera proxy. W zależności od konfiguracji serwer proxy może zapewnić równoważenie obciążenia, większe bezpieczeństwo i prywatność. Ustawienia serwera proxy są niezależne od referencji uwierzytelniających i wyboru osobistych lub współużytkowanych referencji.

  • Host proxy: adres URL serwera proxy. Na przykład: https://proxy.example.com.
  • Numer portu serwera proxy: Numer portu używany do nawiązywania połączenia z serwerem proxy. Na przykład 8080 lub 8443.
  • Opcja Protokół proxy dla protokołu HTTP lub HTTPS jest opcjonalna.

W przypadku opcji Połączenia prywatne, aby nawiązać połączenie z bazą danych, która nie jest objęta kontrolą zewnętrzną w Internecie (na przykład za firewallem), należy skonfigurować bezpieczne połączenie.

Wybierz metodę tworzenia połączenia na podstawie miejsca, w którym znajduje się platforma

W projekcie
Kliknij opcję Zasoby > Nowy zasób > Narzędzia dostępu do danych > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie połączenia do projektu.
W katalogu
Kliknij opcję Dodaj do katalogu > Połączenie. Więcej informacji na ten temat zawiera sekcja Dodawanie zasobu aplikacyjnego połączenia do katalogu.
W obszarze wdrażania
Kliknij opcję Dodaj do obszaru > Połączenie. Patrz sekcja Dodawanie połączeń do obszaru wdrażania.
W katalogu zasobów platformy Platform assets catalog
Kliknij opcję Nowe połączenie. Patrz sekcja Dodawanie połączeń platformy.

Następny krok: dodawanie zasobów danych z połączenia

Miejsce, w którym można użyć tego połączenia

Połączeń z jeziorem danych Microsoft Azure można używać w następujących obszarach roboczych i narzędziach:

Projekty

  • Reguły jakości danych (Watson Knowledge Catalog)
  • DataStage (usługaDataStage ). Patrz sekcja Nawiązywanie połączenia ze źródłem danych w programie DataStage.
  • Decision Optimization (Watson Studio i Watson Machine Learning)
  • Wzbogacanie metadanych (Watson Knowledge Catalog)
  • Metadata import (Watson Knowledge Catalog)
  • SPSS Modeler (Watson Studio)

Katalogi

  • Platform assets catalog

  • Inne katalogi (Watson Knowledge Catalog)

Konfiguracja uwierzytelniania w produkcie Azure Data Lake Storage

Aby skonfigurować uwierzytelnianie, potrzebny jest identyfikator najemcy, klient (lub aplikacja) Identyfikator i klucz tajny klienta.

Obsługiwane typy plików:

Połączenie Microsoft Azure Data Lake Storage obsługuje następujące typy plików: Avro, CSV, Delimited text, Excel, JSON, ORC, Parquet, SAS, SAV, SHP i XML.

Więcej inform.

Jezioro danychAzure

Temat nadrzędny: Obsługiwane połączenia

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more