0 / 0
Go back to the English version of the documentation
Zarządzanie wzbogacaniem metadanych
Last updated: 18 lip 2023
Zarządzanie wzbogacaniem metadanych

Zasoby danych można wzbogacać informacjami, które pomagają użytkownikom szybciej znaleźć dane, decydować, czy dane są odpowiednie dla danego zadania, czy mogą ufać danych, a także jak pracować z danymi. Informacje te obejmują na przykład terminy, które definiują znaczenie danych, reguły, które dokumentują prawo własności lub określają standardy jakości, lub przeglądy.

Zarządcy danych tworzą profile zasobów, aby zrozumieć znaczenie danych i ocenić jego jakość. Można również dodać kontekst biznesowy do danych, przypisując terminy. Wzbogacanie metadanych automatyzuje ten proces, zwiększając w ten sposób produktywność zarządcy danych.

Dane są przydatne tylko wtedy, gdy zaufany jest jego kontekst, treść i jakość. W ten sposób dane muszą być w sposób ciągły poddawane ocenie i w razie potrzeby podejmowane są odpowiednie działania w zakresie remediacji. Zarządcy danych mogą konfigurować powtarzające się zadania w taki sposób, aby stale śledziły zmiany treści i struktury danych, a następnie analizują tylko te dane, które uległy zmianie.

Informacje dodawane do zasobów za pomocą wzbogacania metadanych pomagają również chronić dane, ponieważ mogą być używane w strategiach ochrony danych w celu maskowania danych lub ograniczenia dostępu.

Wymagane usługi

Watson Knowledge Catalog

Format daty

Tabele z relacyjnych i nierelacyjnych źródeł danych

Pliki przesłane z lokalnego systemu plików lub z połączeń opartych na plikach do źródeł danych, z następującymi formatami: CSV, TSV, Avro, Parquet, Microsoft Excel (xls, xlsm i xlsx; tylko pierwszy arkusz w skoroszycie jest profilowany dla plików przesyłanych z lokalnego systemu plików).

Te ustrukturyzowane pliki danych nie są profilowane:

  • Pliki w ramach połączonego zasobu folderu. Pliki, które są dostępne z połączonego zasobu folderu, nie są traktowane jako zasoby i nie są profilowane.
  • Pliki w pliku archiwum. Plik archiwum jest przywoływany przez zasób danych, a skompresowane pliki nie są profilowane.

Zasoby danych można wzbogacać ze źródeł danych wymienionych w sekcji Obsługiwane źródła danych na potrzeby importowania metadanych, wzbogacania metadanych i reguł jakości danych.

Wielkość danych

Dowolny; zestawy danych z połączeń opartych na plikach nie mogą mieć więcej niż 4,999 kolumn

wymagane uprawnienia

Aby tworzyć i zarządzać wzbogacaniem metadanych, zarządzać nimi, należy mieć w projekcie rolę Administrator lub Edytujący , a użytkownik musi mieć przynajmniej dostęp do kategorii, które mają być używane w ramach wzbogacania. Ponadto użytkownik musi mieć autoryzację do uzyskiwania dostępu do połączeń ze źródłami danych zasobów danych, które mają być wzbogacone.

Zamiast interfejsu użytkownika można także tworzyć, edytować, uruchamiać lub usuwać wzbogacanie metadanych za pomocą funkcji API. Odsyłacze do tych interfejsów API są wymienione w sekcji Dowiedz się więcej .

Przegląd wzbogacania metadanych

Wzbogacanie zasobów danych obejmuje następujący proces:

  1. Zidentyfikuj zasoby danych, które mają być wzbogacone.

  2. W projekcie utwórz zasób wzbogacania metadanych, aby skonfigurować szczegóły wzbogacania, takie jak zakres i cel wzbogacenia, oraz harmonogram zadania wzbogacania.

  3. Uruchom zadanie wzbogacania.

  4. Dla każdego zasobu danych zawartego w wzbogacaniu, praca z wynikami w zasobie wzbogacania metadanych:

    1. Zidentyfikuj anomalie i problemy dotyczące jakości i podejmij odpowiednie działania w celu podjęcia natychmiastowych działań.
    2. Umożliwia sprawdzenie przypisań terminów oraz ocenę i działanie na podstawie sugestii dotyczących terminów.
    3. Zarządzanie przypisaniami klas danych na poziomie kolumny.

    Użytkownik może również uzyskać dostęp do wyników wzbogacania i pracować z nimi w profilu każdego zasobu pojedynczego. Patrz sekcja Profile zasobów aplikacyjnych.

  5. Należy ponownie ocenić dane zasoby aplikacyjne.

Zamiast interfejsu użytkownika można wykonywać większość zadań z interfejsami API. Odsyłacze do produktu Interfejs API danych produktu Watson są wyświetlane dla każdego odpowiedniego zadania.

O ile można dodawać pojedyncze połączone zasoby do wzbogacania metadanych, to wzbogacanie metadanych jest przeznaczone do masowego przetwarzania zasobów danych dodanych do projektu za pośrednictwem importu metadanych.

Aby zapewnić spójne korzystanie z opcji wzbogacania, można skonfigurować ustawienia domyślne dla wszystkich zasobów wzbogacania metadanych w projekcie. Aby można było skonfigurować te ustawienia, w projekcie musi istnieć co najmniej jeden zasób wzbogacania metadanych. Aby otworzyć stronę ustawień, należy otworzyć istniejący zasób wzbogacania metadanych i kliknąć opcję Ustawienia domyślne.

Więcej inform.

Następne kroki

Temat nadrzędny: Kuracja danych

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more