0 / 0
Powrót do angielskiej wersji dokumentacji
Profile zasobów danych

Profile zasobów danych

Profil zasobu zawiera wygenerowane informacje i statystyki dotyczące treści zasobu. Profil można wyświetlić na stronie Profil zasobu.

Wymagania i ograniczenia

Profil zasobów aplikacyjnych można wyświetlić w następujących okolicznościach.

Wymagane uprawnienia

Aby wyświetlić stronę Profil zasobu danych, można mieć dowolną rolę w projekcie lub katalogu.

Aby utworzyć lub zaktualizować profil, użytkownik musi mieć przypisaną rolę Administrator lub Edytujący w projekcie lub katalogu.

Obszary robocze

Profil zasobu można wyświetlić w projektach.

Typy zasobów

Te typy zasobów aplikacyjnych mają profil:

 • Zasoby danych z relacyjnych lub nierelacyjnych baz danych z połączenia do źródeł danych, z wyjątkiem Cloudant

 • Zasoby danych z partycjonowanych zestawów danych, w których partycjonowany zestaw danych składa się z wielu plików i jest reprezentowany przez jeden folder przesłany z lokalnego systemu plików lub z połączeń opartych na plikach do źródeł danych.

 • Zasoby danych z plików przesłanych z lokalnego systemu plików lub z połączeń opartych na plikach do źródeł danych, z następującymi formatami:

  • CSV
  • XLS, XLSM, XLSX (profilowany jest tylko pierwszy arkusz w skoroszycie).
  • TSV
  • Avro
  • Parkiet

  Jednak ustrukturyzowane pliki danych nie są profilowane, gdy zasoby danych nie odwołują się jawnie do tych plików, np. w takich okolicznościach:

  • Pliki znajdują się w połączonym zasobie folderu. Pliki, które są dostępne z połączonego zasobu folderu, nie są traktowane jako zasoby i nie są profilowane.
  • Pliki znajdują się w pliku archiwum. Plik archiwum jest przywoływany przez zasób danych, a skompresowane pliki nie są profilowane.

Tworzenie profilu

W projektach można utworzyć profil dla zasobu danych, klikając opcję Utwórz profil. Istnieje możliwość zaktualizowania istniejącego profilu po zmianie danych.

Wyniki profilowania

Po utworzeniu lub zaktualizowaniu profilu zasobu analizowane są kolumny w zasobie danych. Domyślnie profil jest tworzony w oparciu o pierwsze 5000 wierszy danych. Jeśli zasób danych zawiera więcej niż 250 kolumn, profil jest tworzony w oparciu o pierwsze 1000 wierszy danych.

Profil zasobu danych zawiera informacje na temat każdej kolumny w zestawie danych:

 • Gdy profil został utworzony lub ostatnio zaktualizowany.
 • Liczba przeanalizowanych kolumn i wierszy.
 • Typy danych dla rozkładu kolumn i typów danych.
 • Formaty danych dla rozkładu kolumn i formatów.
 • Procent dopasowanych, niezgodnych lub brakujących danych dla każdej kolumny.
 • Rozkład częstości dla wszystkich wartości zidentyfikowanych w kolumnie.
 • Statystyki dotyczące danych dla każdej kolumny:
  • Liczba odrębnych wartości wskazuje, ile różnych wartości znajduje się w danych próbkowanych dla kolumny.
  • Wartość procentowa unikalnych wartości wskazuje wartość procentową odrębnych wartości, które pojawiają się tylko raz w kolumnie.
  • Minimalne, maksymalne lub średnie, a czasami odchylenie standardowe w tej kolumnie. W zależności od formatu danych kolumny statystyki różnią się nieznacznie. Na przykład statystyki dla kolumny typu danych typu integer mają wartości minimalne, maksymalne i średnie oraz wartość odchylenia standardowego, podczas gdy statystyka dla kolumny typu danych typu łańcuchowego ma minimalną długość, maksymalną długość i średnią długość.

Temat nadrzędny: Typy zasobów i właściwości

Generatywne wyszukiwanie i odpowiedź AI
Odpowiedzi te są generowane przez duży model języka w pliku watsonx.ai w oparciu o treść z dokumentacji produktu. Dowiedz się więcej