0 / 0
Wróć do wersji angielskiej dokumentacji
Typy i właściwości zasobów
Typy i właściwości zasobów

Typy i właściwości zasobów

Zasób jest elementem, który zawiera metadane dotyczące danych, innych typów informacji lub kodu operacyjnego. Użytkownik pracuje z zasobami w całej platformie Cloud Pak for Data (Cloud Pak for Data), w tym w głównych obszarach roboczych: projektach, katalogach i obszarach wdrażania.

Aby zrozumieć zasoby aplikacyjne, należy znać różne typy zasobów aplikacyjnych, ich właściwości i miejsca, w których można je znaleźć:

Obszary robocze dla zasobów

Każdy zasób aplikacyjny w dowolnym z obszarów roboczych, dla którego jest współpracownik, można znaleźć, wyszukując go z poziomu globalnego paska wyszukiwania. Więcej informacji na ten temat zawiera sekcja Wyszukiwanie zasobów aplikacyjnych na platformie.

To, co można zrobić z zasobami, zależy od typu zasobu i od typu obszaru roboczego.

Projekty W przypadku współpracy z innymi osobami w celu pracy z danymi. Na przykład: można przygotować dane, przeanalizować dane lub utworzyć modele w projektach. W projektach można tworzyć wszystkie typy zasobów aplikacyjnych, a także uruchamiać zasoby operacyjne. Patrz Projekty.

Katalogi W przypadku przechowywania zasobów aplikacyjnych w celu udostępnienia ich do współużytkowania dla organizacji. Zasoby z katalogów można kopiować do projektów, aby pracować z nimi, lub publikować zasoby aplikacyjne z projektów w katalogu. Do katalogu można publikować wszystkie typy zasobów danych oraz niektóre typy zasobów operacyjnych. Istnieje możliwość edytowania metadanych zasobów w katalogu, ale nie można uruchamiać zasobów operacyjnych. Patrz: Katalogi.

Obszary wdrażania W przypadku wdrażania modeli lub innych zasobów w środowisku produkcyjnym. Zasoby możliwe do wdrożenia można kopiować z projektów do obszarów wdrażania, a następnie tworzyć wdrożenia z tych zasobów aplikacyjnych. Patrz Obszary wdrażania.

Data virtualization W przypadku tworzenia tabel wirtualnych przez połączenie lub segmentację jednej lub większej liczby tabel. Tabele wirtualne są publikowane jako zasoby danych w katalogu. Patrz sekcja Wirtualizowanie danych.

Zasoby danych

Zasoby danych zawierają metadane dotyczące danych, w tym informacje na temat uzyskiwania dostępu do danych.

Sposób tworzenia zasobu danych zależy od tego, gdzie są następujące dane:

  • Jeśli dane znajdują się w pliku, należy przesłać plik z systemu lokalnego do projektu, katalogu lub obszaru wdrażania.
  • Jeśli dane znajdują się w zdalnym źródle danych, należy najpierw utworzyć zasób połączenia , który definiuje połączenie z tym źródłem danych. Następnie należy utworzyć zasób danych, wybierając połączenie, ścieżkę lub inną strukturę, a także tabelę lub plik, który zawiera dane. Ten typ zasobu danych jest nazywany połączonym zasobem danych.

Typy zasobów danych

Zasób danych z pliku Zasób danych z pliku wskazuje na plik, który został przesłany z systemu lokalnego. Plik jest przechowywany w kontenerze obiektowej pamięci masowej w instancji IBM Cloud Object Storage , która jest powiązana z projektem, katalogiem lub miejscem wdrożenia. Zawartość pliku może zawierać ustrukturyzowane dane, nieustrukturyzowane dane tekstowe, obrazy i inne typy danych. Użytkownik może utworzyć zasób danych z plikiem dowolnego formatu. Można jednak wykonać więcej czynności w plikach CSV niż w przypadku innych typów plików.

Połączony zasób danych Połączony zasób danych wskazuje na tabelę, plik lub folder, do którego dostęp odbywa się za pośrednictwem połączenia ze zdalnym źródłem danych. Połączenie jest zdefiniowane w zasobie połączenia powiązanym z połączonym zasobem danych. Dostęp do połączonego zasobu danych powoduje, że dane są pobierane dynamicznie ze źródła danych.

Zasób danych folderu jest specjalnym przypadkiem połączonego zasobu danych. Wskazuje on folder w IBM Cloud Object Storage. Zasób danych folderu tworzy się poprzez określenie ścieżki do folderu i zasobu połączenia IBM Cloud Object Storage . Istnieje możliwość wyświetlenia plików i podfolderów, które współużytkują ścieżkę z zasobem danych folderu. Pliki, które można wyświetlić w zasobie danych folderu, nie są samymi zasobami danych. Na przykład można utworzyć zasób danych folderu dla ścieżki, która zawiera kanały informacyjne, które są aktualizowane w sposób ciągły.

Zasób połączenia Zasób połączenia jest uważany za typ zasobu danych. Zawiera on informacje niezbędne do utworzenia połączenia ze źródłem danych. Można wybrać opcję udostępnienia współużytkowanych informacji autoryzacyjnych dla wszystkich użytkowników, którzy mają dostęp do zasobu połączenia w celu użycia, lub określić, że każdy użytkownik musi wprowadzić swoje dane uwierzytelniające, gdy korzystają z połączenia. Projekty i katalogi obsługują wiele typów połączeń zarówno dla IBM , jak i źródeł danych części trzeciej.

Patrz sekcja Dodawanie danych do projektu, Dodawanie zasobów aplikacyjnych do katalogui Dodawanie zasobów danych do miejsca wdrażania.

Aktywa operacyjne

Zasoby operacyjne to sposób pracy z danymi w projektach przy użyciu narzędzi, które przygotowują dane, analizują dane lub budują modele. Zasoby operacyjne są tworzone przy użyciu narzędzi w projektach. Na przykład notatnik Jupyter jest zasobem operacyjnym, który można utworzyć za pomocą narzędzia edytora notatnika w celu przeanalizowania danych.

Uruchamianie zasobów operacyjnych

Podczas uruchamiania zasobów operacyjnych należy używać zasobów obliczeniowych. Zasoby obliczeniowe są mierzone w godzinach jednostki mocy obliczeniowej (CUH) i są śledzone. W zależności od planów usług, możesz mieć ograniczoną ilość CUH miesięcznie, lub ponosić dodatkowe opłaty, jeśli przekroczysz określoną ilość CUH na miesiąc.

W przypadku wielu zasobów operacyjnych użytkownik może wybrać konfigurację środowiska obliczeniowego do użycia. Zwykle większe i szybsze konfiguracje środowiska zużywają zasoby obliczeniowe szybciej. Patrz: Środowiska.

Za każdym razem, gdy uruchamiasz zasób operacyjny, jest on uznawany za zadanie. Zadania można monitorować i planować. Patrz Zadania.

Rodzaje aktywów operacyjnych

Wiele zasobów operacyjnych jest udostępnianych przez usługi podstawowe. Niektóre zasoby operacyjne wymagają jednak innych usług.

Te typy zasobów operacyjnych można tworzyć bez dodatkowych usług:

  • Data Refinery przepływy w celu zawężania danych za pomocą narzędzia Data Refinery .
  • notebooki Jupyter do analizy danych lub modeli budowania. Używany jest edytor notatnika Jupyter.
  • SPSS Modeler -umożliwia zautomatyzowanie przepływu danych za pomocą modelu z algorytmami SPSS w programie SPSS Modeler.
  • Decision Optimization w celu rozwiązania scenariuszy w programie budującym model Decision Optimization .
  • Eksperymenty AutoAI , aby zbudować model bez konieczności pisania kodu w narzędziu AutoAI .

  • Import metadanych służy do importowania metadanych zasobu aplikacyjnego do projektu lub katalogu.

  • Wzbogacanie metadanych w celu wzbogacenia zasobów danych w projekcie z wynikami profilowania i analizy jakości danych oraz z terminami biznesowymi.

Te zasoby operacyjne wymagają innych usług. Każdą usługę można udostępnić podczas tworzenia pierwszego zasobu, który go potrzebuje:

  • DataStage przepływy umożliwiają tworzenie zadań transformacji danych za pomocą narzędzia DataStage . Wymaga usługi DataStage .
  • Panele kontrolne , aby wizualizować dane bez kodu w edytorze paneli kontrolnych. Wymaga usługi Cognos Dashboards .

Jeśli usługa Watson Knowledge Catalog jest posiadana bez produktu Watson Studio, można utworzyć przepływy Data Refinery , metadane importu metadanych oraz zasoby wzbogacania metadanych.

Zasoby aplikacyjne konfiguracji

Zasoby aplikacyjne konfiguracji są szablonami wielokrotnego użytku w projektach, aby skonfigurować inne zasoby aplikacyjne lub zadania.

Za pomocą usługi DataStage można tworzyć następujące typy zasobów aplikacyjnych konfiguracji:

  • PodprzepływyDataStage , aby gromadzić zestaw etapów i konektorów do ponownego wykorzystania w przepływach DataStage .
  • Definicje danych , aby określić metadane kolumny dla zasobu danych w celu ponownego wykorzystania w zadaniach przepływu DataStage .
  • Zestawy parametrów służą do gromadzenia wielu parametrów zadania o określonych wartościach do ponownego wykorzystania w zadaniach.

Właściwości zasobu, metadane i relacje

Wszystkie zasoby mają wspólne metadane, które są widoczne wszędzie. Inne właściwości zasobu różnią się w zależności od typu zasobu i miejsca, w którym zasób jest.

Wspólne właściwości

Wszystkie zasoby mają wspólne właściwości, które są widoczne i edytowalne w projektach, katalogach i obszarach wdrażania.

Nazwa Może zawierać do 100 znaków. Obsługuje znaki wielobajtowe. Nie może być pusta, zawierać znaki sterujące Unicode lub zawierać tylko spacje. Nazwy zasobów aplikacyjnych nie muszą być unikalne w ramach projektu lub miejsca wdrożenia. To, czy nazwy zasobów muszą być unikalne w katalogu, zależy od zduplikowanej metody obsługi ustawionej dla katalogu.

Opis Opcjonalne. Może zawierać do 245 znaków, nie licząc spacji. Obsługuje znaki wielobajtowe i odsyłacze hipertekstowe.

Automatycznie generowane lub wykrywane metadane mogą zawierać inne informacje, w zależności od typu zasobu, takie jak data dodania, rozmiar, data utworzenia, ostatni edytor, data ostatniej modyfikacji, harmonogram, współużytkowany, język, typ modelu i status.

Niektóre typy zasobów aplikacyjnych mogą mieć znaczniki, które są niezarządzane metadane, które ułatwiają wyszukiwanie zasobu. Znaczniki mogą zawierać tylko puste spacje, litery, znaki wielobajtowe, cyfry, znaki podkreślenia, myślniki i symbole # i @. Współpracownicy obszaru projektu, katalogu lub obszaru wdrażania z rolą administratora lub edytującego mogą tworzyć znaczniki i dodawać je do zasobów aplikacyjnych.

Więcej informacji o aktywach

Zasoby aplikacyjne mogą mieć więcej właściwości, relacji i metadanych.

Prywatność zasobu Domyślnie ustawiona na wartość publiczną. To ustawienie może ograniczyć dostęp do zasobu w katalogu, gdy jest on ustawiony na wartość prywatną. Tylko właściciel i członkowie zasobu mogą wyświetlać i używać zasobów prywatnych.

Właściciel zasobu i elementy zasobów Domyślnie właścicielem zasobu jest użytkownik, który dodał zasób do katalogu. Członkowie zasobu mogą wyświetlać i używać zasobu, gdy jest oznaczony jako prywatny.

Artefakty zarządzania Mogą być przypisywane automatycznie przez właściciela zasobu lub przez zarządców danych. Artefakty zarządzania mogą dodawać metadane i relacje do zasobów aplikacyjnych lub maskować dane wrażliwe w zasobach danych. Informacje te są ogólnie dostępne w katalogach. W przypadku niektórych typów zasobów informacje te są również dostępne w projektach.

Atrybuty niestandardowe Opcjonalne. Atrybuty niestandardowe są wyświetlane w sekcji Szczegóły na karcie Przegląd zasobu w katalogu. Dla zasobów aplikacyjnych z interfejsami API można tworzyć atrybuty niestandardowe.

Podgląd zasobu podgląd zasobu. Treść, która jest widoczna w podglądzie, zależy od typu zasobu, pliku lub danych.

Recenzje i oceny Wszyscy współpracownicy katalogu mogą ocenić i przeglądać zasoby aplikacyjne.

Więcej informacji na temat zasobów danych

W zależności od formatu danych w zasobach danych można wyświetlić więcej informacji po otwarciu zasobu.

Ścieżka do danych Informacje niezbędne do uzyskania dostępu do danych. Połączony zasób danych dla tabeli w bazie danych zawiera odwołanie do zasobu połączenia dla bazy danych, schematu lub innych informacji o ścieżce oraz nazwę tabeli. Zasób danych dla pliku przesyłania ma odwołanie do położenia pliku w kontenerze pamięci masowej obiektu dla projektu, katalogu lub obszaru wdrażania.

Format pliku Typ MIME pliku. Wykryto automatycznie.

Profil danych A profil danych, dla danych z relacyjnych źródeł danych, a także dla CSV, TSV, Avro, Parkiet, Microsoft Word, Microsoft Excel (tylko pierwszy arkusz w skoroszycie), PDF, tekst i pliki HTML.

Działania Historia produktu działania wykonywana na zasobie w projektach i katalogach. Niezależnie od tego, czy działania można wyświetlać, zależą od Plan oferty produktu Watson Knowledge Catalog.

Dodatkowe informacje

Temat nadrzędny: Przegląd programu IBM Cloud Pak for Data as a Service