0 / 0
Go back to the English version of the documentation
Importowanie plików dla zbiorów danych odniesienia
Last updated: 18 sie 2023
Importowanie plików dla zbiorów danych odniesienia

Zestawy danych odniesienia można tworzyć poza katalogiem w formacie CSV (wartości rozdzielane przecinkami), a następnie importować lub ponownie importować wartości. Można także importować relacje wartości-odwzorowania między wartościami w wielu zestawach danych odniesienia.

Aby zaimportować zestawy danych odniesienia, użyj jednej z następujących metod:

  • Zaimportuj jeden lub więcej zestawów danych odniesienia z wcześniej wyeksportowanego pliku ZIP za pomocą żądania API.
  • Importuj informacje o zestawie danych z pliku CSV za pomocą interfejsu użytkownika lub żądania API. Wiele zbiorów danych odniesienia można zaimportować w jednym pliku. Ta metoda nie zawiera wartości danych odniesienia-należy je importować oddzielnie.
  • Zaimportuj wartości danych odniesienia z pliku CSV dla konkretnego zestawu przy użyciu interfejsu użytkownika lub żądania API.
  • Zaimportuj pokrewne wartości danych odniesienia z pliku CSV do istniejącego zestawu danych odniesienia za pomocą interfejsu użytkownika lub żądania API.
Uwaga: Maksymalna liczba wartości, które można zaimportować, wynosi 5000.

Plany Watson Knowledge Catalog mają ograniczenia dotyczące liczby i wielkości zestawów danych odniesienia, które można utworzyć.

Podczas importowania lub eksportowania zestawu danych odniesienia w pliku ZIP plik zawiera plik CSV, który definiuje zestawy danych odniesienia zawarte w tym pliku ZIP oraz, w oddzielnym folderze, jeden plik CSV na zestaw zawierający wartości danych odniesienia. Te pliki CSV mają inny format.

Plik CSV zbioru danych odniesienia definiuje właściwości każdego dołączonego zestawu, takie jak jego identyfikator artefaktu, nazwa, opis, kategoria, do której należy, oraz typ zestawu danych odniesienia. Może mieć następujący format:

artifact_id,Name,Artifact Type,Category,Description,Secondary Categories,Related Terms,Data Set Type
026df326-74f2-4dce-8d6b-7d2f36b09d98,Customer Non Performing Loan Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,Distinguishes between Customers according to their number of outstanding non-performing loans.,ecf8fade-4956-4e92-9a56-308949f0cb58,a9a63e90-94df-4b00-95ec-a951189d2183,TEXT
0544a0b7-07b7-4509-8cbe-22e36caa218b,Household Life Cycle Status,reference_data,8a72919e-8c40-4a73-b190-4803deb2160d,Distinguishes between Households according to the state of existence of the Household.,ecf8fade-4956-4e92-9a56-308949f0cb58,3a6f0d98-64fc-4166-b3e4-7f2ebcbeac9f,TEXT
07cf348c-76a3-482c-9614-2b89edabbaaf,Financial Legal Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,"Distinguishes between Individuals or Organizations according to whether they are undergoing proceedings that affect their financial standing; for example, (US) Chapter 11 status, In Liquidation, In Receivership, Bankrupt.",ecf8fade-4956-4e92-9a56-308949f0cb58,03976617-abe9-4e5a-88cf-57193b22cce1,TEXT

Plik CSV dla wartości danych odniesienia na minimum składa się z następujących kolumn, które są zdefiniowane dla zbioru danych odniesienia:

  1. Kod
  2. Wartość
  3. Opis (opcjonalny)
  4. Element nadrzędny (opcjonalnie)

Może on również zawierać inne informacje, takie jak pokrewne wartości danych odniesienia lub kolumny niestandardowe.

Na przykład, pierwsze kilka wierszy danych odniesienia dla kodów NAICS wygląda następująco:

Code,value,description,parent
11,Agriculture, Forestry, Fishing and Hunting
111,Crop Production,Crop Produ,11
1111,Oilseed and Grain Farming,111
11111,Soybean Farming,Soybean Farming,1111
111110,Soybean Farming,Soybean Farming,1111
11112,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111
111120,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111

Więcej informacji na temat formatowania plików CSV w pliku Format pliku CSV na potrzeby importowania artefaktów zarządzania. Różne metody importowania są opisane w sekcji Importowanie metod dla artefaktów zarządzania.

W poniższych sekcjach opisano sposób importowania plików CSV dla zestawów danych referencyjnych za pomocą interfejsu użytkownika.

Importowanie plików z wartościami danych odniesienia

W wybranym odwołaniu się zestawu danych kliknij opcję Prześlij plik , aby wybrać plik CSV, z którego mają zostać zaimportowane wartości:

  • Wiersze w pliku z istniejącymi kodami aktualizują istniejące wiersze.
  • Wiersze z nowymi kodami są dodawane.

Podczas importowania wartości z pliku CSV należy odwzorować kolumny z pliku na wszystkie kolumny domyślne lub niestandardowe. Jeśli kolumny nie istnieją, można je utworzyć.

Importowanie kolumn niestandardowych

Wartości w zbiorze danych odniesienia domyślnie mają następujące kolumny: kod, wartość, opis (opcjonalnie) i element nadrzędny (opcjonalny). Użytkownik może jednak chcieć przechwycić dodatkowe informacje związane z kodem w kolumnach niestandardowych. Na przykład może być używany zestaw danych odniesienia dla kodów krajów i wymagane jest przechwytywanie niektórych innych atrybutów, takich jak premier kraju, języka lub alternatywnych nazw.

Istnieje możliwość dodania kolumn niestandardowych podczas tworzenia zbioru danych odniesienia z pliku CSV, w którym zdefiniowane są takie kolumny, lub podczas importowania lub ponownego importowania wartości z pliku CSV do istniejącego zestawu danych odniesienia.

Poniżej znajduje się przykład fragmentu pliku CSV z kolumnami niestandardowymi. Ten plik może być używany do importowania lub ponownego importowania wartości.

code,value,description,Capital City,National Day,Official Language,Population
AFG,Afghanistan,The Islamic Republic of Afghanistan,Kabul,19/08/1919,دری,37200000
ALA,Åland Islands,Åland,Mariehamn,07/05/1920,svɛ̂nːska,28007
ALB,Albania,The Republic of Albania,Tirana,28/11/1912,Albanian,2850000
DZA,Algeria,The People's Democratic Republic of Algeria,Algiers,05/07/1962,الجزائر‎,42200000
ASM,American Samoa,The Territory of American Samoa,Pago Pago,14/06/1889,English,55465

Aby zaimportować niestandardowe kolumny do referencyjnego zestawu danych:

  1. Otwórz odwołanie do zestawu danych i kliknij opcję Prześlij plik. Podaj plik CSV i kliknij przycisk Dalej.
  2. Odwzoruj kolumny z pliku na kolumny domyślne lub exisitng w zestawie danych odniesienia. Aby dodać nową kolumnę niestandardową z listy rozwijanej Kolumna docelowa , wybierz opcję + Dodaj kolumnę niestandardową (opcjonalnie).
  3. Podaj nazwę kolumny, opis, maksymalną liczbę znaków i określ, czy należy sprawdzać poprawność wartości kolumn względem kodu innego zbioru danych odniesienia.
  4. Kolumnę niestandardową można oznaczyć jako część klucza złożonego. Kolumny niestandardowe, które są częścią klucza złożonego, są domyślnie obowiązkowe.
  5. Powtórz kroki dla każdej kolumny z pliku CSV, który ma zostać odwzorowany.
  6. Podczas odwzorowywania wszystkich kolumn należy przejrzeć informacje, zmienić kolejność kolumn, jeśli jest to wymagane, a następnie kliknąć przycisk Zapisz.

Importowanie powiązanych wartości

Istnieje możliwość importowania relacji między wartościami w zestawach danych odniesienia przy użyciu pliku CSV. Wartości w źródłowych i docelowych zestawach danych odniesienia muszą istnieć w systemie w celu tworzenia relacji, w przeciwnym razie relacje nie są importowane. Najpierw zaimportuj oba pokrewne zestawy danych odniesienia, a następnie użyj tych samych plików CSV do zaimportowania relacji.

Poniżej znajduje się przykład pliku CSV z odwzorowaniami wartości.

code,value,description,map_1_n_to_states,map_1_1_continents
IND,India,Asian country,"KA,AP,MP,DL,GJ",ASIA
USA,America,North American Country,"CA,FL,NY,TX",NorthAmerica
GER,Germany,European Country,,Europe

Aby dodać pokrewne wartości, importując plik CSV, wykonaj następujące kroki:

  1. Otwórz referencyjny zestaw danych, dla którego chcesz dodać powiązane wartości.
  2. W menu z trzema kropkami kliknij opcję Prześlij powiązane wartości.
  3. Dodaj plik, który ma zostać przesłany, przeciągając go do okna Importuj wartości pokrewne lub przeglądając plik. Następnie kliknij przycisk Dalej.
  4. Wybierz kolumnę z pliku, która ma wartości kodów, które mają być odwzorowane na jedną lub więcej wartości kodu.
  5. Wybierz typ relacji (jeden-do-jednego lub jednego-do-wielu), jaki ma być między każdą wartością i wartością pokrewnymi.
  6. Wybierz kolumnę z pliku, która ma powiązane kody wartości odniesienia, do których ma zostać odwzorowana, i które odwołują się do zestawu danych, do którego należą powiązane wartości.
  7. Kliknij przycisk Zapisz.

Uwaga: Podczas pracy z plikami CSV z wartościami danych odniesienia zdefiniowanymi za pomocą klucza złożonego, należy upewnić się, że relacja nadrzędna między wartościami, a wartościami powiązanymi z jednym i wieloma odwzorowanymi są reprezentowane jako konkatenacja wartości kolumn niestandardowych kodu i klucza złożonego oddzielonych znakiem |. Kod zawsze idzie najpierw, a następnie wartości kolumny klucza złożonego, na przykład: CODE|CC1|CC2|CC3.

Więcej inform.

Temat nadrzędny: Dane odniesienia

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more