0 / 0
Go back to the English version of the documentation
Wybieranie narzędzia
Last updated: 20 wrz 2023
Wybieranie narzędzia

Podstawowe usługi dla programu Cloud Pak for Data as a Service udostępniają szereg narzędzi dla użytkowników ze wszystkimi poziomami doświadczenia w przygotowywaniu, analizowaniu i modelowaniu danych, od początkującego do eksperta. Odpowiednie narzędzie zależy od rodzaju posiadanego przez użytkownika danych, zadań, które mają być wykonane, oraz ilości automatyzacji, którą chcesz wykonać.

Aby sprawdzić, które narzędzia są używane w projekcie i które usługi wymagają tych narzędzi, należy otworzyć narzędzia i odwzorowanie usług.

Aby wybrać odpowiednie narzędzie, należy wziąć pod uwagę te czynniki.

Typ danych, które są dostępne

  • Dane tabelaryczne w plikach z ogranicznikami lub w danych relacyjnych w zdalnych źródłach danych
  • Pliki graficzne
  • Tekstowa (nieustrukturyzowana) data w dokumentach

Typ zadań, które należy wykonać

  • Przygotowywanie danych: oczyszczanie, kształtowanie, wizualizowanie, organizowanie i sprawdzanie poprawności danych.
  • Analiza danych: identyfikowanie wzorców i relacji w danych, a także wyświetlanie spostrzeżeń.
  • Budowanie modeli: budowanie, szkolenie, testowanie i wdrażanie modeli w celu przewidywania lub optymalizacji decyzji.

Jak bardzo chcesz zautomatyzować

  • Narzędzia edytora kodu: Użyj do napisania kodu w języku Python lub R, a wszystko to również w przypadku Spark.
  • Narzędzia graficznego programu budującego: za pomocą menu i funkcji przeciągania i upuszczania można korzystać z programu budującego do wizualnego programu.
  • Narzędzia do automatycznego budowania: służą do konfigurowania zautomatyzowanych zadań, które wymagają ograniczonych danych wprowadzanych przez użytkownika.

Znajdź odpowiednie narzędzie:

Narzędzia do danych tabelarycznych lub relacyjnych

Narzędzia dla danych tabelarycznych lub relacyjnych według zadania:

Narzędzia do danych tabelarycznych lub relacyjnych
Narzędzie Typ narzędzia Przygotuj dane Analizowanie danych Modele budowania
Edytor notatnika Jupyter Edytor kodu
Nauczanie stowarzyszone Edytor kodu
RStudio Edytor kodu
Data Refinery Graficzny program budujący
Przepływ maskowania Automatyczny program budujący
Watson Query Graficzny program budujący
DataStage Graficzny program budujący
Edytor panelu kontrolnego Graficzny program budujący
SPSS Modeler Graficzny program budujący
Program budujący modelDecision Optimization Graficzny program budujący i edytor kodu
AutoAI Automatyczny program budujący
Metadata import Automatyczny program budujący
Wzbogacanie metadanych Automatyczny program budujący
Reguła jakości danych Zautomatyzowany program budujący i edytor kodu
IBM Match 360 with Watson (wersja beta) Automatyczny program budujący
Watson Pipelines Graficzny program budujący

Narzędzia do danych tekstowych

Narzędzia do budowania modelu, który klasyfikuje dane tekstowe:

Narzędzia do danych tekstowych
Narzędzie Edytor kodu Graficzny program budujący Automatyczny program budujący
Edytor notatnika Jupyter
RStudio
SPSS Modeler
Watson Pipelines

Narzędzia do tworzenia obrazów

Narzędzia do budowania modelu, który klasyfikuje obrazy:

Narzędzia do tworzenia obrazów
Narzędzie Edytor kodu Graficzny program budujący Automatyczny program budujący
Edytor notatnika Jupyter
RStudio
Watson Pipelines

Dostęp do narzędzi

Aby użyć narzędzia, należy utworzyć zasób aplikacyjny specyficzny dla tego narzędzia lub otworzyć istniejący zasób aplikacyjny dla tego narzędzia. Aby utworzyć zasób, kliknij opcję Nowy zasób lub Importuj zasoby aplikacyjne , a następnie wybierz typ zasobu aplikacyjnego. W tej tabeli przedstawiono typ zasobu do wybrania dla każdego narzędzia.

Narzędzia do odwzorowania typów zasobów
Aby użyć tego narzędzia Wybierz ten typ zasobu aplikacyjnego
Edytor notatnika Jupyter Edytor notatnika Jupyter
Data Refinery Przepływ Data Refinery
Przepływy maskowania Przepływy maskowania
DataStage Przepływ DataStage
Edytor panelu kontrolnego Kokpit
SPSS Modeler Przepływ programu Modeler
Program budujący modelDecision Optimization Decision Optimization
AutoAI Eksperyment AutoAI
Nauczanie stowarzyszone Eksperyment edukacyjny
Metadata import Metadata import
Wzbogacanie metadanych Wzbogacanie metadanych
Reguły dotyczące jakości danych Reguła jakości danych
IBM Match 360 with Watson (wersja beta) Konfiguracja danych głównych

Aby edytować notatniki za pomocą programu RStudio, należy kliknąć opcję Uruchom środowisko IDE > RStudio.

Edytor notatnika Jupyter

Edytor notatnika Jupyter służy do tworzenia notatnika, w którym można uruchamiać kod w celu przygotowania, wizualizacji i analizy danych, a także budowania i uczenia modelu.

Wymagana usługa
Watson Studio
Format danych
Dowolne
Wielkość danych
Dowolne
W jaki sposób można przygotować dane, przeanalizować dane lub zbudować modele
Napisz kod w języku Python lub R, wszystkie również ze Spark.
Dołącz do swojego kodu bogaty tekst i multimedia.
Praca z dowolnym rodzajem danych w dowolny sposób.
Użyj preinstalowanego lub zainstaluj inne biblioteki i pakiety Open Source oraz IBM .
Zaplanuj uruchomienie kodu
Zaimportuj notatnik z pliku, adresu URL lub galerii.
Udostępnij do współużytkowania kopie notatnika zewnętrznie w trybie tylko do odczytu.
Wprowadzenie
Aby utworzyć notatnik, należy kliknąć opcję Nowy zasób aplikacyjny > Edytor notatnika Jupyter.
Więcej inform.
Załaduj i analizuj wideo zestawy danych publicznych
Filmy wideo na temat notebooków
Przykładowe notebooki
Documentation na temat notebooków

Data Refinery

Użyj opcji Data Refinery , aby przygotować i zwizualizować dane tabelaryczne za pomocą graficznego edytora przepływów. Użytkownik tworzy, a następnie uruchamia przepływ Data Refinery jako zestaw uporządkowanych operacji na danych.

Wymagane usługi
Watson Studio lub Watson Knowledge Catalog
Format danych
Tabelaryczne: Avro, CSV, JSON, Microsoft Excel (formaty xls i xlsx. Tylko pierwszy arkusz, z wyjątkiem połączeń i połączonych zasobów danych.), Parkiet, SAS z rozszerzeniem "sas7bdat" (tylko do odczytu), TSV (tylko do odczytu) lub z ogranicznikami danych tekstowych
Relacyjny: Tabele w relacyjnych źródłach danych
Wielkość danych
Dowolne
W jaki sposób można przygotować dane
Cleanse, kształt, organizacja danych z ponad 60 operacjami.
Zapisz dane rafinowane jako nowy zestaw danych lub zaktualizuj oryginalne dane.
Dane profilu w celu sprawdzenia jego poprawności.
Za pomocą interaktywnych szablonów można manipulować danymi za pomocą operacji kodu, funkcji i operatorów logicznych.
Zaplanuj powtarzające się operacje na danych.
W jaki sposób można analizować dane
Identyfikowanie wzorców, połączeń i relacji w obrębie danych na wielu wykresach wizualizacji.
Wprowadzenie
Aby utworzyć przepływ Data Refinery , kliknij opcję Nowy zasób > Data Refinery. Kafle Data Refinery znajdują się w sekcji Programy budujące graficzne .
Więcej inform.
Documentation na temat Data Refinery
Filmy wideo Data Refinery
Kształt wideo danych kształtu

Watson Query

Użyj opcji Watson Query , aby połączyć wiele źródeł danych w jedną samorównoważący zbiór źródeł danych lub baz danych.

Format danych
Relacyjny: Tabele w relacyjnych źródłach danych
Wielkość danych
Dowolne
W jaki sposób można przygotować dane
Nawiąże połączenie z wieloma źródłami danych.
Utwórz tabele wirtualne.
Wprowadzenie
Aby utworzyć tabele wirtualne, należy kliknąć opcję Dane > Data virtualization. W menu usługi kliknij opcję Wirtualizacja > Wirtualizacja > Tabele.
Więcej inform.
Dokumentacja produktuWatson Query

DataStage

Za pomocą narzędzia DataStage można przygotować i wizualizować dane tabelaryczne za pomocą graficznego edytora przepływów. Użytkownik tworzy, a następnie uruchamia przepływ DataStage jako zestaw uporządkowanych operacji na danych.

Format danych
Tabelaryczne: Avro, CSV, JSON, Parkiet, TSV (tylko do odczytu), lub pliki tekstowe z ogranicznikami
Relacyjny: Tabele w relacyjnych źródłach danych
Wielkość danych
Dowolne
W jaki sposób można przygotować dane
Zaprojektuj graficzny przepływ integracji danych, który generuje kod programu Orchestrate w celu uruchomienia na wysokim poziomie mechanizmu równoległego DataStage .
Wykonywanie operacji takich jak: Łączenie, Funnel, Suma kontrolna, Scalanie, Modyfikuj, Usuń duplikaty i Sortuj.
Wprowadzenie
Aby utworzyć przepływ DataStage , kliknij opcję Nowy zasób > DataStage. Kafelek DataStage znajduje się w sekcji Programy budujące graficzne .
Więcej inform.
Dokumentacja produktu DataStage

Edytor paneli kontrolnych

Za pomocą edytora panelu kontrolnego można utworzyć zestaw wizualizacji wyników analitycznych w programie budującym graficznym.

Wymagana usługa
Cognos Dashboard Embedded
Format danych
Tabelaryczne: pliki CSV
Relacyjny: Tabele w niektórych relacyjnych źródłach danych
Wielkość danych
Dowolna wielkość
W jaki sposób można analizować dane
Tworzenie wykresów bez kodowania.
Do panelu kontrolnego dashboard.: Współużytkuj interaktywne panele kontrolne z zewnątrz.
Wprowadzenie
Aby utworzyć panel kontrolny, kliknij opcję Nowy zasób aplikacyjny > Edytor panelu kontrolnego. Kafel Panel kontrolny znajduje się w sekcji Programy budujące graficzne .
Więcej inform.
Documentation na temat paneli kontrolnych
Filmy wideo na temat paneli kontrolnych

SPSS Modeler

Za pomocą programu SPSS Modeler można utworzyć przepływ w celu przygotowania danych oraz budowania i uczenia modelu za pomocą edytora przepływów w programie budującym graficznym.

Wymagane usługi
Watson Studio
Formaty danych
Relacyjny: Tabele w relacyjnych źródłach danych
Tabelaryczne: pliki Excel (.xls lub .xlsx), pliki CSV lub pliki SPSS Statistics (.sav)
Textual: W obsługiwanych tabelach relacyjnych lub plikach
Wielkość danych
Dowolne
W jaki sposób można przygotować dane
Korzystanie z funkcji automatycznego przygotowywania danych.
Napisz instrukcje SQL, aby manipulować danymi.
Służy do czyszczenia, kształtowania, pobierania próbek, sortowania i wyliczania danych.
W jaki sposób można analizować dane
Wizualizacja danych z ponad 40 wykresami.
Zidentyfikuj język naturalny pola tekstowego.
W jaki sposób można budować modele
Budowanie modeli predykcyjnych.
Wybierz spośród ponad 40 algorytmów modelowania.
Użyj funkcji automatycznego modelowania.
Modelowanie szeregów czasowych lub danych geoprzestrzennych.
Klasyfikowanie danych tekstowych.
Identyfikowanie relacji między pojęciami w danych tekstowych.
Wprowadzenie
Aby utworzyć przepływ programu SPSS Modeler , kliknij opcję Nowy zasób > SPSS Modeler.
Więcej inform.
SPSS Modeler -odświeżony interfejs użytkownika dla wideo z danymi korporacyjnymi z zakresu power science.
Documentation o programie SPSS Modeler

Program budujący model Decision Optimization

Użyj opcji Decision Optimization , aby zbudować i uruchomić modele optymalizacji w modelerze Decision Optimization lub w notatniku Jupyter.

Wymagane usługi
Watson Studio
Formaty danych
Tabelaryczne: pliki CSV
Wielkość danych
Dowolne
W jaki sposób można przygotować dane
Zaimportuj odpowiednie dane do scenariusza i dokonaj edycji.
W jaki sposób można budować modele
Budowanie modeli optymalizacji decyzji nakazowych.
Twórz, importuj i edytuj modele w języku Python DOcplex, OPL lub z wyrażeniami języka naturalnego.
Twórz, importuj i edytuj modele w notebookach.
W jaki sposób można rozwiązywać modele
Uruchamianie i rozwiązywanie modeli optymalizacji decyzji za pomocą mechanizmów CPLEX.
Zbadaj i porównaj rozwiązania dla wielu scenariuszy.
Tworzenie tabel, wykresów i notatek w celu zwizualizowania danych i rozwiązań dla jednego lub większej liczby scenariuszy.
Wprowadzenie
Aby utworzyć model Decision Optimization , kliknij opcję Nowy zasób > Decision Optimizationlub w przypadku notebooków kliknij opcję Nowy zasób aplikacyjny > Edytor notatnika Jupyter.
Więcej inform.
Filmy wideo dotyczące Decision Optimization
Documentation dotycząca Decision Optimization

Narzędzie AutoAI

Narzędzie AutoAI umożliwia automatyczne analizowanie danych tabelarycznych i generowanie modeli potokowych modeli kandydujących dostosowanych do problemu z modelowaniem predykcyjnym.

Wymagana usługa
Watson Machine Learning
Format danych
Tabelaryczne: pliki CSV
Wielkość danych
Zależy od typu modelu. Szczegółowe informacje na ten temat zawiera sekcja AutoAI -przegląd .
W jaki sposób można przygotować dane
Automatycznie transformuj dane, takie jak podstawiaj brakujące wartości i transformuj tekst na wartości skalarne.
W jaki sposób można budować modele
Wytłaczaj klasyfikację binarną, klasyfikację wieloklasową lub model regresji.
Wyświetl infografikę drzewa, w której przedstawiono sekwencje etapów szkolenia AutoAI .
Generowanie liderów modeli rurociągów, które są uporządkowane według wyników walidacji krzyżowej.
Zapisz potok jako model.
Wprowadzenie
Aby utworzyć eksperyment AutoAI , kliknij opcję Nowy zasób > AutoAI.
Więcej inform.
Documentation o programie AutoAI

Stowarzyszona nauka

Użyj narzędzia do nauki stowarzyszonej, aby szkolić wspólny model przy użyciu rozproszonych danych. Dane nie są nigdy łączone ani współużytkowane, zachowując integralność danych podczas udostępniania wszystkich uczestniczących stron modelu na podstawie zagregowanych danych.

Wymagana usługa
Watson Machine Learning
Format danych
Dowolne
Wielkość danych
Dowolna wielkość
W jaki sposób można budować modele
Wybierz strukturę szkolenia.
Skonfiguruj wspólny model.
Skonfiguruj plik do szkolenia wspólnego modelu.
Mają zdalne strony trenować swoje dane.
Wdróż model wspólny.
Wprowadzenie
Aby utworzyć eksperyment, kliknij opcję Nowy zasób > Uczenie stowarzyszone.
Więcej inform.
Documentation dotycząca programu Federated Learning

Metadata import

Narzędzie do importowania metadanych służy do automatycznego wykrywania i importowania metadanych technicznych i procesowych dla zasobów danych w projekcie lub katalogu.

Wymagana usługa
Watson Knowledge Catalog
Format danych
Dowolne
Wielkość danych
Dowolna wielkość
W jaki sposób można przygotować dane
Importowanie zasobów danych z połączenia do źródła danych.
Wprowadzenie
Aby zaimportować metadane, kliknij opcję Nowy zasób > Metadata import.
Więcej inform.
Documentation dotycząca importu metadanych
Filmy wideo dotyczące serwisu Watson Knowledge Catalog

Wzbogacanie metadanych

Użyj narzędzia do wzbogacania metadanych, aby automatycznie profilować zasoby danych i analizować jakość danych w projekcie.

Wymagana usługa
Watson Knowledge Catalog
Format danych
Relacyjny i strukturalny: Tabele i pliki w relacyjnych i nierelacyjnych źródłach danych
Tabelaryczne pliki: Avro, CSV lub Parkiet
Wielkość danych
Dowolna wielkość
W jaki sposób można przygotować i analizować dane
Profilowanie i analizowanie wybranego zestawu zasobów danych w projekcie.
Wprowadzenie
Aby wzbogacić dane, kliknij opcję Nowy zasób > wzbogacanie metadanych.
Więcej inform.
Documentation dotycząca wzbogacania metadanych

Reguła jakości danych

Użyj narzędzia do jakości danych, aby utworzyć reguły, które analizują jakość danych w projekcie.

Wymagana usługa
Watson Knowledge Catalog
Format danych
Relacyjny i strukturalny: Tabele i pliki w relacyjnych i nierelacyjnych źródłach danych
Tabelaryczne pliki: Avro, CSV lub Parkiet
Wielkość danych
Dowolna wielkość
W jaki sposób można przygotować i analizować dane
Analiza jakości wybranego zestawu zasobów danych w projekcie.
Wprowadzenie
Aby utworzyć regułę jakości danych, kliknij opcję Nowy zasób > Reguła jakości danych.
Więcej inform.
Documentation o regułach jakości danych

IBM Match 360 with Watson

Użyj programu IBM Match 360 with Watson , aby utworzyć główne jednostki danych reprezentujące cyfrowe bliźniacze klientów. Utwórz model i odwzoruj dane, a następnie uruchom zgodny algorytm, aby utworzyć główne obiekty danych. Dostosuj i dostrój odpowiedni algorytm, tak aby spełniał wymagania organizacji.

Wymagane usługi
IBM Match 360 with Watson IBM Watson Knowledge Catalog
Wielkość danych
Do 1 000 000 rekordów (dla planu Beta Lite)
W jaki sposób można przygotować dane
Modeluj i odwzoruj dane ze źródeł w organizacji.
Uruchom dostosowywalny algorytm dopasowywania, aby utworzyć główne obiekty danych.
Wyświetlanie i edytowanie obiektów danych głównych oraz powiązanych z nimi rekordów.
Wprowadzenie
Aby utworzyć zasób aplikacyjny konfiguracji IBM Match 360 , kliknij opcję Nowy zasób > Konfiguracja danych głównych.
Więcej inform.
Documentation o programie IBM Match 360 with Watson

Środowisko IDE produktu RStudio

Użyj środowiska RStudio IDE do analizy danych lub tworzenia aplikacji Shiny, pisząc kod R.

Wymagana usługa
Watson Studio
Format danych
Dowolne
Wielkość danych
Dowolna wielkość
W jaki sposób można przygotować dane, analizować dane i budować modele
Napisz kod w R.
Tworzenie aplikacji Shiny.
Użyj otwartych bibliotek źródłowych i pakietów.
Dołącz do swojego kodu bogaty tekst i multimedia.
Przygotuj dane.
Wizualizuj dane.
Odkryj spostrzeżenia z danych.
Budowanie i szkolenie modelu przy użyciu bibliotek Open Source.
Współużytkuj swoją aplikację Shiny w repozytorium Git .
Wprowadzenie
Aby użyć produktu RStudio, należy kliknąć opcję Uruchom środowisko IDE > RStudio.
Więcej inform.
Documentation produktu RStudio
Przegląd wideo RStudio IDE
Filmy wideo dotyczące produktu RStudio

Przepływy maskowania

Za pomocą narzędzia przepływu maskowania można przygotować maskowane kopie lub maskowane podzbiory danych z katalogu. Dane są de-identyfikowane przy użyciu zaawansowanych opcji maskowania z regułami ochrony danych.

Wymagana usługa
Watson Knowledge Catalog
Format danych
Relacyjny: Tabele w relacyjnych źródłach danych
Wielkość danych
Dowolna wielkość
W jaki sposób można przygotować dane, przeanalizować dane lub zbudować modele
Importowanie zasobów danych z katalogu zarządzanego do projektu.
Utwórz definicje zadań przepływu maskowania, aby określić, które dane mają być maskowane zgodnie z regułami ochrony danych.
Opcjonalnie podzbiór danych w celu zmniejszenia wielkości skopiowanych danych.
Uruchom zadania maskowania przepływu, aby załadować maskowane kopie do docelowych połączeń z bazą danych.
Wprowadzenie
Upewnij się, że wstępnie wymagane kroki w produkcie Watson Knowledge Catalog zostały zakończone. Aby prywatyzować dane, wykonaj jedną z następujących czynności:
  • Kliknij opcję Nowy zasób > Przepływ maskowania.
  • Kliknij opcje menu dla poszczególnych zasobów danych, aby maskować ten zasób bezpośrednio.
Więcej inform.
Documentation o danych maskujących

Watson Pipelines

Edytor kanwy Pipelines służy do tworzenia przepływu w celu przygotowania, wizualizacji i analizy danych, a także do budowania i uczenia modelu.

Format danych
Dowolne
Wielkość danych
Dowolne
W jaki sposób można przygotować dane, przeanalizować dane lub zbudować modele
Użyj różnych węzłów, które zawierają własne dzienniki.
Włącz notebooki do przepływu w celu uruchomienia dowolnego kodu Python lub R.
Praca z dowolnym rodzajem danych w dowolny sposób.
Trwa uruchamianie harmonogramu przepływu.
Zaimportuj dane z podłączonego PVC, projektu lub danych z programu Github.
Utwórz komponent niestandardowy przy użyciu kodu Python .
W celu monitorowania jakości danych należy warunkowo monitorować jakość danych.
Użyj haka WWW, aby wysyłać wiadomości e-mail lub wiadomości, aby na bieżąco informować o statusie Twojego przepływu.
Wprowadzenie
Aby utworzyć nowy potok, kliknij opcję Nowy zasób > Pipeliny.

Wizualizacje danych

Wizualizacje danych umożliwiają wykrywanie spostrzeżeń na podstawie danych. Eksplorując dane z różnych perspektyw z wizualizacjami, można identyfikować wzorce, połączenia i relacje w obrębie tych danych i szybko zrozumieć duże ilości informacji.

Format danych
Tabelaryczne: Avro, CSV, JSON, Parkiet, TSV, SAV, Microsoft Excel .xls i .xlsx, SAS, pliki tekstowe z ogranicznikami i połączone dane. Więcej informacji na temat obsługiwanych źródeł danych zawiera sekcja Konektory.
Wielkość danych
Brak limitu
Wprowadzenie
Aby utworzyć wizualizację, kliknij opcję Zasób danych na liście typów zasobów w projekcie, a następnie wybierz zasób danych. Kliknij kartę Wizualizacja i wybierz typ wykresu.
Więcej inform.
Wizualizacja danych

Temat nadrzędny: Projekty

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more