Translation not up to date
Podstawowe usługi dla programu Cloud Pak for Data as a Service udostępniają szereg narzędzi dla użytkowników ze wszystkimi poziomami doświadczenia w przygotowywaniu, analizowaniu i modelowaniu danych, od początkującego do eksperta. Odpowiednie narzędzie zależy od rodzaju posiadanego przez użytkownika danych, zadań, które mają być wykonane, oraz ilości automatyzacji, którą chcesz wykonać.
Aby sprawdzić, które narzędzia są używane w projekcie i które usługi wymagają tych narzędzi, należy otworzyć narzędzia i odwzorowanie usług.
Aby wybrać odpowiednie narzędzie, należy wziąć pod uwagę te czynniki.
Typ danych, które są dostępne
- Dane tabelaryczne w plikach z ogranicznikami lub w danych relacyjnych w zdalnych źródłach danych
- Pliki graficzne
- Tekstowa (nieustrukturyzowana) data w dokumentach
Typ zadań, które należy wykonać
- Przygotowywanie danych: oczyszczanie, kształtowanie, wizualizowanie, organizowanie i sprawdzanie poprawności danych.
- Analiza danych: identyfikowanie wzorców i relacji w danych, a także wyświetlanie spostrzeżeń.
- Budowanie modeli: budowanie, szkolenie, testowanie i wdrażanie modeli w celu przewidywania lub optymalizacji decyzji.
Jak bardzo chcesz zautomatyzować
- Narzędzia edytora kodu: Użyj do napisania kodu w języku Python lub R, a wszystko to również w przypadku Spark.
- Narzędzia graficznego programu budującego: za pomocą menu i funkcji przeciągania i upuszczania można korzystać z programu budującego do wizualnego programu.
- Narzędzia do automatycznego budowania: służą do konfigurowania zautomatyzowanych zadań, które wymagają ograniczonych danych wprowadzanych przez użytkownika.
Znajdź odpowiednie narzędzie:
- Narzędzia do tabelarycznych lub relacyjnych danych
- Narzędzia do obsługi danych tekstowych
- Narzędzia do obsługi danych obrazu
- Uzyskiwanie dostępu do narzędzi
Narzędzia do danych tabelarycznych lub relacyjnych
Narzędzia dla danych tabelarycznych lub relacyjnych według zadania:
Narzędzie | Typ narzędzia | Przygotuj dane | Analizowanie danych | Modele budowania |
---|---|---|---|---|
Edytor notatnika Jupyter | Edytor kodu | ✓ | ✓ | ✓ |
Nauczanie stowarzyszone | Edytor kodu | ✓ | ||
RStudio | Edytor kodu | ✓ | ✓ | ✓ |
Data Refinery | Graficzny program budujący | ✓ | ✓ | |
Przepływ maskowania | Automatyczny program budujący | ✓ | ||
Watson Query | Graficzny program budujący | ✓ | ||
DataStage | Graficzny program budujący | ✓ | ||
Edytor panelu kontrolnego | Graficzny program budujący | ✓ | ||
SPSS Modeler | Graficzny program budujący | ✓ | ✓ | ✓ |
Program budujący modelDecision Optimization | Graficzny program budujący i edytor kodu | ✓ | ✓ | |
AutoAI | Automatyczny program budujący | ✓ | ✓ | |
Metadata import | Automatyczny program budujący | ✓ | ||
Wzbogacanie metadanych | Automatyczny program budujący | ✓ | ✓ | |
Reguła jakości danych | Zautomatyzowany program budujący i edytor kodu | ✓ | ||
IBM Match 360 with Watson (wersja beta) | Automatyczny program budujący | ✓ | ||
Watson Pipelines | Graficzny program budujący | ✓ | ✓ | ✓ |
Narzędzia do danych tekstowych
Narzędzia do budowania modelu, który klasyfikuje dane tekstowe:
Narzędzie | Edytor kodu | Graficzny program budujący | Automatyczny program budujący |
---|---|---|---|
Edytor notatnika Jupyter | ✓ | ||
RStudio | ✓ | ||
SPSS Modeler | ✓ | ||
Watson Pipelines | ✓ |
Narzędzia do tworzenia obrazów
Narzędzia do budowania modelu, który klasyfikuje obrazy:
Narzędzie | Edytor kodu | Graficzny program budujący | Automatyczny program budujący |
---|---|---|---|
Edytor notatnika Jupyter | ✓ | ||
RStudio | ✓ | ||
Watson Pipelines | ✓ |
Dostęp do narzędzi
Aby użyć narzędzia, należy utworzyć zasób aplikacyjny specyficzny dla tego narzędzia lub otworzyć istniejący zasób aplikacyjny dla tego narzędzia. Aby utworzyć zasób, kliknij opcję Nowy zasób lub Importuj zasoby aplikacyjne , a następnie wybierz typ zasobu aplikacyjnego. W tej tabeli przedstawiono typ zasobu do wybrania dla każdego narzędzia.
Aby użyć tego narzędzia | Wybierz ten typ zasobu aplikacyjnego |
---|---|
Edytor notatnika Jupyter | Edytor notatnika Jupyter |
Data Refinery | Przepływ Data Refinery |
Przepływy maskowania | Przepływy maskowania |
DataStage | Przepływ DataStage |
Edytor panelu kontrolnego | Kokpit |
SPSS Modeler | Przepływ programu Modeler |
Program budujący modelDecision Optimization | Decision Optimization |
AutoAI | Eksperyment AutoAI |
Nauczanie stowarzyszone | Eksperyment edukacyjny |
Metadata import | Metadata import |
Wzbogacanie metadanych | Wzbogacanie metadanych |
Reguły dotyczące jakości danych | Reguła jakości danych |
IBM Match 360 with Watson (wersja beta) | Konfiguracja danych głównych |
Aby edytować notatniki za pomocą programu RStudio, należy kliknąć opcję Uruchom środowisko IDE > RStudio.
Edytor notatnika Jupyter
Edytor notatnika Jupyter służy do tworzenia notatnika, w którym można uruchamiać kod w celu przygotowania, wizualizacji i analizy danych, a także budowania i uczenia modelu.
- Wymagana usługa
- Watson Studio
- Format danych
- Dowolne
- Wielkość danych
- Dowolne
- W jaki sposób można przygotować dane, przeanalizować dane lub zbudować modele
- Napisz kod w języku Python lub R, wszystkie również ze Spark.
- Dołącz do swojego kodu bogaty tekst i multimedia.
- Praca z dowolnym rodzajem danych w dowolny sposób.
- Użyj preinstalowanego lub zainstaluj inne biblioteki i pakiety Open Source oraz IBM .
- Zaplanuj uruchomienie kodu
- Zaimportuj notatnik z pliku, adresu URL lub galerii.
- Udostępnij do współużytkowania kopie notatnika zewnętrznie w trybie tylko do odczytu.
- Wprowadzenie
- Aby utworzyć notatnik, należy kliknąć opcję Nowy zasób aplikacyjny > Edytor notatnika Jupyter.
- Więcej inform.
- Załaduj i analizuj wideo zestawy danych publicznych
- Filmy wideo na temat notebooków
- Przykładowe notebooki
- Documentation na temat notebooków
Data Refinery
Użyj opcji Data Refinery , aby przygotować i zwizualizować dane tabelaryczne za pomocą graficznego edytora przepływów. Użytkownik tworzy, a następnie uruchamia przepływ Data Refinery jako zestaw uporządkowanych operacji na danych.
- Wymagane usługi
- Watson Studio lub Watson Knowledge Catalog
- Format danych
- Tabelaryczne: Avro, CSV, JSON, Microsoft Excel (formaty xls i xlsx. Tylko pierwszy arkusz, z wyjątkiem połączeń i połączonych zasobów danych.), Parkiet, SAS z rozszerzeniem "sas7bdat" (tylko do odczytu), TSV (tylko do odczytu) lub z ogranicznikami danych tekstowych
- Relacyjny: Tabele w relacyjnych źródłach danych
- Wielkość danych
- Dowolne
- W jaki sposób można przygotować dane
- Cleanse, kształt, organizacja danych z ponad 60 operacjami.
- Zapisz dane rafinowane jako nowy zestaw danych lub zaktualizuj oryginalne dane.
- Dane profilu w celu sprawdzenia jego poprawności.
- Za pomocą interaktywnych szablonów można manipulować danymi za pomocą operacji kodu, funkcji i operatorów logicznych.
- Zaplanuj powtarzające się operacje na danych.
- W jaki sposób można analizować dane
- Identyfikowanie wzorców, połączeń i relacji w obrębie danych na wielu wykresach wizualizacji.
- Wprowadzenie
- Aby utworzyć przepływ Data Refinery , kliknij opcję Nowy zasób > Data Refinery. Kafle Data Refinery znajdują się w sekcji Programy budujące graficzne .
- Więcej inform.
- Documentation na temat Data Refinery
- Filmy wideo Data Refinery
- Kształt wideo danych kształtu
Watson Query
Użyj opcji Watson Query , aby połączyć wiele źródeł danych w jedną samorównoważący zbiór źródeł danych lub baz danych.
- Format danych
- Relacyjny: Tabele w relacyjnych źródłach danych
- Wielkość danych
- Dowolne
- W jaki sposób można przygotować dane
- Nawiąże połączenie z wieloma źródłami danych.
- Utwórz tabele wirtualne.
- Wprowadzenie
- Aby utworzyć tabele wirtualne, należy kliknąć opcję Dane > Data virtualization. W menu usługi kliknij opcję Wirtualizacja > Wirtualizacja > Tabele.
- Więcej inform.
- Dokumentacja produktuWatson Query
DataStage
Za pomocą narzędzia DataStage można przygotować i wizualizować dane tabelaryczne za pomocą graficznego edytora przepływów. Użytkownik tworzy, a następnie uruchamia przepływ DataStage jako zestaw uporządkowanych operacji na danych.
- Format danych
- Tabelaryczne: Avro, CSV, JSON, Parkiet, TSV (tylko do odczytu), lub pliki tekstowe z ogranicznikami
- Relacyjny: Tabele w relacyjnych źródłach danych
- Wielkość danych
- Dowolne
- W jaki sposób można przygotować dane
- Zaprojektuj graficzny przepływ integracji danych, który generuje kod programu Orchestrate w celu uruchomienia na wysokim poziomie mechanizmu równoległego DataStage .
- Wykonywanie operacji takich jak: Łączenie, Funnel, Suma kontrolna, Scalanie, Modyfikuj, Usuń duplikaty i Sortuj.
- Wprowadzenie
- Aby utworzyć przepływ DataStage , kliknij opcję Nowy zasób > DataStage. Kafelek DataStage znajduje się w sekcji Programy budujące graficzne .
- Więcej inform.
- Dokumentacja produktu DataStage
Edytor paneli kontrolnych
Za pomocą edytora panelu kontrolnego można utworzyć zestaw wizualizacji wyników analitycznych w programie budującym graficznym.
- Wymagana usługa
- Cognos Dashboard Embedded
- Format danych
- Tabelaryczne: pliki CSV
- Relacyjny: Tabele w niektórych relacyjnych źródłach danych
- Wielkość danych
- Dowolna wielkość
- W jaki sposób można analizować dane
- Tworzenie wykresów bez kodowania.
- Do panelu kontrolnego dashboard.: Współużytkuj interaktywne panele kontrolne z zewnątrz.
- Wprowadzenie
- Aby utworzyć panel kontrolny, kliknij opcję Nowy zasób aplikacyjny > Edytor panelu kontrolnego. Kafel Panel kontrolny znajduje się w sekcji Programy budujące graficzne .
- Więcej inform.
- Documentation na temat paneli kontrolnych
- Filmy wideo na temat paneli kontrolnych
SPSS Modeler
Za pomocą programu SPSS Modeler można utworzyć przepływ w celu przygotowania danych oraz budowania i uczenia modelu za pomocą edytora przepływów w programie budującym graficznym.
- Wymagane usługi
- Watson Studio
- Formaty danych
- Relacyjny: Tabele w relacyjnych źródłach danych
- Tabelaryczne: pliki Excel (.xls lub .xlsx), pliki CSV lub pliki SPSS Statistics (.sav)
- Textual: W obsługiwanych tabelach relacyjnych lub plikach
- Wielkość danych
- Dowolne
- W jaki sposób można przygotować dane
- Korzystanie z funkcji automatycznego przygotowywania danych.
- Napisz instrukcje SQL, aby manipulować danymi.
- Służy do czyszczenia, kształtowania, pobierania próbek, sortowania i wyliczania danych.
- W jaki sposób można analizować dane
- Wizualizacja danych z ponad 40 wykresami.
- Zidentyfikuj język naturalny pola tekstowego.
- W jaki sposób można budować modele
- Budowanie modeli predykcyjnych.
- Wybierz spośród ponad 40 algorytmów modelowania.
- Użyj funkcji automatycznego modelowania.
- Modelowanie szeregów czasowych lub danych geoprzestrzennych.
- Klasyfikowanie danych tekstowych.
- Identyfikowanie relacji między pojęciami w danych tekstowych.
- Wprowadzenie
- Aby utworzyć przepływ programu SPSS Modeler , kliknij opcję Nowy zasób > SPSS Modeler.
- Więcej inform.
- SPSS Modeler -odświeżony interfejs użytkownika dla wideo z danymi korporacyjnymi z zakresu power science.
- Documentation o programie SPSS Modeler
Program budujący model Decision Optimization
Użyj opcji Decision Optimization , aby zbudować i uruchomić modele optymalizacji w modelerze Decision Optimization lub w notatniku Jupyter.
- Wymagane usługi
- Watson Studio
- Formaty danych
- Tabelaryczne: pliki CSV
- Wielkość danych
- Dowolne
- W jaki sposób można przygotować dane
- Zaimportuj odpowiednie dane do scenariusza i dokonaj edycji.
- W jaki sposób można budować modele
- Budowanie modeli optymalizacji decyzji nakazowych.
- Twórz, importuj i edytuj modele w języku Python DOcplex, OPL lub z wyrażeniami języka naturalnego.
- Twórz, importuj i edytuj modele w notebookach.
- W jaki sposób można rozwiązywać modele
- Uruchamianie i rozwiązywanie modeli optymalizacji decyzji za pomocą mechanizmów CPLEX.
- Zbadaj i porównaj rozwiązania dla wielu scenariuszy.
- Tworzenie tabel, wykresów i notatek w celu zwizualizowania danych i rozwiązań dla jednego lub większej liczby scenariuszy.
- Wprowadzenie
- Aby utworzyć model Decision Optimization , kliknij opcję Nowy zasób > Decision Optimizationlub w przypadku notebooków kliknij opcję Nowy zasób aplikacyjny > Edytor notatnika Jupyter.
- Więcej inform.
- Filmy wideo dotyczące Decision Optimization
- Documentation dotycząca Decision Optimization
Narzędzie AutoAI
Narzędzie AutoAI umożliwia automatyczne analizowanie danych tabelarycznych i generowanie modeli potokowych modeli kandydujących dostosowanych do problemu z modelowaniem predykcyjnym.
- Wymagana usługa
- Watson Machine Learning
- Format danych
- Tabelaryczne: pliki CSV
- Wielkość danych
- Zależy od typu modelu. Szczegółowe informacje na ten temat zawiera sekcja AutoAI -przegląd .
- W jaki sposób można przygotować dane
- Automatycznie transformuj dane, takie jak podstawiaj brakujące wartości i transformuj tekst na wartości skalarne.
- W jaki sposób można budować modele
- Wytłaczaj klasyfikację binarną, klasyfikację wieloklasową lub model regresji.
- Wyświetl infografikę drzewa, w której przedstawiono sekwencje etapów szkolenia AutoAI .
- Generowanie liderów modeli rurociągów, które są uporządkowane według wyników walidacji krzyżowej.
- Zapisz potok jako model.
- Wprowadzenie
- Aby utworzyć eksperyment AutoAI , kliknij opcję Nowy zasób > AutoAI.
- Więcej inform.
- Documentation o programie AutoAI
Stowarzyszona nauka
Użyj narzędzia do nauki stowarzyszonej, aby szkolić wspólny model przy użyciu rozproszonych danych. Dane nie są nigdy łączone ani współużytkowane, zachowując integralność danych podczas udostępniania wszystkich uczestniczących stron modelu na podstawie zagregowanych danych.
- Wymagana usługa
- Watson Machine Learning
- Format danych
- Dowolne
- Wielkość danych
- Dowolna wielkość
- W jaki sposób można budować modele
- Wybierz strukturę szkolenia.
- Skonfiguruj wspólny model.
- Skonfiguruj plik do szkolenia wspólnego modelu.
- Mają zdalne strony trenować swoje dane.
- Wdróż model wspólny.
- Wprowadzenie
- Aby utworzyć eksperyment, kliknij opcję Nowy zasób > Uczenie stowarzyszone.
- Więcej inform.
- Documentation dotycząca programu Federated Learning
Metadata import
Narzędzie do importowania metadanych służy do automatycznego wykrywania i importowania metadanych technicznych i procesowych dla zasobów danych w projekcie lub katalogu.
- Wymagana usługa
- Watson Knowledge Catalog
- Format danych
- Dowolne
- Wielkość danych
- Dowolna wielkość
- W jaki sposób można przygotować dane
- Importowanie zasobów danych z połączenia do źródła danych.
- Wprowadzenie
- Aby zaimportować metadane, kliknij opcję Nowy zasób > Metadata import.
- Więcej inform.
- Documentation dotycząca importu metadanych
- Filmy wideo dotyczące serwisu Watson Knowledge Catalog
Wzbogacanie metadanych
Użyj narzędzia do wzbogacania metadanych, aby automatycznie profilować zasoby danych i analizować jakość danych w projekcie.
- Wymagana usługa
- Watson Knowledge Catalog
- Format danych
- Relacyjny i strukturalny: Tabele i pliki w relacyjnych i nierelacyjnych źródłach danych
- Tabelaryczne pliki: Avro, CSV lub Parkiet
- Wielkość danych
- Dowolna wielkość
- W jaki sposób można przygotować i analizować dane
- Profilowanie i analizowanie wybranego zestawu zasobów danych w projekcie.
- Wprowadzenie
- Aby wzbogacić dane, kliknij opcję Nowy zasób > wzbogacanie metadanych.
- Więcej inform.
- Documentation dotycząca wzbogacania metadanych
Reguła jakości danych
Użyj narzędzia do jakości danych, aby utworzyć reguły, które analizują jakość danych w projekcie.
- Wymagana usługa
- Watson Knowledge Catalog
- Format danych
- Relacyjny i strukturalny: Tabele i pliki w relacyjnych i nierelacyjnych źródłach danych
- Tabelaryczne pliki: Avro, CSV lub Parkiet
- Wielkość danych
- Dowolna wielkość
- W jaki sposób można przygotować i analizować dane
- Analiza jakości wybranego zestawu zasobów danych w projekcie.
- Wprowadzenie
- Aby utworzyć regułę jakości danych, kliknij opcję Nowy zasób > Reguła jakości danych.
- Więcej inform.
- Documentation o regułach jakości danych
IBM Match 360 with Watson
Użyj programu IBM Match 360 with Watson , aby utworzyć główne jednostki danych reprezentujące cyfrowe bliźniacze klientów. Utwórz model i odwzoruj dane, a następnie uruchom zgodny algorytm, aby utworzyć główne obiekty danych. Dostosuj i dostrój odpowiedni algorytm, tak aby spełniał wymagania organizacji.
- Wymagane usługi
- IBM Match 360 with Watson IBM Watson Knowledge Catalog
- Wielkość danych
- Do 1 000 000 rekordów (dla planu Beta Lite)
- W jaki sposób można przygotować dane
- Modeluj i odwzoruj dane ze źródeł w organizacji.
- Uruchom dostosowywalny algorytm dopasowywania, aby utworzyć główne obiekty danych.
- Wyświetlanie i edytowanie obiektów danych głównych oraz powiązanych z nimi rekordów.
- Wprowadzenie
- Aby utworzyć zasób aplikacyjny konfiguracji IBM Match 360 , kliknij opcję Nowy zasób > Konfiguracja danych głównych.
- Więcej inform.
- Documentation o programie IBM Match 360 with Watson
Środowisko IDE produktu RStudio
Użyj środowiska RStudio IDE do analizy danych lub tworzenia aplikacji Shiny, pisząc kod R.
- Wymagana usługa
- Watson Studio
- Format danych
- Dowolne
- Wielkość danych
- Dowolna wielkość
- W jaki sposób można przygotować dane, analizować dane i budować modele
- Napisz kod w R.
- Tworzenie aplikacji Shiny.
- Użyj otwartych bibliotek źródłowych i pakietów.
- Dołącz do swojego kodu bogaty tekst i multimedia.
- Przygotuj dane.
- Wizualizuj dane.
- Odkryj spostrzeżenia z danych.
- Budowanie i szkolenie modelu przy użyciu bibliotek Open Source.
- Współużytkuj swoją aplikację Shiny w repozytorium Git .
- Wprowadzenie
- Aby użyć produktu RStudio, należy kliknąć opcję Uruchom środowisko IDE > RStudio.
- Więcej inform.
- Documentation produktu RStudio
- Przegląd wideo RStudio IDE
- Filmy wideo dotyczące produktu RStudio
Przepływy maskowania
Za pomocą narzędzia przepływu maskowania można przygotować maskowane kopie lub maskowane podzbiory danych z katalogu. Dane są de-identyfikowane przy użyciu zaawansowanych opcji maskowania z regułami ochrony danych.
- Wymagana usługa
- Watson Knowledge Catalog
- Format danych
- Relacyjny: Tabele w relacyjnych źródłach danych
- Wielkość danych
- Dowolna wielkość
- W jaki sposób można przygotować dane, przeanalizować dane lub zbudować modele
- Importowanie zasobów danych z katalogu zarządzanego do projektu.
- Utwórz definicje zadań przepływu maskowania, aby określić, które dane mają być maskowane zgodnie z regułami ochrony danych.
- Opcjonalnie podzbiór danych w celu zmniejszenia wielkości skopiowanych danych.
- Uruchom zadania maskowania przepływu, aby załadować maskowane kopie do docelowych połączeń z bazą danych.
- Wprowadzenie
- Upewnij się, że wstępnie wymagane kroki w produkcie Watson Knowledge Catalog zostały zakończone. Aby prywatyzować dane, wykonaj jedną z następujących czynności:
- Kliknij opcję Nowy zasób > Przepływ maskowania.
- Kliknij opcje menu dla poszczególnych zasobów danych, aby maskować ten zasób bezpośrednio.
- Więcej inform.
- Documentation o danych maskujących
Watson Pipelines
Edytor kanwy Pipelines służy do tworzenia przepływu w celu przygotowania, wizualizacji i analizy danych, a także do budowania i uczenia modelu.
- Format danych
- Dowolne
- Wielkość danych
- Dowolne
- W jaki sposób można przygotować dane, przeanalizować dane lub zbudować modele
- Użyj różnych węzłów, które zawierają własne dzienniki.
- Włącz notebooki do przepływu w celu uruchomienia dowolnego kodu Python lub R.
- Praca z dowolnym rodzajem danych w dowolny sposób.
- Trwa uruchamianie harmonogramu przepływu.
- Zaimportuj dane z podłączonego PVC, projektu lub danych z programu Github.
- Utwórz komponent niestandardowy przy użyciu kodu Python .
- W celu monitorowania jakości danych należy warunkowo monitorować jakość danych.
- Użyj haka WWW, aby wysyłać wiadomości e-mail lub wiadomości, aby na bieżąco informować o statusie Twojego przepływu.
- Wprowadzenie
- Aby utworzyć nowy potok, kliknij opcję Nowy zasób > Pipeliny.
Wizualizacje danych
Wizualizacje danych umożliwiają wykrywanie spostrzeżeń na podstawie danych. Eksplorując dane z różnych perspektyw z wizualizacjami, można identyfikować wzorce, połączenia i relacje w obrębie tych danych i szybko zrozumieć duże ilości informacji.
- Format danych
- Tabelaryczne: Avro, CSV, JSON, Parkiet, TSV, SAV, Microsoft Excel .xls i .xlsx, SAS, pliki tekstowe z ogranicznikami i połączone dane. Więcej informacji na temat obsługiwanych źródeł danych zawiera sekcja Konektory.
- Wielkość danych
- Brak limitu
- Wprowadzenie
- Aby utworzyć wizualizację, kliknij opcję Zasób danych na liście typów zasobów w projekcie, a następnie wybierz zasób danych. Kliknij kartę Wizualizacja i wybierz typ wykresu.
- Więcej inform.
- Wizualizacja danych
Temat nadrzędny: Projekty