0 / 0
Go back to the English version of the documentation
Výběr nástroje
Last updated: 20. 9. 2023
Výběr nástroje

Hlavní služby pro produkt Cloud Pak for Data as a Service poskytují široké spektrum nástrojů pro uživatele se všemi úrovněmi zkušeností při přípravě, analýze a modelování dat od začátečníků až po odborníky. Ten správný nástroj závisí na typu dat, na úlohách, které plánujete provést, a na množství automatizace, kterou chcete.

Chcete-li zobrazit nástroje, které používáte v projektu a které služby tyto nástroje vyžadují, otevřete mapu nástrojů a služeb.

Chcete-li vybrat správný nástroj, zvažte tyto faktory.

Typ dat, která máte

  • Tabulková data v souborech s oddělovači nebo v relačních datech ve vzdálených zdrojích dat
  • Soubory obrázků
  • Textová (nestrukturovaná) data v dokumentech

Typ úloh, které je třeba provést

  • Příprava dat: vyčištění, tvar, vizualizace, uspořádání a ověření dat.
  • Analýza dat: identifikace vzorů a vztahů v datech a zobrazení poznatků.
  • Modely sestavení: sestavení, školení, testování a implementace modelů pro vytváření předpovědí nebo optimalizaci rozhodnutí.

Jak moc automatizace chcete

  • Nástroje editoru kódu: Použijte pro zápis kódu do Python nebo R, vše také se Spark.
  • Grafické nástroje pro tvůrce: nabídky a funkce přetahování pomocí myši v tvůrci jsou vizuálně naprogramovány.
  • Automatizované nástroje tvůrce: slouží ke konfiguraci automatizovaných úloh, které vyžadují omezený vstup uživatele.

Najděte správný nástroj:

Nástroje pro tabulková nebo relační data

Nástroje pro tabulková nebo relační data podle úloh:

Nástroje pro tabulková nebo relační data
Nástroj Typ nástroje Připravit data Analyzovat data Sestavit modely
Editor notebooku Jupyter Editor kódu
Federovaný výukový materiál Editor kódu
Produkt RStudio Editor kódu
Data Refinery Grafický tvůrce
Maskování toku Automatizovaný tvůrce
Watson Query Grafický tvůrce
DataStage Grafický tvůrce
Editor panelu dashboard Grafický tvůrce
SPSS Modeler Grafický tvůrce
Tvůrce modelů produktu Decision Optimization Grafický tvůrce a editor kódu
AutoAI Automatizovaný tvůrce
Metadata import Automatizovaný tvůrce
Obohacení metadat Automatizovaný tvůrce
Pravidlo kvality dat Automatizovaný tvůrce a editor kódu
IBM Match 360 with Watson (Beta) Automatizovaný tvůrce
Watson Pipelines Grafický tvůrce

Nástroje pro textová data

Nástroje pro sestavení modelu, který klasifikuje textová data:

Nástroje pro textová data
Nástroj Editor kódu Grafický tvůrce Automatizovaný tvůrce
Editor notebooku Jupyter
Produkt RStudio
SPSS Modeler
Watson Pipelines

Nástroje pro obrazová data

Nástroje pro sestavení modelu, který klasifikuje obrázky:

Nástroje pro obrazová data
Nástroj Editor kódu Grafický tvůrce Automatizovaný tvůrce
Editor notebooku Jupyter
Produkt RStudio
Watson Pipelines

Přístup k nástrojům

Chcete-li použít nářadí, musíte vytvořit aktivum specifické pro tento nástroj nebo otevřít existující aktivum pro tento nástroj. Chcete-li vytvořit aktivum, klepněte na volbu Nové aktivum nebo Importovat aktiva a poté vyberte typ aktiva, který chcete. Tato tabulka zobrazuje typ aktiva, které se má zvolit pro každý nástroj.

Nástroje pro mapování typu aktiva
Použití tohoto nástroje Zvolit tento typ aktiva
Editor notebooku Jupyter Editor notebooku Jupyter
Data Refinery Tok Data Refinery
Maskování toků Maskování toků
DataStage Tok DataStage
Editor panelu dashboard Řídicí panel
SPSS Modeler Tok produktu Modeler
Tvůrce modelů produktu Decision Optimization Decision Optimization
AutoAI Experiment AutoAI
Federovaný výukový materiál Federovaný výukový test
Metadata import Metadata import
Obohacení metadat obohacení metadat
Pravidla kvality dat Pravidlo kvality dat
IBM Match 360 with Watson (Beta) Konfigurace hlavních dat

Chcete-li upravit zápisníky s RStudio, klepněte na volbu Spustit prostředí IDE > RStudio.

Editor notebooku Jupyter

Pomocí editoru zápisníku Jupyter vytvořte zápisník, ve kterém spustíte kód pro přípravu, vizualizaci a analýzu dat nebo pro sestavení a vycvicení modelu.

Požadovaná služba
Watson Studio
Formát dat
Jakékoli
Velikost dat
Jakékoli
Jak můžete připravit data, analyzovat data nebo sestavovat modely
Napište kód do Python nebo R, vše také se Spark.
Zahrňte formátovaný text a média do kódu.
Pracujte s libovolným druhem dat libovolným způsobem.
Použít předinstalované nebo instalovat jiné otevřené zdrojové knihovny a knihovny IBM a balíky.
Plánovat spuštění vašeho kódu
Importovat zápisník ze souboru, adresy URL nebo z galerie.
Sdílejte kopie vašeho notebooku jen pro čtení externě.
Začínáme
Chcete-li vytvořit zápisník, klepněte na volbu Nové aktivum > Editor notebooku Jupyter.
Další informace
Načíst a analyzovat video veřejné datové sady
Videa o přenosných počítačích
Ukázkové notebooky
Documentation o přenosných počítačích

Data Refinery

Použijte Data Refinery k přípravě a vizualizaci tabulkových dat pomocí grafického editoru toků. Vytvoříte a poté spustíte tok Data Refinery jako sadu řazených operací na datech.

Požadované služby
Watson Studio nebo Watson Knowledge Catalog
Formát dat
Tabulková tabulka: AVro, CSV, JSON, Microsoft Excel (xls a xlsx formats). Pouze první list, kromě spojů a připojených datových aktiv.), Parquet, SAS s příponou "sas7bdat" (jen pro čtení), TSV (jen pro čtení) nebo aktiva s oddělovači textu s oddělovači
Relační: Tabulky v relačních zdrojích dat
Velikost dat
Jakékoli
Jak připravit data
Očistěte, tvarem, organizujte data s více než 60 operacemi.
Uložit upřesněné údaje jako novou datovou sadu nebo aktualizovat původní data.
Data profilu pro ověření platnosti.
Interaktivní šablony používejte k manipulaci s daty s operacemi kódu, funkcemi a logickými operátory.
Plánování opakovaných operací na datech.
Jak analyzovat data
Identifikujte vzory, připojení a vztahy v rámci dat ve více vizualizačních grafech.
Začínáme
Chcete-li vytvořit tok Data Refinery , klepněte na volbu Nové aktivum > Data Refinery. Dlaždice Data Refinery se nachází v sekci Grafická tvůrci .
Další informace
Documentation o Data Refinery
Videa o Data Refinery
Video tvaru dat

Watson Query

Produkt Watson Query můžete použít k připojení více zdrojů dat do jediného samovyvažovacího shromažďování zdrojů dat nebo databází.

Formát dat
Relační: Tabulky v relačních zdrojích dat
Velikost dat
Jakékoli
Jak připravit data
Připojte se k více zdrojům dat.
Vytvořte virtuální tabulky.
Začínáme
Chcete-li vytvořit virtuální tabulky, klepněte na volbu Data > Data virtualization. V nabídce služby klepněte na volbu Virtualizace > Virtualizace > Tabulky.
Další informace
Dokumentace k produktuWatson Query

DataStage

Pomocí produktu DataStage připravte a vizualizujte tabulková data pomocí grafického editoru toků. Vytvoříte a poté spustíte tok DataStage jako sadu řazených operací s daty.

Formát dat
Tabulková tabulka: Avro, CSV, JSON, Parquet, TSV (pouze pro čtení) nebo textové soubory s oddělovači
Relační: Tabulky v relačních zdrojích dat
Velikost dat
Jakékoli
Jak připravit data
Navrhněte grafický tok integrace dat, který generuje kód Orchestrát, který má být spuštěn na vysoce výkonném paralelním stroji DataStage .
Proveďte operace, jako jsou: Join, Funnel, Checksum, Merge, Modify, Remove Duplicates, and Sort.
Začínáme
Chcete-li vytvořit tok DataStage , klepněte na volbu Nové aktivum > DataStage. Dlaždice DataStage se nachází v sekci Grafická tvůrci .
Další informace
Dokumentace k produktuDataStage

Editor panelu dashboard

Pomocí editoru panelu dashboard můžete vytvořit sadu vizualizací analytických výsledků v grafickém tvůrci.

Požadovaná služba
Cognos Dashboard Embedded
Formát dat
Tabulkové: CSV-soubory
Relační: Tabulky v některých relačních zdrojích dat
Velikost dat
Libovolná velikost
Jak analyzovat data
Vytvořit grafy bez kódování.
Do svého panelu dashboard.: Sdílejte interaktivní panely dashboard externě.
Začínáme
Chcete-li vytvořit panel dashboard, klepněte na volbu Nové aktivum > Editor panelů dashboard. Dlaždice Editor panelu dashboard se nachází v sekci Grafická tvůrci .
Další informace
Documentation o panelech dashboard
Videa o panelech dashboard

SPSS Modeler

Pomocí produktu SPSS Modeler vytvořte tok k přípravě dat a sestavení a vycvičování modelu pomocí editoru toků v grafickém tvůrci.

Požadované služby
Watson Studio
Formáty dat
Relační: Tabulky v relačních zdrojích dat
Tabulková: Soubory aplikace Excel (.xls nebo .xlsx), soubory CSV nebo soubory SPSS Statistics (.sav)
Textuální: V podporovaných relačních tabulkách nebo souborech
Velikost dat
Jakékoli
Jak připravit data
Použít automatické funkce přípravy dat.
Psát příkazy SQL pro manipulaci s daty.
Očistěte, tvarovat, třídit, třídit a odvozovat data.
Jak analyzovat data
Vizualizovat data pomocí více než 40 grafů.
Identifikujte přirozený jazyk textového pole.
Jak můžete sestavit modely
Sestavit prediktivní modely.
Vyberte si z více než 40 algoritmů modelování.
Používejte funkce automatického modelování.
Modelové časové řady nebo geoprostorová data.
Klasifikujte textová data.
Identifikujte vztahy mezi koncepcemi v textových datech.
Začínáme
Chcete-li vytvořit tok SPSS Modeler , klepněte na volbu Nové aktivum > SPSS Modeler.
Další informace
SPSS Modeler -Obnovené uživatelské rozhraní pro video s produktem Enterprise Data Science powerhouse video
Documentation k produktu SPSS Modeler

Tvůrce modelů Decision Optimization

Volbu Decision Optimization použijte k sestavení a spuštění optimalizačních modelů v modeláře Decision Optimization nebo v zápisníku Jupyter.

Požadované služby
Watson Studio
Formáty dat
Tabulkové: CSV-soubory
Velikost dat
Jakékoli
Jak připravit data
Importujte relevantní data do scénáře a upravte ji.
Jak můžete sestavit modely
Sestavujte modelovací modely pro rozhodování.
Vytvářejte, importujte a upravujte modely v produktu Python DOcplex, OPL nebo s výrazy přirozeného jazyka.
Vytvořit, importovat a upravit modely v přenosných počítačích.
Jak můžete řešit modely
Spuštění a řešení optimalizačních modelů rozhodování pomocí strojů CPLEX.
Prozkoumejte a porovnejte řešení pro více scénářů.
Vytvářejte tabulky, grafy a poznámky k vizualizaci dat a řešení pro jeden nebo více scénářů.
Začínáme
Chcete-li vytvořit model Decision Optimization , klepněte na volbu Nové aktivum > Decision Optimizationnebo pro přenosné počítače klepněte na volbu Nové aktivum > Editor notebooku Jupyter.
Další informace
Videa o Decision Optimization
Documentation o Decision Optimization

Nástroj AutoAI

Pomocí nástroje AutoAI můžete automaticky analyzovat tabulková data a generovat kandidátní modelové kolony přizpůsobené pro prediktivní problém modelování.

Požadovaná služba
Watson Machine Learning
Formát dat
Tabulkové: CSV-soubory
Velikost dat
Závisí na typu modelu. Podrobnosti viz AutoAI Přehled .
Jak připravit data
Automaticky transformujte data, jako je vkládání chybějících hodnot a transformujte text na skalární hodnoty.
Jak můžete sestavit modely
Vypravit binární klasifikaci, klasifikaci multiskla nebo regresní model.
Zobrazení stromu s infografickými informacemi, které ukazují posloupnosti fází AutoAI .
Vygenerujte žebříček ropovodů seřazených podle skóre křížových ověření.
Uložte kolonu jako model.
Začínáme
Chcete-li vytvořit experiment AutoAI , klepněte na volbu Nové aktivum > AutoAI.
Další informace
Documentation o AutoAI

Federované učení

Použijte nástroj Federated Learning k vyškolení běžného modelu pomocí distribuovaných dat. Data nejsou nikdy zkombinována nebo sdílena, zachovávají integritu dat a zároveň poskytuje všem zúčastněným stranám model založený na agregovaných datech.

Požadovaná služba
Watson Machine Learning
Formát dat
Jakékoli
Velikost dat
Libovolná velikost
Jak můžete sestavit modely
Vyberte si tréninkový rámec.
Nakonfigurujte společný model.
Nakonfigurujte soubor pro školení obecného modelu.
Mají vzdálené strany trénovat jejich data.
Implementujte obecný model.
Začínáme
Chcete-li vytvořit experiment, klepněte na volbu Nové aktivum > Federované učení.
Další informace
Documentation o produktu Federated Learning

Metadata import

Použijte nástroj pro import metadat k automatickému zjišťování a importu technických metadat a metadat procesu pro datová aktiva do projektu nebo katalogu.

Požadovaná služba
Watson Knowledge Catalog
Formát dat
Jakékoli
Velikost dat
Libovolná velikost
Jak připravit data
Import datových aktiv z připojení ke zdroji dat.
Začínáme
Chcete-li importovat metadata, klepněte na volbu Nové aktivum > Metadata import.
Další informace
Documentation o importu metadat
Videa o produktu Watson Knowledge Catalog

obohacení metadat

Použijte nástroj pro obohacení obsahu metadat k automatickému profilování datových aktiv a analýzu kvality dat v projektu.

Požadovaná služba
Watson Knowledge Catalog
Formát dat
Relační a strukturované: Tabulky a soubory v relačních a nerelačních zdrojích dat
Tabulkové soubory: Avro, CSV nebo Parquet
Velikost dat
Libovolná velikost
Jak můžete připravit a analyzovat data
Profilovat a analyzovat sadu vybraných datových aktiv v projektu.
Začínáme
Chcete-li obohatí data, klepněte na volbu Nové aktivum > obohacení metadat.
Další informace
Documentation o obohacení metadat

Pravidlo kvality dat

Použijte nástroj kvality dat k vytvoření pravidel, která analyzují kvalitu dat v projektu.

Požadovaná služba
Watson Knowledge Catalog
Formát dat
Relační a strukturované: Tabulky a soubory v relačních a nerelačních zdrojích dat
Tabulkové soubory: Avro, CSV nebo Parquet
Velikost dat
Libovolná velikost
Jak můžete připravit a analyzovat data
Analyzovat kvalitu vybrané sady datových aktiv v projektu.
Začínáme
Chcete-li vytvořit pravidlo kvality dat, klepněte na volbu Nové aktivum > Pravidlo kvality dat.
Další informace
Documentation o pravidlech kvality dat

IBM Match 360 with Watson

Použijte produkt IBM Match 360 with Watson k vytvoření hlavních datových entit, které představují digitální dvojčata vašich zákazníků. Modelovat a mapovat vaše data, poté spustit odpovídající algoritmus pro vytvoření entit hlavních dat. Upravte a vylaďte odpovídající algoritmus, aby odpovídal požadavkům vaší organizace.

Požadované služby
IBM Match 360 with Watson IBM Watson Knowledge Catalog
Velikost dat
Až 1 000 000 záznamů (pro plán Beta Lite)
Jak připravit data
Modelovat a mapovat data ze zdrojů v rámci vaší organizace.
Spusťte přizpůsobitelný algoritmus shody pro vytvoření hlavních datových entit.
Zobrazit a upravit hlavní datové entity a jejich přidružené záznamy.
Začínáme
Chcete-li vytvořit aktivum konfigurace IBM Match 360 , klepněte na volbu Nové aktivum > Konfigurace hlavních dat.
Další informace
Documentation k produktu IBM Match 360 with Watson

Prostředí RStudio IDE

Použijte produkt RStudio IDE k analýze dat nebo pro vytvoření aplikací Shiny zápisem kódu R.

Požadovaná služba
Watson Studio
Formát dat
Jakékoli
Velikost dat
Libovolná velikost
Jak můžete připravit data, analyzovat data a sestavovat modely
Zapsat kód na R.
Vytvořte Shiny aplikace.
Použijte otevřené zdrojové knihovny a balíky.
Zahrňte formátovaný text a média do kódu.
Připravit data.
Vizualizovat data.
Objevte poznatky z dat.
Sestavte a vycvičujte model pomocí knihoven s otevřeným zdrojovým kódem.
Sdílejte svou aplikaci Shiny v úložišti Git .
Začínáme
Chcete-li použít aplikaci RStudio, klepněte na volbu Spustit prostředí IDE > RStudio.
Další informace
Documentation k aplikaci RStudio
Přehled videa produktu RStudio IDE
Videa o produktu RStudio

Maskování toků

Použijte nástroj toku Masking k přípravě maskovaných kopií nebo maskovaných dílčích sad dat z katalogu. Data jsou deidentifikovaná pomocí rozšířených voleb maskování s pravidly ochrany dat.

Požadovaná služba
Watson Knowledge Catalog
Formát dat
Relační: Tabulky v relačních zdrojích dat
Velikost dat
Libovolná velikost
Jak můžete připravit data, analyzovat data nebo sestavovat modely
Importujte data aktiv z regulovaného katalogu do projektu.
Vytvořením definic úloh pro maskování úloh určete, jaká data se mají maskovat pomocí pravidel ochrany dat.
Volitelná dílčí sada dat pro omezení velikosti zkopírovaných dat.
Spusťte maskovací úlohy, které navedou maskované kopie do cílových databázových spojení.
Začínáme
Ujistěte se, že jsou dokončeny předem požadované kroky v produktu Watson Knowledge Catalog. Chcete-li privatizovat data, proveďte jednu z následujících úloh:
  • Klepněte na volbu Nové aktivum > Průtok maskování.
  • Klepněte na volby nabídky pro jednotlivá datová aktiva, chcete-li přímo zamaskovat aktivum.
Další informace
Documentation o maskování dat

Watson Pipelines

Editor plátna Pipelines slouží k vytvoření toku pro přípravu, vizualizaci a analýzu dat nebo pro sestavení a přípravu modelu.

Formát dat
Jakékoli
Velikost dat
Jakékoli
Jak můžete připravit data, analyzovat data nebo sestavovat modely
Použijte různé uzly, které každý obsahuje vlastní protokoly.
Chcete-li spustit jakýkoli kód Python nebo R, do toku vložte do toku podnikové přenosné počítače.
Pracujte s libovolným druhem dat libovolným způsobem.
Plán se spustí s vaším tokem.
Importujte data z vašeho připojeného PVC, projektu nebo data příjmu od objektu Github.
Vytvořte vlastní komponentu s kódem Python .
Stabilizujte své kolony tak, abyste monitorovali kvalitu dat, ale chcete.
Pomocí webhooku odešlete e-maily nebo zprávy, které chcete průběžně aktualizovat ve stavu vašeho toku.
Začínáme
Chcete-li vytvořit nový propojení procesů, klepněte na volbu Nové aktivum > Propojení procesů.

Vizualizace dat

Vizualizace dat slouží ke zjišťování informací z vašich dat. Prozkoumávání dat z různých perspektiv s vizualizacemi umožňuje identifikovat vzory, připojení a vztahy v rámci těchto dat a rychle pochopit velké množství informací.

Formát dat
Tabulární: Avro, CSV, JSON, Parquet, TSV, SAV, Microsoft Excel .xls a .xlsx, SAS, textové soubory s oddělovači a připojená data. Další informace o podporovaných zdrojích dat naleznete v tématu Konektory.
Velikost dat
Bez omezení
Začínáme
Chcete-li vytvořit vizualizaci, klepněte na volbu Datové aktivum v seznamu typů aktiv ve svém projektu a vyberte datové aktivum. Klepněte na kartu Vizualizace a vyberte typ grafu.
Další informace
Vizualizace dat

Nadřízené téma: Projekty