Translation not up to date
Hlavní služby pro produkt Cloud Pak for Data as a Service poskytují široké spektrum nástrojů pro uživatele se všemi úrovněmi zkušeností při přípravě, analýze a modelování dat od začátečníků až po odborníky. Ten správný nástroj závisí na typu dat, na úlohách, které plánujete provést, a na množství automatizace, kterou chcete.
Chcete-li zobrazit nástroje, které používáte v projektu a které služby tyto nástroje vyžadují, otevřete mapu nástrojů a služeb.
Chcete-li vybrat správný nástroj, zvažte tyto faktory.
Typ dat, která máte
- Tabulková data v souborech s oddělovači nebo v relačních datech ve vzdálených zdrojích dat
- Soubory obrázků
- Textová (nestrukturovaná) data v dokumentech
Typ úloh, které je třeba provést
- Příprava dat: vyčištění, tvar, vizualizace, uspořádání a ověření dat.
- Analýza dat: identifikace vzorů a vztahů v datech a zobrazení poznatků.
- Modely sestavení: sestavení, školení, testování a implementace modelů pro vytváření předpovědí nebo optimalizaci rozhodnutí.
Jak moc automatizace chcete
- Nástroje editoru kódu: Použijte pro zápis kódu do Python nebo R, vše také se Spark.
- Grafické nástroje pro tvůrce: nabídky a funkce přetahování pomocí myši v tvůrci jsou vizuálně naprogramovány.
- Automatizované nástroje tvůrce: slouží ke konfiguraci automatizovaných úloh, které vyžadují omezený vstup uživatele.
Najděte správný nástroj:
- Nástroje pro tabulková nebo relační data
- Nástroje pro textová data
- Nástroje pro data obrázku
- Přístup k nástrojům
Nástroje pro tabulková nebo relační data
Nástroje pro tabulková nebo relační data podle úloh:
Nástroj | Typ nástroje | Připravit data | Analyzovat data | Sestavit modely |
---|---|---|---|---|
Editor notebooku Jupyter | Editor kódu | ✓ | ✓ | ✓ |
Federovaný výukový materiál | Editor kódu | ✓ | ||
Produkt RStudio | Editor kódu | ✓ | ✓ | ✓ |
Data Refinery | Grafický tvůrce | ✓ | ✓ | |
Maskování toku | Automatizovaný tvůrce | ✓ | ||
Watson Query | Grafický tvůrce | ✓ | ||
DataStage | Grafický tvůrce | ✓ | ||
Editor panelu dashboard | Grafický tvůrce | ✓ | ||
SPSS Modeler | Grafický tvůrce | ✓ | ✓ | ✓ |
Tvůrce modelů produktu Decision Optimization | Grafický tvůrce a editor kódu | ✓ | ✓ | |
AutoAI | Automatizovaný tvůrce | ✓ | ✓ | |
Metadata import | Automatizovaný tvůrce | ✓ | ||
Obohacení metadat | Automatizovaný tvůrce | ✓ | ✓ | |
Pravidlo kvality dat | Automatizovaný tvůrce a editor kódu | ✓ | ||
IBM Match 360 with Watson (Beta) | Automatizovaný tvůrce | ✓ | ||
Watson Pipelines | Grafický tvůrce | ✓ | ✓ | ✓ |
Nástroje pro textová data
Nástroje pro sestavení modelu, který klasifikuje textová data:
Nástroj | Editor kódu | Grafický tvůrce | Automatizovaný tvůrce |
---|---|---|---|
Editor notebooku Jupyter | ✓ | ||
Produkt RStudio | ✓ | ||
SPSS Modeler | ✓ | ||
Watson Pipelines | ✓ |
Nástroje pro obrazová data
Nástroje pro sestavení modelu, který klasifikuje obrázky:
Nástroj | Editor kódu | Grafický tvůrce | Automatizovaný tvůrce |
---|---|---|---|
Editor notebooku Jupyter | ✓ | ||
Produkt RStudio | ✓ | ||
Watson Pipelines | ✓ |
Přístup k nástrojům
Chcete-li použít nářadí, musíte vytvořit aktivum specifické pro tento nástroj nebo otevřít existující aktivum pro tento nástroj. Chcete-li vytvořit aktivum, klepněte na volbu Nové aktivum nebo Importovat aktiva a poté vyberte typ aktiva, který chcete. Tato tabulka zobrazuje typ aktiva, které se má zvolit pro každý nástroj.
Použití tohoto nástroje | Zvolit tento typ aktiva |
---|---|
Editor notebooku Jupyter | Editor notebooku Jupyter |
Data Refinery | Tok Data Refinery |
Maskování toků | Maskování toků |
DataStage | Tok DataStage |
Editor panelu dashboard | Řídicí panel |
SPSS Modeler | Tok produktu Modeler |
Tvůrce modelů produktu Decision Optimization | Decision Optimization |
AutoAI | Experiment AutoAI |
Federovaný výukový materiál | Federovaný výukový test |
Metadata import | Metadata import |
Obohacení metadat | obohacení metadat |
Pravidla kvality dat | Pravidlo kvality dat |
IBM Match 360 with Watson (Beta) | Konfigurace hlavních dat |
Chcete-li upravit zápisníky s RStudio, klepněte na volbu Spustit prostředí IDE > RStudio.
Editor notebooku Jupyter
Pomocí editoru zápisníku Jupyter vytvořte zápisník, ve kterém spustíte kód pro přípravu, vizualizaci a analýzu dat nebo pro sestavení a vycvicení modelu.
- Požadovaná služba
- Watson Studio
- Formát dat
- Jakékoli
- Velikost dat
- Jakékoli
- Jak můžete připravit data, analyzovat data nebo sestavovat modely
- Napište kód do Python nebo R, vše také se Spark.
- Zahrňte formátovaný text a média do kódu.
- Pracujte s libovolným druhem dat libovolným způsobem.
- Použít předinstalované nebo instalovat jiné otevřené zdrojové knihovny a knihovny IBM a balíky.
- Plánovat spuštění vašeho kódu
- Importovat zápisník ze souboru, adresy URL nebo z galerie.
- Sdílejte kopie vašeho notebooku jen pro čtení externě.
- Začínáme
- Chcete-li vytvořit zápisník, klepněte na volbu Nové aktivum > Editor notebooku Jupyter.
- Další informace
- Načíst a analyzovat video veřejné datové sady
- Videa o přenosných počítačích
- Ukázkové notebooky
- Documentation o přenosných počítačích
Data Refinery
Použijte Data Refinery k přípravě a vizualizaci tabulkových dat pomocí grafického editoru toků. Vytvoříte a poté spustíte tok Data Refinery jako sadu řazených operací na datech.
- Požadované služby
- Watson Studio nebo Watson Knowledge Catalog
- Formát dat
- Tabulková tabulka: AVro, CSV, JSON, Microsoft Excel (xls a xlsx formats). Pouze první list, kromě spojů a připojených datových aktiv.), Parquet, SAS s příponou "sas7bdat" (jen pro čtení), TSV (jen pro čtení) nebo aktiva s oddělovači textu s oddělovači
- Relační: Tabulky v relačních zdrojích dat
- Velikost dat
- Jakékoli
- Jak připravit data
- Očistěte, tvarem, organizujte data s více než 60 operacemi.
- Uložit upřesněné údaje jako novou datovou sadu nebo aktualizovat původní data.
- Data profilu pro ověření platnosti.
- Interaktivní šablony používejte k manipulaci s daty s operacemi kódu, funkcemi a logickými operátory.
- Plánování opakovaných operací na datech.
- Jak analyzovat data
- Identifikujte vzory, připojení a vztahy v rámci dat ve více vizualizačních grafech.
- Začínáme
- Chcete-li vytvořit tok Data Refinery , klepněte na volbu Nové aktivum > Data Refinery. Dlaždice Data Refinery se nachází v sekci Grafická tvůrci .
- Další informace
- Documentation o Data Refinery
- Videa o Data Refinery
- Video tvaru dat
Watson Query
Produkt Watson Query můžete použít k připojení více zdrojů dat do jediného samovyvažovacího shromažďování zdrojů dat nebo databází.
- Formát dat
- Relační: Tabulky v relačních zdrojích dat
- Velikost dat
- Jakékoli
- Jak připravit data
- Připojte se k více zdrojům dat.
- Vytvořte virtuální tabulky.
- Začínáme
- Chcete-li vytvořit virtuální tabulky, klepněte na volbu Data > Data virtualization. V nabídce služby klepněte na volbu Virtualizace > Virtualizace > Tabulky.
- Další informace
- Dokumentace k produktuWatson Query
DataStage
Pomocí produktu DataStage připravte a vizualizujte tabulková data pomocí grafického editoru toků. Vytvoříte a poté spustíte tok DataStage jako sadu řazených operací s daty.
- Formát dat
- Tabulková tabulka: Avro, CSV, JSON, Parquet, TSV (pouze pro čtení) nebo textové soubory s oddělovači
- Relační: Tabulky v relačních zdrojích dat
- Velikost dat
- Jakékoli
- Jak připravit data
- Navrhněte grafický tok integrace dat, který generuje kód Orchestrát, který má být spuštěn na vysoce výkonném paralelním stroji DataStage .
- Proveďte operace, jako jsou: Join, Funnel, Checksum, Merge, Modify, Remove Duplicates, and Sort.
- Začínáme
- Chcete-li vytvořit tok DataStage , klepněte na volbu Nové aktivum > DataStage. Dlaždice DataStage se nachází v sekci Grafická tvůrci .
- Další informace
- Dokumentace k produktuDataStage
Editor panelu dashboard
Pomocí editoru panelu dashboard můžete vytvořit sadu vizualizací analytických výsledků v grafickém tvůrci.
- Požadovaná služba
- Cognos Dashboard Embedded
- Formát dat
- Tabulkové: CSV-soubory
- Relační: Tabulky v některých relačních zdrojích dat
- Velikost dat
- Libovolná velikost
- Jak analyzovat data
- Vytvořit grafy bez kódování.
- Do svého panelu dashboard.: Sdílejte interaktivní panely dashboard externě.
- Začínáme
- Chcete-li vytvořit panel dashboard, klepněte na volbu Nové aktivum > Editor panelů dashboard. Dlaždice Editor panelu dashboard se nachází v sekci Grafická tvůrci .
- Další informace
- Documentation o panelech dashboard
- Videa o panelech dashboard
SPSS Modeler
Pomocí produktu SPSS Modeler vytvořte tok k přípravě dat a sestavení a vycvičování modelu pomocí editoru toků v grafickém tvůrci.
- Požadované služby
- Watson Studio
- Formáty dat
- Relační: Tabulky v relačních zdrojích dat
- Tabulková: Soubory aplikace Excel (.xls nebo .xlsx), soubory CSV nebo soubory SPSS Statistics (.sav)
- Textuální: V podporovaných relačních tabulkách nebo souborech
- Velikost dat
- Jakékoli
- Jak připravit data
- Použít automatické funkce přípravy dat.
- Psát příkazy SQL pro manipulaci s daty.
- Očistěte, tvarovat, třídit, třídit a odvozovat data.
- Jak analyzovat data
- Vizualizovat data pomocí více než 40 grafů.
- Identifikujte přirozený jazyk textového pole.
- Jak můžete sestavit modely
- Sestavit prediktivní modely.
- Vyberte si z více než 40 algoritmů modelování.
- Používejte funkce automatického modelování.
- Modelové časové řady nebo geoprostorová data.
- Klasifikujte textová data.
- Identifikujte vztahy mezi koncepcemi v textových datech.
- Začínáme
- Chcete-li vytvořit tok SPSS Modeler , klepněte na volbu Nové aktivum > SPSS Modeler.
- Další informace
- SPSS Modeler -Obnovené uživatelské rozhraní pro video s produktem Enterprise Data Science powerhouse video
- Documentation k produktu SPSS Modeler
Tvůrce modelů Decision Optimization
Volbu Decision Optimization použijte k sestavení a spuštění optimalizačních modelů v modeláře Decision Optimization nebo v zápisníku Jupyter.
- Požadované služby
- Watson Studio
- Formáty dat
- Tabulkové: CSV-soubory
- Velikost dat
- Jakékoli
- Jak připravit data
- Importujte relevantní data do scénáře a upravte ji.
- Jak můžete sestavit modely
- Sestavujte modelovací modely pro rozhodování.
- Vytvářejte, importujte a upravujte modely v produktu Python DOcplex, OPL nebo s výrazy přirozeného jazyka.
- Vytvořit, importovat a upravit modely v přenosných počítačích.
- Jak můžete řešit modely
- Spuštění a řešení optimalizačních modelů rozhodování pomocí strojů CPLEX.
- Prozkoumejte a porovnejte řešení pro více scénářů.
- Vytvářejte tabulky, grafy a poznámky k vizualizaci dat a řešení pro jeden nebo více scénářů.
- Začínáme
- Chcete-li vytvořit model Decision Optimization , klepněte na volbu Nové aktivum > Decision Optimizationnebo pro přenosné počítače klepněte na volbu Nové aktivum > Editor notebooku Jupyter.
- Další informace
- Videa o Decision Optimization
- Documentation o Decision Optimization
Nástroj AutoAI
Pomocí nástroje AutoAI můžete automaticky analyzovat tabulková data a generovat kandidátní modelové kolony přizpůsobené pro prediktivní problém modelování.
- Požadovaná služba
- Watson Machine Learning
- Formát dat
- Tabulkové: CSV-soubory
- Velikost dat
- Závisí na typu modelu. Podrobnosti viz AutoAI Přehled .
- Jak připravit data
- Automaticky transformujte data, jako je vkládání chybějících hodnot a transformujte text na skalární hodnoty.
- Jak můžete sestavit modely
- Vypravit binární klasifikaci, klasifikaci multiskla nebo regresní model.
- Zobrazení stromu s infografickými informacemi, které ukazují posloupnosti fází AutoAI .
- Vygenerujte žebříček ropovodů seřazených podle skóre křížových ověření.
- Uložte kolonu jako model.
- Začínáme
- Chcete-li vytvořit experiment AutoAI , klepněte na volbu Nové aktivum > AutoAI.
- Další informace
- Documentation o AutoAI
Federované učení
Použijte nástroj Federated Learning k vyškolení běžného modelu pomocí distribuovaných dat. Data nejsou nikdy zkombinována nebo sdílena, zachovávají integritu dat a zároveň poskytuje všem zúčastněným stranám model založený na agregovaných datech.
- Požadovaná služba
- Watson Machine Learning
- Formát dat
- Jakékoli
- Velikost dat
- Libovolná velikost
- Jak můžete sestavit modely
- Vyberte si tréninkový rámec.
- Nakonfigurujte společný model.
- Nakonfigurujte soubor pro školení obecného modelu.
- Mají vzdálené strany trénovat jejich data.
- Implementujte obecný model.
- Začínáme
- Chcete-li vytvořit experiment, klepněte na volbu Nové aktivum > Federované učení.
- Další informace
- Documentation o produktu Federated Learning
Metadata import
Použijte nástroj pro import metadat k automatickému zjišťování a importu technických metadat a metadat procesu pro datová aktiva do projektu nebo katalogu.
- Požadovaná služba
- Watson Knowledge Catalog
- Formát dat
- Jakékoli
- Velikost dat
- Libovolná velikost
- Jak připravit data
- Import datových aktiv z připojení ke zdroji dat.
- Začínáme
- Chcete-li importovat metadata, klepněte na volbu Nové aktivum > Metadata import.
- Další informace
- Documentation o importu metadat
- Videa o produktu Watson Knowledge Catalog
obohacení metadat
Použijte nástroj pro obohacení obsahu metadat k automatickému profilování datových aktiv a analýzu kvality dat v projektu.
- Požadovaná služba
- Watson Knowledge Catalog
- Formát dat
- Relační a strukturované: Tabulky a soubory v relačních a nerelačních zdrojích dat
- Tabulkové soubory: Avro, CSV nebo Parquet
- Velikost dat
- Libovolná velikost
- Jak můžete připravit a analyzovat data
- Profilovat a analyzovat sadu vybraných datových aktiv v projektu.
- Začínáme
- Chcete-li obohatí data, klepněte na volbu Nové aktivum > obohacení metadat.
- Další informace
- Documentation o obohacení metadat
Pravidlo kvality dat
Použijte nástroj kvality dat k vytvoření pravidel, která analyzují kvalitu dat v projektu.
- Požadovaná služba
- Watson Knowledge Catalog
- Formát dat
- Relační a strukturované: Tabulky a soubory v relačních a nerelačních zdrojích dat
- Tabulkové soubory: Avro, CSV nebo Parquet
- Velikost dat
- Libovolná velikost
- Jak můžete připravit a analyzovat data
- Analyzovat kvalitu vybrané sady datových aktiv v projektu.
- Začínáme
- Chcete-li vytvořit pravidlo kvality dat, klepněte na volbu Nové aktivum > Pravidlo kvality dat.
- Další informace
- Documentation o pravidlech kvality dat
IBM Match 360 with Watson
Použijte produkt IBM Match 360 with Watson k vytvoření hlavních datových entit, které představují digitální dvojčata vašich zákazníků. Modelovat a mapovat vaše data, poté spustit odpovídající algoritmus pro vytvoření entit hlavních dat. Upravte a vylaďte odpovídající algoritmus, aby odpovídal požadavkům vaší organizace.
- Požadované služby
- IBM Match 360 with Watson IBM Watson Knowledge Catalog
- Velikost dat
- Až 1 000 000 záznamů (pro plán Beta Lite)
- Jak připravit data
- Modelovat a mapovat data ze zdrojů v rámci vaší organizace.
- Spusťte přizpůsobitelný algoritmus shody pro vytvoření hlavních datových entit.
- Zobrazit a upravit hlavní datové entity a jejich přidružené záznamy.
- Začínáme
- Chcete-li vytvořit aktivum konfigurace IBM Match 360 , klepněte na volbu Nové aktivum > Konfigurace hlavních dat.
- Další informace
- Documentation k produktu IBM Match 360 with Watson
Prostředí RStudio IDE
Použijte produkt RStudio IDE k analýze dat nebo pro vytvoření aplikací Shiny zápisem kódu R.
- Požadovaná služba
- Watson Studio
- Formát dat
- Jakékoli
- Velikost dat
- Libovolná velikost
- Jak můžete připravit data, analyzovat data a sestavovat modely
- Zapsat kód na R.
- Vytvořte Shiny aplikace.
- Použijte otevřené zdrojové knihovny a balíky.
- Zahrňte formátovaný text a média do kódu.
- Připravit data.
- Vizualizovat data.
- Objevte poznatky z dat.
- Sestavte a vycvičujte model pomocí knihoven s otevřeným zdrojovým kódem.
- Sdílejte svou aplikaci Shiny v úložišti Git .
- Začínáme
- Chcete-li použít aplikaci RStudio, klepněte na volbu Spustit prostředí IDE > RStudio.
- Další informace
- Documentation k aplikaci RStudio
- Přehled videa produktu RStudio IDE
- Videa o produktu RStudio
Maskování toků
Použijte nástroj toku Masking k přípravě maskovaných kopií nebo maskovaných dílčích sad dat z katalogu. Data jsou deidentifikovaná pomocí rozšířených voleb maskování s pravidly ochrany dat.
- Požadovaná služba
- Watson Knowledge Catalog
- Formát dat
- Relační: Tabulky v relačních zdrojích dat
- Velikost dat
- Libovolná velikost
- Jak můžete připravit data, analyzovat data nebo sestavovat modely
- Importujte data aktiv z regulovaného katalogu do projektu.
- Vytvořením definic úloh pro maskování úloh určete, jaká data se mají maskovat pomocí pravidel ochrany dat.
- Volitelná dílčí sada dat pro omezení velikosti zkopírovaných dat.
- Spusťte maskovací úlohy, které navedou maskované kopie do cílových databázových spojení.
- Začínáme
- Ujistěte se, že jsou dokončeny předem požadované kroky v produktu Watson Knowledge Catalog. Chcete-li privatizovat data, proveďte jednu z následujících úloh:
- Klepněte na volbu Nové aktivum > Průtok maskování.
- Klepněte na volby nabídky pro jednotlivá datová aktiva, chcete-li přímo zamaskovat aktivum.
- Další informace
- Documentation o maskování dat
Watson Pipelines
Editor plátna Pipelines slouží k vytvoření toku pro přípravu, vizualizaci a analýzu dat nebo pro sestavení a přípravu modelu.
- Formát dat
- Jakékoli
- Velikost dat
- Jakékoli
- Jak můžete připravit data, analyzovat data nebo sestavovat modely
- Použijte různé uzly, které každý obsahuje vlastní protokoly.
- Chcete-li spustit jakýkoli kód Python nebo R, do toku vložte do toku podnikové přenosné počítače.
- Pracujte s libovolným druhem dat libovolným způsobem.
- Plán se spustí s vaším tokem.
- Importujte data z vašeho připojeného PVC, projektu nebo data příjmu od objektu Github.
- Vytvořte vlastní komponentu s kódem Python .
- Stabilizujte své kolony tak, abyste monitorovali kvalitu dat, ale chcete.
- Pomocí webhooku odešlete e-maily nebo zprávy, které chcete průběžně aktualizovat ve stavu vašeho toku.
- Začínáme
- Chcete-li vytvořit nový propojení procesů, klepněte na volbu Nové aktivum > Propojení procesů.
Vizualizace dat
Vizualizace dat slouží ke zjišťování informací z vašich dat. Prozkoumávání dat z různých perspektiv s vizualizacemi umožňuje identifikovat vzory, připojení a vztahy v rámci těchto dat a rychle pochopit velké množství informací.
- Formát dat
- Tabulární: Avro, CSV, JSON, Parquet, TSV, SAV, Microsoft Excel .xls a .xlsx, SAS, textové soubory s oddělovači a připojená data. Další informace o podporovaných zdrojích dat naleznete v tématu Konektory.
- Velikost dat
- Bez omezení
- Začínáme
- Chcete-li vytvořit vizualizaci, klepněte na volbu Datové aktivum v seznamu typů aktiv ve svém projektu a vyberte datové aktivum. Klepněte na kartu Vizualizace a vyberte typ grafu.
- Další informace
- Vizualizace dat
Nadřízené téma: Projekty