Translation not up to date
Plánování zkušeností s notebooky a skripty
Chcete-li vytvořit plán pro použití zápisníků a skriptů Jupyter, nejprve pochopte volby, které máte, důsledky těchto voleb a jak tyto volby ovlivňují pořadí úloh implementace.
Většinu úloh souvisejících se zápisníkem a skriptem můžete provádět s rolí Editor nebo Administrátor v analytickém projektu.
Než začnete pracovat se zápisníky a skripty, měli byste zvážit následující otázky, protože většina úloh musí být dokončena v konkrétním pořadí:
- V jakém programovacím jazyce chcete pracovat?
- Co budou vaše notebooky dělat?
- S jakými knihovnami chcete pracovat?
- Jak můžete použít zápisník nebo skript v produktu Cloud Pak for Data as a Service?
Chcete-li vytvořit plán pro použití zápisníků nebo skriptů Jupyter, určete, kterou z následujících úloh musíte provést.
Úloha | Povinné? | Časování |
---|---|---|
Vytvoření projektu | Ano | To musí být váš úplně první úkol |
Přidání datových aktiv do projektu | Ano | Než začnete vytvářet zápisníky |
Vychystávání programovacího jazyka | Ano | Než vyberete nástroj |
Výběr nástroje | Ano | Poté, co jste si vybrali jazyk |
Kontrola balíků knihoven | Ano | Před výběrem běhového prostředí |
Výběr vhodného běhového prostředí | Ano | Před otevřením vývojového prostředí |
Správa životního cyklu zápisníků a skriptů | Ne | Když je zápisník nebo skript připraven |
Používá se pro zápisníky a skripty po vytvoření | Ne | Když je zápisník připraven |
Vytvoření projektu
Než budete moci začít pracovat v noteboocích, musíte vytvořit projekt.
- Projekty
- Můžete vytvořit prázdný projekt, jeden ze souboru nebo z adresy URL. V tomto projektu:
- Můžete použít Juypter Notebook a RStudio.
- Zápisníky jsou aktiva v projektu.
- Spolupráce zápisníku je založena na uzamčení uživatelem na úrovni projektu.
- Skripty R a lesklé aplikace nejsou aktivy v projektu.
- Neexistuje žádná spolupráce na R skripty nebo lesklé aplikace.
Výběr programovacího jazyka
Můžete se rozhodnout pracovat v následujících jazycích:
- Zápisníky
- Python a R
- Skripty
- R skripty a R lesklé aplikace
Výběr nástroje
V produktu Cloud Pak for Data as a Servicemůžete pracovat s notebookem a skripty v následujícím nástroji:
- Editor zápisníku juypter
- V editoru zápisníků Juypter můžete vytvořit zápisníky Python nebo R. Zápisníky jsou aktiva v projektu. Spolupráce je pouze na úrovni projektu. Zápisník je při otevření uzamčen uživatelem a může být odemknut pouze stejným uživatelem nebo administrátorem projektu.
- RStudio
- V aplikaci RStudio můžete vytvářet skripty R a lesklé aplikace. Skripty R nejsou aktivy v projektu, což znamená, že na úrovni projektu neexistuje žádná spolupráce.
Kontrola balíků knihoven
Když otevřete zápisník v běhovém prostředí, máte přístup k velkému výběru předinstalovaných balíků knihovny vědy o datech. Mnoho prostředí také zahrnuje knihovny poskytované společností IBM bez dalších poplatků, jako je například knihovna Watson Natural Language Processing v prostředí Python , knihovny, které vám pomohou získat přístup k aktivům projektu, nebo knihovny pro časové řady nebo geoprostorovou analýzu v prostředích Spark.
Chcete-li zobrazit seznam balíků knihoven a verzí obsažených v šabloně prostředí, vyberte šablonu na stránce Šablony na kartě Spravovat na stránce projektu Prostředí .
Pokud v šabloně chybí knihovny, můžete je přidat:
- Prostřednictvím zápisníku nebo skriptu
- Pro své prostředí můžete použít známé příkazy instalace balíku. Například v zápisnících Python můžete použít
,mamba
neboconda
.pip
- Vytvoření vlastní šablony prostředí
- Při vytváření vlastní šablony můžete vytvořit přizpůsobení softwaru a přidat knihovny, které chcete zahrnout. Podrobnosti viz Přizpůsobení šablon prostředí.
Výběr běhového prostředí
Výběr výpočetního prostředí pro zápisník závisí na množství dat, která chcete zpracovat, a na složitosti procesů analýzy dat.
Watson Studio nabízí mnoho výchozích šablon prostředí s různými velikostmi hardwaru a konfiguracemi softwaru, které vám pomohou rychle začít, aniž byste museli vytvářet vlastní šablony. Tyto zahrnuté šablony jsou uvedeny na stránce Šablony na kartě Spravovat na stránce Prostředí projektu. Další informace o zahrnutých prostředích viz Prostředí.
Pokud dostupné šablony nevyhovují vašim potřebám, můžete vytvořit vlastní šablony a určit velikost hardwaru a konfiguraci softwaru. Podrobnosti viz Přizpůsobení šablon prostředí.
Práce s daty
Chcete-li pracovat s daty v zápisníku, musíte:
- Přidejte data do svého projektu, který data změní na aktivum projektu. Viz Přidání dat do projektu , kde jsou uvedeny různé metody pro přidání dat do projektu.
- Použijte vygenerovaný kód, který načte data z aktiva do datové struktury ve vašem zápisníku. Seznam podporovaných datových typů viz Podpora načtení dat.
- Napište vlastní kód pro načtení dat, pokud není zdroj dat přidán jako aktivum projektu nebo podpora pro přidání generovaného kódu není k dispozici pro aktivum projektu.
Správa životního cyklu zápisníků a skriptů
Po vytvoření a otestování notebooku v nástroji můžete:
- Publikujte jej do katalogu, aby ostatní členové katalogu mohli používat zápisník ve svých projektech. Viz Publikování aktiv z projektu do katalogu.
- Sdílejte kopii jen pro čtení mimo produkt Watson Studio , aby ji mohli zobrazit a používat lidé, kteří nejsou spolupracovníky ve vašich projektech. Viz Sdílení zápisníků s adresou URL.
- Publikujte jej do úložiště GitHub . Viz téma Publikování notebooků na serveru GitHub.
- Zveřejněte ji jako gist. Viz Publikování zápisníku jako gist.
Skripty R a lesklé aplikace nemohou být publikovány nebo sdíleny pomocí funkcí v projektu.
Použití pro zápisníky a skripty po vytvoření
Volby pro zápisník, který je vytvořen a připraven k použití v produktu Cloud Pak for Data as a Service , zahrnují:
Spuštění jako úloha v projektu. Viz Vytváření a správa úloh v projektu.
Spuštění jako součást propojení procesů Watson . Viz Konfigurace uzlů propojení procesů.
Chcete-li se ujistit, že zápisník lze spustit jako úlohu nebo v propojení procesů, postupujte takto:
- Ujistěte se, že žádné buňky nevyžadují interaktivní vstup od uživatele.
- Ujistěte se, že zápisník protokoluje dostatečně podrobné informace, aby porozuměli průběhu a případným selháním, a to nahlédnutím do protokolu.
- Použijte proměnné prostředí v kódu pro přístup ke konfiguracím, pokud je zápisník nebo skript vyžaduje, například vstupní datový soubor nebo počet spuštění trénování.
Použití klienta Watson Machine Learning Python k sestavení, trénování a následnému nasazení modelů. Viz Watson Machine Learning Python.
Použití rozhraní REST API Watson Machine Learning k sestavení, trénování a následnému nasazení modelů.
Skripty R a aplikace Shiny lze vytvářet a používat pouze v prostředí RStudio IDE v produktu Cloud Pak for Data as a Service. Nelze vytvářet úlohy pro skripty R nebo implementace R Shiny.
Nadřízené téma: Zápisníky a skripty