Go back to the English version of the documentation

Plánování zkušeností s notebooky a skripty

Last updated: 09. 11. 2023
Plánování zkušeností s notebooky a skripty

Chcete-li vytvořit plán pro použití zápisníků a skriptů Jupyter, nejprve pochopte volby, které máte, důsledky těchto voleb a jak tyto volby ovlivňují pořadí úloh implementace.

Většinu úloh souvisejících se zápisníkem a skriptem můžete provádět s rolí Editor nebo Administrátor v analytickém projektu.

Než začnete pracovat se zápisníky a skripty, měli byste zvážit následující otázky, protože většina úloh musí být dokončena v konkrétním pořadí:

  • V jakém programovacím jazyce chcete pracovat?
  • Co budou vaše notebooky dělat?
  • S jakými knihovnami chcete pracovat?
  • Jak můžete použít zápisník nebo skript v produktu Cloud Pak for Data as a Service?

Chcete-li vytvořit plán pro použití zápisníků nebo skriptů Jupyter, určete, kterou z následujících úloh musíte provést.

Úloha Povinné? Časování
Vytvoření projektu Ano To musí být váš úplně první úkol
Přidání datových aktiv do projektu Ano Než začnete vytvářet zápisníky
Vychystávání programovacího jazyka Ano Než vyberete nástroj
Výběr nástroje Ano Poté, co jste si vybrali jazyk
Kontrola balíků knihoven Ano Před výběrem běhového prostředí
Výběr vhodného běhového prostředí Ano Před otevřením vývojového prostředí
Správa životního cyklu zápisníků a skriptů Ne Když je zápisník nebo skript připraven
Používá se pro zápisníky a skripty po vytvoření Ne Když je zápisník připraven

Vytvoření projektu

Než budete moci začít pracovat v noteboocích, musíte vytvořit projekt.

Projekty
Můžete vytvořit prázdný projekt, jeden ze souboru nebo z adresy URL. V tomto projektu:
  • Můžete použít Juypter Notebook a RStudio.
  • Zápisníky jsou aktiva v projektu.
  • Spolupráce zápisníku je založena na uzamčení uživatelem na úrovni projektu.
  • Skripty R a lesklé aplikace nejsou aktivy v projektu.
  • Neexistuje žádná spolupráce na R skripty nebo lesklé aplikace.

Výběr programovacího jazyka

Můžete se rozhodnout pracovat v následujících jazycích:

Zápisníky
Python a R
Skripty
R skripty a R lesklé aplikace

Výběr nástroje

V produktu Cloud Pak for Data as a Servicemůžete pracovat s notebookem a skripty v následujícím nástroji:

Editor zápisníku juypter
V editoru zápisníků Juypter můžete vytvořit zápisníky Python nebo R. Zápisníky jsou aktiva v projektu. Spolupráce je pouze na úrovni projektu. Zápisník je při otevření uzamčen uživatelem a může být odemknut pouze stejným uživatelem nebo administrátorem projektu.
RStudio
V aplikaci RStudio můžete vytvářet skripty R a lesklé aplikace. Skripty R nejsou aktivy v projektu, což znamená, že na úrovni projektu neexistuje žádná spolupráce.

Kontrola balíků knihoven

Když otevřete zápisník v běhovém prostředí, máte přístup k velkému výběru předinstalovaných balíků knihovny vědy o datech. Mnoho prostředí také zahrnuje knihovny poskytované společností IBM bez dalších poplatků, jako je například knihovna Watson Natural Language Processing v prostředí Python , knihovny, které vám pomohou získat přístup k aktivům projektu, nebo knihovny pro časové řady nebo geoprostorovou analýzu v prostředích Spark.

Chcete-li zobrazit seznam balíků knihoven a verzí obsažených v šabloně prostředí, vyberte šablonu na stránce Šablony na kartě Spravovat na stránce projektu Prostředí .

Pokud v šabloně chybí knihovny, můžete je přidat:

Prostřednictvím zápisníku nebo skriptu
Pro své prostředí můžete použít známé příkazy instalace balíku. Například v zápisnících Python můžete použít mamba, conda nebo pip.
Vytvoření vlastní šablony prostředí
Při vytváření vlastní šablony můžete vytvořit přizpůsobení softwaru a přidat knihovny, které chcete zahrnout. Podrobnosti viz Přizpůsobení šablon prostředí.

Výběr běhového prostředí

Výběr výpočetního prostředí pro zápisník závisí na množství dat, která chcete zpracovat, a na složitosti procesů analýzy dat.

Watson Studio nabízí mnoho výchozích šablon prostředí s různými velikostmi hardwaru a konfiguracemi softwaru, které vám pomohou rychle začít, aniž byste museli vytvářet vlastní šablony. Tyto zahrnuté šablony jsou uvedeny na stránce Šablony na kartě Spravovat na stránce Prostředí projektu. Další informace o zahrnutých prostředích viz Prostředí.

Pokud dostupné šablony nevyhovují vašim potřebám, můžete vytvořit vlastní šablony a určit velikost hardwaru a konfiguraci softwaru. Podrobnosti viz Přizpůsobení šablon prostředí.

Důležité: Ujistěte se, že prostředí má dostatek paměti pro uložení dat, která načtete do zápisníku. Často to znamená, že prostředí musí mít podstatně více paměti, než je celková velikost dat načtených do zápisníku, protože některé datové rámce, jako pandas, mohou obsahovat více kopií dat v paměti.

Práce s daty

Chcete-li pracovat s daty v zápisníku, musíte:

  • Přidejte data do svého projektu, který data změní na aktivum projektu. Viz Přidání dat do projektu , kde jsou uvedeny různé metody pro přidání dat do projektu.
  • Použijte vygenerovaný kód, který načte data z aktiva do datové struktury ve vašem zápisníku. Seznam podporovaných datových typů viz Podpora načtení dat.
  • Napište vlastní kód pro načtení dat, pokud není zdroj dat přidán jako aktivum projektu nebo podpora pro přidání generovaného kódu není k dispozici pro aktivum projektu.

Správa životního cyklu zápisníků a skriptů

Po vytvoření a otestování notebooku v nástroji můžete:

Skripty R a lesklé aplikace nemohou být publikovány nebo sdíleny pomocí funkcí v projektu.

Použití pro zápisníky a skripty po vytvoření

Volby pro zápisník, který je vytvořen a připraven k použití v produktu Cloud Pak for Data as a Service , zahrnují:

  • Spuštění jako úloha v projektu. Viz Vytváření a správa úloh v projektu.

  • Spuštění jako součást propojení procesů Watson . Viz Konfigurace uzlů propojení procesů.

    Chcete-li se ujistit, že zápisník lze spustit jako úlohu nebo v propojení procesů, postupujte takto:

    • Ujistěte se, že žádné buňky nevyžadují interaktivní vstup od uživatele.
    • Ujistěte se, že zápisník protokoluje dostatečně podrobné informace, aby porozuměli průběhu a případným selháním, a to nahlédnutím do protokolu.
    • Použijte proměnné prostředí v kódu pro přístup ke konfiguracím, pokud je zápisník nebo skript vyžaduje, například vstupní datový soubor nebo počet spuštění trénování.
  • Použití klienta Watson Machine Learning Python k sestavení, trénování a následnému nasazení modelů. Viz Watson Machine Learning Python.

  • Použití rozhraní REST API Watson Machine Learning k sestavení, trénování a následnému nasazení modelů.

Skripty R a aplikace Shiny lze vytvářet a používat pouze v prostředí RStudio IDE v produktu Cloud Pak for Data as a Service. Nelze vytvářet úlohy pro skripty R nebo implementace R Shiny.

Nadřízené téma: Zápisníky a skripty