0 / 0
Go back to the English version of the documentation
Vytvoření experimentu pro analýzu textu
Last updated: 31. 8. 2023
Vytvoření experimentu pro analýzu textu

Funkci analýzy textu AutoAIpoužijte k provedení textové analýzy vašich experimentů. Například provedením základní analýzy vyznění můžete předpovědět výsledek na základě textových komentářů.

Poznámka: Analýza textu je k dispozici pouze pro klasifikaci AutoAI a regresní experimenty. Tato funkce není k dispozici pro experimenty časových řad.

Přehled analýzy textu

Při vytvoření experimentu, který používá funkci textové analýzy, použije proces AutoAI algoritmus word2vec k převedení textu do vektorů a pak porovná vektory pro zjištění dopadu na sloupec predikce.

Algoritmus word2vec přijímá jako vstup korpus (text) textu a vytváří výstup vektorů. Přeměním textu na číselné znázornění může tento text detekovat a porovnávat podobná slova. Při školení s dostatečnými daty může produkt word2vec vytvářet přesné předpovědi o významu slova nebo o vztahu k jiným slovům. Předpovědi lze použít k analýze textu a odhadu ve významu v aplikacích analýzy vyznění.

Během fáze inženýrské fáze experimentu experimentu se vygeneruje 20 funkcí pro textový sloupec s použitím algoritmu word2vec . Automatická detekce textových funkcí je založena na analýze počtu jedinečných hodnot ve sloupci a počtu tokenů v záznamu (minimální počet = 3). Je-li počet jedinečných hodnot menší než počet všech hodnot děleno 5, sloupec se nebude považovat za text.

Po dokončení experimentu můžete přezkoumat výsledky technického návrhu funkce z stránky s podrobnostmi o propojení procesů. Potrubí můžete také uložit jako zápisník, kde můžete přezkoumat transformace a zobrazit vizualizaci transformací.

Poznámka: Když přezkoumáte experiment, pokud zjistíte, že textový sloupec nebyl zjištěn a zpracován automatickou detekcí, můžete zadat textový sloupec ručně v nastavení experimentu.

Příklad: Analýza komentářů zákazníků

V tomto příkladu se komentáře pro společnost půjčovny fiktivních vozů používají k vyškolení modelu, který předpovídá hodnocení spokojenosti, když je zadán nový komentář.

Podívejte se na toto krátké video, abyste viděli tento příklad a pak si přečtěte další podrobnosti o textové funkci pod videem.

Právní omezení pro video: Některé méně významné kroky a grafické prvky v tomto videu se mohou lišit od vaší platformy.

Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.

  • Transkripce videa
    Čas transcript
    00.00 V tomto videu uvidíte, jak vytvořit experiment AutoAI k provedení analýzy vyznění v textovém souboru.
    00:09 K provedení textové analýzy ve vašich experimentech můžete použít návrh textové funkce.
    00:15 Například provedením základní analýzy vyznění můžete předpovědět výsledek na základě textových komentářů.
    00:22 Začněte v projektu a přidejte aktivum do tohoto projektu, nový experiment AutoAI .
    00:29 Stačí zadat název, popis, vyberte strojovou výuku a pak vytvořit experiment.
    00:38 Když se zobrazí tvůrce experimentů AutoAI , můžete datovou sadu přidat.
    00:43 V tomto případě je datová sada již uložena v projektu jako datové aktivum.
    00:48 Vyberte aktivum, které chcete přidat do experimentu.
    00:53 Než budete pokračovat, zobrazte náhled dat.
    00:56 Tato datová sada má dva sloupce.
    00:59 První obsahuje komentáře zákazníků a druhá obsahuje buď 0, pro "Nespokojen", nebo 1, pro "Splněno".
    01:08 Toto není prognóza časové řady, takže pro tuto volbu vyberte "Ne".
    01:13 Poté vyberte sloupec, který má být předpověděl, což je "Spokojenost" v tomto příkladu.
    01:19 Hodnota AutoAI určuje, že sloupec spokojenosti obsahuje dvě možné hodnoty a že je vhodný pro binární model klasifikace.
    01:28 A pozitivní třída je 1, pro "Spokojený".
    01:32 Chcete-li upravit experiment, otevřete nastavení experimentu.
    01:36 Na panelu zdroje dat uvidíte některé volby pro inženýrství funkcí textu.
    01:41 Můžete automaticky vybrat sloupce textu, nebo můžete více řídit ručním určením sloupců pro návrh funkce textu.
    01:52 Můžete také vybrat počet přenašečů, které se mají vytvořit pro každý sloupec v rámci inženýringu funkcí textu.
    01:58 Nižší číslo je rychlejší a vyšší číslo je přesnější, ale pomalejší.
    02:03 Nyní spusťte experiment, abyste zobrazili transformace a průběh.
    02:09 Když vytvoříte experiment, který používá funkci textové analýzy, použije proces AutoAI algoritmus word2vec k transformaci textu do vektorů a pak porovná vektory pro zjištění dopadu na sloupec predikce.
    02:23 Během fáze inženýrské fáze experimentu experimentu se vygeneruje dvacet funkcí pro textový sloupec s použitím algoritmu word2vec .
    02:33 Po dokončení experimentu můžete přezkoumat výsledky technického návrhu funkce z stránky s podrobnostmi o propojení procesů.
    02:40 Na panelu Souhrn funkcí můžete přezkoumat textové transformace.
    02:45 Vidíte, že AutoAI vytvořila několik textových funkcí použitím funkce algoritmu k prvkům sloupce, spolu s funkcí, která je důležitá a ukazuje, které funkce nejvíce přispívají k vašemu výstupu z předpovědi.
    02:59 Toto propojení procesů můžete uložit jako model nebo jako notebook.
    03:03 Zápisník obsahuje kód pro zobrazení transformací a vizualizací těchto transformací.
    03:09 V takovém případě vytvořte model.
    03:13 Použijte odkaz k zobrazení modelu.
    03:16 Nyní povyšte model na prostor implementace.
    03:23 Zde jsou podrobnosti modelu, a odtud můžete model implementovat.
    03:28 V takovém případě se bude jednat o implementaci online.
    03:36 Po dokončení této implementace otevřete implementaci.
    03:39 V testovací aplikaci můžete zadat jeden nebo více komentářů k analýze.
    03:46 Poté klepněte na tlačítko "Predict".
    03:49 Předpokládá se, že první zákazník nebude s touto službou spokojen.
    03:54 A druhý zákazník se s touto službou spokojení.
    03:59 Další videa naleznete v dokumentaci k produktu Cloud Pak for Data as a Service .

Vzhledem k datové sadě, která obsahuje sloupec komentářů k přezkoumání pro zkušenost s pronájmem (Customer_service), a sloupec obsahující údaj o binární spokojenosti (Satisfaction), kde 0 představuje negativní komentář a 1 představuje pozitivní komentář, je experiment vycvičen k předpovědi hodnocení spokojenosti, je-li zadána nová zpětná vazba.

Příprava experimentu pro transformaci textu

Po načtení datové sady a určení sloupce předpovědi (Spokojenost) Experimentální nastavení vybere volbu Použít inženýring funkcí textu .

Nastavení zdroje dat pro použití inženýrství funkcí textu

Poznamenejte si některé podrobnosti o ladění experimentu pro analýzu textu:

  • Můžete přijmout výchozí výběr automatického výběru sloupců textu nebo můžete uplatnit větší kontrolu ručním určením sloupců pro návrh funkce textu.
  • Při spuštění experimentu se vygeneruje výchozí hodnota 20 funkcí pro textový sloupec s použitím algoritmu word2vec . Tuto hodnotu můžete upravit, chcete-li zvýšit nebo snížit počet funkcí. Čím více jsou vektory, které generujete, tím přesnější je váš model, ale delší školící takess.
  • Zbývající část možností se vztahuje na všechny typy experimentů, takže můžete finovat, jak zpracovat finální údaje o školení.

Spusťte experiment, abyste zobrazili probíhající transformace.

Leaderboard ropovodů Pipeline

Vyberte název propojení procesů a poté klepnutím na volbu Souhrn funkcí přezkoumáte textové transformace.

Souhrn funkcí jednotlivého propojení procesů

Můžete také uložit piroponu experimentu jako zápisník a přezkoumat transformace jako vizualizaci.

Implementace a hodnocení modelu transformace textu

Když skórovat tento model, zadejte nové komentáře, abyste získali předpověď s skóre důvěry pro to, zda komentář vede k pozitivnímu nebo negativnímu hodnocení spokojenosti.

Například při vstupu do komentáře " Trvalo nám to skoro tři hodiny, než jsme získali auto. Bylo to absurdní " předpovídá hodnocení spokojenosti 0 s pravděpodobností spolehlivosti 95%.

Předpovídání skóre spokojenosti

Další kroky

Sestavení experimentu s prognózou časové řady

Nadřízené téma: Sestavení modelu AutoAI

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more