Translation not up to date
Funkci analýzy textu AutoAIpoužijte k provedení textové analýzy vašich experimentů. Například provedením základní analýzy vyznění můžete předpovědět výsledek na základě textových komentářů.
Přehled analýzy textu
Při vytvoření experimentu, který používá funkci textové analýzy, použije proces AutoAI algoritmus word2vec
k převedení textu do vektorů a pak porovná vektory pro zjištění dopadu na sloupec predikce.
Algoritmus word2vec
přijímá jako vstup korpus (text) textu a vytváří výstup vektorů. Přeměním textu na číselné znázornění může tento text detekovat a porovnávat podobná slova. Při školení s dostatečnými daty může produkt word2vec
vytvářet přesné předpovědi o významu slova nebo o vztahu k jiným slovům. Předpovědi lze použít k analýze textu a odhadu ve významu v aplikacích analýzy vyznění.
Během fáze inženýrské fáze experimentu experimentu se vygeneruje 20 funkcí pro textový sloupec s použitím algoritmu word2vec
. Automatická detekce textových funkcí je založena na analýze počtu jedinečných hodnot ve sloupci a počtu tokenů v záznamu (minimální počet = 3). Je-li počet jedinečných hodnot menší než počet všech hodnot děleno 5, sloupec se nebude považovat za text.
Po dokončení experimentu můžete přezkoumat výsledky technického návrhu funkce z stránky s podrobnostmi o propojení procesů. Potrubí můžete také uložit jako zápisník, kde můžete přezkoumat transformace a zobrazit vizualizaci transformací.
Příklad: Analýza komentářů zákazníků
V tomto příkladu se komentáře pro společnost půjčovny fiktivních vozů používají k vyškolení modelu, který předpovídá hodnocení spokojenosti, když je zadán nový komentář.
Podívejte se na toto krátké video, abyste viděli tento příklad a pak si přečtěte další podrobnosti o textové funkci pod videem.
Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.
Transkripce videa Čas transcript 00.00 V tomto videu uvidíte, jak vytvořit experiment AutoAI k provedení analýzy vyznění v textovém souboru. 00:09 K provedení textové analýzy ve vašich experimentech můžete použít návrh textové funkce. 00:15 Například provedením základní analýzy vyznění můžete předpovědět výsledek na základě textových komentářů. 00:22 Začněte v projektu a přidejte aktivum do tohoto projektu, nový experiment AutoAI . 00:29 Stačí zadat název, popis, vyberte strojovou výuku a pak vytvořit experiment. 00:38 Když se zobrazí tvůrce experimentů AutoAI , můžete datovou sadu přidat. 00:43 V tomto případě je datová sada již uložena v projektu jako datové aktivum. 00:48 Vyberte aktivum, které chcete přidat do experimentu. 00:53 Než budete pokračovat, zobrazte náhled dat. 00:56 Tato datová sada má dva sloupce. 00:59 První obsahuje komentáře zákazníků a druhá obsahuje buď 0, pro "Nespokojen", nebo 1, pro "Splněno". 01:08 Toto není prognóza časové řady, takže pro tuto volbu vyberte "Ne". 01:13 Poté vyberte sloupec, který má být předpověděl, což je "Spokojenost" v tomto příkladu. 01:19 Hodnota AutoAI určuje, že sloupec spokojenosti obsahuje dvě možné hodnoty a že je vhodný pro binární model klasifikace. 01:28 A pozitivní třída je 1, pro "Spokojený". 01:32 Chcete-li upravit experiment, otevřete nastavení experimentu. 01:36 Na panelu zdroje dat uvidíte některé volby pro inženýrství funkcí textu. 01:41 Můžete automaticky vybrat sloupce textu, nebo můžete více řídit ručním určením sloupců pro návrh funkce textu. 01:52 Můžete také vybrat počet přenašečů, které se mají vytvořit pro každý sloupec v rámci inženýringu funkcí textu. 01:58 Nižší číslo je rychlejší a vyšší číslo je přesnější, ale pomalejší. 02:03 Nyní spusťte experiment, abyste zobrazili transformace a průběh. 02:09 Když vytvoříte experiment, který používá funkci textové analýzy, použije proces AutoAI algoritmus word2vec k transformaci textu do vektorů a pak porovná vektory pro zjištění dopadu na sloupec predikce. 02:23 Během fáze inženýrské fáze experimentu experimentu se vygeneruje dvacet funkcí pro textový sloupec s použitím algoritmu word2vec . 02:33 Po dokončení experimentu můžete přezkoumat výsledky technického návrhu funkce z stránky s podrobnostmi o propojení procesů. 02:40 Na panelu Souhrn funkcí můžete přezkoumat textové transformace. 02:45 Vidíte, že AutoAI vytvořila několik textových funkcí použitím funkce algoritmu k prvkům sloupce, spolu s funkcí, která je důležitá a ukazuje, které funkce nejvíce přispívají k vašemu výstupu z předpovědi. 02:59 Toto propojení procesů můžete uložit jako model nebo jako notebook. 03:03 Zápisník obsahuje kód pro zobrazení transformací a vizualizací těchto transformací. 03:09 V takovém případě vytvořte model. 03:13 Použijte odkaz k zobrazení modelu. 03:16 Nyní povyšte model na prostor implementace. 03:23 Zde jsou podrobnosti modelu, a odtud můžete model implementovat. 03:28 V takovém případě se bude jednat o implementaci online. 03:36 Po dokončení této implementace otevřete implementaci. 03:39 V testovací aplikaci můžete zadat jeden nebo více komentářů k analýze. 03:46 Poté klepněte na tlačítko "Predict". 03:49 Předpokládá se, že první zákazník nebude s touto službou spokojen. 03:54 A druhý zákazník se s touto službou spokojení. 03:59 Další videa naleznete v dokumentaci k produktu Cloud Pak for Data as a Service .
Vzhledem k datové sadě, která obsahuje sloupec komentářů k přezkoumání pro zkušenost s pronájmem (Customer_service), a sloupec obsahující údaj o binární spokojenosti (Satisfaction), kde 0 představuje negativní komentář a 1 představuje pozitivní komentář, je experiment vycvičen k předpovědi hodnocení spokojenosti, je-li zadána nová zpětná vazba.
Příprava experimentu pro transformaci textu
Po načtení datové sady a určení sloupce předpovědi (Spokojenost) Experimentální nastavení vybere volbu Použít inženýring funkcí textu .
Poznamenejte si některé podrobnosti o ladění experimentu pro analýzu textu:
- Můžete přijmout výchozí výběr automatického výběru sloupců textu nebo můžete uplatnit větší kontrolu ručním určením sloupců pro návrh funkce textu.
- Při spuštění experimentu se vygeneruje výchozí hodnota 20 funkcí pro textový sloupec s použitím algoritmu
word2vec
. Tuto hodnotu můžete upravit, chcete-li zvýšit nebo snížit počet funkcí. Čím více jsou vektory, které generujete, tím přesnější je váš model, ale delší školící takess. - Zbývající část možností se vztahuje na všechny typy experimentů, takže můžete finovat, jak zpracovat finální údaje o školení.
Spusťte experiment, abyste zobrazili probíhající transformace.
Vyberte název propojení procesů a poté klepnutím na volbu Souhrn funkcí přezkoumáte textové transformace.
Můžete také uložit piroponu experimentu jako zápisník a přezkoumat transformace jako vizualizaci.
Implementace a hodnocení modelu transformace textu
Když skórovat tento model, zadejte nové komentáře, abyste získali předpověď s skóre důvěry pro to, zda komentář vede k pozitivnímu nebo negativnímu hodnocení spokojenosti.
Například při vstupu do komentáře " Trvalo nám to skoro tři hodiny, než jsme získali auto. Bylo to absurdní " předpovídá hodnocení spokojenosti 0 s pravděpodobností spolehlivosti 95%.
Další kroky
Sestavení experimentu s prognózou časové řady
Nadřízené téma: Sestavení modelu AutoAI