0 / 0
Go back to the English version of the documentation
Analýza textu
Last updated: 01. 11. 2023
Textová analýza (SPSS Modeler)

SPSS Modeler nabízí uzly, které se specializují na zpracování textu.

Uzly analýzy textu nabízejí výkonné funkce analýzy textu s využitím pokročilých lingvistických technologií a zpracování přirozeného jazyka (NLP) k rychlému zpracování široké škály nestrukturovaných textových dat a z tohoto textu extrahovat a organizovat klíčové koncepty. Analýza textu může tyto koncepty také seskupit do kategorií.

Přibližně 80% dat uchovávaných v rámci organizace je ve formě textových dokumentů-například zpráv, webových stránek, e-mailů a poznámek call centra. Text je klíčovým faktorem, který umožňuje organizaci lépe porozumět chování svých zákazníků. Systém, který obsahuje NLP, může inteligentně extrahovat koncepty, včetně složených frází. Kromě toho znalost základního jazyka umožňuje klasifikaci pojmů do souvisejících skupin, jako jsou produkty, organizace nebo lidé, pomocí významu a kontextu. V důsledku toho můžete rychle určit relevanci informací pro vaše potřeby. Tyto extrahované koncepty a kategorie lze kombinovat s existujícími strukturovanými daty, jako jsou například demografické údaje, a použít je pro modelování v produktu SPSS Modeler , aby bylo možné lépe a lépe se rozhodovat.

Lingvistické systémy jsou citlivé na znalosti-čím více informací je obsaženo v jejich slovnících, tím vyšší je kvalita výsledků. Analýza textu poskytuje sadu lingvistických prostředků, jako jsou slovníky pro výrazy a synonyma, knihovny a šablony. Tyto uzly dále umožňují vývoj a upřesnění těchto lingvistických prostředků ve vašem kontextu. Doladění lingvistických zdrojů je často iterativní proces, který je nezbytný pro přesné vyhledávání a kategorizaci konceptů. Součástí jsou také vlastní šablony, knihovny a slovníky pro specifické domény, jako např. CRM a genomika.

Rady pro zahájení práce:

Toto video poskytuje vizuální metodu jako alternativu k obsahu v této dokumentaci.

Zřeknutí se odpovědnosti za video: Některé drobné kroky a grafické prvky v tomto videu se mohou lišit od vaší platformy.

  
https://video.ibm.com/embed/channel/23952663/video/spss-text-analytics-workbench

Aplikace

Obecně platí, že každý, kdo běžně potřebuje revidovat velké objemy dokumentů, aby identifikoval klíčové prvky pro další zkoumání, může využívat výhod použití analýzy textu. Příklady některých specifických aplikací:

  • Vědecký a lékařský výzkum. Prozkoumejte sekundární výzkumné materiály, jako jsou patentové zprávy, články v časopisech a publikace protokolů. Identifikovat asociace, které byly dříve neznámé (například lékař spojený s konkrétním produktem), které představují cesty pro další zkoumání. Minimalizujte čas strávený v procesu zjišťování drog. Použití jako pomůcka při výzkumu genomiky.
  • Průzkum investic. Přezkoumejte denní zprávy analytiků, články s novinkami a tiskové zprávy společnosti, abyste identifikovali klíčové strategické body nebo tržní posuny. Analýza trendů těchto informací odhaluje vznikající problémy nebo příležitosti pro firmu nebo průmysl v určitém časovém období.
  • Detekce podvodů. Použití v bankovním a zdravotnickém podvodu k odhalení anomálií a odhalení červených vlajek ve velkém množství textu.
  • Průzkum trhu. Využití ve výzkumu trhu se snaží identifikovat klíčová témata v otevřených odpovědích průzkumu.
  • Analýza blogu a webového kanálu. Prozkoumejte a sestavujte modely pomocí klíčových nápadů, které se nacházejí ve zpravodajských kanálech, blozích atd.
  • CRM. Vytvářejte modely s využitím dat ze všech dotykových bodů zákazníků, jako je e-mail, transakce a průzkumy.

Uzly

Spolu s mnoha standardními uzly v produktu SPSS Modelermůžete také pracovat s uzly dolování textu , abyste začlenili sílu textové analýzy do svých toků. Tyto uzly jsou k dispozici na paletě uzlů v části Analýza textu:
  • Uzel identifikátoru jazyka je uzel procesu, který prochází zdrojový text, aby určil, v jakém lidském jazyce je napsán, a poté jej označil v novém poli. Tento uzel, primárně navržený pro použití s velkým množstvím dat, je zvláště užitečný, když máte ve svých zdrojích dat více než jeden jazyk a chcete zpracovat pouze jeden jazyk.
  • Uzel analýzy textových odkazů extrahuje koncepty a také identifikuje vztahy mezi koncepty na základě známých vzorů v textu. Pomocí extrakce vzorů můžete zjišťovat vztahy mezi svými koncepty a také názory či kvalifikátory připojené k těmto konceptům. Uzel Analýza textových odkazů (TLA) nabízí přímější způsob, jak identifikovat a extrahovat vzory z vašeho textu a poté přidat výsledky vzoru do datové sady v toku. Smlouvu TLA však můžete provádět také pomocí relace pracovní plochy analýzy textu prostřednictvím uzlu modelování dolování textu.
  • Uzel dolování textu používá lingvistické metody k extrahování klíčových konceptů z textu, umožňuje vytvářet kategorie s těmito koncepty a dalšími daty a nabízí schopnost identifikovat vztahy a přidružení mezi koncepty na základě známých vzorů (tzv. analýza textových odkazů). Tento uzel můžete použít k prozkoumání obsahu textových dat nebo k vytvoření modelu koncepce nebo modelu kategorie. Koncepty a kategorie lze kombinovat s existujícími strukturovanými daty, jako jsou například demografické údaje, a lze je použít pro modelování.
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more