0 / 0
Go back to the English version of the documentation
Slovník pojmů
Last updated: 14. 8. 2023
Slovník pojmů

Tento slovníček obsahuje výrazy a definice pro watsonx.ai.

A B S U U E F G H I J L U S O P P J Ú J V ST Z

A

odpovědnost

Očekávání, že organizace nebo jednotlivci zajistí řádné fungování systémů AI, které navrhují, vyvíjejí, fungují nebo nasazují v souladu se svými rolemi a platnými regulačními rámci, zajistí řádné fungování systémů AI, které navrhují, vyvíjejí, fungují nebo nasazují. To zahrnuje určení toho, kdo je odpovědný za umělou chybu, která může vyžadovat, aby právní odborníci určily odpovědnost za případ od případu.

aktivní učení

Model pro výuku počítače, ve kterém systém vyžaduje více dat se jmenovkou pouze v případě, že je potřebuje.

aktivní běhová komponenta

Instance prostředí, které je spuštěné pro poskytnutí výpočetních prostředků pro analytická aktiva.

Umělá inteligence

Viz umělá inteligence.

AI etika

Víceoborové pole, které studuje, jak optimalizovat příznivý dopad influenzy ptáků při současném snížení rizik a nepříznivých výsledků. Příklady etických otázek AI jsou otázky odpovědnosti a soukromí, spravedlnosti, vysvětlitelnosti, robustnosti, transparentnosti, udržitelnosti životního prostředí, začlenění, mravní agentury, sladění hodnoty, odpovědnosti, důvěry a zneužívání technologií.

Řízení AI

Rozhodování organizace, prostřednictvím svých podnikových pokynů, pracovníků, procesů a systémů pro přímé, vyhodnocení, monitorování a provedení nápravných opatření po celou dobu životního cyklu influenzy ptáků za účelem zajištění toho, že systém AI funguje tak, jak to organizace zamýšlí, jak to očekávají od zúčastněných stran, a jak to vyžaduje příslušné nařízení.

Bezpečnost influenzy ptáků

Oblast výzkumu zaměřená na zajištění toho, aby systémy umělé inteligence fungovaly způsobem, který je prospěšný pro lidstvo a neúmyslně nezpůsobuje škody, řeší otázky jako spolehlivost, spravedlnost, transparentnost a sladění systémů AI s lidskými hodnotami.

Systém AI

Viz termín systém umělé inteligence.

algoritmus

Vzorec použitý na data k určení optimálních způsobů řešení analytických problémů.

analýza

Věda o studiu dat za účelem nalezení smysluplných vzorců v datech a vyvozování závěrů založených na těchto vzorech.

příslušná důvěra

V systému AI se jedná o množství důvěry, které je kalibrováno na jeho přesnost, spolehlivost a důvěryhodnost.

umělá inteligence (AI)

Emulace přírodní inteligence strojem.

systém umělé inteligence (AI system)

Systém, který může vytvářet předpovědi, doporučení nebo rozhodnutí ovlivňující fyzická nebo virtuální prostředí a jejichž výstupy nebo chování nejsou nezbytně předurčeny jeho vývojářem nebo uživatelem. Systémy AI jsou obvykle školeny s velkými objemy strukturovaných nebo nestrukturovaných dat a mohou být navrženy tak, aby pracovaly s různými úrovněmi autonomie nebo žádné, aby bylo dosaženo cílů definovaných člověkem.

Aktivum

Položka, která obsahuje informace o datech, jiných hodnotných informacích nebo kódu, který pracuje s daty. Viz také datové aktivum.

Experiment AutoAI

Automatizovaný tréninkový proces, který považuje sérii definic školení a parametrů za účelem vytvoření sady hodnocených produktovodů jako vzorových kandidátů.

B

dávková implementace

Metoda pro implementaci modelů, které zpracovává vstupní data ze souboru, datového připojení nebo připojených dat v sektoru úložiště, pak zapíše výstup do vybraného cíle.

předpojatost

Systematická chyba v systému AI, který byl navržen, úmyslně či nikoli, způsobem, který může generovat nekalé rozhodnutí. Bias může být přítomen jak v systému AI, tak v datech použitých pro vlak a testovat. Přednost influenzy ptáků se může v systému AI objevit jako výsledek kulturních očekávání, technických omezení nebo neočekávaných kontextů implementace. Viz také termín spravedlnost.

detekce zkreslení

Proces výpočtu spravedlivosti vůči metrikám na zjištění, kdy modely AI dodávají nespravedlivé výsledky na základě určitých atributů.

binární klasifikace

Klasifikační model se dvěma třídami. Predikce jsou binární volbou jedné ze dvou tříd.

C

model klasifikace

Prediktivní model, který předpovídá data v různých kategoriích. Klasifikace mohou být binární, se dvěma třídami dat nebo více třídami, pokud existuje více než 2 kategorií.

cleanse

Chcete-li se ujistit, že všechny hodnoty v datové sadě jsou konzistentní a správně zaznamenané.

počítačová lingvistika

Mezioborové pole, které zkoumá přístupy k výpočetně modelovanému přírodním jazykům.

Prostředek výpočtu

Hardwarové a softwarové prostředky, které jsou definované šablonou prostředí pro spouštění aktiv v nástrojích.

matrix

Měření výkonu, které určuje přesnost mezi kladnými a zápornými předpověznými výsledky modelu v porovnání s pozitivními a zápornými skutečnými výsledky.

připojené datové aktivum

Ukazatel na data, ke kterým se přistupuje prostřednictvím připojení k externímu zdroji dat.

připojené aktivum složky

Ukazatel na složku v produktu IBM Cloud Object Storage.

připojení

Informace požadované pro připojení k databázi. Skutečné informace, které se vyžadují, se liší v závislosti na DBMS a způsobu připojení.

aktivum připojení

Aktivum, které obsahuje informace, které umožňují připojení ke zdroji dat.

omezení

  • V databázích-vztah mezi tabulkami.
  • V Decision Optimizationse jedná o podmínku, která musí být splněna řešením problému.

průběžné učení

Automatizace úloh monitorování výkonu modelu, rekvalifikace s novými daty a opětovné implementace s cílem zajistit kvalitu předpovědí.

Implementace Core ML

Proces stažení implementace ve formátu jádra ML pro použití v aplikacích iOS .

korpus

Kolekce zdrojových dokumentů, které se používají k vycvičení modelu strojového učení.

křížové ověření

Technika testování, jak dobře se model zobecňuje, pokud chybí vzorek testu z výběrového souboru. Křížové ověření rozděluje data odborné přípravy na několik dílčích sad a pak sestaví stejný počet modelů, přičemž každá dílčí sada se bude postupně držet v řadě. Každý z těchto modelů je testován na ukázce počtu pouzdro a průměrná přesnost modelů na těchto ukázkách se používá k odhadu přesnosti modelu při použití na nová data.

kurát

Chcete-li vybrat, shromáždit, zachovat a zachovat obsah související s určitým tématem, postupujte takto. Crace zavádí, udržuje a přidává hodnotu k datům; transformuje data do věrohodných informací a znalostí.

D

datové aktivum

Aktivum, které ukazuje na data, například na odeslaný soubor. Připojení a připojená datová aktiva se také považují za datová aktiva. Viz také aktivum.

věda dat

Analýza a vizualizace strukturovaných a nestrukturovaných dat za účelem zjištění poznatků a znalostí.

datová sada

Kolekce dat, obvykle ve formě řádků (záznamů) a sloupců (polí) a obsažených v souboru nebo v databázové tabulce.

zdroj dat

Úložiště, fronta nebo kanál pro čtení dat, jako např. databáze Db2 .

datová tabulka

Kolekce dat, obvykle ve formě řádků (záznamů) a sloupců (polí) a obsažených v tabulce.

datový sklad

Velké centralizované úložiště dat shromážděných z různých zdrojů, které se používají pro účely vytváření sestav a analýz dat. V první řadě ukládá strukturovaná a polostrukturovaná data a umožňují podnikům přijímat informovaná rozhodnutí.

hranice rozhodnutí

Rozdělení datových bodů v prostoru do různých skupin nebo klasifikací.

model pouze pro dekodér

Model, který generuje výstupní textové slovo slovem inference ze vstupní posloupnosti. Modely Decoder-only se používají pro úlohy, jako je generování textu a odpovídání na otázky.

implementace

Model nebo aplikační balík, který je k dispozici pro použití.

prostor implementace

Pracovní prostor, kde jsou nasazeny modely a implementace jsou spravovány.

Deterministický

Popisuje charakteristiky výpočetních systémů, pokud jsou jejich výstupy zcela určeny svými vstupy.

DevOps

Metodologie softwaru, která integruje vývoj aplikací a IT operace tak, aby týmy mohly rychleji poskytovat kód k produkci a iterovat průběžně na základě zpětné vazby na trhu.

diskriminační AI

Třída algoritmu, která se zaměřuje na nalezení hranice, která odděluje různé třídy v datech.

Dokplex

Rozhraní API Python pro modelování a řešení problémů Decision Optimization .

E

vložení

Číselná reprezentace jednotky informací, jako je například slovo nebo věta, jako vektor reálných čísel. Vnoření jsou učená, nízká-dimenzionální reprezentace dat s vyšším rozměrem. Viz také kódování, reprezentace.

vznik

Vlastnost základních modelů, v nichž model vykazuje chování, která nebyla výslovně vycvičena.

naléhavé chování

Chování vystavované modelem foundation, který nebyl explicitně konstruován.

model kodéru-dekodéru

Model pro porozumění vstupním textu a pro generování výstupního textu na základě vstupního textu. Modely Encoder-dekodéru se používají pro úlohy, jako je sumarizace nebo překlad.

model pouze pro kodér

Model, který rozpoznává vstupní text na úrovni vět tím, že transformuje vstupní posloupnosti do reprezentačních vektorů s názvem embeddings. Modely s kódováním-pouze se používají pro úlohy, jako je klasifikace zpětné vazby zákazníků a extrakce informací z velkých dokumentů.

Kódování

Znázornění jednotky informací, jako je například znak nebo slovo, jako sada čísel. Viz též embedding, positional encoding.

Adresa URL koncového bodu

Cílová adresa v síti, která identifikuje prostředky, jako jsou služby a objekty. Adresa URL koncového bodu je například použita k identifikaci umístění modelu nebo implementace funkce, když uživatel odešle data informačního obsahu do implementace.

prostředí

Výpočetní prostředky pro spouštění úloh.

běhová komponenta prostředí

Vytváření instance šablony prostředí pro spouštění analytických aktiv.

šablona prostředí

Definice, která uvádí prostředky hardwaru a softwaru pro vytvoření instancí běhových prostředí prostředí.

vnější funkce

Funkce, která může ovlivnit prediktivní model, ale nemůže být ovlivněna návratem. Například, teploty mohou ovlivnit předpovězené zmrzliny prodeje, ale zmrzliny prodeje nemůže ovlivnit teploty.

experiment

Modelový tréninkový proces, který považuje sérii definic školení a parametrů k určení nejpřesnější konfigurace modelu.

vysvětlitelnost

  • Schopnost lidských uživatelů trasovat, monitorovat a porozumět předpovědím, které jsou prováděny v aplikacích používajících systémy AI.
  • Schopnost systému AI poskytovat náhledy, které lidé mohou použít k pochopení příčin předpovědí systému.

F

spravedlnost

V systému AI je to spravedlivé zacházení s jednotlivci nebo skupinami jednotlivců. Výběr určité koncepce vlastního kapitálu pro systém AI závisí na kontextu, ve kterém se používá. Viz také předpojatost.

funkce

Vlastnost nebo charakteristika položky v rámci datové sady, např. sloupec v tabulce. V některých případech jsou funkce nastaveny jako kombinace jiných funkcí v datové sadě.

inženýrská funkce

Proces výběru, transformace a vytváření nových funkcí ze nezpracovaných dat za účelem zlepšení výkonu a prediktivního výkonu modelů počítačů se studiem.

Skupina funkcí

Sada sloupců určitého datového aktiva spolu s metadaty, která se používají pro výuku počítače.

Výběr funkcí

Identifikace sloupců dat, které nejlépe podporují přesnou předpověď nebo skóre v modelu strojového učení.

úložiště funkcí

Centralizované úložiště nebo systém, který spravuje a organizuje funkce, poskytuje rozšiřitelný a efektivní způsob ukládání, načítání a sdílení dat funkcí v rámci produktovodů a aplikací pro výuku počítačů.

transformace funkcí

V AutoAI-fáze vytváření propojení procesů, která používá algoritmy k transformaci a optimalizaci dat v rámci přípravy na dosažení nejlepšího výsledku pro daný typ modelu.

federované učení

Školení obecného modelu studia, který používá více zdrojů dat, které nejsou přesunuty, sloučené nebo sdílené. Výsledkem je lepší-vyškolený model, aniž by byla ohrožena bezpečnost dat.

pár výzev k zadání

Technika výzvy, v níž je model poskytnut malý počet příkladů, který ukazuje, jak dokončit úlohu.

jemné vyladění

Proces přizpůsobení předškoleného modelu k provedení zvláštní úlohy tím, že provádí další školení. Podrobné vyladění může zahrnovat (1) aktualizaci stávajících parametrů modelu, známé jako úplné jemné vyladění, nebo (2) aktualizace podmnožiny existujících parametrů modelu nebo přidání nových parametrů do modelu a jejich proškolení při zmrazení stávajících parametrů modelu, známé jako efektivní jemné doladění modelu.

tok

Kolekce uzlů, které definují sadu kroků pro zpracování dat nebo školení modelu.

základní model

Model AI, který lze adaptovat na širokou škálu navazujících úloh. Modely Foundation jsou zpravidla modelové modely large-scale, které jsou školeny na neoznačené údaje za použití vlastního dohledu. Jako modely ve velkém měřítku mohou modely základů obsahovat miliardy parametrů.

G

Ganttův graf

Grafické znázornění časové osy projektu a trvání, kdy jsou data časového plánu zobrazena jako vodorovné pruhy podél časového měřítka.

generativní AI

Třída algoritmů AI, která může vytvářet různé typy obsahu včetně textu, zdrojového kódu, imagů, zvukových a syntetických dat.

variabilita

Charakteristika generativní modely při vytváření různých výstupů, a to i když je vstup do modelu stále konstantní. Viz také pravděpodobnostní.

GPU

Viz graphics processing unit.

grafický tvůrce

Nástroj pro vytváření analytických aktiv vizuálně kódováním. Plátno je oblast, na kterou lze umístit objekty nebo uzly, které lze připojit k vytvoření toku.

grafická procesní jednotka (GPU)

Specializovaný procesor určený k rychlé manipulaci a změně paměti za účelem urychlení vytváření obrazů v obrazové paměti určené pro výstup na obrazovku. GPU jsou silně vytížené při učení stroje kvůli jejich schopnosti paralelního zpracování.

H

halucinace

Odezva ze základního modelu, která zahrnuje mimo téma, opakující se, nesprávné nebo vymyšlenou obsah. Halucinace zahrnující zhotovení detailů se mohou stát, když je model vyzván ke generování textu, ale model nemá dostatek souvisejícího textu k nakreslení, aby generoval výsledek obsahující správné podrobnosti.

zahotaná sada

Sada označených dat, která se záměrně zatajila z výcvikových a validačních sad, slouží jako nezaujaté hodnocení výkonu konečného modelu na neviditelné datech.

homogenizace

Trend výzkumu strojového učení, v němž je malý počet širokých neuronových architektur, jako je transformátor, dosahuje ve stavu techniky, vede k širokému spektru úkolů napříč různými úkoly.

HPO

Viz hyperparameter optimization.

lidský dohled

Lidské zapojení do přezkumu rozhodnutí, která byla poskytnuta systémem AI, umožňuje lidskou autonomii a odpovědnost za rozhodování.

hyperparametr

V počítačově učení se jedná o parametr, jehož hodnota je nastavena před tréninkem jako způsob, jak zvýšit přesnost modelu.

optimalizace hyperparametru (HPO)

Proces nastavení hodnot hyperparametru na nastavení, která poskytují nejpřesnější model.

I

obrázek

Softwarový balík, který obsahuje sadu knihoven.

přírůstkové učení

Proces školení modelu s využitím dat, která se průběžně aktualizuje, aniž by se zapomíná na data získaná z předchozích úloh. Tato technika se používá k vycviování modelu s dávkami dat z velkého vzdělávacího zdroje dat.

dedukce

Proces použití trénovaného modelu strojového učení k vytváření předpovědí na nových datech.

INGEST

  • Chcete-li nepřetržitě přidávat do databáze vysoký objem dat v reálném čase.
  • Dodání dat do systému za účelem vytvoření základu znalostí.

Náhled

Je to přesné nebo hluboké pochopení něčeho. Poznatky jsou odvozeny pomocí kognitivních analýz k zajištění aktuálních snímků a předpovědí chování zákazníků a přístupů.

inteligentní AI

Umělé inteligentní systémy, které mohou pochopit, učit se, adaptovat a implementovat znalosti, demonstrovat schopnosti jako rozhodování, řešení problémů a pochopení složitých konceptů, podobně jako lidské inteligence.

Záměr

Účel nebo cíl vyjádřený vstupem zákazníka do chatbot, jako je například odpovídání na otázku nebo zpracování platby.

J

úkol

Samostatně proveditelná jednotka práce.

Notebook Jupyter

Viz notebook.

L

popisek

Třída nebo kategorie přiřazená k datovému bodu pod dohledem learning.Labels lze odvodit z dat, ale často je používají lidské labelery nebo anotátory.

označená data

Nezpracovaná data, která mají přiřazené štítky k přidání kontextu nebo významu, aby mohla být použita k výuce strojových modelů. Například číselné hodnoty mohou být označeny jako PSČ nebo věk pro poskytnutí kontextu pro vstupy a výstupy modelu.

model velkých jazyků

Jazykový model s velkým počtem parametrů, vyškolený na velkém množství textu.

latentní prostor

n-rozměrový matematický prostor, ve kterém jsou vloženy instance dat. Dvourozměrný latentní prostor vkládá data jako body do roviny 2D (viz také: reprezentační prostor). Viz též presentational space.

LoRA

Viz low-rank adaptation.

low-rank adaptace (LoRA)

Technika, která snižuje výpočetní požadavky velkých jazykových modelů díky využití nízkořadé struktury ve svých matricích vah, což vede k efektivnějším a rozšiřitelnějším tréninkovým a inferenčním procesům a způsob, jak dolaďovat modely založené na základech.

M

learning (ML)

Větev umělé inteligence (AI) a počítačové vědy, která se zaměřuje na využití dat a algoritmů tak, aby napodobovala způsob, jakým se lidé učí, postupně zdokonalují přesnost modelů AI.

výukový rámec stroje

Knihovny a běhové prostředí pro školení a implementaci modelu.

Model strojového učení

Model AI, který je školen na sadu dat k vývoji algoritmů, které může použít k analýze a učení nových dat.

mentální model

Individuální informace o tom, jak systém pracuje a jak jejich akce ovlivňují výsledky systému. Pokud se tato očekávání neshodují se skutečnými schopnostmi systému, může vést k frustraci, opuštění nebo zneužití.

nesprávné zarovnání

Nesrovnalost mezi cíli nebo chováním, které je systém AI optimalizován k dosažení a pravdivých, často složitých cílů svých lidských uživatelů nebo návrhářů.

ML.

Viz machine learning.

MLOPY

  • Metodika, která má model strojového učení od vývoje až po výrobu.
  • Postup spolupráce mezi vědeckými pracovníky a profesionály v oblasti správy pomáhá se správou životního cyklu výuky produkčního počítače (nebo důkladného učení). MLOS se zaměřuje na zvýšení automatizace a zlepšení kvality produkce ML a zároveň se zaměřuje na obchodní a regulační požadavky. Jedná se o vývoj modelu, školení, ověření, implementaci, monitorování a správu a použití metod, jako je CI/CD.

model

  • V kontextu strojového učení se sada funkcí a algoritmů, které byly vycvičeny a testována na datové sadě za účelem poskytování předpovědí nebo rozhodnutí.
  • V Decision Optimizationse jedná o matematickou formulaci problému, kterou lze vyřešit pomocí optimalizačních modulů CPLEX s použitím různých datových sad.

ModelOps

Metodika pro řízení kompletního životního cyklu modelu AI, včetně školení, implementace, bodování, hodnocení, rekvalifikace a aktualizace.

monitorovaná skupina

Třída dat, která je monitorována za účelem zjištění, zda se výsledky z prediktivního modelu výrazně liší od výsledků referenční skupiny. Skupiny se běžně monitorují na základě charakteristik, které zahrnují rasu, pohlaví nebo věk.

model klasifikace pro více vláken

Úloha klasifikace s více než dvěma třídami. Pokud například binární model klasifikace předpovídá ano nebo žádné hodnoty, model s více třídami předpovídá ano, ne, možná, nebo nelze použít.

časová řada s více variantami

Experiment časové řady, který obsahuje dvě nebo více změn proměnných. Příklad: Model časových řad předpovídá využití elektřiny třemi klienty.

N

zpracování přirozeného jazyka (NLP)

Pole umělé inteligence a lingvistiky, které studují problémy spojené se zpracováním a manipulací s přírodním jazykem, s cílem zvýšit schopnost počítačů porozumět lidským jazykům.

knihovna zpracování přirozeného jazyka

Knihovna, která poskytuje základní funkce pro zpracování přirozeného jazyka pro analýzu syntaxe a předškolené modely pro širokou škálu úloh zpracování textu.

neuronová síť

Matematický model pro předpovídání nebo klasifikaci případů pomocí složitého matematického schématu, který simuluje abstraktní verzi mozkových buněk. Neuronová síť je vycvičena tím, že ji předkládá s velkým počtem pozorovaných případů, jedna po druhé a umožňuje ji opakovaně aktualizovat, dokud se nenaučí tuto úlohu.

NLVE

Viz natural language processing.

uzel

V toku SPSS Modeler se jedná o grafické znázornění datové operace.

zápisník

Interaktivní dokument, který obsahuje spustitelný kód, popisný text pro tento kód a výsledky jakéhokoli kódu, který se spustí.

jádro

Část zápisníkového editoru, která provádí kód a vrací výpočetní výsledky.

O

Úložiště objektů

Metoda ukládání dat, obvykle používaná v cloudu, ve kterém jsou data uložena jako samostatné jednotky nebo objekty ve fondu úložišť nebo v úložišti, které nepoužívají hierarchii souborů, ale ukládá všechny objekty na stejné úrovni.

jednorázová výuka

Model pro hluboké učení, který je založen na předpokladu, že se většina lidí učí, když obdrží jen jeden nebo dva příklady. Tento model je podobný nedozorovaném učení.

Výzva-bez výzvy

Technika výzvy k zadání, v níž je k dispozici jediný příklad, který ukazuje, jak dokončit úlohu.

online implementace

Metoda přístupu k implementaci modelu nebo implementace kódu Python prostřednictvím koncového bodu rozhraní API jako webové služby za účelem generování předpovědí online v reálném čase.

ontologie

Explicitní formální specifikace pro reprezentaci objektů, koncepcí a dalších entit, které mohou existovat v určité oblasti zájmu, a vztahů mezi nimi.

provozní aktivum

Aktivum, které spouští kód v nástroji nebo úloze.

optimalizace

Proces nalezení nejvhodnějšího řešení přesně definovaného problému při respektování uložených omezení a omezení. Například, jak určit, jak přidělit prostředky nebo jak najít ty nejlepší prvky nebo kombinace z velké sady alternativ.

Programovací jazyk optimalizace

Modelovací jazyk pro vyjádření modelových formulací optimalizačních problémů ve formátu, který lze vyřešit pomocí optimalizačních modulů CPLEX, jako je např. IBM CPLEX.

optimalizovaná metrika

Metrika používaná k měření výkonu modelu. Přesnost je například typická metrika používaná k měření výkonu binárního modelu klasifikace.

koordinace

Proces vytvoření konce mezi koncovými body, který může trénovat, spouštět, implementovat, testovat a vyhodnocovat model učení se strojem a používá automatizaci ke koordinaci systému, často pomocí mikroslužeb.

nadměrné spoléhání

Přijetí nesprávného doporučení přijatého modelem AI uživatelem. Viz také závislost, nedostatečně spolehnutí.

P

parametr

  • Reálná váha mezi 0.0 a 1.0 označuje sílu spojení mezi dvěma neurony v neuronové síti.
  • Konfigurovatelná část modelu, která je pro model interní a jejíž hodnoty jsou odhadovány nebo se z nich poučili. Parametry jsou aspekty modelu, které jsou upraveny během tréninkového procesu tak, aby model pomohl přesně předpovědět výstup. Výkonnostní a prediktivní výkon modelu je z velké části závislý na hodnotách těchto parametrů.

Strana

V produktu Federated Learning, entita, která přispívá daty pro školení obecného modelu. Data se nepřesunují ani nekombinují, ale každá strana získá výhodu sdruženého školení.

informační obsah

Data, která jsou předána do implementace za účelem získání skóre, předpovědi nebo řešení.

protokolování informačního obsahu

Zachycení dat informačního obsahu a výstupu implementace pro monitorování průběžného stavu influenzy ptáků v obchodních aplikacích.

Kanál

  • Ve Watson Pipelinesse tok koncových aktiv od vytvoření přes implementaci až do konce.
  • V AutoAI, kandidátský model.

základní deska ropovodu

V tabulce AutoAIse takto označuje tabulka, která zobrazuje seznam automaticky generovaných kandidátských modelů, ropovodů, seřazených podle zadaných kritérií.

zásada

Strategie nebo pravidlo, které agent řídí k určení další akce založené na aktuálním stavu.

poziční kódování

Kódování uspořádané posloupnosti dat, která obsahuje poziční informace, jako je například kódování slov ve větě, které zahrnuje pozici každého slova v rámci věty. Viz také termín kódování.

prediktivní analýza

Obchodní proces a sada souvisejících technologií, které se zabývají predikcí budoucích možností a trendů. Prediktivní analýza používá takové různorodé disciplíny jako pravděpodobnost, statistiky, učení se strojem a umělou inteligenci k obchodním problémům při hledání nejlepší akce pro specifickou situaci.

předškolený model

Model AI, který byl dříve vyškolen na velké datové sadě, aby dokončil specifickou úlohu. Místo sestavení modelu od začátku se používají předškolené modely.

předškolení

Proces školení modelovacího modelu počítače na velké datové sadě před dokončením jeho vyladění pro specifickou úlohu.

Ochrana soukromí

Zajištění toho, aby informace o jednotlivci byly chráněny před neoprávněným přístupem a nevhodným používáním.

pravděpodobnostní

Vlastnost, která je vystavena náhodnosti; nedeterministická. Probamistické modely nevyprodukují stejné výstupy vzhledem ke stejným vstupům. Viz též generative variability.

projekt

Pracovní prostor spolupráce pro práci s daty a dalšími aktivy.

výzva - prompt

  • Data, jako např. text nebo obrázek, který připravuje, instruuje nebo pořizuje výstup na základní model.
  • Komponenta akce, která oznamuje, že před přechodem na výstupní obrazovku je pro některé pole vyžadován vstup uživatele.

výzva k zadání

Proces návrhu přirozeného jazyka vyzve k provedení specifické úlohy pro model jazyka.

vyladění výzev

Účinný, snížený nákladový způsob přizpůsobení předškoleného modelu novým úkolům bez přeškolování modelu nebo aktualizaci jeho vah. Vyladění výzev zahrnuje učení malého počtu nových parametrů, které jsou připojeny k výzvě k zadání modelu, zatímco zmrazení existujících parametrů modelu.

výzvy k zadání

Proces poskytování vstupu do základního modelu, který jej přivede k vytvoření výstupu.

smazání

Proces zjednodušení, zmenšování nebo ořezávání rozhodovacího stromu nebo neuronové sítě. To se provádí odebráním méně důležitých uzlů nebo vrstev, což snižuje složitost, aby se zabránilo přeceňování a zlepšení generalizace modelu při zachování prediktivní moci.

Python

Programovací jazyk, který se používá ve vědě o datech a AI.

Funkce Python

Funkce, která obsahuje kód Python pro podporu modelu v produkci.

R

R

Rozšiřitelný skriptovací jazyk používaný v oblasti vědy a vývoje dat, který nabízí širokou škálu analytických, statistických a grafických funkcí a technik.

RAG

Viz načtení rozšířené generace.

náhodné semeno

Číslo použité k inicializaci generátoru čísel pseudorandom. Náhodná semena umožňují reprodukovatelnost procesů, které se spoléhají na generování náhodných čísel.

referenční skupina

Skupina, která je identifikována jako nejpravděpodobnější, že dostane pozitivní výsledek v předpovědním modelu. Výsledky lze porovnat s monitorovanou skupinou, abyste se mohli podívat na potenciální zkreslení ve výsledcích.

Upřesnit

Pro vyčištění a formování dat.

regresní model

Model, který odkazuje na závislou proměnnou na jednu nebo více nezávislých proměnných.

zesílení učení

Technika učení v počítači, ve které se agent učí provádět sekvenční rozhodnutí v prostředí za účelem maximalizace signálu odplaty. Agenti jsou inspirováni procesem testování a chyb, agenti interagují s prostředím, přijímají zpětnou vazbu a přizpůsobují své akce tak, aby dosáhli optimálních zásad.

posílení učení o lidské zpětné vazbě (RLHF)

Způsob, jak sladit odpovědi modelu výukového modelu s pokyny uvedenými ve výzvě k zadání. Produkt RLHF vyžaduje, aby lidský anotátory hodnotil více výstupů z modelu. Tyto žebříčky se pak používají k vycvičení modelu odměny za použití výztuží učení. Model odměn se pak používá k finalizaci výstupu velkého programovacího modelu.

spoléhání

V systémech AI se uživatel přijímá doporučení, které vytvořil model AI nebo výstup generovaný modelem AI. Viz též overreliance, underreliance.

reprezentace

Kódování jednotky informací, často jako vektor reálných čísel. Viz též embedding.

reprezentační prostor

n-rozměrový matematický prostor, ve kterém jsou vloženy instance dat. Dvourozměrný latentní prostor vkládá data jako body do roviny 2D (viz také: latentní prostor). Viz též latent space.

načtení rozšířené generace (RAG)

Technika, při které je rozsáhlý jazykový model rozšířen o znalosti z externích zdrojů za účelem generování textu. V kroku načítání jsou relevantní dokumenty z externího zdroje identifikovány z dotazu uživatele. V kroku generování jsou části těchto dokumentů zahrnuty do výzvy LLM, aby se vygenerovala odezva s uzemněním v načtených dokumentech.

Odměna

Signál, který se používá k vedení agenta, obvykle agenta pro zvyšování učení, který poskytuje zpětnou vazbu o dobrotě rozhodnutí.

RLHF

Viz posílení učení na lidské zpětné vazbě.

běhové prostředí

Předdefinovaná nebo vlastní konfigurace hardwaru a softwaru, která se používá ke spouštění nástrojů nebo úloh, jako např. notebooky.

S

bodování

  • V počítačově učení proces měření důvěry předpovídaného výsledku.
  • Proces výpočtu toho, jak úzce se atributy pro příchozí identitu shodují s atributy existující entity.

skript

Soubor, který obsahuje skripty Python nebo R pro podporu modelu v produkčním prostředí.

self-attention

Mechanizmus upozornění, který používá informace ze samotného vstupu dat k určení toho, na které části vstupu se má při generování výstupu zaměřit.

osoby s vlastním dohledem

Metoda výuky strojového učení, ve které se model učí z neoznačených dat maskováním tokenů ve vstupní posloupnosti a poté se jej snaží předpovědět. Příkladem je "I like ________ výhonky".

sentience

Schopnost mít subjektivní zkušenosti a pocity, nebo vědomí. To zahrnuje schopnost vnímat, rozum a zažívat vjemy jako bolest a potěšení.

Tvar

Chcete-li přizpůsobit data filtrováním, řazením, odebráním sloupců, slučováním tabulek, prováděním operací, které zahrnují výpočty, seskupení dat, hierarchie a další.

malá data

Data, která jsou přístupná a srozumitelná lidmi. Viz též structured data.

SQL pushback

V produktu SPSS Modelerjde o proces provádění mnoha operací přípravy dat a dolování dat přímo v databázi prostřednictvím kódu SQL.

strukturovaná data

Data, která se nacházejí v pevných polích v rámci záznamu nebo souboru. Příklady strukturovaných dat jsou relační databáze a tabulky. Viz také nestrukturovaná data, malá data.

strukturované informace

Položky uložené ve strukturovaných prostředcích, jako jsou indexy vyhledávacího stroje, databáze nebo znalostní báze.

dozorované učení

Metoda výuky strojového učení, ve které je model vyškolen v datové sadě s popisky, aby bylo možné vytvářet předpovědi pro nová data.

T

Teplota

Parametr v generativní modelu, který uvádí množství variace v procesu generování. Vyšší teploty vedou k větší variabilitě ve výstupu modelu.

klasifikace textu

Model, který automaticky identifikuje a klasifikuje text do určených kategorií.

Časové řady

Sada hodnot proměnné v pravidelných časových bodech.

model časové řady

Model, který sleduje a předpovídá data v čase.

token

Samostatná měrná jednotka nebo analýza v textu, jako je slovo nebo dílčí slovo.

tokenizace

Proces použitý při zpracování přirozeného jazyka k rozdělení řetězce textu na menší jednotky, jako jsou slova nebo podslova.

školený model

Model, který je vycvičen se skutečnými daty a je připraven k implementaci s cílem předpovídat výsledky při prezentaci s novými daty.

Trénování

Počáteční fáze sestavení modelu zahrnující podmnožinu zdrojových dat. Model se učí podle příkladu ze známých dat. Model lze poté testovat proti další dílčí sadě, pro kterou je výsledek již znám.

školení dat

Sada anotovaných dokumentů, které lze použít k trénování počítačových modelů počítačů.

Učební sada

Sada označených dat, která se používá k vycvičením modelu strojového učení vystavením příkladů a jejich odpovídajících jmenovek, což umožňuje modelům naučit se vzory a vytvářet předpovědi.

přenos učení

Strategie učení stroje, ve které se vycvičený model použije na zcela nový problém.

transformátor

Architektura neuronové sítě, která používá poziční kódování a mechanismus sebepozorování k předpovídání dalšího tokenu v posloupnosti tokenů.

průhlednost

Sdílení vhodných informací se zúčastněnými stranami o tom, jak byl systém AI navržen a rozvíjen. Příklady těchto informací jsou to, jaká data se shromažďují, jak se budou používat a ukládat, a kdo k němu má přístup; a výsledky testů pro přesnost, robustnost a předpojatost.

kalibrace důvěryhodnosti

Proces vyhodnocení a úpravy důvěry v systému AI na základě faktorů, jako jsou jeho přesnost, spolehlivost a věrohodnost.

Turingova zkouška

Návrh Alana Turingova v roce 1950, zkouška schopnosti stroje vykazovat inteligentní chování ekvivalentní, nebo nerozeznatelný od, že na člověka.

U

nespoléhání

Uživatel odmítá správná doporučení z modelu AI. Viz také přílišná závislost, závislost.

jednvariantní časová řada

Experiment časové řady, který obsahuje pouze jednu změnu proměnné. Například model časových řad předpovídající, že teplota má jeden sloupec predikce teploty.

nestrukturovaných dat

Veškerá data, která jsou uložena v nestrukturovaném formátu, spíše než v pevných polích. Data v textovém dokumentu jsou příkladem nestrukturovaných dat. Viz též structured data.

nestrukturované informace

Data, která nejsou obsažena v pevném umístění, například v textovém dokumentu přirozeného jazyka.

učení bez dozoru

  • Model pro hloubkové učení, který umožňuje použití syrových a neoznačených dat k vycvičení systému bez lidského úsilí.
  • Metoda výuky strojového učení, ve které není model poskytnut s návěštím dat a musí najít vzory nebo strukturu v datech sama o sobě.

V

sada ověření platnosti

Samostatná sada označených dat, která se používá k vyhodnocení výkonu a generalizační schopnosti počítačového modelu učení se během procesu školení, pomoci při ladění hyperparametrů a výběru modelu.

Vector

Rozměrový, uspořádaný seznam čísel, jako např. [ 1, 2, 5] nebo [0.7, 0.2, -1.0].

vizualizace

Graf, graf, zákres, tabulka, mapa nebo jakékoli jiné vizuální reprezentace dat.

W

váha

Koeficient pro uzel, který transformuje vstupní data v rámci vrstvy sítě. Váha je parametr, který model AI učí prostřednictvím školení, upravuje svou hodnotu tak, aby snižovala počet chyb v předpovědích modelu.

Z

Výzva k zadání nulové hodnoty

Technika výzvy, v níž model dokončuje úlohu, aniž by byl uveden konkrétní příklad toho, jak.