0 / 0
Torna alla versione inglese della documentazione
Glossario
Ultimo aggiornamento: 11 dic 2024
Glossario

Questo glossario fornisce termini e definizioni per Cloud Pak for Data as a Service.

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W

A

acceleratore

Nell'informatica ad alte prestazioni, un circuito specializzato che viene utilizzato per sottrarre alla CPU una parte del carico di calcolo, aumentando l'efficienza del sistema. Ad esempio, nel deep learning, l'elaborazione accelerata da GPU viene spesso utilizzata per scaricare parte del carico di lavoro di calcolo su una GPU mentre l'applicazione principale viene eseguita dalla CPU. Vedere anche unità di elaborazione grafica.

responsabilità

L'aspettativa che le organizzazioni o gli individui garantiscano il corretto funzionamento, per tutto il loro ciclo di vita, dei sistemi di intelligenza artificiale che progettano, sviluppano, gestiscono o distribuiscono, in conformità con i loro ruoli e i quadri normativi applicabili. Ciò include la determinazione di chi è responsabile di un errore di intelligenza artificiale che può richiedere agli esperti legali di determinare la responsabilità caso per caso.

funzione di attivazione

Una funzione che definisce l'uscita di un'unità neurale data una serie di attivazioni in entrata da altri neuroni

apprendimento attivo

Un modello per il machine learning in cui il sistema richiede più dati etichettati solo quando ne ha bisogno.

metadati attivi

Metadati che vengono aggiornati automaticamente in base all'analisi dei processi di machine learning. Ad esempio, la creazione di profili e l'analisi della qualità dei dati aggiornano automaticamente metadati per gli asset di dati.

runtime attivo

Un'istanza di un ambiente in esecuzione per fornire risorse di calcolo alle risorse che eseguono codice.

agente

Un algoritmo o un programma che interagisce con un ambiente per apprendere azioni o decisioni ottimali, in genere utilizzando l'apprendimento per rinforzo, per raggiungere un obiettivo specifico.

AI

Vedi intelligenza artificiale.

Acceleratore AI

Hardware di silicio specializzato progettato per eseguire in modo efficiente le attività legate all'intelligenza artificiale, come l'apprendimento profondo, l'apprendimento automatico e le reti neurali, per un'elaborazione più rapida ed efficiente dal punto di vista energetico. Può essere un'unità dedicata in un core, un chiplet separato in un chip multimodulo o una scheda separata.

L'Etica dell'AI

Un campo multidisciplinare che studia come ottimizzare l'impatto benefico dell'IA riducendo i rischi e i risultati negativi. Esempi di problemi di etica dell'intelligenza artificiale sono la responsabilità dei dati e la privacy, l'equità, l'esplicabilità, la solidità, la trasparenza, la sostenibilità ambientale, l'inclusione, l'agenzia morale, l'allineamento del valore, la responsabilità, la fiducia e l'uso improprio della tecnologia.

Governance dell'AI

L'atto di un'organizzazione di governare, attraverso le sue istruzioni aziendali, il personale, i processi e i sistemi per dirigere, valutare, monitorare e intraprendere azioni correttive per tutto il ciclo di vita dell'intelligenza artificiale, per fornire la garanzia che il sistema di intelligenza artificiale stia funzionando come l'organizzazione intende, come i suoi stakeholder si aspettano, e come richiesto dalla normativa pertinente.

Sicurezza AI

Il campo di ricerca che mira a garantire che i sistemi di intelligenza artificiale operino in un modo che sia benefico per l'umanità e non causi inavvertitamente danni, affrontando questioni come l'affidabilità, la correttezza, la trasparenza e l'allineamento dei sistemi di intelligenza artificiale con i valori umani.

Sistema AI

Vedere sistema di intelligenza artificiale.

algoritmo

Una formula applicata ai dati per determinare i modi ottimali per risolvere i problemi analitici.

rischi superiori

La scienza di studiare i dati per trovare modelli significativi nei dati e trarre conclusioni basate su tali modelli.

intelligenza artificiale (AI)

La capacità di acquisire, elaborare, creare e applicare la conoscenza sotto forma di modello per fare previsioni, raccomandazioni o decisioni.

sistema di intelligenza artificiale (sistema AI)

Un sistema che può fare previsioni, raccomandazioni o decisioni che influenzano ambienti fisici o virtuali e i cui output o comportamenti non sono necessariamente predeterminati dallo sviluppatore o dall'utente. I sistemi di IA sono tipicamente addestrati con grandi quantità di dati strutturati o non strutturati e potrebbero essere progettati per operare con diversi livelli di autonomia o nessuno, per raggiungere obiettivi definiti dall'uomo.

asset

Un elemento in un progetto o catalogo che contiene i metadati relativi ai dati o all'analisi dei dati.

regola di composizione degli attributi

Una delle regole che determinano il modo in cui i valori degli attributi di un'entità dei dati master vengono selezionati dai record dei suoi membri. Si veda anche la regola.

Esperimento AutoAI

Un processo di addestramento automatizzato che considera una serie di parametri e definizioni di addestramento per creare un insieme di pipeline classificate come candidati di modelli.

B

distribuzione in batch

Un metodo per distribuire i modelli che elabora i dati di input da un file, una connessione dati o i dati connessi in un bucket di archiviazione, quindi scrive l'output in una destinazione selezionata.

bias

Errore sistematico in un sistema di intelligenza artificiale che è stato progettato, intenzionalmente o meno, in un modo che può generare decisioni sleali. La distorsione può essere presente sia nel sistema AI che nei dati utilizzati per addestrarlo e testarlo. La distorsione dell'IA può emergere in un sistema di intelligenza artificiale come risultato di aspettative culturali, limitazioni tecniche o contesti di distribuzione imprevisti. Vedere anche correttezza.

rilevamento pregiudizio

Il processo di calcolo della correttezza delle metriche per rilevare quando i modelli AI stanno producendo risultati errati sulla base di determinati attributi.

attenuazione dei pregiudizi

Ridurre le distorsioni nei modelli di intelligenza artificiale curando i dati di formazione e applicando tecniche di equità.

classificazione binaria

Un modello di classificazione con due classi. Le previsioni sono una scelta binaria di una delle due classi.

termine di business

Una parola o una frase che definisce un concetto di business in modo standard per un'azienda. I termini possono essere utilizzati per arricchire i metadati degli asset di dati e per definire i criteri delle regole di protezione dei dati.

vocabolario di business

La serie di risorse di governance, come i termini di business e le classi di dati, che descrivono e arricchiscono gli asset di dati.

C

catalog

Un repository di asset per la condivisione di un'organizzazione. Gli asset nei cataloghi possono essere controllati da regole di protezione dei dati e arricchito da altre risorse di governance, come le classificazioni, le classi di dati e i termini di business. I cataloghi possono memorizzare dati strutturati e non strutturati, riferimenti ai dati in origini dati esterne e altri asset analitici, come i modelli di machine learning.

categoria

Per la governance dei dati, uno spazio di lavoro collaborativo per organizzare e gestire gli artefatti di governance.

classificazione

Per la governance dei dati, un artefatto di governance che descrive il livello di sensibilità dei dati in un asset di dati.

pulire

Per garantire che tutti i valori in un dataset siano congruenti e correttamente registrati.

collaboratore

Un membro di un gruppo di persone che sta lavorando insieme verso un obiettivo comune.

problema combinatorio

Un problema difficile da risolvere perché richiede più decisioni che coinvolgono un numero troppo elevato di combinazioni di scelte possibili. Alcuni esempi sono la ricerca di un raggruppamento, l'ordinamento o l'assegnazione di oggetti.

risorse di calcolo

Le risorse hardware e software definite da una definizione dell'ambiente per eseguire asset analitici.

matrice di confusione

Una misura delle prestazioni che determina l'accuratezza tra i risultati previsti positivi e negativi di un modello rispetto ai risultati effettivi positivi e negativi.

Dati connessi

Un dataset a cui si accede tramite una connessione a un'origine dati esterna.

connessione

Le informazioni necessarie per connettersi a un database. Le informazioni effettive richieste variano in base al DBMS e al metodo di connessione.

vincolo

In Decision Optimization, una condizione che deve essere soddisfatta dalla soluzione di un problema.

apprendimento continuo

Automazione delle attività di monitoraggio delle prestazioni del modello, riqualificazione con nuovi dati e ridistribuzione per garantire la qualità di previsione.

distribuzione Core ML

Il processo di download di una distribuzione in formato Core ML da utilizzare nelle app iOS.

corpo

Una raccolta di documenti di origine utilizzati per addestrare un modello di machine learning.

Modello CPLEX

Un modello di Decision Optimization formulato per essere risolto dal motore CPLEX.

Modello CPO

Un modello di programmazione a vincoli formulato per essere risolto dal motore Decision Optimization CP Optimizer (CPO).

rendere accurato

  • Selezionare, raccogliere, conservare e mantenere il contenuto rilevante per un argomento specifico. La conservazione stabilisce, mantiene e aggiunge valore ai dati; li trasforma in informazioni attendibili.
  • Creare un asset di dati e prepararlo per la pubblicazione in un catalogo. La conservazione può includere l'arricchimento dell'asset di dati assegnando risorse di governance come i termini di business, la classificazione e le classi di dati, e analizzando la qualità dei dati nell'asset di dati.

D

asset di dati

Un asset che punta ai dati, ad esempio, ad un file caricato. Anche le connessioni e gli asset di dati connessi sono considerati asset di dati.

classe dati

Una risorsa di governance che categorizza le colonne in dataset relazionali in base al tipo di dati e al modo in cui vengono utilizzati i dati.

governance dei dati

Il processo di tracciamento e controllo dei dati per mantenere la qualità, la sicurezza e la conformità dei dati.

integrazione dati

La combinazione di processi tecnici e di business utilizzati per combinare i dati da fonti diverse in informazioni significative e preziose.

data lake

Un repository di archiviazione dati su larga scala che memorizza i dati non elaborati in qualsiasi formato in un'architettura semplice. I data lakes contengono dati strutturati e non strutturati e dati binari per l'elaborazione e l'analisi.

data lakehouse

Un'architettura di elaborazione e archiviazione dei dati unificata che combina la flessibilità di un data lake con le query strutturate e le ottimizzazioni delle prestazioni di un data warehouse, consentendo un'analisi dei dati scalabile ed efficiente per le applicazioni di analytics e AI.

mining dei dati

Il processo di raccolta delle informazioni di business critiche da un'origine dati, di correlazione delle informazioni e di scoperta di associazioni, modelli e andamenti. Vedere anche predictive analytics.

modello di dati

Una visualizzazione di elementi di dati, le relazioni e gli attributi.

Condotto dati

Una serie di fasi di elaborazione e trasformazione dei dati.

riservatezza dei dati

La protezione dei dati da accessi non autorizzati e da usi impropri.

Prodotto di dati

Una raccolta di dati ottimizzati o di asset correlati ai dati che vengono impacchettati per il riutilizzo e la distribuzione con accesso controllato. I prodotti dati contengono dati, modelli, dashboard e altri tipi di asset di calcolo. Diversamente dagli asset di dati nei cataloghi di governance, i prodotti di dati sono gestiti come prodotti con più scopi per fornire valore di business.

regola di protezione dati

Una risorsa di governance che specifica i dati da controllare e le modalità di controllo. Una regola di protezione dei dati contiene criteri e un'azione. Si veda anche la regola.

analisi qualità dei dati

L'analisi dei dati rispetto alle dimensioni di qualità accuratezza, completezza, coerenza, tempestività, unicità e validità.

definizione della qualità dei dati

Una definizione di qualità dei dati descrive una valutazione della regola o una condizione per le regole di qualità dei dati.

regola di qualità dei dati

Durante l'analisi della qualità dei dati, una regola di qualità dei dati che valuta se vengono soddisfatte specifiche condizioni e identifica i record che non soddisfano le condizioni come violazioni di regole. Si veda anche la regola.

Flusso Data Refinery

Un'origine dati, una catena di una o più operazioni che ottimizzano e modellano tale origine dati, e una destinazione in cui i dati si spostano.

scienza dei dati

l'analisi e la visualizzazione dei dati strutturati e non strutturati per scoprire informazioni dettagliate e conoscenze.

serie di dati

Una raccolta di dati, generalmente nel formato di righe (record) e colonne (campi) e contenuta in un file o una tabella di database.

origine dati

Un repository, una coda o un feed per la lettura dei dati, ad esempio un database.

Flusso DataStage

Una risorsa che si basa su un insieme ordinato di passaggi per estrarre, trasformare e caricare i dati.

tabella dati

Una raccolta di dati, generalmente nel formato di righe (record) e colonna (campi) e contenuta in una tabella.

data warehouse

Un grande repository centralizzato di dati raccolti da varie origini utilizzato per la creazione di report e l'analisi dei dati. Memorizza principalmente dati strutturati e semistrutturati, consentendo alle aziende di prendere decisioni informate.

Esperimento Decision Optimization

Un asset che contiene un gruppo di scenari che rappresentano formulazioni di modelli o dataset relativi allo stesso problema in fase di risoluzione.

modello Decision Optimization

Un modello prescrittivo che può essere risolto con l'ottimizzazione per fornire la migliore soluzione ad un problema Decision Optimization.

variabile di decisione

Una di un insieme di variabili che rappresentano le decisioni da effettuare, i cui valori sono determinati dal motore di ottimizzazione assicurando che tutti i vincoli siano soddisfatti e che l'obiettivo sia ottimizzato.

apprendimento profondo

Un modello computazionale che utilizza più strati di nodi interconnessi, organizzati in livelli gerarchici, per trasformare i dati in ingresso (primo strato) attraverso una serie di calcoli per produrre un output (strato finale). L'apprendimento profondo si ispira alla struttura e al funzionamento del cervello umano.

esperimento di apprendimento approfondito

Un processo di formazione del modello che si basa su un raggruppamento logico di una o più definizioni di formazione del modello che sono collegate in una rete neurale.

rete neurale profonda

Una rete neurale con più strati nascosti, che consente di ottenere rappresentazioni più complesse dei dati.

distribuzione

Un modello o pacchetto dell'applicazione disponibile per l'utilizzo.

spazio di distribuzione

Uno spazio di lavoro in cui vengono distribuiti i modelli e gestite le distribuzioni.

DOcplex

Un'API Python per la modellazione e la soluzione dei problemi di Decision Optimization .

E

URL endpoint

Un indirizzo di destinazione di rete che identifica le risorse, come i servizi e gli oggetti. Ad esempio, viene utilizzato un URL endpoint per identificare la posizione di una distribuzione di modello o funzione quando un utente invia i dati di payload alla distribuzione.

ambiente

Le risorse di calcolo per i lavori in esecuzione.

runtime dell'ambiente

Un'istanziazione del modello di ambiente per eseguire le risorse.

template di ambiente

Una definizione che specifica le risorse hardware e software per creare istanza dei runtime dell'ambiente.

sfruttabilità

  • La capacità di utenti reali di tracciare, controllare e comprendere le predizioni effettuate nelle applicazioni che utilizzano sistemi di IA.
  • La capacità di un sistema di intelligenza artificiale di fornire informazioni che gli esseri umani possono utilizzare per comprendere le cause delle previsioni del sistema.

F

congruità

In un sistema di IA, il trattamento equo di individui o gruppi di individui. La scelta di una nozione specifica di equity per un sistema AI dipende dal contesto in cui viene utilizzato. Vedere anche distorsione.

componente

Una proprietà o caratteristica di un elemento all'interno di un dataset, ad esempio, una colonna in un foglio di calcolo. In alcuni casi, le funzioni vengono ingegnerizzate come combinazioni di altre funzioni nel dataset.

Progettazione di funzioni

Il processo di selezione, trasformazione e creazione di nuove funzioni dai dati non elaborati per migliorare le prestazioni e il potere predittivo dei modelli di machine learning.

selezione della funzione

Identificazione delle colonne di dati che meglio supportano una previsione o un punteggio accurati in un modello di machine learning.

negozio di funzioni

Un sistema o un repository centralizzato che gestisce e organizza le funzioni, fornendo un modo scalabile ed efficiente per archiviare, richiamare e condividere i dati delle funzioni tra le applicazioni e le pipeline di machine learning.

trasformazione della funzione

In AutoAI, una fase della creazione della pipeline che applica algoritmi per trasformare ed ottimizzare i dati di addestramento per ottenere il miglior risultato per il tipo di modello.

apprendimento federato

Il training di un modello di machine learning comune che utilizza più origini dati che non vengono spostate, unite o condivise. Il risultato è un modello ottimizzato senza compromettere la sicurezza dei dati.

flusso

Una raccolta di nodi che definiscono un insieme di passi per l'elaborazione dei dati o l'addestramento di un modello.

Modello di base

Un modello di intelligenza artificiale che può essere adattato a un'ampia gamma di compiti a valle. I modelli Foundation sono in genere modelli generativi su larga scala che vengono addestrati su dati non etichettati utilizzando l'auto-supervisione. Essendo modelli su larga scala, i modelli di fondazione possono includere miliardi di parametri.

G

grafico Gantt

Una rappresentazione grafica di una sequenza temporale e della durata di un progetto in cui i dati di pianificazione vengono visualizzati come barre orizzontali lungo una scala temporale.

Gen AI

Vedi IA generativa.

iA generativa (gen AI)

Una classe di algoritmi di intelligenza artificiale in grado di produrre vari tipi di contenuti, tra cui testo, codice sorgente, immagini, audio e dati sintetici.

oggetto di governance

Elementi di governance che arricchiscono o controllano gli asset di dati. Le risorse di governance comprendono termini di business, classificazioni, classi di dati, politiche, regole e dataset di riferimento.

regola di governance

Una risorsa di governance che fornisce una descrizione di linguaggio naturale dei criteri utilizzati per determinare se gli asset di dati sono conformi agli obiettivi di business. Si veda anche la regola.

flusso di lavoro di governance

Un processo basato su attività per controllare la creazione, la modifica e l'eliminazione delle risorse di governance.

catalogo governato

Un catalogo che applica l'abilitazione delle regole di protezione dei dati.

GPU

Vedere unità di elaborazione grafica.

programma di creazione grafico

Uno strumento per la creazione di risorse di flusso tramite la codifica visiva. Un'area su cui posizionare oggetti o nodi che possono essere collegati per creare un flusso.

GPU (graphics processing unit)

Un processore specializzato progettato per manipolare e modificare rapidamente la memoria per accelerare la creazione di immagini in un frame buffer destinato all'output su un display. Le GPU sono fortemente utilizzate nell'apprendimento automatico a causa delle loro capacità di elaborazione parallela. Vedi anche acceleratore.

tenuta a terra

Fornire un modello linguistico di grandi dimensioni con informazioni per migliorare l'accuratezza dei risultati.

H

Rilevamento HAP (rilevamento HAP)

  • La capacità di rilevare e filtrare l'odio, l'abuso e la blasfemia sia nelle richieste inviate dagli utenti sia nelle risposte generate da un modello di intelligenza artificiale.

Rivelatore HAP (rivelatore HAP)

  • Un classificatore di frasi che rimuove i contenuti potenzialmente dannosi, come i discorsi di odio, gli abusi e le bestemmie, dall'output e dall'input del modello di fondazione.

serie di dati di controllo

Un insieme di dati con etichetta che viene intenzionalmente trattenuto da entrambi i set di addestramento e convalida, fungendo da valutazione imparziale delle prestazioni del modello finale su dati non visti.

supervisione umana

Coinvolgimento umano nella revisione delle decisioni rese da un sistema di intelligenza artificiale, consentendo l'autonomia umana e la responsabilità della decisione.

iperparametro

Nel machine learning, un parametro il cui valore è impostato prima dell'addestramento come metodo per aumentare la precisione del modello.

I

immagine

Un package software che contiene un insieme di librerie.

inferenza

Il processo di esecuzione di dati reali attraverso un modello di intelligenza artificiale addestrato per fare una previsione o risolvere un compito.

assimilare

  • Per inserire i dati in un sistema allo scopo di creare una base di conoscenza.
  • Per aggiungere costantemente un elevato volume di dati in tempo reale ad un database.

comprensione profonda

Una comprensione accurata o profonda di qualcosa. Le informazioni dettagliate vengono derivate utilizzando l'analytics cognitiva per fornire istantanee e previsioni correnti dei comportamenti e degli atteggiamenti dei clienti.

intento

Uno scopo o un obiettivo espresso dall'input del cliente a un chatbot, come rispondere a una domanda o elaborare un pagamento di fattura.

J

lavoro

Un'unità di lavoro eseguibile separatamente.

K

base di conoscenza

Vedi corpus.

L

dati etichettati

I dati non elaborati a cui vengono assegnate le etichette per aggiungere il contesto o il significato in modo che possano essere utilizzati per addestrare i modelli di machine learning. Ad esempio, i valori numerici potrebbero essere etichettati come codici postali o età per fornire il contesto per gli input e gli output del modello.

modello linguistico di grandi dimensioni (LLM)

Un modello di lingua con un gran numero di parametri, addestrato su una gran quantità di testo.

derivazione

  • La cronologia del flusso di dati attraverso l'asset.
  • La cronologia degli eventi eseguiti su un asset.

LLM

Vedere modello linguistico di grandi dimensioni.

modello logico

Una rappresentazione logica di oggetti di dati correlati a un dominio di business.

M

machine learning (ML)

Un ramo dell'intelligenza artificiale (AI) e dell'informatica che si concentra sull'utilizzo di dati e algoritmi per imitare il modo in cui gli esseri umani imparano, migliorando gradualmente l'accuratezza dei modelli di IA.

framework di machine learning

Le librerie e il runtime per l'addestramento e la distribuzione di un modello.

modello di machine learning

Un modello di intelligenza artificiale che viene addestrato su una serie di dati per sviluppare algoritmi che può utilizzare per analizzare e apprendere da nuovi dati.

maschera

Per sostituire i valori dei dati sensibili in una colonna di un dataset. I metodi di mascheramento variano nel programma di utilità dei dati e nella privacy, dal fornire valori di sostituzione formattati in modo simile che mantengono l'integrità referenziale al fornire lo stesso valore di sostituzione per l'intera colonna.

flusso di mascheramento

Un flusso che produce copie di dati permanentemente mascherate.

dati (unici) di riferimento

  • Per l'addestramento del modello, i dati di riferimento che rimangono gli stessi per diversi lavori sullo stesso modello ma che possono essere modificati, se necessario.
  • In Match 360, una vista consolidata dei dati provenienti dalle diverse origini.

entità dei dati master

Una composizione di record che un algoritmo di corrispondenza ha stabilito rappresentare la stessa entità del mondo reale, come una persona o un'organizzazione. Ogni entità comprende uno o più record membri che l'algoritmo di corrispondenza ha collegato tra loro.

programmazione matematica (mathematical programming, MP)

Un campo della matematica, o ricerca operativa, utilizzato per modellare e risolvere problemi di Decision Optimization. Racchiude la programmazione lineare, di numeri interi, di numeri interi misti e non lineare.

Importazione di metadati

Un metodo di importazione dei metadati associati agli asset di dati, inclusi i metadati del processo che descrivono la derivazione degli asset di dati e i metadati tecnici che descrivono la struttura degli asset di dati.

disallineamento

Una discrepanza tra gli obiettivi o i comportamenti che un sistema di intelligenza artificiale è ottimizzato per raggiungere e i veri obiettivi, spesso complessi, dei suoi utenti umani o progettisti

ML

Vedere machine learning.

MLOps

  • La pratica per la collaborazione tra data scientist e professionisti delle operazioni per aiutare a gestire il ciclo di vita del machine learning di produzione (o deep learning). MLOps mira ad aumentare l'automazione e a migliorare la qualità della produzione ML, concentrandosi anche sui requisiti di business e normativi. Comprende sviluppo di modelli, formazione, convalida, distribuzione, monitoraggio e gestione e utilizza metodi come CI/CD.
  • Una metodologia che prende un modello di machine learning dallo sviluppo alla produzione.

modello

  • In un contesto di machine learning, una serie di funzioni e algoritmi che sono stati addestrati e sottoposti a test su un dataset per fornire previsioni o decisioni.
  • In Decision Optimization, una formulazione matematica di un problema che può essere risolto con motori di ottimizzazione CPLEX che utilizzano dataset differenti.

formulazione di modello

In Decision Optimization, la formulazione matematica di un modello espresso come elenco di variabili di decisione, una o più funzioni obiettivo da massimizzare o minimizzare ed alcuni vincoli da soddisfare.

ModelOps

Una metodologia per la gestione dell'intero ciclo di vita di un modello AI, che include formazione, implementazione, calcolo del punteggio, valutazione, riaggiornamento e aggiornamento.

MP

Vedere programmazione matematica.

N

linguaggio naturale

Una sintassi di modellazione che assomiglia alla lingua umana (in inglese) per formulare modelli.

elaborazione del linguaggio naturale (NLP)

Un campo di intelligenza artificiale e linguistica che studia i problemi inerenti all'elaborazione e alla manipolazione del linguaggio naturale, con l'obiettivo di aumentare la capacità dei computer di comprendere i linguaggi umani.

libreria di elaborazione del linguaggio naturale

Una libreria che fornisce funzioni di elaborazione del linguaggio naturale di base per l'analisi della sintassi e modelli predefiniti per un'ampia varietà di attività di elaborazione del testo.

rete neurale

Un modello matematico per la previsione o la classificazione dei casi utilizzando un complesso schema matematico che simula una versione astratta delle cellule cerebrali. L'addestramento di una rete neurale viene eseguito applicando alla rete un numero elevato di casi osservati, uno alla volta, e consentendo alla rete di aggiornarsi automaticamente ogni volta fino a quando l'attività non viene appresa.

NLP

Vedi natural language processing.

nodo

La rappresentazione grafica di un'operazione dati in uno stream o in un flusso. Diversi tipi di nodi hanno forme diverse per indicare il tipo di operazione che eseguono.

notebook

Un documento interattivo che contiene codice eseguibile, testo descrittivo per quel codice e i risultati di qualsiasi codice eseguito.

kernel del notebook

La parte dell'editor del notebook che esegue il codice e restituisce i risultati di calcolo.

O

offuscare

Sostituire i dati in una colonna con valori formattati in modo simile che corrispondono al formato originale. Una forma di mascheramento.

funzione obiettivo

In Decision Opmization and operations research, un'espressione per ottimizzare (ovvero, ridurre o massimizzare) soddisfacendo altri vincoli del problema.

archivio dell'oggetto

Un metodo di memorizzazione dei dati, tipicamente utilizzato nel cloud, in cui i dati vengono memorizzati come unità distinte, o oggetti, in un pool di archiviazione o repository che non utilizza una gerarchia di file ma che memorizza tutti gli oggetti allo stesso livello.

distribuzione online

Metodo di accesso a un modello o distribuzione del codice Python tramite un endpoint API come un servizio web per generare previsioni online, in tempo reale.

ontologia

Una specifica formale esplicita della rappresentazione di oggetti, concetti e altre entità che possono esistere in alcune aree di interesse e le relazioni tra loro.

asset operativo

Un asset che esegue il codice in uno strumento o in un lavoro.

modello OPL

Una formulazione di modello espressa in linguaggio di modellazione OPL.

soluzione ottimale

Nella ricerca di operazioni, una soluzione ad un problema che ottimizza la funzione obiettiva (lineare o quadratica) e soddisfa tutti gli altri vincoli del problema.

ottimizzazione

Il processo di trovare la soluzione più appropriata a un problema definito con precisione, rispettando i vincoli e i limiti imposti. Ad esempio, determinare come allocare le risorse o come trovare gli elementi o le combinazioni migliori da una vasta serie di alternative.

orchestrazione

Il processo di creare un flusso end-to-end che può addestrare, eseguire, distribuire, verificare e valutare un modello di machine learning e utilizza l'automazione per coordinare il sistema, spesso utilizzando i microservizi.

P

Revisione delle coppie

Un processo durante il quale un utente del data steward confronta i record per determinare se corrispondono. I risultati della revisione a coppie addestrano un algoritmo di corrispondenza a decidere quali record vengono abbinati alle entità dei dati master.

Parametro

Una parte configurabile del modello che è interna a un modello e i cui valori vengono stimati o appresi dai dati. I parametri sono aspetti del modello che vengono regolati durante il processo di addestramento per aiutare il modello a prevedere accuratamente l'output. Le prestazioni e il potere predittivo del modello dipendono in gran parte dai valori di questi parametri.

parte

In Federated Learning, un'entità che fornisce dati per l'addestramento di un modello comune. I dati non vengono spostati o combinati, ma ogni parte ottiene il beneficio della formazione federata.

payload

I dati passati a una distribuzione per ottenere nuovamente un punteggio, una previsione o una soluzione.

registrazione payload

L'acquisizione dei dati del payload e la distribuzione dell'output per monitorare l'integrità continua dell'IA nelle applicazioni di business.

modello fisico

Una definizione delle strutture fisiche e delle relazioni dei dati.

pipeline

  • In Watson Pipelines, un flusso end-to-end di risorse dalla creazione alla distribuzione.
  • In AutoAI, un modello candidato.

classifica pipeline

In AutoAI, una tabella che mostra l'elenco dei modelli candidati generati automaticamente, come pipeline, classificati in base ai criteri specificati.

segnaposto

Un campo o una variabile che devono essere sostituiti da un valore.

politica

  • Una strategia o una regola che un agent segue per determinare l'azione successiva in base allo stato corrente.
  • Un insieme di regole che proteggono i dati controllando l'accesso agli asset di dati o rendendo anonimi i dati sensibili all'interno degli asset di dati.
  • Una risorsa di governance composta da una o più regole di governance e protezione dei dati.

analytics predittiva

Un processo di business e una serie di tecnologie correlate che si occupano della previsione delle future possibilità e andamenti. L'analisi predittiva applica diverse discipline come la probabilità, le statistiche, il machine learning e l'intelligenza artificiale ai problemi di business per trovare l'azione migliore per una situazione specifica. Vedere anche data mining.

modello preaddestrato

Un modello AI precedentemente addestrato su un dataset di grandi dimensioni per eseguire un'attività specifica. I modelli preaddestrati vengono utilizzati invece di creare un modello da zero.

categoria primaria

Per la governance dei dati, la categoria che contiene l'artefatto di governance. Una categoria è simile ad una cartella o directory che organizza le risorse di governance dell'utente.

privacy

Garanzia che le informazioni su un individuo siano protette da accesso non autorizzato e uso inappropriato.

profilo

Le statistiche e i metadati generati relativi al contenuto testuale dei dati.

progetto

Uno spazio di collaborazione per gestire dati e altri asset.

riduzione

Il processo di semplificazione, riduzione o taglio di un albero decisionale o di una rete neurale. Ciò avviene rimuovendo i nodi o gli strati meno importanti, riducendo la complessità per evitare l'overfitting e migliorare la generalizzazione del modello, pur mantenendo il suo potere predittivo.

pubblicare

Per copiare un asset in un catalogo.

Python

Un linguaggio di programmazione utilizzato nella scienza dei dati e nell'intelligenza artificiale.

modello DOcplex Python

Una formulazione di modello espressa in Python.

Python funzione

Una funzione che contiene codice Python per supportare un modello in produzione.

Q

regola di qualità

Una o più condizioni richieste per un record di dati per soddisfare gli standard di qualità. Durante l'analisi della qualità dei dati, i record di dati vengono controllati rispetto a tali condizioni. Si veda anche la regola.

quantizzazione

Un metodo di compressione dei pesi dei modelli di fondazione per accelerare l'inferenza e ridurre le esigenze di memoria della GPU.

R

R

Un linguaggio di script estensibile utilizzato nella data science e nell'AI che offre un'ampia gamma di funzioni e tecniche analitiche, statistiche e grafiche.

leggi

Per copiare i dati in un'applicazione al fine di manipolarlo o analizzarlo.

revisionare

Per sostituire tutti i valori dei dati in una colonna con la stessa stringa per nascondere i valori sensibili, il formato dei dati e le relazioni tra i valori. Una forma di mascheramento ..

dataset di riferimento

Una risorsa di governance che definisce valori per tipi specifici di colonne.

perfeziona

Per pulire e formare i dati.

apprendimento a punteggio di prestazioni

Una tecnica di machine learning in cui un agente impara a prendere decisioni sequenziali in un ambiente per massimizzare un segnale di ricompensa. Ispirati alla prova e all'apprendimento degli errori, gli agenti interagiscono con l'ambiente, ricevono feedback e regolano le loro azioni per raggiungere politiche ottimali.

premio

Un segnale utilizzato per guidare un agente, in genere un agente di apprendimento per rinforzo, che fornisce un feedback sulla bontà di una decisione

regola

Un artefatto che contiene informazioni, criteri o logica per analizzare o proteggere i dati. Vedi anche regola di protezione dei dati, regola di qualità dei dati, regola di governance, regola di qualità, regola di composizione degli attributi.

ambiente di runtime

La configurazione hardware e software predefinita o personalizzata utilizzata per eseguire strumenti o lavori, come i notebook.

S

calcolo del punteggio

  • Nell'apprendimento automatico, il processo di misurazione della confidenza di un risultato previsto.
  • Il processo di calcolo che determina il livello di corrispondenza degli attributi per un'identità in entrata con gli attributi di un'entità esistente.

script

Un file che contiene gli script Python o R per supportare un modello in produzione.

categoria secondaria

Una categoria facoltativa che fa riferimento alla risorsa di governance.

auto - attenzione

Un meccanismo di attenzione che utilizza le informazioni provenienti dai dati di input stessi per determinare su quali parti dell'input concentrarsi quando si genera l'output.

apprendimento auto - supervisionato

Un metodo di addestramento di machine learning in cui un modello apprende dai dati senza etichetta mascherando i token in una sequenza di input e quindi tentando di prevederli. Un esempio è "Mi piacciono i germogli ________".

ricerca semantica

Una ricerca per parole chiave che incorpora l'analisi linguistica e contestuale. In una ricerca semantica, l'intento dell'interrogazione è specificato da uno o più specificatori. Ad esempio, è possibile specificare una persona di nome "Bush" e una tale query non restituirebbe risultati sul tipo di cespugli che crescono in un giardino, ma piuttosto solo sulle persone di nome Bush.

dati riservati

Dati che contengono informazioni che devono essere protette da accessi o divulgazioni non autorizzati. Le categorie di dati sensibili possono essere informazioni sanitarie protette, informazioni di identificazione personale, segreti commerciali o risultati finanziari.

analisi delle sensazioni

Esame del sentimento o delle emozioni espresse in un testo, ad esempio per determinare se la recensione di un film è positiva o negativa.

forma

Per personalizzare i dati tramite filtraggio, ordinamento, rimozione delle colonne, unione di tabelle; esecuzione di operazioni che includono calcoli, raggruppamenti di dati, gerarchie e altro.

piccoli dati

Dati accessibili e comprensibili agli esseri umani. Vedere anche dati strutturati.

pushback SQL

In SPSS Modeler, il processo di esecuzione di molte operazioni di preparazione ed estrazione (mining) dei dati direttamente nel database tramite codice SQL.

dati strutturati

Dati che si trovano in campi fissi all'interno di un record o di un file. I database relazionali e i fogli di calcolo sono esempi di dati strutturati. Vedi anche dati non strutturati, piccoli dati.

informazioni strutturate

Elementi memorizzati in risorse strutturate, come indici del motore di ricerca, database o knowledge base.

sostituto

Sostituire i dati in una colonna con valori che non corrispondono al formato originale ma conservano l'integrità referenziale.

Supernodo

Un nodo SPSS Modeler che comprime uno stream di dati incapsulando diversi nodi in un unico nodo.

apprendimento controllato

Un metodo di machine learning in cui un modello viene addestrato su un dataset etichettato per effettuare previsioni su nuovi dati.

T

classificazione del testo

Un modello che identifica e classifica automaticamente il testo in categorie specificate.

serie temporali

Una serie di valori di una variabile in momenti periodici.

modello addestrato

Un modello che viene addestrato con i dati effettivi ed è pronto per essere implementato per prevedere i risultati quando vengono presentati nuovi dati.

addestramento

La fase iniziale di creazione del modello, che coinvolge un sottoinsieme dei dati di origine. Il modello impara per esempio dai dati noti. Il modello può quindi essere sottoposto a test rispetto ad un ulteriore sottoinsieme per cui l'esito è già noto.

dati di addestramento

Una raccolta di dati utilizzata per addestrare i modelli di apprendimento automatico.

set di addestramento

Un insieme di dati con etichetta che viene utilizzato per addestrare un modello di machine learning esponendolo agli esempi e alle etichette corrispondenti, consentendo al modello di apprendere i pattern e fare previsioni.

apprendimento per trasferimento

Una strategia di machine learning in cui un modello addestrato viene applicato a un problema completamente nuovo.

trasformazione

Un'architettura di rete neurale che utilizza le codifiche posizionali e il meccanismo di autoattenzione per prevedere il token successivo in una sequenza di token.

trasparenza

Condividere informazioni appropriate con le parti interessate su come è stato progettato e sviluppato un sistema di intelligenza artificiale. Esempi di queste informazioni sono quali dati vengono raccolti, in che modo verranno utilizzati e archiviati e chi vi ha accesso e i risultati dei test per l'accuratezza, la robustezza e la distorsione.

Test di Turing

Proposto da Alan Turing nel 1950, un test della capacità di una macchina di esibire un comportamento intelligente equivalente, o indistinguibile, a quello di un essere umano.

U

problema senza limiti

Un problema di Decision Optimization in cui esiste un numero infinito di soluzioni e l'obiettivo può assumere valori fino all'infinito. Problemi illimitati sono spesso causati da vincoli mancanti nella formulazione del modello.

dati non strutturati

Qualsiasi dato che viene memorizzato in un formato non strutturato piuttosto che in campi fissi. I dati in un documento di elaborazione testo è un esempio di dati non strutturati. Vedere anche dati strutturati.

informazioni non strutturate

Dati che non sono contenuti in una posizione fissa, come il documento di testo in lingua naturale.

apprendimento non supervisionato

Un metodo di addestramento di machine learning in cui un modello non viene fornito con dati etichettati e deve trovare modelli o strutture nei dati da solo.

V

Serie di convalida

Una serie separata di dati etichettati che viene utilizzata per valutare le prestazioni e la capacità di generalizzazione di un modello di machine learning durante il processo di addestramento, assistendo nell'ottimizzazione degli iperparametri e nella selezione del modello.

visualizzazione

Un'immagine, grafico, diagramma, tabella, mappa o qualsiasi altra rappresentazione visiva dei dati.

W

peso

Un coefficiente per un nodo che trasforma i dati di input all'interno del livello della rete. Il peso è un parametro che un modello AI impara attraverso l'addestramento, regolandone il valore per ridurre gli errori nelle previsioni del modello.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni