0 / 0
Torna alla versione inglese della documentazione
Glossario
Ultimo aggiornamento: 05 dic 2024
Glossario

Questo glossario fornisce termini e definizioni per watsonx.ai e watsonx.governance.

In questo glossario vengono utilizzati i seguenti riferimenti incrociati:

  • Vedi ti rimanda da un termine non preferenziale a uno preferenziale oppure da un'abbreviazione a una forma estesa del termine.
  • Vedi anche ti rimanda a termini correlati o contrari.

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W | Z

A

acceleratore

Nel calcolo ad alte prestazioni, un circuito specializzato che viene utilizzato per prendere parte del carico computazionale dalla CPU, aumentando l'efficienza del sistema. Ad esempio, nel deep learning, il GPU - accelerated computing è spesso impiegato per scaricare parte del carico di lavoro di calcolo su una GPU mentre l'applicazione principale esegue la CPU. Vedere anche unità di elaborazione grafica.

responsabilità

L'aspettativa che le organizzazioni o gli individui garantiscano il corretto funzionamento, per tutto il loro ciclo di vita, dei sistemi di intelligenza artificiale che progettano, sviluppano, gestiscono o distribuiscono, in conformità con i loro ruoli e i quadri normativi applicabili. Ciò include la determinazione di chi è responsabile di un errore di intelligenza artificiale che può richiedere agli esperti legali di determinare la responsabilità caso per caso.

funzione di attivazione

Una funzione che definisce l'output di un'unità neurale dato un insieme di attivazioni in entrata da altri neuroni

apprendimento attivo

Un modello per il machine learning in cui il sistema richiede più dati etichettati solo quando ne ha bisogno.

metadati attivi

Metadati che vengono aggiornati automaticamente in base all'analisi dei processi di machine learning. Ad esempio, la creazione di profili e l'analisi della qualità dei dati aggiornano automaticamente metadati per gli asset di dati.

runtime attivo

Un'istanza di un ambiente in esecuzione per fornire risorse di calcolo alle risorse che eseguono codice.

agente

Un algoritmo o un programma che interagisce con un ambiente per imparare azioni o decisioni ottimali, in genere utilizzando l'apprendimento di rinforzo, per raggiungere un obiettivo specifico.

AI agentic

Un flusso AI generativo che può scomporre un prompt in più attività, assegnare attività agli agent AI gen appropriati e sintetizzare una risposta senza l'intervento umano.

IA

Vedi intelligenza artificiale.

Acceleratore AI

Hardware di silicio specializzato progettato per eseguire in modo efficiente attività correlate all'intelligenza artificiale come il deep learning, il machine learning e le reti neurali per un calcolo più rapido ed efficiente dal punto di vista energetico. Può essere un'unità dedicata in un nucleo, un chiplet separato su un chip multi - modulo o una scheda separata.

L'Etica dell'AI

Un campo multidisciplinare che studia come ottimizzare l'impatto benefico dell'IA riducendo i rischi e i risultati negativi. Esempi di problemi di etica dell'intelligenza artificiale sono la responsabilità dei dati e la privacy, l'equità, l'esplicabilità, la solidità, la trasparenza, la sostenibilità ambientale, l'inclusione, l'agenzia morale, l'allineamento del valore, la responsabilità, la fiducia e l'uso improprio della tecnologia.

Governance dell'AI

L'atto di un'organizzazione di governare, attraverso le sue istruzioni aziendali, il personale, i processi e i sistemi per dirigere, valutare, monitorare e intraprendere azioni correttive per tutto il ciclo di vita dell'intelligenza artificiale, per fornire la garanzia che il sistema di intelligenza artificiale stia funzionando come l'organizzazione intende, come i suoi stakeholder si aspettano, e come richiesto dalla normativa pertinente.

Sicurezza AI

Il campo di ricerca che mira a garantire che i sistemi di intelligenza artificiale operino in un modo che sia benefico per l'umanità e non causi inavvertitamente danni, affrontando questioni come l'affidabilità, la correttezza, la trasparenza e l'allineamento dei sistemi di intelligenza artificiale con i valori umani.

Servizio AI

Un'unità di codice distribuibile che contiene la logica di un caso d'uso di IA generativa e fornisce un endpoint per l'inferenza da un'applicazione.

Sistema AI

Vedere sistema di intelligenza artificiale.

algoritmo

Una formula applicata ai dati per determinare i modi ottimali per risolvere i problemi analitici.

rischi superiori

La scienza di studiare i dati per trovare modelli significativi nei dati e trarre conclusioni basate su tali modelli.

attendibilità appropriata

In un sistema di intelligenza artificiale, una quantità di fiducia calibrata sulla sua accuratezza, affidabilità e credibilità.

intelligenza artificiale (AI)

La capacità di acquisire, elaborare, creare e applicare la conoscenza sotto forma di un modello per fare previsioni, raccomandazioni o decisioni.

sistema di intelligenza artificiale (sistema AI)

Un sistema che può fare previsioni, raccomandazioni o decisioni che influenzano ambienti fisici o virtuali e i cui output o comportamenti non sono necessariamente predeterminati dallo sviluppatore o dall'utente. I sistemi di IA sono tipicamente addestrati con grandi quantità di dati strutturati o non strutturati e potrebbero essere progettati per operare con diversi livelli di autonomia o nessuno, per raggiungere obiettivi definiti dall'uomo.

risorsa

Un elemento che contiene informazioni sui dati, altre informazioni preziose o codice che funziona con i dati. Vedere anche asset di dati.

meccanismo di attenzione

Un meccanismo nei modelli di deep learning che determina su quali parti dell'input si concentra un modello quando si produce l'output.

Esperimento AutoAI

Un processo di addestramento automatizzato che considera una serie di parametri e definizioni di addestramento per creare un insieme di pipeline classificate come candidati di modelli.

B

distribuzione in batch

Un metodo per distribuire i modelli che elabora i dati di input da un file, una connessione dati o i dati connessi in un bucket di archiviazione, quindi scrive l'output in una destinazione selezionata.

distorsione

Errore sistematico in un sistema di intelligenza artificiale che è stato progettato, intenzionalmente o meno, in un modo che può generare decisioni sleali. La distorsione può essere presente sia nel sistema AI che nei dati utilizzati per addestrarlo e testarlo. La distorsione dell'IA può emergere in un sistema di intelligenza artificiale come risultato di aspettative culturali, limitazioni tecniche o contesti di distribuzione imprevisti. Vedere anche correttezza.

rilevamento pregiudizio

Il processo di calcolo della correttezza delle metriche per rilevare quando i modelli AI stanno producendo risultati errati sulla base di determinati attributi.

mitigazione della distorsione

Ridurre i pregiudizi nei modelli di IA curando i dati di addestramento e applicando tecniche di correttezza.

classificazione binaria

Un modello di classificazione con due classi. Le previsioni sono una scelta binaria di una delle due classi.

C

modello di classificazione

Un modello predittivo che prevede i dati in categorie distinte. Le classificazioni possono essere binarie, con due classi di dati o multi - classe quando ci sono più di 2 categorie.

pulire

Per garantire che tutti i valori in un dataset siano congruenti e correttamente registrati.

CNN

Vedere rete neurale convoluzionale.

funzione di forzatura cognitiva

Un intervento che viene applicato in un momento decisionale per interrompere il ragionamento euristico e indurre una persona a impegnarsi nel pensiero analitico; gli esempi includono una checklist, un time - out diagnostico o la richiesta a una persona di escludere un'alternativa.

linguistica computazionale

Campo interdisciplinare che esplora gli approcci per la modellazione computazionale dei linguaggi naturali.

risorsa di calcolo

Le risorse hardware e software definite da un modello di ambiente per eseguire gli asset negli strumenti.

matrice di confusione

Una misura delle prestazioni che determina l'accuratezza tra i risultati previsti positivi e negativi di un modello rispetto ai risultati effettivi positivi e negativi.

asset di dati connesso

Un puntatore ai dati a cui si accede tramite una connessione ad un'origine dati esterna.

Asset di cartella connesso

Un puntatore ad una cartella in IBM Cloud Object Storage.

connessione

Le informazioni necessarie per connettersi a un database. Le informazioni effettive richieste variano in base al DBMS e al metodo di connessione.

asset di connessione

Un asset che contiene informazioni che abilitano la connessione a un'origine dati.

vincolo

  • Nei database, una relazione tra tabelle.
  • In Decision Optimization, una condizione che deve essere soddisfatta dalla soluzione di un problema.

apprendimento continuo

Automazione delle attività di monitoraggio delle prestazioni del modello, riqualificazione con nuovi dati e ridistribuzione per garantire la qualità di previsione.

rete neurale convoluzionale (CNN)

Una classe di rete neurale comunemente utilizzata nelle attività di computer vision che utilizza livelli convoluzionali per elaborare i dati delle immagini.

distribuzione Core ML

Il processo di download di una distribuzione in formato Core ML da utilizzare nelle app iOS.

corpo

Una raccolta di documenti di origine utilizzati per addestrare un modello di machine learning.

Modello CPLEX

Un modello Decision Optimization formulato per essere risolto dal motore CPLEX.

Modello CPO

Un modello di programmazione dei vincoli formulato per essere risolto dal motore CPO (CP Optimizer) Decision Optimization .

convalida incrociata

Una tecnica per verificare il grado di generalizzazione di un modello in assenza di un campione di test di hold-out. La convalida incrociata divide i dati di addestramento in un certo numero di sottoinsiemi e quindi crea lo stesso numero di modelli, con ciascun sottoinsieme tenuto a turno. Ciascuno di questi modelli viene testato sul campione di holdout e la precisione media dei modelli su tali campioni di holdout viene utilizzata per stimare la precisione del modello quando viene applicato ai nuovi dati.

rendere accurato

Selezionare, raccogliere, conservare e mantenere il contenuto rilevante per un argomento specifico. La conservazione stabilisce, mantiene e aggiunge valore ai dati; li trasforma in informazioni attendibili.

D

asset di dati

Un asset che punta ai dati, ad esempio, ad un file caricato. Anche le connessioni e gli asset di dati connessi sono considerati asset di dati. Vedere anche asset.

Imputazione dei dati

La sostituzione dei valori mancanti in un dataset con valori stimati o espliciti.

data lake

Un repository di archiviazione dati su larga scala che memorizza i dati non elaborati in qualsiasi formato in un'architettura semplice. I data lakes contengono dati strutturati e non strutturati e dati binari per l'elaborazione e l'analisi.

data lakehouse

Un'architettura di elaborazione e archiviazione dei dati unificata che combina la flessibilità di un data lake con le query strutturate e le ottimizzazioni delle prestazioni di un data warehouse, consentendo un'analisi dei dati scalabile ed efficiente per le applicazioni di analytics e AI.

mining dei dati

Il processo di raccolta delle informazioni di business critiche da un'origine dati, di correlazione delle informazioni e di scoperta di associazioni, modelli e andamenti. Vedere anche predictive analytics.

Flusso Data Refinery

Una serie di passi che ripuliscono e modellano i dati per produrre un nuovo asset di dati.

scienza dei dati

l'analisi e la visualizzazione dei dati strutturati e non strutturati per scoprire informazioni dettagliate e conoscenze.

serie di dati

Una raccolta di dati, generalmente nel formato di righe (record) e colonne (campi) e contenuta in un file o una tabella di database.

origine dati

Un repository, una coda o un feed per la lettura dei dati, ad esempio un database.

tabella dati

Una raccolta di dati, generalmente nel formato di righe (record) e colonna (campi) e contenuta in una tabella.

data warehouse

Un grande repository centralizzato di dati raccolti da varie origini utilizzato per la creazione di report e l'analisi dei dati. Memorizza principalmente dati strutturati e semistrutturati, consentendo alle aziende di prendere decisioni informate.

DDL

Vedi apprendimento approfondito distribuito (distributed deep learning).

limite decisione

Una divisione di punti di dati in uno spazio in gruppi o classificazioni distinte.

modello solo decoder

Un modello che genera testo di output parola per parola per inferenza dalla sequenza di input. I modelli solo decodificatore vengono utilizzati per attività quali la generazione di testo e la risposta alle domande.

apprendimento profondo

Un modello di calcolo che utilizza più livelli di nodi interconnessi, organizzati in livelli gerarchici, per trasformare i dati di immissione (primo livello) attraverso una serie di calcoli per produrre un output (livello finale). Il deep learning è ispirato alla struttura e alla funzione del cervello umano. Vedere anche apprendimento approfondito distribuito.

rete neurale profonda

Una rete neurale con più livelli nascosti, che consente rappresentazioni più complesse dei dati.

ragionamento profondo

Una classe di apprendimento automatico in cui i sistemi generano intuizioni dai dati per supportare compiti cognitivi che vanno oltre la percezione e la classificazione, come il buon senso, il cambiamento delle situazioni, la pianificazione e il processo decisionale.

distribuzione

Un modello o pacchetto dell'applicazione disponibile per l'utilizzo.

spazio di distribuzione

Uno spazio di lavoro in cui vengono distribuiti i modelli e gestite le distribuzioni.

deterministici

Descrive una caratteristica dei sistemi di calcolo quando i loro output sono completamente determinati dai loro input.

AI discriminante

Una classe di algoritmo che si concentra sulla ricerca di un limite che separa classi differenti nei dati.

DDL (distributed deep learning)

Un approccio alla formazione di apprendimento approfondito che sfrutta i metodi di calcolo distribuito. In un ambiente DDL, il carico di lavoro di calcolo viene distribuito tra l'unità di elaborazione centrale e l'unità di elaborazione grafica. Vedere anche apprendimento approfondito.

DOcplex

Un'API Python per la modellazione e la soluzione dei problemi di Decision Optimization .

E

inserimento

Una rappresentazione numerica di un'unità di informazioni, come una parola o una frase, come un vettore di numeri reali. Le incorporazioni sono apprese, rappresentazioni a bassa dimensione di dati di dimensioni superiori. Vedere anche codifica, rappresentazione.

emersione

Una proprietà dei modelli di base in cui il modello mostra comportamenti che non sono esplicitamente addestrati.

comportamento emergente

Un comportamento esibito da un foundation model che non è stato costruito esplicitamente.

modello codificatore - decodificatore

Un modello per comprendere il testo di input e per generare il testo di output basato sul testo di input. I modelli di codificatore - decodificatore vengono utilizzati per attività quali il riepilogo o la traduzione.

modello solo codificatore

Un modello che comprende il testo di input a livello di frase trasformando le sequenze di input in vettori di rappresentazione denominati incorporazioni. I modelli di solo codificatore vengono utilizzati per attività quali la classificazione del feedback dei clienti e l'estrazione di informazioni da documenti di grandi dimensioni.

codifica

La rappresentazione di un'unità di informazioni, come un carattere o una parola, come una serie di numeri. Vedere anche integrazione, codifica posizionale.

URL endpoint

Un indirizzo di destinazione di rete che identifica le risorse, come i servizi e gli oggetti. Ad esempio, viene utilizzato un URL endpoint per identificare la posizione di una distribuzione di modello o funzione quando un utente invia i dati di payload alla distribuzione.

ambiente

Le risorse di calcolo per i lavori in esecuzione.

runtime dell'ambiente

Un'istanziazione del modello di ambiente per eseguire le risorse.

template di ambiente

Una definizione che specifica le risorse hardware e software per creare istanza dei runtime dell'ambiente.

feature esogena

Una funzione che può influenzare il modello predittivo ma non può essere influenzata in cambio. Ad esempio, le temperature possono influenzare le vendite di gelato previste, ma le vendite di gelato non possono influenzare le temperature.

sperimentazione

Un processo di addestramento del modello che considera una serie di definizioni e parametri di addestramento per determinare la configurazione del modello più accurata.

sfruttabilità

  • La capacità di utenti reali di tracciare, controllare e comprendere le predizioni effettuate nelle applicazioni che utilizzano sistemi di IA.
  • La capacità di un sistema di intelligenza artificiale di fornire informazioni che gli esseri umani possono utilizzare per comprendere le cause delle previsioni del sistema.

F

congruità

In un sistema di IA, il trattamento equo di individui o gruppi di individui. La scelta di una nozione specifica di equity per un sistema AI dipende dal contesto in cui viene utilizzato. Vedere anche distorsione.

componente

Una proprietà o caratteristica di un elemento all'interno di un dataset, ad esempio, una colonna in un foglio di calcolo. In alcuni casi, le funzioni vengono ingegnerizzate come combinazioni di altre funzioni nel dataset.

Progettazione di funzioni

Il processo di selezione, trasformazione e creazione di nuove funzioni dai dati non elaborati per migliorare le prestazioni e il potere predittivo dei modelli di machine learning.

Gruppo di funzioni

Una serie di colonne di un particolare asset di dati insieme ai metadati utilizzati per il machine learning.

selezione della funzione

Identificazione delle colonne di dati che meglio supportano una previsione o un punteggio accurati in un modello di machine learning.

negozio di funzioni

Un sistema o un repository centralizzato che gestisce e organizza le funzioni, fornendo un modo scalabile ed efficiente per archiviare, richiamare e condividere i dati delle funzioni tra le applicazioni e le pipeline di machine learning.

trasformazione della funzione

In AutoAI, una fase della creazione della pipeline che applica algoritmi per trasformare ed ottimizzare i dati di addestramento per ottenere il miglior risultato per il tipo di modello.

apprendimento federato

Il training di un modello di machine learning comune che utilizza più origini dati che non vengono spostate, unite o condivise. Il risultato è un modello ottimizzato senza compromettere la sicurezza dei dati.

richiesta di pochi istantanee

Una tecnica di richiesta in cui un numero ridotto di esempi viene fornito al modello per dimostrare come completare l'attività.

Ottimizzazione dettagliata

Il processo di adattamento di un modello pre - addestrato per eseguire un'attività specifica conducendo una formazione aggiuntiva. L'ottimizzazione può implicare (1) l'aggiornamento dei parametri esistenti del modello, noti come ottimizzazione completa, o (2) l'aggiornamento di un sottoinsieme dei parametri esistenti del modello o l'aggiunta di nuovi parametri al modello e l'addestramento mentre si congelano i parametri esistenti del modello, noti come ottimizzazione efficiente dei parametri.

flusso

Una raccolta di nodi che definiscono un insieme di passi per l'elaborazione dei dati o l'addestramento di un modello.

foundation model

Un modello di IA che può essere adattato a una vasta gamma di attività a valle. I modelli di base sono in genere modelli generativi su larga scala che vengono addestrati su dati senza etichetta utilizzando l'auto - supervisione. Come modelli su larga scala, i modelli di base possono includere miliardi di parametri.

G

grafico Gantt

Una rappresentazione grafica di una sequenza temporale e della durata di un progetto in cui i dati di pianificazione vengono visualizzati come barre orizzontali lungo una scala temporale.

Gen AI

Vedere generative AI.

generative AI (gen AI)

Una classe di algoritmi AI che possono produrre vari tipi di contenuto, tra cui testo, codice sorgente, immagini, audio e dati sintetici.

variabilità generativa

La caratteristica dei modelli generativi per produrre uscite variegate, anche quando l'input al modello è tenuto costante. Vedere anche probabilistico.

GPU

Vedere unità di elaborazione grafica.

programma di creazione grafico

Uno strumento per la creazione di risorse di flusso tramite la codifica visiva. Un'area su cui posizionare oggetti o nodi che possono essere collegati per creare un flusso.

GPU (graphics processing unit)

Un processore specializzato progettato per manipolare e modificare rapidamente la memoria per accelerare la creazione di immagini in un frame buffer destinato all'output su un display. Le GPU sono fortemente utilizzate nell'apprendimento automatico a causa delle loro capacità di elaborazione parallela. Vedere anche acceleratore.

tenuta a terra

Fornire un modello di linguaggio di grandi dimensioni con informazioni per migliorare l'accuratezza dei risultati.

H

Allucinazione

Una risposta di un foundation model che include contenuti fuori tema, ripetitivi, errati o inventati. Le allucinazioni che coinvolgono i dettagli di fabbricazione possono verificarsi quando a un modello viene richiesto di generare testo, ma il modello non ha abbastanza testo correlato da utilizzare per generare un risultato che contiene i dettagli corretti.

Rilevamento HAP (rilevamento HAP)

  • La capacità di rilevare e filtrare l'odio, l'abuso e la profanità in entrambi i prompt inviati dagli utenti e nelle risposte generate da un modello di IA.

Rilevatore HAP (rilevatore HAP)

  • Un classificatore di frasi che rimuove i contenuti potenzialmente dannosi, come i discorsi di odio, gli abusi e le bestemmie, dall'output e dall'input foundation model.

serie di dati di controllo

Un insieme di dati con etichetta che viene intenzionalmente trattenuto da entrambi i set di addestramento e convalida, fungendo da valutazione imparziale delle prestazioni del modello finale su dati non visti.

omogeneizzazione

La tendenza nella ricerca di apprendimento automatico in cui un piccolo numero di architetture di rete neurale profonda, come il trasformatore, stanno ottenendo risultati all'avanguardia in una vasta gamma di attività.

HPO

Vedere ottimizzazione di iperparametri.

supervisione umana

Coinvolgimento umano nella revisione delle decisioni rese da un sistema di intelligenza artificiale, consentendo l'autonomia umana e la responsabilità della decisione.

iperparametro

Nel machine learning, un parametro il cui valore è impostato prima dell'addestramento come metodo per aumentare la precisione del modello.

ottimizzazione iperparametro (HPO)

Il processo di impostazione dei valori di iperparametro ai valori che forniscono il modello più accurato.

I

immagine

Un package software che contiene un insieme di librerie.

Apprendimento incrementale

Il processo di addestramento di un modello utilizzando dati continuamente aggiornati senza dimenticare i dati ottenuti dalle attività precedenti. Questa tecnica viene utilizzata per preparare un modello con batch di dati da un'origine dati di addestramento di grandi dimensioni.

inferenza

Il processo di esecuzione di dati in tempo reale tramite un modello AI addestrato per effettuare una previsione o risolvere un'attività.

assimilare

  • Per aggiungere costantemente un elevato volume di dati in tempo reale ad un database.
  • Per inserire i dati in un sistema allo scopo di creare una base di conoscenza.

comprensione profonda

Una comprensione accurata o profonda di qualcosa. Le informazioni dettagliate vengono derivate utilizzando l'analytics cognitiva per fornire istantanee e previsioni correnti dei comportamenti e degli atteggiamenti dei clienti.

AI intelligente

Sistemi di intelligenza artificiale in grado di comprendere, imparare, adattare e implementare la conoscenza, dimostrando abilità come il processo decisionale, la risoluzione di problemi e la comprensione di concetti complessi, molto come l'intelligenza umana.

intento

Uno scopo o un obiettivo espresso dall'input del cliente a un chatbot, come rispondere a una domanda o elaborare un pagamento di fattura.

J

lavoro

Un'unità di lavoro eseguibile separatamente.

K

base di conoscenza

Vedere corpus.

L

etichetta

Una classe o una categoria assegnata a un punto di dati nell' learning.Labels supervisionato può essere derivata dai dati ma spesso viene applicata da etichettatori o annotatori umani.

dati etichettati

I dati non elaborati a cui vengono assegnate le etichette per aggiungere il contesto o il significato in modo che possano essere utilizzati per addestrare i modelli di machine learning. Ad esempio, i valori numerici potrebbero essere etichettati come codici postali o età per fornire il contesto per gli input e gli output del modello.

LLM (large language model)

Un modello di lingua con un gran numero di parametri, addestrato su una gran quantità di testo.

spazio latente

Uno spazio matematico n - dimensionale in cui le istanze di dati sono integrate. Uno spazio latente bidimensionale incorpora i dati come punti all'interno di un piano 2D (vedere anche: spazio di rappresentazione). Vedere anche spazio di rappresentazione.

LLM

Vedere modello di linguaggio di grandi dimensioni.

M

machine learning (ML)

Un ramo dell'intelligenza artificiale (AI) e dell'informatica che si concentra sull'utilizzo di dati e algoritmi per imitare il modo in cui gli esseri umani imparano, migliorando gradualmente l'accuratezza dei modelli di IA.

framework di machine learning

Le librerie e il runtime per l'addestramento e la distribuzione di un modello.

modello di machine learning

Un modello di intelligenza artificiale che viene addestrato su una serie di dati per sviluppare algoritmi che può utilizzare per analizzare e apprendere da nuovi dati.

modello mentale

La comprensione di un individuo di come funziona un sistema e come le sue azioni influenzano i risultati del sistema. Quando queste aspettative non corrispondono alle capacità effettive di un sistema, possono portare alla frustrazione, all'abbandono o all'uso improprio.

disallineamento

Una discrepanza tra gli obiettivi o i comportamenti che un sistema di intelligenza artificiale è ottimizzato per raggiungere e i veri obiettivi, spesso complessi, dei suoi utenti umani o progettisti

ML

Vedere machine learning.

MLOps

  • Una metodologia che prende un modello di machine learning dallo sviluppo alla produzione.
  • La pratica per la collaborazione tra data scientist e professionisti delle operazioni per aiutare a gestire il ciclo di vita del machine learning di produzione (o deep learning). MLOps mira ad aumentare l'automazione e a migliorare la qualità della produzione ML, concentrandosi anche sui requisiti di business e normativi. Comprende sviluppo di modelli, formazione, convalida, distribuzione, monitoraggio e gestione e utilizza metodi come CI/CD.

modello

  • In un contesto di machine learning, una serie di funzioni e algoritmi che sono stati addestrati e sottoposti a test su un dataset per fornire previsioni o decisioni.
  • In Decision Optimization, una formulazione matematica di un problema che può essere risolto con motori di ottimizzazione CPLEX che utilizzano dataset differenti.

ModelOps

Una metodologia per la gestione dell'intero ciclo di vita di un modello AI, che include formazione, implementazione, calcolo del punteggio, valutazione, riaggiornamento e aggiornamento.

Gruppo monitorato

Una classe di dati monitorata per determinare se i risultati di un modello predittivo differiscono in modo significativo dai risultati del gruppo di riferimento. I gruppi sono comunemente monitorati in base a caratteristiche che includono razza, sesso o età.

modello di classificazione multiclasse

Un'attività di classificazione con più di due classi. Ad esempio, dove un modello di classificazione binaria prevede valori sì o no, un modello multi - classe prevede valori sì, no, forse o non applicabile.

modello multimodale

Un modello AI generativo che può elaborare più tipi di dati, come testo, immagini e audio, e convertirli tra loro. Ad esempio, un modello multimodale può prendere input di testo e generare output di immagini.

serie temporali multivariate

Esperimento di serie temporali che contiene due o più variabili che cambiano. Ad esempio, un modello di serie temporali che prevede l'utilizzo di elettricità di tre client.

N

elaborazione del linguaggio naturale (NLP)

Un campo di intelligenza artificiale e linguistica che studia i problemi inerenti all'elaborazione e alla manipolazione del linguaggio naturale, con l'obiettivo di aumentare la capacità dei computer di comprendere i linguaggi umani.

libreria di elaborazione del linguaggio naturale

Una libreria che fornisce funzioni di elaborazione del linguaggio naturale di base per l'analisi della sintassi e modelli predefiniti per un'ampia varietà di attività di elaborazione del testo.

rete neurale

Un modello matematico per la previsione o la classificazione dei casi utilizzando un complesso schema matematico che simula una versione astratta delle cellule cerebrali. L'addestramento di una rete neurale viene eseguito applicando alla rete un numero elevato di casi osservati, uno alla volta, e consentendo alla rete di aggiornarsi automaticamente ogni volta fino a quando l'attività non viene appresa.

NLP

Vedi natural language processing.

nodo

In un flusso SPSS Modeler , la rappresentazione grafica di un'operazione di dati.

blocco note

Un documento interattivo che contiene codice eseguibile, testo descrittivo per quel codice e i risultati di qualsiasi codice eseguito.

kernel del notebook

La parte dell'editor del notebook che esegue il codice e restituisce i risultati di calcolo.

O

archivio dell'oggetto

Un metodo di memorizzazione dei dati, tipicamente utilizzato nel cloud, in cui i dati vengono memorizzati come unità distinte, o oggetti, in un pool di archiviazione o repository che non utilizza una gerarchia di file ma che memorizza tutti gli oggetti allo stesso livello.

apprendimento one-shot

Un modello per il deep learning che si basa sulla premessa che la maggior parte dell'apprendimento umano si svolge dopo aver ricevuto solo uno o due esempi. Questo modello è simile all'apprendimento non supervisionato.

richiesta one-shot

Una tecnica di richiesta in cui viene fornito un singolo esempio al modello per dimostrare come completare l'attività.

distribuzione online

Metodo di accesso a un modello o distribuzione del codice Python tramite un endpoint API come un servizio web per generare previsioni online, in tempo reale.

ontologia

Una specifica formale esplicita della rappresentazione di oggetti, concetti e altre entità che possono esistere in alcune aree di interesse e le relazioni tra loro.

asset operativo

Un asset che esegue il codice in uno strumento o in un lavoro.

di rete

Il processo di trovare la soluzione più appropriata a un problema definito con precisione, rispettando i vincoli e i limiti imposti. Ad esempio, determinare come allocare le risorse o come trovare gli elementi o le combinazioni migliori da una vasta serie di alternative.

Linguaggio di programmazione di ottimizzazione

Un linguaggio di modellazione per l'espressione di formulazioni di modelli dei problemi di ottimizzazione in un formato che può essere risolto da motori di ottimizzazione CPLEX come IBM CPLEX.

Metrica ottimizzata

Una metrica utilizzata per misurare le prestazioni del modello. Ad esempio, la precisione è la metrica tipica utilizzata per misurare le prestazioni di un modello di classificazione binario.

orchestrazione

Il processo di creare un flusso end-to-end che può addestrare, eseguire, distribuire, verificare e valutare un modello di machine learning e utilizza l'automazione per coordinare il sistema, spesso utilizzando i microservizi.

eccessiva dipendenza

L'accettazione di un suggerimento errato da parte di un modello AI da parte di un utente. Vedere anche affidabilità (reliance), underreliance.

P

Parametro

  • Una parte configurabile del modello che è interna a un modello e i cui valori vengono stimati o appresi dai dati. I parametri sono aspetti del modello che vengono regolati durante il processo di addestramento per aiutare il modello a prevedere accuratamente l'output. Le prestazioni e il potere predittivo del modello dipendono in gran parte dai valori di questi parametri.
  • Un peso con valore reale compreso tra 0.0 e 1.0 che indica l'intensità della connessione tra due neuroni in una rete neurale.

parte

In Federated Learning, un'entità che fornisce dati per l'addestramento di un modello comune. I dati non vengono spostati o combinati, ma ogni parte ottiene il beneficio della formazione federata.

payload

I dati passati a una distribuzione per ottenere nuovamente un punteggio, una previsione o una soluzione.

registrazione payload

L'acquisizione dei dati del payload e la distribuzione dell'output per monitorare l'integrità continua dell'IA nelle applicazioni di business.

pipeline

  • In Watson Pipelines, un flusso end-to-end di risorse dalla creazione alla distribuzione.
  • In AutoAI, un modello candidato.

classifica pipeline

In AutoAI, una tabella che mostra l'elenco dei modelli candidati generati automaticamente, come pipeline, classificati in base ai criteri specificati.

politica

Una strategia o una regola che un agent segue per determinare l'azione successiva in base allo stato corrente.

codifica posizionale

Una codifica di una sequenza ordinata di dati che include informazioni posizionali, come la codifica di parole in una frase che include la posizione di ciascuna parola all'interno della frase. Vedere anche codifica.

analytics predittiva

Un processo di business e una serie di tecnologie correlate che si occupano della previsione delle future possibilità e andamenti. L'analisi predittiva applica diverse discipline come la probabilità, le statistiche, il machine learning e l'intelligenza artificiale ai problemi di business per trovare l'azione migliore per una situazione specifica. Vedere anche data mining.

modello preaddestrato

Un modello AI precedentemente addestrato su un dataset di grandi dimensioni per eseguire un'attività specifica. I modelli preaddestrati vengono utilizzati invece di creare un modello da zero.

preaddestramento

Il processo di addestramento di un modello di machine learning su un dataset di grandi dimensioni prima di ottimizzarlo per un'attività specifica.

privacy

Garanzia che le informazioni su un individuo siano protette da accesso non autorizzato e uso inappropriato.

Probabilistico

La caratteristica di essere soggetto a casualità; non deterministico. I modelli probabilistici non producono gli stessi output dati gli stessi input. Vedere anche variabilità generativa.

progetto

Uno spazio di collaborazione per gestire dati e altri asset.

richiesta

  • Dati, come testo o immagine, che preparano, istruiscono o condizionano l'output di un foundation model.
  • Un componente di un'azione che indica che l'input utente è richiesto per un campo prima di effettuare una transizione a uno schermo di output.

Ingegneria prompt

Il processo di progettazione del linguaggio naturale richiede un modello di lingua per eseguire un'attività specifica.

invio di prompt

Il processo di fornire input a un foundation model per indurlo a produrre output.

Ottimizzazione prompt

Un modo efficiente e a basso costo di adattare un modello pre - addestrato a nuove attività senza riaddestrare il modello o aggiornarne i pesi. L'ottimizzazione dei prompt implica l'apprendimento di un numero ridotto di nuovi parametri che vengono accodati al prompt di un modello, bloccando i parametri esistenti del modello.

riduzione

Il processo di semplificazione, riduzione o troncamento di una struttura ad albero delle decisioni o di una rete neurale. Questa operazione viene eseguita rimuovendo i nodi o i livelli meno importanti, riducendo la complessità per impedire il sovradattamento e migliorare la generalizzazione del modello mantenendo il suo potere predittivo.

Python

Un linguaggio di programmazione utilizzato nella scienza dei dati e nell'intelligenza artificiale.

Python funzione

Una funzione che contiene codice Python per supportare un modello in produzione.

Q

quantizzazione

Un metodo di compressione dei pesi foundation model per accelerare l'inferenza e ridurre le esigenze di memoria della GPU.

R

R

Un linguaggio di script estensibile utilizzato nella data science e nell'AI che offre un'ampia gamma di funzioni e tecniche analitiche, statistiche e grafiche.

RAG

Vedere richiamo della generazione aumentata.

seme random

Un numero utilizzato per inizializzare un generatore di numeri pseudocasuali. I valori di inizializzazione casuali consentono la riproducibilità per i processi che si basano sulla generazione di numeri casuali.

gruppo di riferimento

Un gruppo identificato come più probabile che riceva un risultato positivo in un modello predittivo. I risultati possono essere confrontati con un gruppo monitorato per cercare potenziali distorsioni nei risultati.

perfeziona

Per pulire e formare i dati.

modello di regressione

Un modello che mette in relazione una variabile dipendente con una o più variabili indipendenti.

apprendimento a punteggio di prestazioni

Una tecnica di machine learning in cui un agente impara a prendere decisioni sequenziali in un ambiente per massimizzare un segnale di ricompensa. Ispirati alla prova e all'apprendimento degli errori, gli agenti interagiscono con l'ambiente, ricevono feedback e regolano le loro azioni per raggiungere politiche ottimali.

rafforzamento dell'apprendimento sul feedback umano (RLHF)

Un metodo per allineare le risposte di un modello di apprendimento delle lingue alle istruzioni fornite in un prompt. RLHF richiede che gli annotatori umani classificano più output dal modello. Queste classifiche vengono quindi utilizzate per addestrare un modello di ricompensa utilizzando l'apprendimento del rinforzo. Il modello di ricompensa viene quindi utilizzato per ottimizzare l'emissione del modello di linguaggio di grandi dimensioni.

dipendenza

Nei sistemi AI, l'accettazione da parte dell'utente di una raccomandazione effettuata da, o l'output generato da, un modello AI. Vedere anche eccessiva, scarsa affidabilità.

rappresentazione

Una codifica di un'unità di informazioni, spesso come vettore di numeri reali. Vedere anche integrazione.

spazio di rappresentazione

Uno spazio matematico n - dimensionale in cui le istanze di dati sono integrate. Uno spazio latente bidimensionale incorpora i dati come punti in un piano 2D (vedere anche: spazio latente). Vedere anche spazio latente.

Reranking

Un processo di intelligenza artificiale generativa per classificare un insieme di passaggi di documenti dalla più alla meno probabile risposta a una determinata domanda.

richiamo di RAG (augmented generation)

Una tecnica in cui un modello di linguaggio di grandi dimensioni viene ampliato con conoscenze provenienti da fonti esterne per generare testo. Nella fase di richiamo, i documenti pertinenti da un'origine esterna vengono identificati dalla query dell'utente. Nella fase di generazione, parti di tali documenti sono incluse nella richiesta LLM per generare una risposta basata sui documenti richiamati.

premio

Un segnale utilizzato per guidare un agente, in genere un agente di apprendimento di rinforzo, che fornisce un feedback sulla bontà di una decisione

RLHF

Vedi apprendimento di rinforzo sul feedback umano.

ambiente di runtime

La configurazione hardware e software predefinita o personalizzata utilizzata per eseguire strumenti o lavori, come i notebook.

S

calcolo del punteggio

  • Nell'apprendimento automatico, il processo di misurazione della confidenza di un risultato previsto.
  • Il processo di calcolo che determina il livello di corrispondenza degli attributi per un'identità in entrata con gli attributi di un'entità esistente.

script

Un file che contiene gli script Python o R per supportare un modello in produzione.

auto - attenzione

Un meccanismo di attenzione che utilizza le informazioni provenienti dai dati di input stessi per determinare su quali parti dell'input concentrarsi quando si genera l'output.

apprendimento auto - supervisionato

Un metodo di addestramento di machine learning in cui un modello apprende dai dati senza etichetta mascherando i token in una sequenza di input e quindi tentando di prevederli. Un esempio è "Mi piacciono i germogli ________".

analisi delle sensazioni

Esame del sentimento o dell'emozione espressa nel testo, ad esempio determinare se una recensione di un film è positiva o negativa.

forma

Per personalizzare i dati tramite filtraggio, ordinamento, rimozione delle colonne, unione di tabelle; esecuzione di operazioni che includono calcoli, raggruppamenti di dati, gerarchie e altro.

piccoli dati

Dati accessibili e comprensibili agli esseri umani. Vedere anche dati strutturati.

pushback SQL

In SPSS Modeler, il processo di esecuzione di molte operazioni di preparazione ed estrazione (mining) dei dati direttamente nel database tramite codice SQL.

dati strutturati

Dati che si trovano in campi fissi all'interno di un record o di un file. I database relazionali e i fogli di calcolo sono esempi di dati strutturati. Vedi anche dati non strutturati, piccoli dati.

informazioni strutturate

Elementi memorizzati in risorse strutturate, come indici del motore di ricerca, database o knowledge base.

apprendimento controllato

Un metodo di machine learning in cui un modello viene addestrato su un dataset etichettato per effettuare previsioni su nuovi dati.

T

temperatura

Parametro in un modello generativo che specifica la quantità di variazione nel processo di generazione. Temperature più elevate si traducono in una maggiore variabilità nell'output del modello.

classificazione del testo

Un modello che identifica e classifica automaticamente il testo in categorie specificate.

text extraction

Un metodo di intelligenza artificiale generativa per convertire informazioni altamente strutturate in un formato testuale più semplice da utilizzare come input per modelli linguistici di grandi dimensioni.

serie temporale

Una serie di valori di una variabile in momenti periodici.

Modello di serie temporali

Un modello che tiene traccia e prevede i dati nel tempo.

gettone

Un'unità discreta di significato o analisi in un testo, come una parola o una sottoparola.

tokenizzazione

Il processo utilizzato nell'elaborazione del linguaggio naturale per suddividere una stringa di testo in unità più piccole, come parole o sottoparole.

modello addestrato

Un modello che viene addestrato con i dati effettivi ed è pronto per essere implementato per prevedere i risultati quando vengono presentati nuovi dati.

addestramento

La fase iniziale di creazione del modello, che coinvolge un sottoinsieme dei dati di origine. Il modello impara per esempio dai dati noti. Il modello può quindi essere sottoposto a test rispetto ad un ulteriore sottoinsieme per cui l'esito è già noto.

dati di addestramento

Una raccolta di dati utilizzata per addestrare i modelli di apprendimento automatico.

set di addestramento

Un insieme di dati con etichetta che viene utilizzato per addestrare un modello di machine learning esponendolo agli esempi e alle etichette corrispondenti, consentendo al modello di apprendere i pattern e fare previsioni.

apprendimento per trasferimento

Una strategia di machine learning in cui un modello addestrato viene applicato a un problema completamente nuovo.

trasformazione

Un'architettura di rete neurale che utilizza codifiche posizionali e il meccanismo di auto - attenzione per prevedere il token successivo in una sequenza di token.

trasparenza

Condividere informazioni appropriate con le parti interessate su come è stato progettato e sviluppato un sistema di intelligenza artificiale. Esempi di queste informazioni sono quali dati vengono raccolti, in che modo verranno utilizzati e archiviati e chi vi ha accesso e i risultati dei test per l'accuratezza, la robustezza e la distorsione.

calibrazione trust

Il processo di valutazione e adattamento della propria fiducia in un sistema di intelligenza artificiale basato su fattori quali la sua accuratezza, affidabilità e credibilità.

Test di Turing

Proposto da Alan Turing nel 1950, un test della capacità di una macchina di esibire un comportamento intelligente equivalente, o indistinguibile, a quello di un essere umano.

U

sottoutilizzo

Il rifiuto da parte di un utente di una raccomandazione corretta effettuata da un modello AI. Vedere anche eccessiva, affidabilità.

serie temporali univariate

Esperimento di serie temporali che contiene una sola variabile di modifica. Ad esempio, un modello di serie temporali che prevede la temperatura ha una singola colonna di previsione della temperatura.

dati non strutturati

Qualsiasi dato che viene memorizzato in un formato non strutturato piuttosto che in campi fissi. I dati in un documento di elaborazione testo è un esempio di dati non strutturati. Vedere anche dati strutturati.

informazioni non strutturate

Dati che non sono contenuti in una posizione fissa, come il documento di testo in lingua naturale.

apprendimento senza supervisione

  • Un modello per l'apprendimento approfondito che consente di utilizzare dati base non etichettati per addestrare un sistema con poco sforzo umano.
  • Un metodo di addestramento di machine learning in cui un modello non viene fornito con dati etichettati e deve trovare modelli o strutture nei dati da solo.

V

Serie di convalida

Una serie separata di dati etichettati che viene utilizzata per valutare le prestazioni e la capacità di generalizzazione di un modello di machine learning durante il processo di addestramento, assistendo nell'ottimizzazione degli iperparametri e nella selezione del modello.

vettore

Un elenco ordinato e unidimensionale di numeri, ad esempio [ 1, 2, 5] o [0.7, 0.2, -1.0].

Database vettoriale

Vedere archivio vettori.

Indice vettoriale

Un indice che richiama le incorporazioni vettoriali di documenti da un archivio di vettori.

Archivio vettoriale

Un repository che memorizza integrazioni vettoriali di documenti.

programma di verbalizzazione

Nell'AI generativa, un template per formattare i dati durante l'ottimizzazione e l'inferenza.

agent virtuale

Un chatbot preaddestrato che può elaborare il linguaggio naturale per rispondere e completare semplici transazioni di business o instradare richieste più complicate a un utente con competenze in materia.

visualizzazione

Un'immagine, grafico, diagramma, tabella, mappa o qualsiasi altra rappresentazione visiva dei dati.

W

peso

Un coefficiente per un nodo che trasforma i dati di input all'interno del livello della rete. Il peso è un parametro che un modello AI impara attraverso l'addestramento, regolandone il valore per ridurre gli errori nelle previsioni del modello.

Z

prompt zero - shot

Una tecnica di richiesta in cui il modello completa un'attività senza ricevere un esempio specifico di come.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni