Questo glossario fornisce termini e definizioni per watsonx.ai e watsonx.governance.
In questo glossario vengono utilizzati i seguenti riferimenti incrociati:
- Vedi ti rimanda da un termine non preferenziale a uno preferenziale oppure da un'abbreviazione a una forma estesa del termine.
- Vedi anche ti rimanda a termini correlati o contrari.
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W | Z
A
acceleratore
Nel calcolo ad alte prestazioni, un circuito specializzato che viene utilizzato per prendere parte del carico computazionale dalla CPU, aumentando l'efficienza del sistema. Ad esempio, nel deep learning, il GPU - accelerated computing è spesso impiegato per scaricare parte del carico di lavoro di calcolo su una GPU mentre l'applicazione principale esegue la CPU. Vedere anche unità di elaborazione grafica.
responsabilità
L'aspettativa che le organizzazioni o gli individui garantiscano il corretto funzionamento, per tutto il loro ciclo di vita, dei sistemi di intelligenza artificiale che progettano, sviluppano, gestiscono o distribuiscono, in conformità con i loro ruoli e i quadri normativi applicabili. Ciò include la determinazione di chi è responsabile di un errore di intelligenza artificiale che può richiedere agli esperti legali di determinare la responsabilità caso per caso.
funzione di attivazione
Una funzione che definisce l'output di un'unità neurale dato un insieme di attivazioni in entrata da altri neuroni
apprendimento attivo
Un modello per il machine learning in cui il sistema richiede più dati etichettati solo quando ne ha bisogno.
metadati attivi
Metadati che vengono aggiornati automaticamente in base all'analisi dei processi di machine learning. Ad esempio, la creazione di profili e l'analisi della qualità dei dati aggiornano automaticamente metadati per gli asset di dati.
runtime attivo
Un'istanza di un ambiente in esecuzione per fornire risorse di calcolo alle risorse che eseguono codice.
agente
Un algoritmo o un programma che interagisce con un ambiente per imparare azioni o decisioni ottimali, in genere utilizzando l'apprendimento di rinforzo, per raggiungere un obiettivo specifico.
AI agentic
Un flusso AI generativo che può scomporre un prompt in più attività, assegnare attività agli agent AI gen appropriati e sintetizzare una risposta senza l'intervento umano.
IA
Vedi intelligenza artificiale.
Acceleratore AI
Hardware di silicio specializzato progettato per eseguire in modo efficiente attività correlate all'intelligenza artificiale come il deep learning, il machine learning e le reti neurali per un calcolo più rapido ed efficiente dal punto di vista energetico. Può essere un'unità dedicata in un nucleo, un chiplet separato su un chip multi - modulo o una scheda separata.
L'Etica dell'AI
Un campo multidisciplinare che studia come ottimizzare l'impatto benefico dell'IA riducendo i rischi e i risultati negativi. Esempi di problemi di etica dell'intelligenza artificiale sono la responsabilità dei dati e la privacy, l'equità, l'esplicabilità, la solidità, la trasparenza, la sostenibilità ambientale, l'inclusione, l'agenzia morale, l'allineamento del valore, la responsabilità, la fiducia e l'uso improprio della tecnologia.
Governance dell'AI
L'atto di un'organizzazione di governare, attraverso le sue istruzioni aziendali, il personale, i processi e i sistemi per dirigere, valutare, monitorare e intraprendere azioni correttive per tutto il ciclo di vita dell'intelligenza artificiale, per fornire la garanzia che il sistema di intelligenza artificiale stia funzionando come l'organizzazione intende, come i suoi stakeholder si aspettano, e come richiesto dalla normativa pertinente.
Sicurezza AI
Il campo di ricerca che mira a garantire che i sistemi di intelligenza artificiale operino in un modo che sia benefico per l'umanità e non causi inavvertitamente danni, affrontando questioni come l'affidabilità, la correttezza, la trasparenza e l'allineamento dei sistemi di intelligenza artificiale con i valori umani.
Servizio AI
Un'unità di codice distribuibile che contiene la logica di un caso d'uso di IA generativa e fornisce un endpoint per l'inferenza da un'applicazione.
Sistema AI
algoritmo
Una formula applicata ai dati per determinare i modi ottimali per risolvere i problemi analitici.
rischi superiori
La scienza di studiare i dati per trovare modelli significativi nei dati e trarre conclusioni basate su tali modelli.
attendibilità appropriata
In un sistema di intelligenza artificiale, una quantità di fiducia calibrata sulla sua accuratezza, affidabilità e credibilità.
intelligenza artificiale (AI)
La capacità di acquisire, elaborare, creare e applicare la conoscenza sotto forma di un modello per fare previsioni, raccomandazioni o decisioni.
sistema di intelligenza artificiale (sistema AI)
Un sistema che può fare previsioni, raccomandazioni o decisioni che influenzano ambienti fisici o virtuali e i cui output o comportamenti non sono necessariamente predeterminati dallo sviluppatore o dall'utente. I sistemi di IA sono tipicamente addestrati con grandi quantità di dati strutturati o non strutturati e potrebbero essere progettati per operare con diversi livelli di autonomia o nessuno, per raggiungere obiettivi definiti dall'uomo.
risorsa
Un elemento che contiene informazioni sui dati, altre informazioni preziose o codice che funziona con i dati. Vedere anche asset di dati.
meccanismo di attenzione
Un meccanismo nei modelli di deep learning che determina su quali parti dell'input si concentra un modello quando si produce l'output.
Esperimento AutoAI
Un processo di addestramento automatizzato che considera una serie di parametri e definizioni di addestramento per creare un insieme di pipeline classificate come candidati di modelli.
B
distribuzione in batch
Un metodo per distribuire i modelli che elabora i dati di input da un file, una connessione dati o i dati connessi in un bucket di archiviazione, quindi scrive l'output in una destinazione selezionata.
distorsione
Errore sistematico in un sistema di intelligenza artificiale che è stato progettato, intenzionalmente o meno, in un modo che può generare decisioni sleali. La distorsione può essere presente sia nel sistema AI che nei dati utilizzati per addestrarlo e testarlo. La distorsione dell'IA può emergere in un sistema di intelligenza artificiale come risultato di aspettative culturali, limitazioni tecniche o contesti di distribuzione imprevisti. Vedere anche correttezza.
rilevamento pregiudizio
Il processo di calcolo della correttezza delle metriche per rilevare quando i modelli AI stanno producendo risultati errati sulla base di determinati attributi.
mitigazione della distorsione
Ridurre i pregiudizi nei modelli di IA curando i dati di addestramento e applicando tecniche di correttezza.
classificazione binaria
Un modello di classificazione con due classi. Le previsioni sono una scelta binaria di una delle due classi.
C
modello di classificazione
Un modello predittivo che prevede i dati in categorie distinte. Le classificazioni possono essere binarie, con due classi di dati o multi - classe quando ci sono più di 2 categorie.
pulire
Per garantire che tutti i valori in un dataset siano congruenti e correttamente registrati.
CNN
Vedere rete neurale convoluzionale.
funzione di forzatura cognitiva
Un intervento che viene applicato in un momento decisionale per interrompere il ragionamento euristico e indurre una persona a impegnarsi nel pensiero analitico; gli esempi includono una checklist, un time - out diagnostico o la richiesta a una persona di escludere un'alternativa.
linguistica computazionale
Campo interdisciplinare che esplora gli approcci per la modellazione computazionale dei linguaggi naturali.
risorsa di calcolo
Le risorse hardware e software definite da un modello di ambiente per eseguire gli asset negli strumenti.
matrice di confusione
Una misura delle prestazioni che determina l'accuratezza tra i risultati previsti positivi e negativi di un modello rispetto ai risultati effettivi positivi e negativi.
asset di dati connesso
Un puntatore ai dati a cui si accede tramite una connessione ad un'origine dati esterna.
Asset di cartella connesso
Un puntatore ad una cartella in IBM Cloud Object Storage.
connessione
Le informazioni necessarie per connettersi a un database. Le informazioni effettive richieste variano in base al DBMS e al metodo di connessione.
asset di connessione
Un asset che contiene informazioni che abilitano la connessione a un'origine dati.
vincolo
- Nei database, una relazione tra tabelle.
- In Decision Optimization, una condizione che deve essere soddisfatta dalla soluzione di un problema.
apprendimento continuo
Automazione delle attività di monitoraggio delle prestazioni del modello, riqualificazione con nuovi dati e ridistribuzione per garantire la qualità di previsione.
rete neurale convoluzionale (CNN)
Una classe di rete neurale comunemente utilizzata nelle attività di computer vision che utilizza livelli convoluzionali per elaborare i dati delle immagini.
distribuzione Core ML
Il processo di download di una distribuzione in formato Core ML da utilizzare nelle app iOS.
corpo
Una raccolta di documenti di origine utilizzati per addestrare un modello di machine learning.
Modello CPLEX
Un modello Decision Optimization formulato per essere risolto dal motore CPLEX.
Modello CPO
Un modello di programmazione dei vincoli formulato per essere risolto dal motore CPO (CP Optimizer) Decision Optimization .
convalida incrociata
Una tecnica per verificare il grado di generalizzazione di un modello in assenza di un campione di test di hold-out. La convalida incrociata divide i dati di addestramento in un certo numero di sottoinsiemi e quindi crea lo stesso numero di modelli, con ciascun sottoinsieme tenuto a turno. Ciascuno di questi modelli viene testato sul campione di holdout e la precisione media dei modelli su tali campioni di holdout viene utilizzata per stimare la precisione del modello quando viene applicato ai nuovi dati.
rendere accurato
Selezionare, raccogliere, conservare e mantenere il contenuto rilevante per un argomento specifico. La conservazione stabilisce, mantiene e aggiunge valore ai dati; li trasforma in informazioni attendibili.
D
asset di dati
Un asset che punta ai dati, ad esempio, ad un file caricato. Anche le connessioni e gli asset di dati connessi sono considerati asset di dati. Vedere anche asset.
Imputazione dei dati
La sostituzione dei valori mancanti in un dataset con valori stimati o espliciti.
data lake
Un repository di archiviazione dati su larga scala che memorizza i dati non elaborati in qualsiasi formato in un'architettura semplice. I data lakes contengono dati strutturati e non strutturati e dati binari per l'elaborazione e l'analisi.
data lakehouse
Un'architettura di elaborazione e archiviazione dei dati unificata che combina la flessibilità di un data lake con le query strutturate e le ottimizzazioni delle prestazioni di un data warehouse, consentendo un'analisi dei dati scalabile ed efficiente per le applicazioni di analytics e AI.
mining dei dati
Il processo di raccolta delle informazioni di business critiche da un'origine dati, di correlazione delle informazioni e di scoperta di associazioni, modelli e andamenti. Vedere anche predictive analytics.
Flusso Data Refinery
Una serie di passi che ripuliscono e modellano i dati per produrre un nuovo asset di dati.
scienza dei dati
l'analisi e la visualizzazione dei dati strutturati e non strutturati per scoprire informazioni dettagliate e conoscenze.
serie di dati
Una raccolta di dati, generalmente nel formato di righe (record) e colonne (campi) e contenuta in un file o una tabella di database.
origine dati
Un repository, una coda o un feed per la lettura dei dati, ad esempio un database.
tabella dati
Una raccolta di dati, generalmente nel formato di righe (record) e colonna (campi) e contenuta in una tabella.
data warehouse
Un grande repository centralizzato di dati raccolti da varie origini utilizzato per la creazione di report e l'analisi dei dati. Memorizza principalmente dati strutturati e semistrutturati, consentendo alle aziende di prendere decisioni informate.
DDL
Vedi apprendimento approfondito distribuito (distributed deep learning).
limite decisione
Una divisione di punti di dati in uno spazio in gruppi o classificazioni distinte.
modello solo decoder
Un modello che genera testo di output parola per parola per inferenza dalla sequenza di input. I modelli solo decodificatore vengono utilizzati per attività quali la generazione di testo e la risposta alle domande.
apprendimento profondo
Un modello di calcolo che utilizza più livelli di nodi interconnessi, organizzati in livelli gerarchici, per trasformare i dati di immissione (primo livello) attraverso una serie di calcoli per produrre un output (livello finale). Il deep learning è ispirato alla struttura e alla funzione del cervello umano. Vedere anche apprendimento approfondito distribuito.
rete neurale profonda
Una rete neurale con più livelli nascosti, che consente rappresentazioni più complesse dei dati.
ragionamento profondo
Una classe di apprendimento automatico in cui i sistemi generano intuizioni dai dati per supportare compiti cognitivi che vanno oltre la percezione e la classificazione, come il buon senso, il cambiamento delle situazioni, la pianificazione e il processo decisionale.
distribuzione
Un modello o pacchetto dell'applicazione disponibile per l'utilizzo.
spazio di distribuzione
Uno spazio di lavoro in cui vengono distribuiti i modelli e gestite le distribuzioni.
deterministici
Descrive una caratteristica dei sistemi di calcolo quando i loro output sono completamente determinati dai loro input.
AI discriminante
Una classe di algoritmo che si concentra sulla ricerca di un limite che separa classi differenti nei dati.
DDL (distributed deep learning)
Un approccio alla formazione di apprendimento approfondito che sfrutta i metodi di calcolo distribuito. In un ambiente DDL, il carico di lavoro di calcolo viene distribuito tra l'unità di elaborazione centrale e l'unità di elaborazione grafica. Vedere anche apprendimento approfondito.
DOcplex
Un'API Python per la modellazione e la soluzione dei problemi di Decision Optimization .
E
inserimento
Una rappresentazione numerica di un'unità di informazioni, come una parola o una frase, come un vettore di numeri reali. Le incorporazioni sono apprese, rappresentazioni a bassa dimensione di dati di dimensioni superiori. Vedere anche codifica, rappresentazione.
emersione
Una proprietà dei modelli di base in cui il modello mostra comportamenti che non sono esplicitamente addestrati.
comportamento emergente
Un comportamento esibito da un foundation model che non è stato costruito esplicitamente.
modello codificatore - decodificatore
Un modello per comprendere il testo di input e per generare il testo di output basato sul testo di input. I modelli di codificatore - decodificatore vengono utilizzati per attività quali il riepilogo o la traduzione.
modello solo codificatore
Un modello che comprende il testo di input a livello di frase trasformando le sequenze di input in vettori di rappresentazione denominati incorporazioni. I modelli di solo codificatore vengono utilizzati per attività quali la classificazione del feedback dei clienti e l'estrazione di informazioni da documenti di grandi dimensioni.
codifica
La rappresentazione di un'unità di informazioni, come un carattere o una parola, come una serie di numeri. Vedere anche integrazione, codifica posizionale.
URL endpoint
Un indirizzo di destinazione di rete che identifica le risorse, come i servizi e gli oggetti. Ad esempio, viene utilizzato un URL endpoint per identificare la posizione di una distribuzione di modello o funzione quando un utente invia i dati di payload alla distribuzione.
ambiente
Le risorse di calcolo per i lavori in esecuzione.
runtime dell'ambiente
Un'istanziazione del modello di ambiente per eseguire le risorse.
template di ambiente
Una definizione che specifica le risorse hardware e software per creare istanza dei runtime dell'ambiente.
feature esogena
Una funzione che può influenzare il modello predittivo ma non può essere influenzata in cambio. Ad esempio, le temperature possono influenzare le vendite di gelato previste, ma le vendite di gelato non possono influenzare le temperature.
sperimentazione
Un processo di addestramento del modello che considera una serie di definizioni e parametri di addestramento per determinare la configurazione del modello più accurata.
sfruttabilità
- La capacità di utenti reali di tracciare, controllare e comprendere le predizioni effettuate nelle applicazioni che utilizzano sistemi di IA.
- La capacità di un sistema di intelligenza artificiale di fornire informazioni che gli esseri umani possono utilizzare per comprendere le cause delle previsioni del sistema.
F
congruità
In un sistema di IA, il trattamento equo di individui o gruppi di individui. La scelta di una nozione specifica di equity per un sistema AI dipende dal contesto in cui viene utilizzato. Vedere anche distorsione.
componente
Una proprietà o caratteristica di un elemento all'interno di un dataset, ad esempio, una colonna in un foglio di calcolo. In alcuni casi, le funzioni vengono ingegnerizzate come combinazioni di altre funzioni nel dataset.
Progettazione di funzioni
Il processo di selezione, trasformazione e creazione di nuove funzioni dai dati non elaborati per migliorare le prestazioni e il potere predittivo dei modelli di machine learning.
Gruppo di funzioni
Una serie di colonne di un particolare asset di dati insieme ai metadati utilizzati per il machine learning.
selezione della funzione
Identificazione delle colonne di dati che meglio supportano una previsione o un punteggio accurati in un modello di machine learning.
negozio di funzioni
Un sistema o un repository centralizzato che gestisce e organizza le funzioni, fornendo un modo scalabile ed efficiente per archiviare, richiamare e condividere i dati delle funzioni tra le applicazioni e le pipeline di machine learning.
trasformazione della funzione
In AutoAI, una fase della creazione della pipeline che applica algoritmi per trasformare ed ottimizzare i dati di addestramento per ottenere il miglior risultato per il tipo di modello.
apprendimento federato
Il training di un modello di machine learning comune che utilizza più origini dati che non vengono spostate, unite o condivise. Il risultato è un modello ottimizzato senza compromettere la sicurezza dei dati.
richiesta di pochi istantanee
Una tecnica di richiesta in cui un numero ridotto di esempi viene fornito al modello per dimostrare come completare l'attività.
Ottimizzazione dettagliata
Il processo di adattamento di un modello pre - addestrato per eseguire un'attività specifica conducendo una formazione aggiuntiva. L'ottimizzazione può implicare (1) l'aggiornamento dei parametri esistenti del modello, noti come ottimizzazione completa, o (2) l'aggiornamento di un sottoinsieme dei parametri esistenti del modello o l'aggiunta di nuovi parametri al modello e l'addestramento mentre si congelano i parametri esistenti del modello, noti come ottimizzazione efficiente dei parametri.
flusso
Una raccolta di nodi che definiscono un insieme di passi per l'elaborazione dei dati o l'addestramento di un modello.
foundation model
Un modello di IA che può essere adattato a una vasta gamma di attività a valle. I modelli di base sono in genere modelli generativi su larga scala che vengono addestrati su dati senza etichetta utilizzando l'auto - supervisione. Come modelli su larga scala, i modelli di base possono includere miliardi di parametri.
G
grafico Gantt
Una rappresentazione grafica di una sequenza temporale e della durata di un progetto in cui i dati di pianificazione vengono visualizzati come barre orizzontali lungo una scala temporale.
Gen AI
Vedere generative AI.
generative AI (gen AI)
Una classe di algoritmi AI che possono produrre vari tipi di contenuto, tra cui testo, codice sorgente, immagini, audio e dati sintetici.
variabilità generativa
La caratteristica dei modelli generativi per produrre uscite variegate, anche quando l'input al modello è tenuto costante. Vedere anche probabilistico.
GPU
Vedere unità di elaborazione grafica.
programma di creazione grafico
Uno strumento per la creazione di risorse di flusso tramite la codifica visiva. Un'area su cui posizionare oggetti o nodi che possono essere collegati per creare un flusso.
GPU (graphics processing unit)
Un processore specializzato progettato per manipolare e modificare rapidamente la memoria per accelerare la creazione di immagini in un frame buffer destinato all'output su un display. Le GPU sono fortemente utilizzate nell'apprendimento automatico a causa delle loro capacità di elaborazione parallela. Vedere anche acceleratore.
tenuta a terra
Fornire un modello di linguaggio di grandi dimensioni con informazioni per migliorare l'accuratezza dei risultati.
H
Allucinazione
Una risposta di un foundation model che include contenuti fuori tema, ripetitivi, errati o inventati. Le allucinazioni che coinvolgono i dettagli di fabbricazione possono verificarsi quando a un modello viene richiesto di generare testo, ma il modello non ha abbastanza testo correlato da utilizzare per generare un risultato che contiene i dettagli corretti.
Rilevamento HAP (rilevamento HAP)
- La capacità di rilevare e filtrare l'odio, l'abuso e la profanità in entrambi i prompt inviati dagli utenti e nelle risposte generate da un modello di IA.
Rilevatore HAP (rilevatore HAP)
- Un classificatore di frasi che rimuove i contenuti potenzialmente dannosi, come i discorsi di odio, gli abusi e le bestemmie, dall'output e dall'input foundation model.
serie di dati di controllo
Un insieme di dati con etichetta che viene intenzionalmente trattenuto da entrambi i set di addestramento e convalida, fungendo da valutazione imparziale delle prestazioni del modello finale su dati non visti.
omogeneizzazione
La tendenza nella ricerca di apprendimento automatico in cui un piccolo numero di architetture di rete neurale profonda, come il trasformatore, stanno ottenendo risultati all'avanguardia in una vasta gamma di attività.
HPO
Vedere ottimizzazione di iperparametri.
supervisione umana
Coinvolgimento umano nella revisione delle decisioni rese da un sistema di intelligenza artificiale, consentendo l'autonomia umana e la responsabilità della decisione.
iperparametro
Nel machine learning, un parametro il cui valore è impostato prima dell'addestramento come metodo per aumentare la precisione del modello.
ottimizzazione iperparametro (HPO)
Il processo di impostazione dei valori di iperparametro ai valori che forniscono il modello più accurato.
I
immagine
Un package software che contiene un insieme di librerie.
Apprendimento incrementale
Il processo di addestramento di un modello utilizzando dati continuamente aggiornati senza dimenticare i dati ottenuti dalle attività precedenti. Questa tecnica viene utilizzata per preparare un modello con batch di dati da un'origine dati di addestramento di grandi dimensioni.
inferenza
Il processo di esecuzione di dati in tempo reale tramite un modello AI addestrato per effettuare una previsione o risolvere un'attività.
assimilare
- Per aggiungere costantemente un elevato volume di dati in tempo reale ad un database.
- Per inserire i dati in un sistema allo scopo di creare una base di conoscenza.
comprensione profonda
Una comprensione accurata o profonda di qualcosa. Le informazioni dettagliate vengono derivate utilizzando l'analytics cognitiva per fornire istantanee e previsioni correnti dei comportamenti e degli atteggiamenti dei clienti.
AI intelligente
Sistemi di intelligenza artificiale in grado di comprendere, imparare, adattare e implementare la conoscenza, dimostrando abilità come il processo decisionale, la risoluzione di problemi e la comprensione di concetti complessi, molto come l'intelligenza umana.
intento
Uno scopo o un obiettivo espresso dall'input del cliente a un chatbot, come rispondere a una domanda o elaborare un pagamento di fattura.
J
lavoro
Un'unità di lavoro eseguibile separatamente.
K
base di conoscenza
Vedere corpus.
L
etichetta
Una classe o una categoria assegnata a un punto di dati nell' learning.Labels supervisionato può essere derivata dai dati ma spesso viene applicata da etichettatori o annotatori umani.
dati etichettati
I dati non elaborati a cui vengono assegnate le etichette per aggiungere il contesto o il significato in modo che possano essere utilizzati per addestrare i modelli di machine learning. Ad esempio, i valori numerici potrebbero essere etichettati come codici postali o età per fornire il contesto per gli input e gli output del modello.
LLM (large language model)
Un modello di lingua con un gran numero di parametri, addestrato su una gran quantità di testo.
spazio latente
Uno spazio matematico n - dimensionale in cui le istanze di dati sono integrate. Uno spazio latente bidimensionale incorpora i dati come punti all'interno di un piano 2D (vedere anche: spazio di rappresentazione). Vedere anche spazio di rappresentazione.
LLM
M
machine learning (ML)
Un ramo dell'intelligenza artificiale (AI) e dell'informatica che si concentra sull'utilizzo di dati e algoritmi per imitare il modo in cui gli esseri umani imparano, migliorando gradualmente l'accuratezza dei modelli di IA.
framework di machine learning
Le librerie e il runtime per l'addestramento e la distribuzione di un modello.
modello di machine learning
Un modello di intelligenza artificiale che viene addestrato su una serie di dati per sviluppare algoritmi che può utilizzare per analizzare e apprendere da nuovi dati.
modello mentale
La comprensione di un individuo di come funziona un sistema e come le sue azioni influenzano i risultati del sistema. Quando queste aspettative non corrispondono alle capacità effettive di un sistema, possono portare alla frustrazione, all'abbandono o all'uso improprio.
disallineamento
Una discrepanza tra gli obiettivi o i comportamenti che un sistema di intelligenza artificiale è ottimizzato per raggiungere e i veri obiettivi, spesso complessi, dei suoi utenti umani o progettisti
ML
Vedere machine learning.
MLOps
- Una metodologia che prende un modello di machine learning dallo sviluppo alla produzione.
- La pratica per la collaborazione tra data scientist e professionisti delle operazioni per aiutare a gestire il ciclo di vita del machine learning di produzione (o deep learning). MLOps mira ad aumentare l'automazione e a migliorare la qualità della produzione ML, concentrandosi anche sui requisiti di business e normativi. Comprende sviluppo di modelli, formazione, convalida, distribuzione, monitoraggio e gestione e utilizza metodi come CI/CD.
modello
- In un contesto di machine learning, una serie di funzioni e algoritmi che sono stati addestrati e sottoposti a test su un dataset per fornire previsioni o decisioni.
- In Decision Optimization, una formulazione matematica di un problema che può essere risolto con motori di ottimizzazione CPLEX che utilizzano dataset differenti.
ModelOps
Una metodologia per la gestione dell'intero ciclo di vita di un modello AI, che include formazione, implementazione, calcolo del punteggio, valutazione, riaggiornamento e aggiornamento.
Gruppo monitorato
Una classe di dati monitorata per determinare se i risultati di un modello predittivo differiscono in modo significativo dai risultati del gruppo di riferimento. I gruppi sono comunemente monitorati in base a caratteristiche che includono razza, sesso o età.
modello di classificazione multiclasse
Un'attività di classificazione con più di due classi. Ad esempio, dove un modello di classificazione binaria prevede valori sì o no, un modello multi - classe prevede valori sì, no, forse o non applicabile.
modello multimodale
Un modello AI generativo che può elaborare più tipi di dati, come testo, immagini e audio, e convertirli tra loro. Ad esempio, un modello multimodale può prendere input di testo e generare output di immagini.
serie temporali multivariate
Esperimento di serie temporali che contiene due o più variabili che cambiano. Ad esempio, un modello di serie temporali che prevede l'utilizzo di elettricità di tre client.
N
elaborazione del linguaggio naturale (NLP)
Un campo di intelligenza artificiale e linguistica che studia i problemi inerenti all'elaborazione e alla manipolazione del linguaggio naturale, con l'obiettivo di aumentare la capacità dei computer di comprendere i linguaggi umani.
libreria di elaborazione del linguaggio naturale
Una libreria che fornisce funzioni di elaborazione del linguaggio naturale di base per l'analisi della sintassi e modelli predefiniti per un'ampia varietà di attività di elaborazione del testo.
rete neurale
Un modello matematico per la previsione o la classificazione dei casi utilizzando un complesso schema matematico che simula una versione astratta delle cellule cerebrali. L'addestramento di una rete neurale viene eseguito applicando alla rete un numero elevato di casi osservati, uno alla volta, e consentendo alla rete di aggiornarsi automaticamente ogni volta fino a quando l'attività non viene appresa.
NLP
nodo
In un flusso SPSS Modeler , la rappresentazione grafica di un'operazione di dati.
blocco note
Un documento interattivo che contiene codice eseguibile, testo descrittivo per quel codice e i risultati di qualsiasi codice eseguito.
kernel del notebook
La parte dell'editor del notebook che esegue il codice e restituisce i risultati di calcolo.
O
archivio dell'oggetto
Un metodo di memorizzazione dei dati, tipicamente utilizzato nel cloud, in cui i dati vengono memorizzati come unità distinte, o oggetti, in un pool di archiviazione o repository che non utilizza una gerarchia di file ma che memorizza tutti gli oggetti allo stesso livello.
apprendimento one-shot
Un modello per il deep learning che si basa sulla premessa che la maggior parte dell'apprendimento umano si svolge dopo aver ricevuto solo uno o due esempi. Questo modello è simile all'apprendimento non supervisionato.
richiesta one-shot
Una tecnica di richiesta in cui viene fornito un singolo esempio al modello per dimostrare come completare l'attività.
distribuzione online
Metodo di accesso a un modello o distribuzione del codice Python tramite un endpoint API come un servizio web per generare previsioni online, in tempo reale.
ontologia
Una specifica formale esplicita della rappresentazione di oggetti, concetti e altre entità che possono esistere in alcune aree di interesse e le relazioni tra loro.
asset operativo
Un asset che esegue il codice in uno strumento o in un lavoro.
di rete
Il processo di trovare la soluzione più appropriata a un problema definito con precisione, rispettando i vincoli e i limiti imposti. Ad esempio, determinare come allocare le risorse o come trovare gli elementi o le combinazioni migliori da una vasta serie di alternative.
Linguaggio di programmazione di ottimizzazione
Un linguaggio di modellazione per l'espressione di formulazioni di modelli dei problemi di ottimizzazione in un formato che può essere risolto da motori di ottimizzazione CPLEX come IBM CPLEX.
Metrica ottimizzata
Una metrica utilizzata per misurare le prestazioni del modello. Ad esempio, la precisione è la metrica tipica utilizzata per misurare le prestazioni di un modello di classificazione binario.
orchestrazione
Il processo di creare un flusso end-to-end che può addestrare, eseguire, distribuire, verificare e valutare un modello di machine learning e utilizza l'automazione per coordinare il sistema, spesso utilizzando i microservizi.
eccessiva dipendenza
L'accettazione di un suggerimento errato da parte di un modello AI da parte di un utente. Vedere anche affidabilità (reliance), underreliance.
P
Parametro
- Una parte configurabile del modello che è interna a un modello e i cui valori vengono stimati o appresi dai dati. I parametri sono aspetti del modello che vengono regolati durante il processo di addestramento per aiutare il modello a prevedere accuratamente l'output. Le prestazioni e il potere predittivo del modello dipendono in gran parte dai valori di questi parametri.
- Un peso con valore reale compreso tra 0.0 e 1.0 che indica l'intensità della connessione tra due neuroni in una rete neurale.
parte
In Federated Learning, un'entità che fornisce dati per l'addestramento di un modello comune. I dati non vengono spostati o combinati, ma ogni parte ottiene il beneficio della formazione federata.
payload
I dati passati a una distribuzione per ottenere nuovamente un punteggio, una previsione o una soluzione.
registrazione payload
L'acquisizione dei dati del payload e la distribuzione dell'output per monitorare l'integrità continua dell'IA nelle applicazioni di business.
pipeline
- In Watson Pipelines, un flusso end-to-end di risorse dalla creazione alla distribuzione.
- In AutoAI, un modello candidato.
classifica pipeline
In AutoAI, una tabella che mostra l'elenco dei modelli candidati generati automaticamente, come pipeline, classificati in base ai criteri specificati.
politica
Una strategia o una regola che un agent segue per determinare l'azione successiva in base allo stato corrente.
codifica posizionale
Una codifica di una sequenza ordinata di dati che include informazioni posizionali, come la codifica di parole in una frase che include la posizione di ciascuna parola all'interno della frase. Vedere anche codifica.
analytics predittiva
Un processo di business e una serie di tecnologie correlate che si occupano della previsione delle future possibilità e andamenti. L'analisi predittiva applica diverse discipline come la probabilità, le statistiche, il machine learning e l'intelligenza artificiale ai problemi di business per trovare l'azione migliore per una situazione specifica. Vedere anche data mining.
modello preaddestrato
Un modello AI precedentemente addestrato su un dataset di grandi dimensioni per eseguire un'attività specifica. I modelli preaddestrati vengono utilizzati invece di creare un modello da zero.
preaddestramento
Il processo di addestramento di un modello di machine learning su un dataset di grandi dimensioni prima di ottimizzarlo per un'attività specifica.
privacy
Garanzia che le informazioni su un individuo siano protette da accesso non autorizzato e uso inappropriato.
Probabilistico
La caratteristica di essere soggetto a casualità; non deterministico. I modelli probabilistici non producono gli stessi output dati gli stessi input. Vedere anche variabilità generativa.
progetto
Uno spazio di collaborazione per gestire dati e altri asset.
richiesta
- Dati, come testo o immagine, che preparano, istruiscono o condizionano l'output di un foundation model.
- Un componente di un'azione che indica che l'input utente è richiesto per un campo prima di effettuare una transizione a uno schermo di output.
Ingegneria prompt
Il processo di progettazione del linguaggio naturale richiede un modello di lingua per eseguire un'attività specifica.
invio di prompt
Il processo di fornire input a un foundation model per indurlo a produrre output.
Ottimizzazione prompt
Un modo efficiente e a basso costo di adattare un modello pre - addestrato a nuove attività senza riaddestrare il modello o aggiornarne i pesi. L'ottimizzazione dei prompt implica l'apprendimento di un numero ridotto di nuovi parametri che vengono accodati al prompt di un modello, bloccando i parametri esistenti del modello.
riduzione
Il processo di semplificazione, riduzione o troncamento di una struttura ad albero delle decisioni o di una rete neurale. Questa operazione viene eseguita rimuovendo i nodi o i livelli meno importanti, riducendo la complessità per impedire il sovradattamento e migliorare la generalizzazione del modello mantenendo il suo potere predittivo.
Python
Un linguaggio di programmazione utilizzato nella scienza dei dati e nell'intelligenza artificiale.
Python funzione
Una funzione che contiene codice Python per supportare un modello in produzione.
Q
quantizzazione
Un metodo di compressione dei pesi foundation model per accelerare l'inferenza e ridurre le esigenze di memoria della GPU.
R
R
Un linguaggio di script estensibile utilizzato nella data science e nell'AI che offre un'ampia gamma di funzioni e tecniche analitiche, statistiche e grafiche.
RAG
seme random
Un numero utilizzato per inizializzare un generatore di numeri pseudocasuali. I valori di inizializzazione casuali consentono la riproducibilità per i processi che si basano sulla generazione di numeri casuali.
gruppo di riferimento
Un gruppo identificato come più probabile che riceva un risultato positivo in un modello predittivo. I risultati possono essere confrontati con un gruppo monitorato per cercare potenziali distorsioni nei risultati.
perfeziona
Per pulire e formare i dati.
modello di regressione
Un modello che mette in relazione una variabile dipendente con una o più variabili indipendenti.
apprendimento a punteggio di prestazioni
Una tecnica di machine learning in cui un agente impara a prendere decisioni sequenziali in un ambiente per massimizzare un segnale di ricompensa. Ispirati alla prova e all'apprendimento degli errori, gli agenti interagiscono con l'ambiente, ricevono feedback e regolano le loro azioni per raggiungere politiche ottimali.
rafforzamento dell'apprendimento sul feedback umano (RLHF)
Un metodo per allineare le risposte di un modello di apprendimento delle lingue alle istruzioni fornite in un prompt. RLHF richiede che gli annotatori umani classificano più output dal modello. Queste classifiche vengono quindi utilizzate per addestrare un modello di ricompensa utilizzando l'apprendimento del rinforzo. Il modello di ricompensa viene quindi utilizzato per ottimizzare l'emissione del modello di linguaggio di grandi dimensioni.
dipendenza
Nei sistemi AI, l'accettazione da parte dell'utente di una raccomandazione effettuata da, o l'output generato da, un modello AI. Vedere anche eccessiva, scarsa affidabilità.
rappresentazione
Una codifica di un'unità di informazioni, spesso come vettore di numeri reali. Vedere anche integrazione.
spazio di rappresentazione
Uno spazio matematico n - dimensionale in cui le istanze di dati sono integrate. Uno spazio latente bidimensionale incorpora i dati come punti in un piano 2D (vedere anche: spazio latente). Vedere anche spazio latente.
Reranking
Un processo di intelligenza artificiale generativa per classificare un insieme di passaggi di documenti dalla più alla meno probabile risposta a una determinata domanda.
richiamo di RAG (augmented generation)
Una tecnica in cui un modello di linguaggio di grandi dimensioni viene ampliato con conoscenze provenienti da fonti esterne per generare testo. Nella fase di richiamo, i documenti pertinenti da un'origine esterna vengono identificati dalla query dell'utente. Nella fase di generazione, parti di tali documenti sono incluse nella richiesta LLM per generare una risposta basata sui documenti richiamati.
premio
Un segnale utilizzato per guidare un agente, in genere un agente di apprendimento di rinforzo, che fornisce un feedback sulla bontà di una decisione
RLHF
ambiente di runtime
La configurazione hardware e software predefinita o personalizzata utilizzata per eseguire strumenti o lavori, come i notebook.
S
calcolo del punteggio
- Nell'apprendimento automatico, il processo di misurazione della confidenza di un risultato previsto.
- Il processo di calcolo che determina il livello di corrispondenza degli attributi per un'identità in entrata con gli attributi di un'entità esistente.
script
Un file che contiene gli script Python o R per supportare un modello in produzione.
auto - attenzione
Un meccanismo di attenzione che utilizza le informazioni provenienti dai dati di input stessi per determinare su quali parti dell'input concentrarsi quando si genera l'output.
apprendimento auto - supervisionato
Un metodo di addestramento di machine learning in cui un modello apprende dai dati senza etichetta mascherando i token in una sequenza di input e quindi tentando di prevederli. Un esempio è "Mi piacciono i germogli ________".
analisi delle sensazioni
Esame del sentimento o dell'emozione espressa nel testo, ad esempio determinare se una recensione di un film è positiva o negativa.
forma
Per personalizzare i dati tramite filtraggio, ordinamento, rimozione delle colonne, unione di tabelle; esecuzione di operazioni che includono calcoli, raggruppamenti di dati, gerarchie e altro.
piccoli dati
Dati accessibili e comprensibili agli esseri umani. Vedere anche dati strutturati.
pushback SQL
In SPSS Modeler, il processo di esecuzione di molte operazioni di preparazione ed estrazione (mining) dei dati direttamente nel database tramite codice SQL.
dati strutturati
Dati che si trovano in campi fissi all'interno di un record o di un file. I database relazionali e i fogli di calcolo sono esempi di dati strutturati. Vedi anche dati non strutturati, piccoli dati.
informazioni strutturate
Elementi memorizzati in risorse strutturate, come indici del motore di ricerca, database o knowledge base.
apprendimento controllato
Un metodo di machine learning in cui un modello viene addestrato su un dataset etichettato per effettuare previsioni su nuovi dati.
T
temperatura
Parametro in un modello generativo che specifica la quantità di variazione nel processo di generazione. Temperature più elevate si traducono in una maggiore variabilità nell'output del modello.
classificazione del testo
Un modello che identifica e classifica automaticamente il testo in categorie specificate.
text extraction
Un metodo di intelligenza artificiale generativa per convertire informazioni altamente strutturate in un formato testuale più semplice da utilizzare come input per modelli linguistici di grandi dimensioni.
serie temporale
Una serie di valori di una variabile in momenti periodici.
Modello di serie temporali
Un modello che tiene traccia e prevede i dati nel tempo.
gettone
Un'unità discreta di significato o analisi in un testo, come una parola o una sottoparola.
tokenizzazione
Il processo utilizzato nell'elaborazione del linguaggio naturale per suddividere una stringa di testo in unità più piccole, come parole o sottoparole.
modello addestrato
Un modello che viene addestrato con i dati effettivi ed è pronto per essere implementato per prevedere i risultati quando vengono presentati nuovi dati.
addestramento
La fase iniziale di creazione del modello, che coinvolge un sottoinsieme dei dati di origine. Il modello impara per esempio dai dati noti. Il modello può quindi essere sottoposto a test rispetto ad un ulteriore sottoinsieme per cui l'esito è già noto.
dati di addestramento
Una raccolta di dati utilizzata per addestrare i modelli di apprendimento automatico.
set di addestramento
Un insieme di dati con etichetta che viene utilizzato per addestrare un modello di machine learning esponendolo agli esempi e alle etichette corrispondenti, consentendo al modello di apprendere i pattern e fare previsioni.
apprendimento per trasferimento
Una strategia di machine learning in cui un modello addestrato viene applicato a un problema completamente nuovo.
trasformazione
Un'architettura di rete neurale che utilizza codifiche posizionali e il meccanismo di auto - attenzione per prevedere il token successivo in una sequenza di token.
trasparenza
Condividere informazioni appropriate con le parti interessate su come è stato progettato e sviluppato un sistema di intelligenza artificiale. Esempi di queste informazioni sono quali dati vengono raccolti, in che modo verranno utilizzati e archiviati e chi vi ha accesso e i risultati dei test per l'accuratezza, la robustezza e la distorsione.
calibrazione trust
Il processo di valutazione e adattamento della propria fiducia in un sistema di intelligenza artificiale basato su fattori quali la sua accuratezza, affidabilità e credibilità.
Test di Turing
Proposto da Alan Turing nel 1950, un test della capacità di una macchina di esibire un comportamento intelligente equivalente, o indistinguibile, a quello di un essere umano.
U
sottoutilizzo
Il rifiuto da parte di un utente di una raccomandazione corretta effettuata da un modello AI. Vedere anche eccessiva, affidabilità.
serie temporali univariate
Esperimento di serie temporali che contiene una sola variabile di modifica. Ad esempio, un modello di serie temporali che prevede la temperatura ha una singola colonna di previsione della temperatura.
dati non strutturati
Qualsiasi dato che viene memorizzato in un formato non strutturato piuttosto che in campi fissi. I dati in un documento di elaborazione testo è un esempio di dati non strutturati. Vedere anche dati strutturati.
informazioni non strutturate
Dati che non sono contenuti in una posizione fissa, come il documento di testo in lingua naturale.
apprendimento senza supervisione
- Un modello per l'apprendimento approfondito che consente di utilizzare dati base non etichettati per addestrare un sistema con poco sforzo umano.
- Un metodo di addestramento di machine learning in cui un modello non viene fornito con dati etichettati e deve trovare modelli o strutture nei dati da solo.
V
Serie di convalida
Una serie separata di dati etichettati che viene utilizzata per valutare le prestazioni e la capacità di generalizzazione di un modello di machine learning durante il processo di addestramento, assistendo nell'ottimizzazione degli iperparametri e nella selezione del modello.
vettore
Un elenco ordinato e unidimensionale di numeri, ad esempio [ 1, 2, 5] o [0.7, 0.2, -1.0].
Database vettoriale
Vedere archivio vettori.
Indice vettoriale
Un indice che richiama le incorporazioni vettoriali di documenti da un archivio di vettori.
Archivio vettoriale
Un repository che memorizza integrazioni vettoriali di documenti.
programma di verbalizzazione
Nell'AI generativa, un template per formattare i dati durante l'ottimizzazione e l'inferenza.
agent virtuale
Un chatbot preaddestrato che può elaborare il linguaggio naturale per rispondere e completare semplici transazioni di business o instradare richieste più complicate a un utente con competenze in materia.
visualizzazione
Un'immagine, grafico, diagramma, tabella, mappa o qualsiasi altra rappresentazione visiva dei dati.
W
peso
Un coefficiente per un nodo che trasforma i dati di input all'interno del livello della rete. Il peso è un parametro che un modello AI impara attraverso l'addestramento, regolandone il valore per ridurre gli errori nelle previsioni del modello.
Z
prompt zero - shot
Una tecnica di richiesta in cui il modello completa un'attività senza ricevere un esempio specifico di come.