Questo glossario fornisce termini e definizioni per Cloud Pak for Data as a Service.
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W
A
acceleratore
Nell'informatica ad alte prestazioni, un circuito specializzato che viene utilizzato per sottrarre alla CPU una parte del carico di calcolo, aumentando l'efficienza del sistema. Ad esempio, nel deep learning, l'elaborazione accelerata da GPU viene spesso utilizzata per scaricare parte del carico di lavoro di calcolo su una GPU mentre l'applicazione principale viene eseguita dalla CPU. Vedere anche unità di elaborazione grafica.
responsabilità
L'aspettativa che le organizzazioni o gli individui garantiscano il corretto funzionamento, per tutto il loro ciclo di vita, dei sistemi di intelligenza artificiale che progettano, sviluppano, gestiscono o distribuiscono, in conformità con i loro ruoli e i quadri normativi applicabili. Ciò include la determinazione di chi è responsabile di un errore di intelligenza artificiale che può richiedere agli esperti legali di determinare la responsabilità caso per caso.
funzione di attivazione
Una funzione che definisce l'uscita di un'unità neurale data una serie di attivazioni in entrata da altri neuroni
apprendimento attivo
Un modello per il machine learning in cui il sistema richiede più dati etichettati solo quando ne ha bisogno.
metadati attivi
Metadati che vengono aggiornati automaticamente in base all'analisi dei processi di machine learning. Ad esempio, la creazione di profili e l'analisi della qualità dei dati aggiornano automaticamente metadati per gli asset di dati.
runtime attivo
Un'istanza di un ambiente in esecuzione per fornire risorse di calcolo alle risorse che eseguono codice.
agente
Un algoritmo o un programma che interagisce con un ambiente per apprendere azioni o decisioni ottimali, in genere utilizzando l'apprendimento per rinforzo, per raggiungere un obiettivo specifico.
AI
Vedi intelligenza artificiale.
Acceleratore AI
Hardware di silicio specializzato progettato per eseguire in modo efficiente le attività legate all'intelligenza artificiale, come l'apprendimento profondo, l'apprendimento automatico e le reti neurali, per un'elaborazione più rapida ed efficiente dal punto di vista energetico. Può essere un'unità dedicata in un core, un chiplet separato in un chip multimodulo o una scheda separata.
L'Etica dell'AI
Un campo multidisciplinare che studia come ottimizzare l'impatto benefico dell'IA riducendo i rischi e i risultati negativi. Esempi di problemi di etica dell'intelligenza artificiale sono la responsabilità dei dati e la privacy, l'equità, l'esplicabilità, la solidità, la trasparenza, la sostenibilità ambientale, l'inclusione, l'agenzia morale, l'allineamento del valore, la responsabilità, la fiducia e l'uso improprio della tecnologia.
Governance dell'AI
L'atto di un'organizzazione di governare, attraverso le sue istruzioni aziendali, il personale, i processi e i sistemi per dirigere, valutare, monitorare e intraprendere azioni correttive per tutto il ciclo di vita dell'intelligenza artificiale, per fornire la garanzia che il sistema di intelligenza artificiale stia funzionando come l'organizzazione intende, come i suoi stakeholder si aspettano, e come richiesto dalla normativa pertinente.
Sicurezza AI
Il campo di ricerca che mira a garantire che i sistemi di intelligenza artificiale operino in un modo che sia benefico per l'umanità e non causi inavvertitamente danni, affrontando questioni come l'affidabilità, la correttezza, la trasparenza e l'allineamento dei sistemi di intelligenza artificiale con i valori umani.
Sistema AI
algoritmo
Una formula applicata ai dati per determinare i modi ottimali per risolvere i problemi analitici.
rischi superiori
La scienza di studiare i dati per trovare modelli significativi nei dati e trarre conclusioni basate su tali modelli.
intelligenza artificiale (AI)
La capacità di acquisire, elaborare, creare e applicare la conoscenza sotto forma di modello per fare previsioni, raccomandazioni o decisioni.
sistema di intelligenza artificiale (sistema AI)
Un sistema che può fare previsioni, raccomandazioni o decisioni che influenzano ambienti fisici o virtuali e i cui output o comportamenti non sono necessariamente predeterminati dallo sviluppatore o dall'utente. I sistemi di IA sono tipicamente addestrati con grandi quantità di dati strutturati o non strutturati e potrebbero essere progettati per operare con diversi livelli di autonomia o nessuno, per raggiungere obiettivi definiti dall'uomo.
asset
Un elemento in un progetto o catalogo che contiene i metadati relativi ai dati o all'analisi dei dati.
regola di composizione degli attributi
Una delle regole che determinano il modo in cui i valori degli attributi di un'entità dei dati master vengono selezionati dai record dei suoi membri. Si veda anche la regola.
Esperimento AutoAI
Un processo di addestramento automatizzato che considera una serie di parametri e definizioni di addestramento per creare un insieme di pipeline classificate come candidati di modelli.
B
distribuzione in batch
Un metodo per distribuire i modelli che elabora i dati di input da un file, una connessione dati o i dati connessi in un bucket di archiviazione, quindi scrive l'output in una destinazione selezionata.
bias
Errore sistematico in un sistema di intelligenza artificiale che è stato progettato, intenzionalmente o meno, in un modo che può generare decisioni sleali. La distorsione può essere presente sia nel sistema AI che nei dati utilizzati per addestrarlo e testarlo. La distorsione dell'IA può emergere in un sistema di intelligenza artificiale come risultato di aspettative culturali, limitazioni tecniche o contesti di distribuzione imprevisti. Vedere anche correttezza.
rilevamento pregiudizio
Il processo di calcolo della correttezza delle metriche per rilevare quando i modelli AI stanno producendo risultati errati sulla base di determinati attributi.
attenuazione dei pregiudizi
Ridurre le distorsioni nei modelli di intelligenza artificiale curando i dati di formazione e applicando tecniche di equità.
classificazione binaria
Un modello di classificazione con due classi. Le previsioni sono una scelta binaria di una delle due classi.
termine di business
Una parola o una frase che definisce un concetto di business in modo standard per un'azienda. I termini possono essere utilizzati per arricchire i metadati degli asset di dati e per definire i criteri delle regole di protezione dei dati.
vocabolario di business
La serie di risorse di governance, come i termini di business e le classi di dati, che descrivono e arricchiscono gli asset di dati.
C
catalog
Un repository di asset per la condivisione di un'organizzazione. Gli asset nei cataloghi possono essere controllati da regole di protezione dei dati e arricchito da altre risorse di governance, come le classificazioni, le classi di dati e i termini di business. I cataloghi possono memorizzare dati strutturati e non strutturati, riferimenti ai dati in origini dati esterne e altri asset analitici, come i modelli di machine learning.
categoria
Per la governance dei dati, uno spazio di lavoro collaborativo per organizzare e gestire gli artefatti di governance.
classificazione
Per la governance dei dati, un artefatto di governance che descrive il livello di sensibilità dei dati in un asset di dati.
pulire
Per garantire che tutti i valori in un dataset siano congruenti e correttamente registrati.
collaboratore
Un membro di un gruppo di persone che sta lavorando insieme verso un obiettivo comune.
problema combinatorio
Un problema difficile da risolvere perché richiede più decisioni che coinvolgono un numero troppo elevato di combinazioni di scelte possibili. Alcuni esempi sono la ricerca di un raggruppamento, l'ordinamento o l'assegnazione di oggetti.
risorse di calcolo
Le risorse hardware e software definite da una definizione dell'ambiente per eseguire asset analitici.
matrice di confusione
Una misura delle prestazioni che determina l'accuratezza tra i risultati previsti positivi e negativi di un modello rispetto ai risultati effettivi positivi e negativi.
Dati connessi
Un dataset a cui si accede tramite una connessione a un'origine dati esterna.
connessione
Le informazioni necessarie per connettersi a un database. Le informazioni effettive richieste variano in base al DBMS e al metodo di connessione.
vincolo
In Decision Optimization, una condizione che deve essere soddisfatta dalla soluzione di un problema.
apprendimento continuo
Automazione delle attività di monitoraggio delle prestazioni del modello, riqualificazione con nuovi dati e ridistribuzione per garantire la qualità di previsione.
distribuzione Core ML
Il processo di download di una distribuzione in formato Core ML da utilizzare nelle app iOS.
corpo
Una raccolta di documenti di origine utilizzati per addestrare un modello di machine learning.
Modello CPLEX
Un modello di Decision Optimization formulato per essere risolto dal motore CPLEX.
Modello CPO
Un modello di programmazione a vincoli formulato per essere risolto dal motore Decision Optimization CP Optimizer (CPO).
rendere accurato
- Selezionare, raccogliere, conservare e mantenere il contenuto rilevante per un argomento specifico. La conservazione stabilisce, mantiene e aggiunge valore ai dati; li trasforma in informazioni attendibili.
- Creare un asset di dati e prepararlo per la pubblicazione in un catalogo. La conservazione può includere l'arricchimento dell'asset di dati assegnando risorse di governance come i termini di business, la classificazione e le classi di dati, e analizzando la qualità dei dati nell'asset di dati.
D
asset di dati
Un asset che punta ai dati, ad esempio, ad un file caricato. Anche le connessioni e gli asset di dati connessi sono considerati asset di dati.
classe dati
Una risorsa di governance che categorizza le colonne in dataset relazionali in base al tipo di dati e al modo in cui vengono utilizzati i dati.
governance dei dati
Il processo di tracciamento e controllo dei dati per mantenere la qualità, la sicurezza e la conformità dei dati.
integrazione dati
La combinazione di processi tecnici e di business utilizzati per combinare i dati da fonti diverse in informazioni significative e preziose.
data lake
Un repository di archiviazione dati su larga scala che memorizza i dati non elaborati in qualsiasi formato in un'architettura semplice. I data lakes contengono dati strutturati e non strutturati e dati binari per l'elaborazione e l'analisi.
data lakehouse
Un'architettura di elaborazione e archiviazione dei dati unificata che combina la flessibilità di un data lake con le query strutturate e le ottimizzazioni delle prestazioni di un data warehouse, consentendo un'analisi dei dati scalabile ed efficiente per le applicazioni di analytics e AI.
mining dei dati
Il processo di raccolta delle informazioni di business critiche da un'origine dati, di correlazione delle informazioni e di scoperta di associazioni, modelli e andamenti. Vedere anche predictive analytics.
modello di dati
Una visualizzazione di elementi di dati, le relazioni e gli attributi.
Condotto dati
Una serie di fasi di elaborazione e trasformazione dei dati.
riservatezza dei dati
La protezione dei dati da accessi non autorizzati e da usi impropri.
Prodotto di dati
Una raccolta di dati ottimizzati o di asset correlati ai dati che vengono impacchettati per il riutilizzo e la distribuzione con accesso controllato. I prodotti dati contengono dati, modelli, dashboard e altri tipi di asset di calcolo. Diversamente dagli asset di dati nei cataloghi di governance, i prodotti di dati sono gestiti come prodotti con più scopi per fornire valore di business.
regola di protezione dati
Una risorsa di governance che specifica i dati da controllare e le modalità di controllo. Una regola di protezione dei dati contiene criteri e un'azione. Si veda anche la regola.
analisi qualità dei dati
L'analisi dei dati rispetto alle dimensioni di qualità accuratezza, completezza, coerenza, tempestività, unicità e validità.
definizione della qualità dei dati
Una definizione di qualità dei dati descrive una valutazione della regola o una condizione per le regole di qualità dei dati.
regola di qualità dei dati
Durante l'analisi della qualità dei dati, una regola di qualità dei dati che valuta se vengono soddisfatte specifiche condizioni e identifica i record che non soddisfano le condizioni come violazioni di regole. Si veda anche la regola.
Flusso Data Refinery
Un'origine dati, una catena di una o più operazioni che ottimizzano e modellano tale origine dati, e una destinazione in cui i dati si spostano.
scienza dei dati
l'analisi e la visualizzazione dei dati strutturati e non strutturati per scoprire informazioni dettagliate e conoscenze.
serie di dati
Una raccolta di dati, generalmente nel formato di righe (record) e colonne (campi) e contenuta in un file o una tabella di database.
origine dati
Un repository, una coda o un feed per la lettura dei dati, ad esempio un database.
Flusso DataStage
Una risorsa che si basa su un insieme ordinato di passaggi per estrarre, trasformare e caricare i dati.
tabella dati
Una raccolta di dati, generalmente nel formato di righe (record) e colonna (campi) e contenuta in una tabella.
data warehouse
Un grande repository centralizzato di dati raccolti da varie origini utilizzato per la creazione di report e l'analisi dei dati. Memorizza principalmente dati strutturati e semistrutturati, consentendo alle aziende di prendere decisioni informate.
Esperimento Decision Optimization
Un asset che contiene un gruppo di scenari che rappresentano formulazioni di modelli o dataset relativi allo stesso problema in fase di risoluzione.
modello Decision Optimization
Un modello prescrittivo che può essere risolto con l'ottimizzazione per fornire la migliore soluzione ad un problema Decision Optimization.
variabile di decisione
Una di un insieme di variabili che rappresentano le decisioni da effettuare, i cui valori sono determinati dal motore di ottimizzazione assicurando che tutti i vincoli siano soddisfatti e che l'obiettivo sia ottimizzato.
apprendimento profondo
Un modello computazionale che utilizza più strati di nodi interconnessi, organizzati in livelli gerarchici, per trasformare i dati in ingresso (primo strato) attraverso una serie di calcoli per produrre un output (strato finale). L'apprendimento profondo si ispira alla struttura e al funzionamento del cervello umano.
esperimento di apprendimento approfondito
Un processo di formazione del modello che si basa su un raggruppamento logico di una o più definizioni di formazione del modello che sono collegate in una rete neurale.
rete neurale profonda
Una rete neurale con più strati nascosti, che consente di ottenere rappresentazioni più complesse dei dati.
distribuzione
Un modello o pacchetto dell'applicazione disponibile per l'utilizzo.
spazio di distribuzione
Uno spazio di lavoro in cui vengono distribuiti i modelli e gestite le distribuzioni.
DOcplex
Un'API Python per la modellazione e la soluzione dei problemi di Decision Optimization .
E
URL endpoint
Un indirizzo di destinazione di rete che identifica le risorse, come i servizi e gli oggetti. Ad esempio, viene utilizzato un URL endpoint per identificare la posizione di una distribuzione di modello o funzione quando un utente invia i dati di payload alla distribuzione.
ambiente
Le risorse di calcolo per i lavori in esecuzione.
runtime dell'ambiente
Un'istanziazione del modello di ambiente per eseguire le risorse.
template di ambiente
Una definizione che specifica le risorse hardware e software per creare istanza dei runtime dell'ambiente.
sfruttabilità
- La capacità di utenti reali di tracciare, controllare e comprendere le predizioni effettuate nelle applicazioni che utilizzano sistemi di IA.
- La capacità di un sistema di intelligenza artificiale di fornire informazioni che gli esseri umani possono utilizzare per comprendere le cause delle previsioni del sistema.
F
congruità
In un sistema di IA, il trattamento equo di individui o gruppi di individui. La scelta di una nozione specifica di equity per un sistema AI dipende dal contesto in cui viene utilizzato. Vedere anche distorsione.
componente
Una proprietà o caratteristica di un elemento all'interno di un dataset, ad esempio, una colonna in un foglio di calcolo. In alcuni casi, le funzioni vengono ingegnerizzate come combinazioni di altre funzioni nel dataset.
Progettazione di funzioni
Il processo di selezione, trasformazione e creazione di nuove funzioni dai dati non elaborati per migliorare le prestazioni e il potere predittivo dei modelli di machine learning.
selezione della funzione
Identificazione delle colonne di dati che meglio supportano una previsione o un punteggio accurati in un modello di machine learning.
negozio di funzioni
Un sistema o un repository centralizzato che gestisce e organizza le funzioni, fornendo un modo scalabile ed efficiente per archiviare, richiamare e condividere i dati delle funzioni tra le applicazioni e le pipeline di machine learning.
trasformazione della funzione
In AutoAI, una fase della creazione della pipeline che applica algoritmi per trasformare ed ottimizzare i dati di addestramento per ottenere il miglior risultato per il tipo di modello.
apprendimento federato
Il training di un modello di machine learning comune che utilizza più origini dati che non vengono spostate, unite o condivise. Il risultato è un modello ottimizzato senza compromettere la sicurezza dei dati.
flusso
Una raccolta di nodi che definiscono un insieme di passi per l'elaborazione dei dati o l'addestramento di un modello.
Modello di base
Un modello di intelligenza artificiale che può essere adattato a un'ampia gamma di compiti a valle. I modelli Foundation sono in genere modelli generativi su larga scala che vengono addestrati su dati non etichettati utilizzando l'auto-supervisione. Essendo modelli su larga scala, i modelli di fondazione possono includere miliardi di parametri.
G
grafico Gantt
Una rappresentazione grafica di una sequenza temporale e della durata di un progetto in cui i dati di pianificazione vengono visualizzati come barre orizzontali lungo una scala temporale.
Gen AI
Vedi IA generativa.
iA generativa (gen AI)
Una classe di algoritmi di intelligenza artificiale in grado di produrre vari tipi di contenuti, tra cui testo, codice sorgente, immagini, audio e dati sintetici.
oggetto di governance
Elementi di governance che arricchiscono o controllano gli asset di dati. Le risorse di governance comprendono termini di business, classificazioni, classi di dati, politiche, regole e dataset di riferimento.
regola di governance
Una risorsa di governance che fornisce una descrizione di linguaggio naturale dei criteri utilizzati per determinare se gli asset di dati sono conformi agli obiettivi di business. Si veda anche la regola.
flusso di lavoro di governance
Un processo basato su attività per controllare la creazione, la modifica e l'eliminazione delle risorse di governance.
catalogo governato
Un catalogo che applica l'abilitazione delle regole di protezione dei dati.
GPU
Vedere unità di elaborazione grafica.
programma di creazione grafico
Uno strumento per la creazione di risorse di flusso tramite la codifica visiva. Un'area su cui posizionare oggetti o nodi che possono essere collegati per creare un flusso.
GPU (graphics processing unit)
Un processore specializzato progettato per manipolare e modificare rapidamente la memoria per accelerare la creazione di immagini in un frame buffer destinato all'output su un display. Le GPU sono fortemente utilizzate nell'apprendimento automatico a causa delle loro capacità di elaborazione parallela. Vedi anche acceleratore.
tenuta a terra
Fornire un modello linguistico di grandi dimensioni con informazioni per migliorare l'accuratezza dei risultati.
H
Rilevamento HAP (rilevamento HAP)
- La capacità di rilevare e filtrare l'odio, l'abuso e la blasfemia sia nelle richieste inviate dagli utenti sia nelle risposte generate da un modello di intelligenza artificiale.
Rivelatore HAP (rivelatore HAP)
- Un classificatore di frasi che rimuove i contenuti potenzialmente dannosi, come i discorsi di odio, gli abusi e le bestemmie, dall'output e dall'input del modello di fondazione.
serie di dati di controllo
Un insieme di dati con etichetta che viene intenzionalmente trattenuto da entrambi i set di addestramento e convalida, fungendo da valutazione imparziale delle prestazioni del modello finale su dati non visti.
supervisione umana
Coinvolgimento umano nella revisione delle decisioni rese da un sistema di intelligenza artificiale, consentendo l'autonomia umana e la responsabilità della decisione.
iperparametro
Nel machine learning, un parametro il cui valore è impostato prima dell'addestramento come metodo per aumentare la precisione del modello.
I
immagine
Un package software che contiene un insieme di librerie.
inferenza
Il processo di esecuzione di dati reali attraverso un modello di intelligenza artificiale addestrato per fare una previsione o risolvere un compito.
assimilare
- Per inserire i dati in un sistema allo scopo di creare una base di conoscenza.
- Per aggiungere costantemente un elevato volume di dati in tempo reale ad un database.
comprensione profonda
Una comprensione accurata o profonda di qualcosa. Le informazioni dettagliate vengono derivate utilizzando l'analytics cognitiva per fornire istantanee e previsioni correnti dei comportamenti e degli atteggiamenti dei clienti.
intento
Uno scopo o un obiettivo espresso dall'input del cliente a un chatbot, come rispondere a una domanda o elaborare un pagamento di fattura.
J
lavoro
Un'unità di lavoro eseguibile separatamente.
K
base di conoscenza
Vedi corpus.
L
dati etichettati
I dati non elaborati a cui vengono assegnate le etichette per aggiungere il contesto o il significato in modo che possano essere utilizzati per addestrare i modelli di machine learning. Ad esempio, i valori numerici potrebbero essere etichettati come codici postali o età per fornire il contesto per gli input e gli output del modello.
modello linguistico di grandi dimensioni (LLM)
Un modello di lingua con un gran numero di parametri, addestrato su una gran quantità di testo.
derivazione
- La cronologia del flusso di dati attraverso l'asset.
- La cronologia degli eventi eseguiti su un asset.
LLM
modello logico
Una rappresentazione logica di oggetti di dati correlati a un dominio di business.
M
machine learning (ML)
Un ramo dell'intelligenza artificiale (AI) e dell'informatica che si concentra sull'utilizzo di dati e algoritmi per imitare il modo in cui gli esseri umani imparano, migliorando gradualmente l'accuratezza dei modelli di IA.
framework di machine learning
Le librerie e il runtime per l'addestramento e la distribuzione di un modello.
modello di machine learning
Un modello di intelligenza artificiale che viene addestrato su una serie di dati per sviluppare algoritmi che può utilizzare per analizzare e apprendere da nuovi dati.
maschera
Per sostituire i valori dei dati sensibili in una colonna di un dataset. I metodi di mascheramento variano nel programma di utilità dei dati e nella privacy, dal fornire valori di sostituzione formattati in modo simile che mantengono l'integrità referenziale al fornire lo stesso valore di sostituzione per l'intera colonna.
flusso di mascheramento
Un flusso che produce copie di dati permanentemente mascherate.
dati (unici) di riferimento
- Per l'addestramento del modello, i dati di riferimento che rimangono gli stessi per diversi lavori sullo stesso modello ma che possono essere modificati, se necessario.
- In Match 360, una vista consolidata dei dati provenienti dalle diverse origini.
entità dei dati master
Una composizione di record che un algoritmo di corrispondenza ha stabilito rappresentare la stessa entità del mondo reale, come una persona o un'organizzazione. Ogni entità comprende uno o più record membri che l'algoritmo di corrispondenza ha collegato tra loro.
programmazione matematica (mathematical programming, MP)
Un campo della matematica, o ricerca operativa, utilizzato per modellare e risolvere problemi di Decision Optimization. Racchiude la programmazione lineare, di numeri interi, di numeri interi misti e non lineare.
Importazione di metadati
Un metodo di importazione dei metadati associati agli asset di dati, inclusi i metadati del processo che descrivono la derivazione degli asset di dati e i metadati tecnici che descrivono la struttura degli asset di dati.
disallineamento
Una discrepanza tra gli obiettivi o i comportamenti che un sistema di intelligenza artificiale è ottimizzato per raggiungere e i veri obiettivi, spesso complessi, dei suoi utenti umani o progettisti
ML
Vedere machine learning.
MLOps
- La pratica per la collaborazione tra data scientist e professionisti delle operazioni per aiutare a gestire il ciclo di vita del machine learning di produzione (o deep learning). MLOps mira ad aumentare l'automazione e a migliorare la qualità della produzione ML, concentrandosi anche sui requisiti di business e normativi. Comprende sviluppo di modelli, formazione, convalida, distribuzione, monitoraggio e gestione e utilizza metodi come CI/CD.
- Una metodologia che prende un modello di machine learning dallo sviluppo alla produzione.
modello
- In un contesto di machine learning, una serie di funzioni e algoritmi che sono stati addestrati e sottoposti a test su un dataset per fornire previsioni o decisioni.
- In Decision Optimization, una formulazione matematica di un problema che può essere risolto con motori di ottimizzazione CPLEX che utilizzano dataset differenti.
formulazione di modello
In Decision Optimization, la formulazione matematica di un modello espresso come elenco di variabili di decisione, una o più funzioni obiettivo da massimizzare o minimizzare ed alcuni vincoli da soddisfare.
ModelOps
Una metodologia per la gestione dell'intero ciclo di vita di un modello AI, che include formazione, implementazione, calcolo del punteggio, valutazione, riaggiornamento e aggiornamento.
MP
Vedere programmazione matematica.
N
linguaggio naturale
Una sintassi di modellazione che assomiglia alla lingua umana (in inglese) per formulare modelli.
elaborazione del linguaggio naturale (NLP)
Un campo di intelligenza artificiale e linguistica che studia i problemi inerenti all'elaborazione e alla manipolazione del linguaggio naturale, con l'obiettivo di aumentare la capacità dei computer di comprendere i linguaggi umani.
libreria di elaborazione del linguaggio naturale
Una libreria che fornisce funzioni di elaborazione del linguaggio naturale di base per l'analisi della sintassi e modelli predefiniti per un'ampia varietà di attività di elaborazione del testo.
rete neurale
Un modello matematico per la previsione o la classificazione dei casi utilizzando un complesso schema matematico che simula una versione astratta delle cellule cerebrali. L'addestramento di una rete neurale viene eseguito applicando alla rete un numero elevato di casi osservati, uno alla volta, e consentendo alla rete di aggiornarsi automaticamente ogni volta fino a quando l'attività non viene appresa.
NLP
nodo
La rappresentazione grafica di un'operazione dati in uno stream o in un flusso. Diversi tipi di nodi hanno forme diverse per indicare il tipo di operazione che eseguono.
notebook
Un documento interattivo che contiene codice eseguibile, testo descrittivo per quel codice e i risultati di qualsiasi codice eseguito.
kernel del notebook
La parte dell'editor del notebook che esegue il codice e restituisce i risultati di calcolo.
O
offuscare
Sostituire i dati in una colonna con valori formattati in modo simile che corrispondono al formato originale. Una forma di mascheramento.
funzione obiettivo
In Decision Opmization and operations research, un'espressione per ottimizzare (ovvero, ridurre o massimizzare) soddisfacendo altri vincoli del problema.
archivio dell'oggetto
Un metodo di memorizzazione dei dati, tipicamente utilizzato nel cloud, in cui i dati vengono memorizzati come unità distinte, o oggetti, in un pool di archiviazione o repository che non utilizza una gerarchia di file ma che memorizza tutti gli oggetti allo stesso livello.
distribuzione online
Metodo di accesso a un modello o distribuzione del codice Python tramite un endpoint API come un servizio web per generare previsioni online, in tempo reale.
ontologia
Una specifica formale esplicita della rappresentazione di oggetti, concetti e altre entità che possono esistere in alcune aree di interesse e le relazioni tra loro.
asset operativo
Un asset che esegue il codice in uno strumento o in un lavoro.
modello OPL
Una formulazione di modello espressa in linguaggio di modellazione OPL.
soluzione ottimale
Nella ricerca di operazioni, una soluzione ad un problema che ottimizza la funzione obiettiva (lineare o quadratica) e soddisfa tutti gli altri vincoli del problema.
ottimizzazione
Il processo di trovare la soluzione più appropriata a un problema definito con precisione, rispettando i vincoli e i limiti imposti. Ad esempio, determinare come allocare le risorse o come trovare gli elementi o le combinazioni migliori da una vasta serie di alternative.
orchestrazione
Il processo di creare un flusso end-to-end che può addestrare, eseguire, distribuire, verificare e valutare un modello di machine learning e utilizza l'automazione per coordinare il sistema, spesso utilizzando i microservizi.
P
Revisione delle coppie
Un processo durante il quale un utente del data steward confronta i record per determinare se corrispondono. I risultati della revisione a coppie addestrano un algoritmo di corrispondenza a decidere quali record vengono abbinati alle entità dei dati master.
Parametro
Una parte configurabile del modello che è interna a un modello e i cui valori vengono stimati o appresi dai dati. I parametri sono aspetti del modello che vengono regolati durante il processo di addestramento per aiutare il modello a prevedere accuratamente l'output. Le prestazioni e il potere predittivo del modello dipendono in gran parte dai valori di questi parametri.
parte
In Federated Learning, un'entità che fornisce dati per l'addestramento di un modello comune. I dati non vengono spostati o combinati, ma ogni parte ottiene il beneficio della formazione federata.
payload
I dati passati a una distribuzione per ottenere nuovamente un punteggio, una previsione o una soluzione.
registrazione payload
L'acquisizione dei dati del payload e la distribuzione dell'output per monitorare l'integrità continua dell'IA nelle applicazioni di business.
modello fisico
Una definizione delle strutture fisiche e delle relazioni dei dati.
pipeline
- In Watson Pipelines, un flusso end-to-end di risorse dalla creazione alla distribuzione.
- In AutoAI, un modello candidato.
classifica pipeline
In AutoAI, una tabella che mostra l'elenco dei modelli candidati generati automaticamente, come pipeline, classificati in base ai criteri specificati.
segnaposto
Un campo o una variabile che devono essere sostituiti da un valore.
politica
- Una strategia o una regola che un agent segue per determinare l'azione successiva in base allo stato corrente.
- Un insieme di regole che proteggono i dati controllando l'accesso agli asset di dati o rendendo anonimi i dati sensibili all'interno degli asset di dati.
- Una risorsa di governance composta da una o più regole di governance e protezione dei dati.
analytics predittiva
Un processo di business e una serie di tecnologie correlate che si occupano della previsione delle future possibilità e andamenti. L'analisi predittiva applica diverse discipline come la probabilità, le statistiche, il machine learning e l'intelligenza artificiale ai problemi di business per trovare l'azione migliore per una situazione specifica. Vedere anche data mining.
modello preaddestrato
Un modello AI precedentemente addestrato su un dataset di grandi dimensioni per eseguire un'attività specifica. I modelli preaddestrati vengono utilizzati invece di creare un modello da zero.
categoria primaria
Per la governance dei dati, la categoria che contiene l'artefatto di governance. Una categoria è simile ad una cartella o directory che organizza le risorse di governance dell'utente.
privacy
Garanzia che le informazioni su un individuo siano protette da accesso non autorizzato e uso inappropriato.
profilo
Le statistiche e i metadati generati relativi al contenuto testuale dei dati.
progetto
Uno spazio di collaborazione per gestire dati e altri asset.
riduzione
Il processo di semplificazione, riduzione o taglio di un albero decisionale o di una rete neurale. Ciò avviene rimuovendo i nodi o gli strati meno importanti, riducendo la complessità per evitare l'overfitting e migliorare la generalizzazione del modello, pur mantenendo il suo potere predittivo.
pubblicare
Per copiare un asset in un catalogo.
Python
Un linguaggio di programmazione utilizzato nella scienza dei dati e nell'intelligenza artificiale.
modello DOcplex Python
Una formulazione di modello espressa in Python.
Python funzione
Una funzione che contiene codice Python per supportare un modello in produzione.
Q
regola di qualità
Una o più condizioni richieste per un record di dati per soddisfare gli standard di qualità. Durante l'analisi della qualità dei dati, i record di dati vengono controllati rispetto a tali condizioni. Si veda anche la regola.
quantizzazione
Un metodo di compressione dei pesi dei modelli di fondazione per accelerare l'inferenza e ridurre le esigenze di memoria della GPU.
R
R
Un linguaggio di script estensibile utilizzato nella data science e nell'AI che offre un'ampia gamma di funzioni e tecniche analitiche, statistiche e grafiche.
leggi
Per copiare i dati in un'applicazione al fine di manipolarlo o analizzarlo.
revisionare
Per sostituire tutti i valori dei dati in una colonna con la stessa stringa per nascondere i valori sensibili, il formato dei dati e le relazioni tra i valori. Una forma di mascheramento ..
dataset di riferimento
Una risorsa di governance che definisce valori per tipi specifici di colonne.
perfeziona
Per pulire e formare i dati.
apprendimento a punteggio di prestazioni
Una tecnica di machine learning in cui un agente impara a prendere decisioni sequenziali in un ambiente per massimizzare un segnale di ricompensa. Ispirati alla prova e all'apprendimento degli errori, gli agenti interagiscono con l'ambiente, ricevono feedback e regolano le loro azioni per raggiungere politiche ottimali.
premio
Un segnale utilizzato per guidare un agente, in genere un agente di apprendimento per rinforzo, che fornisce un feedback sulla bontà di una decisione
regola
Un artefatto che contiene informazioni, criteri o logica per analizzare o proteggere i dati. Vedi anche regola di protezione dei dati, regola di qualità dei dati, regola di governance, regola di qualità, regola di composizione degli attributi.
ambiente di runtime
La configurazione hardware e software predefinita o personalizzata utilizzata per eseguire strumenti o lavori, come i notebook.
S
calcolo del punteggio
- Nell'apprendimento automatico, il processo di misurazione della confidenza di un risultato previsto.
- Il processo di calcolo che determina il livello di corrispondenza degli attributi per un'identità in entrata con gli attributi di un'entità esistente.
script
Un file che contiene gli script Python o R per supportare un modello in produzione.
categoria secondaria
Una categoria facoltativa che fa riferimento alla risorsa di governance.
auto - attenzione
Un meccanismo di attenzione che utilizza le informazioni provenienti dai dati di input stessi per determinare su quali parti dell'input concentrarsi quando si genera l'output.
apprendimento auto - supervisionato
Un metodo di addestramento di machine learning in cui un modello apprende dai dati senza etichetta mascherando i token in una sequenza di input e quindi tentando di prevederli. Un esempio è "Mi piacciono i germogli ________".
ricerca semantica
Una ricerca per parole chiave che incorpora l'analisi linguistica e contestuale. In una ricerca semantica, l'intento dell'interrogazione è specificato da uno o più specificatori. Ad esempio, è possibile specificare una persona di nome "Bush" e una tale query non restituirebbe risultati sul tipo di cespugli che crescono in un giardino, ma piuttosto solo sulle persone di nome Bush.
dati riservati
Dati che contengono informazioni che devono essere protette da accessi o divulgazioni non autorizzati. Le categorie di dati sensibili possono essere informazioni sanitarie protette, informazioni di identificazione personale, segreti commerciali o risultati finanziari.
analisi delle sensazioni
Esame del sentimento o delle emozioni espresse in un testo, ad esempio per determinare se la recensione di un film è positiva o negativa.
forma
Per personalizzare i dati tramite filtraggio, ordinamento, rimozione delle colonne, unione di tabelle; esecuzione di operazioni che includono calcoli, raggruppamenti di dati, gerarchie e altro.
piccoli dati
Dati accessibili e comprensibili agli esseri umani. Vedere anche dati strutturati.
pushback SQL
In SPSS Modeler, il processo di esecuzione di molte operazioni di preparazione ed estrazione (mining) dei dati direttamente nel database tramite codice SQL.
dati strutturati
Dati che si trovano in campi fissi all'interno di un record o di un file. I database relazionali e i fogli di calcolo sono esempi di dati strutturati. Vedi anche dati non strutturati, piccoli dati.
informazioni strutturate
Elementi memorizzati in risorse strutturate, come indici del motore di ricerca, database o knowledge base.
sostituto
Sostituire i dati in una colonna con valori che non corrispondono al formato originale ma conservano l'integrità referenziale.
Supernodo
Un nodo SPSS Modeler che comprime uno stream di dati incapsulando diversi nodi in un unico nodo.
apprendimento controllato
Un metodo di machine learning in cui un modello viene addestrato su un dataset etichettato per effettuare previsioni su nuovi dati.
T
classificazione del testo
Un modello che identifica e classifica automaticamente il testo in categorie specificate.
serie temporali
Una serie di valori di una variabile in momenti periodici.
modello addestrato
Un modello che viene addestrato con i dati effettivi ed è pronto per essere implementato per prevedere i risultati quando vengono presentati nuovi dati.
addestramento
La fase iniziale di creazione del modello, che coinvolge un sottoinsieme dei dati di origine. Il modello impara per esempio dai dati noti. Il modello può quindi essere sottoposto a test rispetto ad un ulteriore sottoinsieme per cui l'esito è già noto.
dati di addestramento
Una raccolta di dati utilizzata per addestrare i modelli di apprendimento automatico.
set di addestramento
Un insieme di dati con etichetta che viene utilizzato per addestrare un modello di machine learning esponendolo agli esempi e alle etichette corrispondenti, consentendo al modello di apprendere i pattern e fare previsioni.
apprendimento per trasferimento
Una strategia di machine learning in cui un modello addestrato viene applicato a un problema completamente nuovo.
trasformazione
Un'architettura di rete neurale che utilizza le codifiche posizionali e il meccanismo di autoattenzione per prevedere il token successivo in una sequenza di token.
trasparenza
Condividere informazioni appropriate con le parti interessate su come è stato progettato e sviluppato un sistema di intelligenza artificiale. Esempi di queste informazioni sono quali dati vengono raccolti, in che modo verranno utilizzati e archiviati e chi vi ha accesso e i risultati dei test per l'accuratezza, la robustezza e la distorsione.
Test di Turing
Proposto da Alan Turing nel 1950, un test della capacità di una macchina di esibire un comportamento intelligente equivalente, o indistinguibile, a quello di un essere umano.
U
problema senza limiti
Un problema di Decision Optimization in cui esiste un numero infinito di soluzioni e l'obiettivo può assumere valori fino all'infinito. Problemi illimitati sono spesso causati da vincoli mancanti nella formulazione del modello.
dati non strutturati
Qualsiasi dato che viene memorizzato in un formato non strutturato piuttosto che in campi fissi. I dati in un documento di elaborazione testo è un esempio di dati non strutturati. Vedere anche dati strutturati.
informazioni non strutturate
Dati che non sono contenuti in una posizione fissa, come il documento di testo in lingua naturale.
apprendimento non supervisionato
Un metodo di addestramento di machine learning in cui un modello non viene fornito con dati etichettati e deve trovare modelli o strutture nei dati da solo.
V
Serie di convalida
Una serie separata di dati etichettati che viene utilizzata per valutare le prestazioni e la capacità di generalizzazione di un modello di machine learning durante il processo di addestramento, assistendo nell'ottimizzazione degli iperparametri e nella selezione del modello.
visualizzazione
Un'immagine, grafico, diagramma, tabella, mappa o qualsiasi altra rappresentazione visiva dei dati.
W
peso
Un coefficiente per un nodo che trasforma i dati di input all'interno del livello della rete. Il peso è un parametro che un modello AI impara attraverso l'addestramento, regolandone il valore per ridurre gli errori nelle previsioni del modello.