Informazioni sui cookie del presente sito Per il corretto funzionamento, i nostri siti Web richiedono alcuni cookie (richiesto). Inoltre, con il suo consenso, potrebbero essere utilizzati altri cookie per l'analisi dell'utilizzo del sito, per migliorare l'esperienza utente e per scopi pubblicitari. Per ulteriori informazioni, consultare le. Visitando il nostro sito web, accettate il trattamento delle informazioni da parte nostra come descritto nelladichiarazione sulla privacy di IBM. Per consentire una corretta navigazione, le preferenze per i cookie dell'utente verranno condivise sui domini Web IBM qui elencati.
Glossario AutoAI
Ultimo aggiornamento: 24 set 2024
Scopri i concetti e i termini utilizzati in AutoAI per creare e distribuire modelli di machine learning.
Punteggio aggregato
L'aggregazione dei quattro tipi di anomalie: spostamento di livello, tendenza, estremo localizzato, varianza. Un punteggio più alto indica un punteggio più forte.
algoritmo
Una formula applicata ai dati per determinare i modi ottimali per risolvere i problemi analitici.
AutoAI
Un processo di addestramento automatizzato che considera una serie di definizioni di training e parametri per creare un insieme di pipeline classificate come candidati modello.
Impiego batch
Elabora i dati di input da un file, da una connessione dati o da dati connessi in un bucket di archiviazione e scrive l'output in una destinazione selezionata.
Rilevamento distorsione (machine learning)
Per identificare gli squilibri nei dati di addestramento o nel comportamento di previsione del modello.
Classificazione binaria
Un modello di classificazione con due classi e assegna campioni solo in una delle due classi.
modello di classificazione
Un modello predittivo che prevede i dati in categorie distinte.
Matrice di confusione
Una misurazione delle prestazioni che determina l'accuratezza tra i risultati previsti positivi e negativi di un modello e i risultati effettivi positivi e negativi.
convalida incrociata
Una tecnica che verifica l'efficacia dei modelli di machine learning. Viene anche utilizzato come procedura di ricampionamento per i modelli con dati limitati.
assegnazione dati
Sostituzione dei valori mancanti in un dataset con valori stimati.
Caratteristiche esogene
Caratteristiche che possono influenzare il modello di previsione ma non possono essere influenzate in cambio. Vedere anche: Funzioni di supporto
correttezza
Determina se un modello produce risultati distorti che favoriscono un gruppo monitorato rispetto a un gruppo di riferimento. Le valutazioni di correttezza rilevano se il modello mostra una tendenza a fornire un risultato favorevole o preferibile più spesso per un gruppo rispetto ad un altro. Le categorie tipiche da monitorare sono età, sesso e razza.
Correlazione funzione
La relazione tra due funzioni. Ad esempio, il codice postale potrebbe avere una forte correlazione con il reddito in alcuni modelli.
Codifica funzione
Trasformazione dei valori categoriali in valori numerici.
Importanza funzione
L'impatto relativo che una particolare colonna o funzione ha sulla previsione del modello.
Scalabilità funzione
Normalizzazione dell'intervallo di variabili indipendenti o funzioni in un dataset.
selezione funzione
Identificazione delle colonne di dati che meglio supportano una previsione o un punteggio accurati.
trasformazione delle caratteristiche
In AutoAI, una fase della creazione della pipeline che applica algoritmi per trasformare e ottimizzare i dati di addestramento per ottenere il risultato migliore per il tipo di modello.
Dati di holdout
Dati utilizzati per verificare o convalidare le prestazioni del modello. I dati di holdout possono essere una parte riservata dei dati di addestramento oppure possono essere un file separato.
HPO (hyperparameter optimization)
Il processo per l'impostazione dei valori di iperparametro sulle impostazioni che forniscono il modello più accurato.
apprendimento incrementale
Il processo di addestramento di un modello che utilizza dati continuamente aggiornati senza dimenticare i dati ottenuti dalle attività precedenti.
Dati tabulari grandi
Dati strutturati che superano il limite di elaborazione standard e devono essere elaborati in batch. Vedere apprendimento incrementale.
Dati etichettati
I dati etichettati per identificare i vettori di dati appropriati da utilizzare per l'addestramento del modello.
gruppo monitorato
Una classe di dati monitorati per determinare se i risultati differiscono in modo significativo dai risultati del gruppo di riferimento. Ad esempio, in un'applicazione di credito, è possibile monitorare le applicazioni in un particolare intervallo di età e confrontare i risultati con l'intervallo di età più probabile che riceva un risultato positivo per valutare se potrebbe esserci una distorsione nei risultati.
Modello di classificazione multiclasse
Un'attività di classificazione con più di due classi. Ad esempio, quando un modello di classificazione binaria prevede sì o no valori, un modello multi - classe prevede sì, no, forseo non applicabile.
Serie temporali multivariate
Esperimento di serie temporali che contiene due o più variabili di modifica. Ad esempio, un modello di serie temporali che prevede l'utilizzo di elettricità di tre clienti.
Metrica ottimizzata
La metrica utilizzata per misurare le prestazioni del modello. Ad esempio, l'accuratezza è la metrica tipica utilizzata per misurare le prestazioni di un modello di classificazione binario.
pipeline (pipeline candidato modello)
Struttura end-to-end che illustra gli steos in un workflow.
Classe positiva
La classe correlata alla funzione obiettivo.
gruppo di riferimento
Un gruppo che si identifica come più probabile che riceva un risultato positivo in un modello predittivo. È possibile quindi confrontare i risultati con un gruppo monitorato per cercare potenziali distorsioni nei risultati.
Modello di regressione
Un modello che mette in relazione una variabile dipendente con una o più variabili indipendenti.
punteggio
Nel machine learning, il processo di misurazione della confidenza di un risultato previsto.
funzioni di supporto
Funzioni di input che possono influenzare l'obiettivo di previsione. Vedi anche: Caratteristiche di Exogenus
Classificazione testo
Un modello che identifica e classifica automaticamente il testo in categorie distinte.
modello di serie temporali (AutoAI)
Un modello che tiene traccia dei dati nel tempo.
Modello preparato
Un modello pronto per la distribuzione.
Formazione
Lo stadio iniziale della creazione del modello, che coinvolge un sottoinsieme dei dati origine. Il modello può quindi essere sottoposto a test rispetto ad un ulteriore sottoinsieme per cui l'esito è già noto.
Dati di addestramento
I dati utilizzati per insegnare e formare un algoritmo di apprendimento del modello.
Serie temporali univariata
Esperimento di serie temporali che contiene una sola variabile di modifica. Ad esempio, un modello di serie temporali che prevede la temperatura ha una singola colonna di previsione della temperatura.
L'argomento è stato utile?
0/1000