0 / 0
Retourner à la version anglaise de la documentation
Glossaire
Dernière mise à jour : 05 déc. 2024
Glossaire

Ce glossaire fournit des termes et des définitions pour watsonx.ai et watsonx.governance.

Les références croisées suivantes sont employées dans ce glossaire :

  • Voir renvoie d'un terme non préféré vers le terme préféré ou d'une abréviation vers sa forme non abrégée.
  • Voir aussi renvoie à un terme connexe ou opposé.

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W | Z

A

raccourci clavier

En calcul haute performance, circuit spécialisé qui est utilisé pour prendre une partie de la charge de calcul de l'unité centrale, augmentant l'efficacité du système. Par exemple, dans l'apprentissage en profondeur, le calcul accéléré par GPU est souvent utilisé pour décharger une partie de la charge de travail de calcul sur un GPU alors que l'application principale s'exécute hors de l'UC. Voir aussi unité de traitement graphique.

responsabilité

L'attente que les organisations ou les personnes assurent le bon fonctionnement, tout au long de leur cycle de vie, des systèmes d'IA qu'elles conçoivent, développent, exploitent ou déploient, conformément à leurs rôles et aux cadres réglementaires applicables. Il s'agit notamment de déterminer qui est responsable d'une erreur d'IA, ce qui peut exiger des experts juridiques qu'ils déterminent la responsabilité au cas par cas.

fonction d'activation

Fonction définissant la sortie d'une unité neuronale à partir d'un ensemble d'activations entrantes provenant d'autres neurones

apprentissage actif

Modèle d'apprentissage automatique dans lequel le système demande davantage de données étiquetées uniquement lorsqu'il en a besoin.

métadonnées actives

Métadonnées qui sont automatiquement mises à jour en fonction de l'analyse par les processus d'apprentissage automatique. Par exemple, le profilage et l'analyse de la qualité des données mettent automatiquement à jour les métadonnées des actifs de données.

environnement d'exécution actif

Instance d'un environnement qui fonctionne pour fournir des ressources de calcul aux actifs qui exécutent du code.

Agent

Algorithme ou programme qui interagit avec un environnement pour apprendre des actions ou des décisions optimales, généralement à l'aide de l'apprentissage par renforcement, afin d'atteindre un objectif spécifique.

IA agentique

Flux d'IA génératif qui peut décomposer une invite en plusieurs tâches, affecter des tâches à des agents d'IA de génération appropriés et synthétiser une réponse sans intervention humaine.

IA

Voir intelligence artificielle.

Accélérateur d'IA

Matériel spécialisé en silicium conçu pour exécuter efficacement des tâches liées à l'IA telles que l'apprentissage en profondeur, l'apprentissage automatique et les réseaux de neurones pour un calcul plus rapide et économe en énergie. Il peut s'agir d'une unité dédiée dans un coeur, d'un chiplet séparé sur une puce multi-module ou d'une carte séparée.

Éthique de l’IA

Domaine multidisciplinaire qui étudie comment optimiser l'impact bénéfique de l'IA tout en réduisant les risques et les résultats négatifs. Les exemples de problèmes d'éthique de l'IA sont la responsabilité et la confidentialité des données, l'équité, l'explicabilité, la robustesse, la transparence, la durabilité environnementale, l'inclusion, l'agence morale, l'alignement des valeurs, la responsabilité, la confiance et l'utilisation abusive de la technologie.

Gouvernance de l'IA

L'acte d'une organisation de gouverner, par le biais de ses instructions d'entreprise, le personnel, les processus et les systèmes pour diriger, évaluer, surveiller et prendre des mesures correctives tout au long du cycle de vie de l'IA, afin de fournir l'assurance que le système d'IA fonctionne comme l'organisation l'entend, comme les parties prenantes s'y attendent, et comme l'exige la réglementation pertinente.

Sécurité de l'intelligence artificielle

Le domaine de recherche visant à s'assurer que les systèmes d'intelligence artificielle fonctionnent de manière bénéfique pour l'humanité et ne causent pas de dommages par inadvertance, en abordant des questions telles que la fiabilité, l'équité, la transparence et l'alignement des systèmes d'intelligence artificielle sur les valeurs humaines.

Service d'IA

Unité de code déployable qui contient la logique d'un cas d'utilisation de l'IA générative et fournit un point final pour l'inférence à partir d'une application.

Système d'intelligence artificielle

Voir système d'intelligence artificielle.

algorithme

Formule appliquée aux données pour déterminer les méthodes optimales de résolution des problèmes analytiques.

analytique

Science de l'étude des données visant à dégager des modèles pertinents dans les données et à tirer des conclusions basées sur ces modèles.

confiance appropriée

Dans un système d'IA, degré de confiance calibré en termes d'exactitude, de fiabilité et de crédibilité.

intelligence artificielle (IA)

Capacité d'acquérir, de traiter, de créer et d'appliquer des connaissances sous la forme d'un modèle pour faire des prévisions, des recommandations ou des décisions.

système d'intelligence artificielle (système d'intelligence artificielle)

Système qui peut faire des prévisions, des recommandations ou des décisions qui influencent des environnements physiques ou virtuels, et dont les résultats ou les comportements ne sont pas nécessairement prédéterminés par son développeur ou son utilisateur. Les systèmes d'IA sont généralement formés avec de grandes quantités de données structurées ou non structurées, et peuvent être conçus pour fonctionner avec des niveaux d'autonomie différents ou aucun, pour atteindre des objectifs définis par l'homme.

actif

Elément contenant des informations sur les données, d'autres informations utiles ou du code qui fonctionne avec les données. Voir aussi actif de données.

mécanisme d'attention

Mécanisme dans les modèles d'apprentissage en profondeur qui détermine les parties de l'entrée sur lesquelles un modèle se concentre lors de la production de la sortie.

expérimentation AutoAI

Processus d'entraînement automatisé dans lequel une série de définitions d'entraînement et de paramètres est considérée afin de créer un jeu de pipelines classés en tant que modèles candidats.

B

déploiement par lots

Méthode permettant de déployer des modèles qui traitent des données d'entrée à partir d'un fichier, d'une connexion de données ou de données connectées dans un compartiment de stockage, puis d'écrire la sortie dans une destination sélectionnée.

pondération

Erreur systématique dans un système d'IA qui a été conçu, intentionnellement ou non, de manière à générer des décisions injustes. Le biais peut être présent à la fois dans le système d'IA et dans les données utilisées pour l'entraîner et le tester. Le biais de l'IA peut apparaître dans un système d'IA en raison d'attentes culturelles, de limites techniques ou de contextes de déploiement imprévus. Voir aussi équité.

détection de biais

Processus de calcul de l'équité des mesures visant à détecter les cas où les modèles d'intelligence artificielle fournissent des résultats biaisés d'après certains attributs.

Atténuation des biais

Réduire les biais dans les modèles d'IA en curant les données d'apprentissage et en appliquant des techniques d'équité.

classification binaire

Modèle de classification avec deux classes. Les prédictions sont un choix binaire de l'une des deux classes.

C

modèle de discrimination

Modèle prédictif qui prévoit les données dans des catégories distinctes. Les classifications peuvent être binaires, avec deux classes de données ou multi-classes lorsqu'il y a plus de 2 catégories.

nettoyer

Faire en sorte que toutes les valeurs d'un jeu de données soient cohérentes et correctement enregistrées.

CNN

Voir réseau de neurones convolutif.

fonction de forçage cognitif

Une intervention qui est appliquée à un moment de prise de décision pour perturber le raisonnement heuristique et amener une personne à s'engager dans la pensée analytique ; les exemples incluent une liste de contrôle, un délai de diagnostic ou demander à une personne d'exclure une alternative.

linguistique computationnelle

Domaine interdisciplinaire qui explore les approches pour la modélisation informatique des langages naturels.

ressource de calcul

Ressources matérielles et logicielles définies par un modèle d'environnement pour exécuter des actifs dans des outils.

matrice de confusion

Mesure de la performance qui détermine la précision entre les résultats positifs et négatifs prévus d'un modèle par rapport aux résultats positifs et négatifs réels.

actif de données connecté

Pointeur vers des données accessibles via une connexion à une source de données externe.

Actif de dossier connecté

Pointeur vers un dossier dans IBM Cloud Object Storage.

connexion

Informations nécessaires pour la connexion à une base de données. Les informations réelles requises varient en fonction du système de gestion de base de données et de la méthode de connexion.

actif de connexion

Actif contenant les informations qui permettent de se connecter à une source de données.

contrainte

  • Dans les bases de données, relation entre les tables.
  • Dans Decision Optimization, condition qui doit être remplie par la solution d'un problème.

apprentissage continu

Automatisation des tâches de surveillance de la performance d'un modèle, de ré-entraînement de celui-ci avec de nouvelles données et de redéploiement de celui-ci pour s'assurer de la qualité de ses prédictions.

réseau de neurones convolutionnel (CNN)

Classe de réseau de neurones couramment utilisée dans les tâches de vision par ordinateur qui utilise des couches convolutionnelles pour traiter des données d'image.

déploiement Core ML

Processus de téléchargement d'un déploiement au format Core ML pour son utilisation dans les applications iOS.

corpus

Collection de documents sources utilisés pour entraîner un modèle d'apprentissage automatique.

Modèle CPLEX

Modèle Decision Optimization formulé pour être résolu par le moteur CPLEX.

Modèle CPO

Modèle de programmation par contraintes formulé pour être résolu par le moteur Decision Optimization CP Optimizer (CPO).

validation croisée

Technique permettant de tester la qualité de la généralisation d'un modèle en l'absence d'un échantillon de test retenu. La validation croisée divise les données d'apprentissage en un certain nombre de sous-ensembles, puis génère le même nombre de modèles, chaque sous-ensemble étant maintenu à son tour. Chacun de ces modèles est testé sur l'échantillon restant, et la précision moyenne des modèles sur ces échantillons restants est utilisée pour estimer la précision du modèle lorsqu'il est appliqué à de nouvelles données.

organiser

Sélectionner, recueillir, conserver et tenir à jour les contenus relatifs à un sujet spécifique. L'organisation établit, gère et ajoute de la valeur aux données ; elle transforme les données en information fiable et en connaissances.

D

actif de données

Actif pointant sur des données, par exemple, un fichier ayant été remonté sur le serveur. Connexions et actifs de données connectés sont également considérés comme des actifs de données. Voir aussi actif.

Imputation de données

Substitution de valeurs manquantes dans un jeu de données par des valeurs estimées ou explicites.

lac de données

Référentiel de stockage de données à grande échelle qui stocke les données brutes dans n'importe quel format dans une architecture à plat. Les lacs de données contiennent des données structurées et non structurées ainsi que des données binaires à des fins de traitement et d'analyse.

lakehouse de données

Une architecture unifiée de stockage et de traitement des données qui combine la flexibilité d'un lac de données avec les requêtes structurées et les optimisations des performances d'un entrepôt de données, permettant une analyse de données évolutive et efficace pour les applications d'IA et d'analyse.

fouille de données

Processus permettant de collecter des informations métier stratégiques critiques à partir d'une source de données, de les mettre en corrélation et d'en déduire des associations, des modèles et des tendances. Voir aussi analyse prédictive.

Flux d'affinage des données

Ensemble d'étapes qui nettoient et façonnent les données pour produire un nouvel actif de données.

science des données

Analyse et visualisation de données structurées et non structurées dans le but de découvrir des points de vue et des connaissances.

jeu de données

Collection de données, habituellement sous la forme de lignes (enregistrements) et de colonnes (champs), contenue dans un fichier ou une table de base de données.

source de données

Un référentiel, une file d'attente ou un flux pour la lecture de données, par exemple une base de données.

table de données

Collection de données, habituellement sous la forme de lignes (enregistrements) et de colonnes (champs), contenue dans une table.

entrepôt de données

Un grand référentiel centralisé de données collectées à partir de diverses sources qui est utilisé pour la génération de rapports et l'analyse de données. Il stocke principalement des données structurées et semi-structurées, ce qui permet aux entreprises de prendre des décisions éclairées.

langage de définition de données

Voir apprentissage en profondeur distribué.

limite de décision

Division de points de données dans un espace en groupes ou classifications distincts.

modèle de décodeur uniquement

Modèle qui génère un texte de sortie mot par mot par inférence à partir de la séquence d'entrée. Les modèles de décodeur uniquement sont utilisés pour des tâches telles que la génération de texte et la réponse à des questions.

apprentissage en profondeur

Modèle de calcul qui utilise plusieurs couches de noeuds interconnectés, organisées en couches hiérarchiques, pour transformer les données d'entrée (première couche) à travers une série de calculs pour produire une sortie (couche finale). L'apprentissage profond est inspiré par la structure et la fonction du cerveau humain. Voir aussi apprentissage en profondeur distribué.

réseau de neurones profond

Un réseau de neurones avec plusieurs couches masquées, permettant des représentations plus complexes des données.

raisonnement profond

Une classe d'apprentissage automatique dans laquelle les systèmes génèrent des informations à partir des données pour soutenir les tâches cognitives au-delà de la perception et de la classification, telles que le bon sens, l'évolution des situations, la planification et la prise de décision.

déploiement

Package de modèle ou d'application prêt à servir.

espace de déploiement

Espace de travail dans lequel les modèles sont déployés et les déploiements sont gérés.

déterministes

Décrit une caractéristique des systèmes de calcul lorsque leurs sorties sont complètement déterminées par leurs entrées.

IA discriminante

Classe d'algorithme qui se concentre sur la recherche d'une limite qui sépare les différentes classes dans les données.

apprentissage en profondeur distribué (DDL)

Une approche de la formation d'apprentissage en profondeur qui tire parti des méthodes de calcul distribué. Dans un environnement DDL, la charge de travail de calcul est répartie entre l'unité de traitement centrale et l'unité de traitement graphique. Voir aussi apprentissage en profondeur.

DOcplex

Une API Python pour la modélisation et la résolution de problèmes Decision Optimization .

E

incorporation

Représentation numérique d'une unité d'information, telle qu'un mot ou une phrase, en tant que vecteur de nombres à valeurs réelles. Les incorporations sont des représentations apprises et de faible dimension de données de dimension supérieure. Voir aussi codage, représentation.

émergence

Propriété des modèles de base dans laquelle le modèle présente des comportements qui n'ont pas été explicitement entraînés.

comportement émergent

Comportement d'un foundation model qui n'a pas été explicitement construit.

modèle encodeur-décodeur

Modèle permettant de comprendre le texte d'entrée et de générer du texte de sortie en fonction du texte d'entrée. Les modèles codeur-décodeur sont utilisés pour des tâches telles que la synthèse ou la traduction.

modèle d'encodeur uniquement

Modèle qui comprend le texte d'entrée au niveau de la phrase en transformant les séquences d'entrée en vecteurs de représentation appelés incorporations. Les modèles d'encodeur uniquement sont utilisés pour des tâches telles que la classification des commentaires des clients et l'extraction d'informations à partir de documents volumineux.

codage

Représentation d'une unité d'information, telle qu'un caractère ou un mot, sous la forme d'un ensemble de nombres. Voir aussi incorporation, codage positionnel.

URL de point d'extrémité

Adresse de destination réseau qui identifie des ressources telles que des services et des objets. Par exemple, une URL de point d'extrémité est utilisée pour identifier l'emplacement d'un déploiement de modèle ou de fonction lorsque l'utilisateur envoie des données utiles à ce déploiement.

environnement

Ressources de calcul pour les travaux en cours d'exécution.

environnement d'exécution

Une instanciation du modèle d'environnement pour exécuter les actifs.

canevas d'environnement

Définition qui spécifie les ressources matérielles et logicielles nécessaires à l'instanciation d'un environnement d'exécution (runtime).

fonction exogène

Fonction qui peut influencer le modèle prédictif mais qui ne peut pas être influencée en retour. Par exemple, les températures peuvent affecter les ventes de crème glacée prévues, mais les ventes de crème glacée ne peuvent pas influencer les températures.

expérimentation

Processus d'entraînement de modèle qui prend en compte une série de définitions et de paramètres d'entraînement pour déterminer la configuration de modèle la plus précise.

explicabilité

  • Capacité des utilisateurs humains à suivre, vérifier et comprendre les prévisions émises par des applications qui utilisent des systèmes d'intelligence artificielle.
  • Capacité d'un système d'IA à fournir des connaissances que les humains peuvent utiliser pour comprendre les causes des prédictions du système.

F

équité

Dans un système d'IA, le traitement équitable des individus ou des groupes d'individus. Le choix d'une notion spécifique d'équité pour un système d'IA dépend du contexte dans lequel il est utilisé. Voir aussi biais.

fonction

Propriété ou caractéristique d'un élément dans un jeu de données, par exemple, une colonne dans une feuille de calcul. Dans certains cas, les fonctions sont conçues comme des combinaisons d'autres fonctions de l'ensemble de données.

Ingénierie des fonctions

Processus de sélection, de transformation et de création de nouvelles fonctions à partir de données brutes pour améliorer les performances et le pouvoir prédictif des modèles d'apprentissage automatique.

Groupe de fonctions

Ensemble de colonnes d'un actif de données particulier avec les métadonnées utilisées pour l'apprentissage automatique.

sélection de fonction

Identification des colonnes de données qui prennent le mieux en charge une prévision ou un score précis dans un modèle d'apprentissage automatique.

magasin de fonctions

Référentiel ou système centralisé qui gère et organise les fonctions, offrant un moyen évolutif et efficace de stocker, d'extraire et de partager des données de fonction entre les pipelines et les applications d'apprentissage automatique.

transformation des fonctions

Dans AutoAI, phase de la création de pipeline qui applique des algorithmes pour transformer et optimiser les données d'entraînement en vue d'obtenir le meilleur résultat compte tenu du type de modèle.

apprentissage fédéré

Entraînement d'un modèle d'apprentissage automatique commun qui utilise plusieurs sources de données qui ne sont pas déplacées, jointes ou partagées. Il en résulte un modèle mieux entraîné sans que la sécurité des données soit compromise.

invite de quelques tirs

Technique d'invite dans laquelle un petit nombre d'exemples sont fournis au modèle pour montrer comment effectuer la tâche.

Réglage fin

Processus consistant à adapter un modèle pré-formé pour effectuer une tâche spécifique en effectuant une formation supplémentaire. L'ajustement fin peut impliquer (1) la mise à jour des paramètres existants du modèle, appelé ajustement fin complet, ou (2) la mise à jour d'un sous-ensemble des paramètres existants du modèle ou l'ajout de nouveaux paramètres au modèle et leur apprentissage tout en gelant les paramètres existants du modèle, appelé ajustement fin efficace des paramètres.

flux

Collection de noeuds qui définissent un ensemble d'étapes pour le traitement des données ou l'entraînement d'un modèle.

foundation model

Un modèle d'IA qui peut être adapté à un large éventail de tâches en aval. Les modèles de base sont généralement des modèles génératifs à grande échelle qui sont entraînés sur des données non étiquetées à l'aide de l'autosupervision. En tant que modèles à grande échelle, les modèles de base peuvent inclure des milliards de paramètres.

G

diagramme de Gantt

Représentation graphique de la chronologie (ligne de temps) et de la durée d'un projet, dans laquelle les données de l'emploi du temps sont figurées par des barres horizontales le long d'une échelle de temps.

IA générative

Voir IA générative.

IA générative (IA de génération)

Classe d'algorithmes d'IA pouvant produire divers types de contenu, notamment du texte, du code source, des images, des données audio et synthétiques.

variabilité générative

La caractéristique des modèles génératifs pour produire des sorties variées, même lorsque l'entrée du modèle est maintenue constante. Voir aussi probabiliste.

Processeur graphique (GPU)

Voir unité de traitement graphique.

générateur graphique

Outil permettant de créer des actifs de flux par codage visuel. Un canevas est une aire sur laquelle on place des objets ou des noeuds que l'on connecte pour créer un flux.

Unité de traitement graphique (GPU)

Processeur spécialisé conçu pour manipuler et modifier rapidement la mémoire afin d'accélérer la création d'images dans un tampon de trame destiné à la sortie vers un affichage. Les GPU sont fortement utilisés dans l'apprentissage automatique en raison de leurs capacités de traitement parallèle. Voir aussi accélérateur.

mise à la terre

Fournir un modèle de langue de grande taille avec des informations pour améliorer la précision des résultats.

H

Libre

Une réponse d'un foundation model qui comprend un contenu hors sujet, répétitif, incorrect ou fabriqué. Des hallucinations impliquant la fabrication de détails peuvent se produire lorsqu'un modèle est invité à générer du texte, mais que le modèle n'a pas assez de texte associé pour générer un résultat contenant les détails corrects.

Détection de type HAP (détection de type HAP)

  • La possibilité de détecter et de filtrer la haine, les abus et les grossièretés dans les deux invites soumises par les utilisateurs et dans les réponses générées par un modèle d'IA.

Détecteur HAP (détecteur HAP)

  • Un classificateur de phrases qui supprime les contenus potentiellement nuisibles, tels que les discours haineux, les abus et les blasphèmes, de la sortie et de l'entrée du foundation model.

ensemble d'attente

Ensemble de données étiquetées qui sont volontairement exclues des ensembles d'apprentissage et de validation, servant d'évaluation non biaisée des performances du modèle final sur les données invisibles.

homogénéisation

La tendance dans la recherche sur l'apprentissage automatique dans laquelle un petit nombre d'architectures de réseaux de neurones profonds, comme le transformateur, obtiennent des résultats à la pointe de la technologie sur une grande variété de tâches.

option HPO

Voir optimisation d'hyperparamètres.

surveillance humaine

Participation humaine à l'examen des décisions rendues par un système d'IA, permettant l'autonomie humaine et la responsabilité de la décision.

hyperparamètre

En apprentissage automatique, paramètre dont la valeur est fixée avant l'entraînement du modèle afin d'accroître la justesse de celui-ci.

optimisation des hyperparamètres (HPO)

Processus consistant à régler les hyperparamètres aux valeurs qui fournissent le modèle le plus juste.

I

image

Package logiciel contenant un ensemble de bibliothèques.

Apprentissage incrémentiel

Processus d'entraînement d'un modèle à l'aide de données continuellement mises à jour sans oublier les données obtenues à partir des tâches précédentes. Cette technique est utilisée pour entraîner un modèle avec des lots de données provenant d'une grande source de données d'apprentissage.

inférence

Processus d'exécution de données en temps réel via un modèle d'IA entraîné pour effectuer une prévision ou résoudre une tâche.

verser

  • Ajouter continuellement un gros volume de données temps réel dans une base de données.
  • Pour introduire des données dans un système dans le but de créer une base de connaissances.

analyse

Une compréhension précise ou approfondie de quelque chose. Les connaissances sont dérivées à l'aide de l'analyse cognitive pour fournir des instantanés et des prévisions à jour des comportements et des attitudes des clients.

intelligence artificielle intelligente

Des systèmes d'intelligence artificielle qui peuvent comprendre, apprendre, s'adapter et mettre en œuvre des connaissances, démontrant des capacités telles que la prise de décision, la résolution de problèmes et la compréhension de concepts complexes, tout comme l'intelligence humaine.

intention

Objectif exprimé par l'entrée du client dans un agent conversationnel, tel que la réponse à une question ou le traitement d'un paiement de facture.

J

travail

Unité de travail exécutable séparément.

K

base de connaissances

Voir corpus.

L

libellé

Une classe ou une catégorie affectée à un point de données dans l' learning.Labels peuvent être dérivés des données mais sont souvent appliqués par des étiqueteurs ou des annotateurs humains.

données étiquetées

Données brutes auxquelles des libellés sont affectés pour ajouter un contexte ou une signification afin qu'elles puissent être utilisées pour entraîner des modèles d'apprentissage automatique. Par exemple, les valeurs numériques peuvent être libellées sous forme de codes postaux ou d'âges afin de fournir un contexte pour les entrées et les sorties de modèle.

modèle de langage de grande taille (LLM)

Modèle de langue avec un grand nombre de paramètres, entraîné sur une grande quantité de texte.

espace latent

Espace mathématique à n dimensions dans lequel les instances de données sont imbriquées. Un espace latent bidimensionnel incorpore des données en tant que points dans un plan 2D (voir aussi: espace de représentation). Voir aussi espace de représentation.

Grand modèle de langage

Voir modèle de langue de grande taille.

M

apprentissage automatique (ML)

Une branche de l'intelligence artificielle (IA) et de l'informatique qui se concentre sur l'utilisation de données et d'algorithmes pour imiter la façon dont les humains apprennent, améliorant progressivement la précision des modèles d'IA.

infrastructure d'apprentissage automatique

Bibliothèques et environnement d'exécution (runtime) utilisés pour l'entraînement et le déploiement d'un modèle.

modèle d'apprentissage automatique

Un modèle d'IA qui est entraîné sur un ensemble de données pour développer des algorithmes qu'il peut utiliser pour analyser et apprendre à partir de nouvelles données.

modèle mental

Compréhension par un individu de la façon dont un système fonctionne et de la façon dont ses actions affectent les résultats du système. Lorsque ces attentes ne correspondent pas aux capacités réelles d'un système, elles peuvent entraîner de la frustration, de l'abandon ou une mauvaise utilisation.

défaut d'alignement

Différence entre les objectifs ou les comportements qu'un système d'IA est optimisé pour atteindre et les objectifs réels, souvent complexes, de ses utilisateurs ou concepteurs humains

apprentissage automatique

Voir apprentissage automatique.

MLOps

  • Méthodologie qui utilise un modèle d'apprentissage automatique du développement à la production.
  • La pratique de la collaboration entre les spécialistes des données et les professionnels des opérations pour aider à gérer le cycle de vie de l'apprentissage automatique de la production (ou apprentissage en profondeur). MLOps cherche à accroître l'automatisation et à améliorer la qualité du ML de production tout en se concentrant sur les exigences métier et réglementaires. Il implique le développement de modèles, la formation, la validation, le déploiement, la surveillance et la gestion et utilise des méthodes telles que CI/CD.

modèle

  • Dans un contexte d'apprentissage automatique, ensemble de fonctions et d'algorithmes ayant été entraînés et testés sur un jeu de données pour fournir des prédictions ou des décisions.
  • Dans Decision Optimization, formulation mathématique d'un problème qui peut être résolue avec les moteurs d'optimisation de CPLEX en utilisant différents jeux de données.

ModelOps

Méthodologie de gestion du cycle de vie complet d'un modèle d'IA, y compris l'entraînement, le déploiement, le scoring, l'évaluation, le ré-entraînement et la mise à jour.

Groupe surveillé

Classe de données surveillée pour déterminer si les résultats d'un modèle prédictif diffèrent de manière significative des résultats du groupe de référence. Les groupes sont couramment surveillés en fonction de caractéristiques qui incluent la race, le sexe ou l'âge.

modèle de classification multiclasse

Tâche de classification comportant plus de deux classes. Par exemple, lorsqu'un modèle de classification binaire prévoit des valeurs oui ou non, un modèle multi-classe prévoit des valeurs oui, non, peut-être ou non applicables.

modèle multimodal

Modèle d'IA générative qui peut traiter plusieurs types de données, tels que du texte, des images et de l'audio, et les convertir entre eux. Par exemple, un modèle multimodal peut prendre une entrée de texte et générer une sortie d'image.

séries temporelles multivariées

Expérimentation de séries temporelles contenant au moins deux variables de modification. Par exemple, un modèle de série temporelle prévoyant la consommation d'électricité de trois clients.

N

traitement automatique du langage naturel (NLP)

Branche de l'intelligence artificielle et de la linguistique qui étudie les problèmes inhérents au traitement et à la manipulation du langage naturel dans le but d'accroître la capacité des ordinateurs à comprendre les langues humaines.

bibliothèque de traitement automatique du langage naturel

Bibliothèque qui fournit des fonctions de traitement du langage naturel de base pour l'analyse de la syntaxe et des modèles pré-entraînés prêts à l'emploi pour une grande variété de tâches de traitement de texte.

réseau de neurones

Modèle mathématique permettant de prédire ou de classer des observations en utilisant un schéma mathématique complexe qui simule une version abstraite des cellules du cerveau. Pour entraîner un réseau de neurones, on lui présente, un par un, un grand nombre de cas observés. Le réseau se met à jour de manière répétée jusqu'à ce qu'il apprenne la tâche.

traitement automatique du langage naturel

Voir traitement automatique du langage naturel.

noeud

Dans un flux SPSS Modeler , représentation graphique d'une opération de données.

bloc-notes

Document interactif contenant un code exécutable, une description texte de ce code et le résultat de son exécution.

noyau du bloc-notes

Partie de l'éditeur de bloc-notes qui exécute le code et renvoie les résultats de calcul.

O

stockage d"objets

Méthode de stockage de données généralement employée dans le cloud, avec laquelle les données sont stockées en tant qu'unités discrètes, ou objets, dans un pool de stockage ou un référentiel qui n'utilise pas de hiérarchie de fichiers mais qui stocke tous les objets au même niveau.

apprentissage unique

Un modèle d'apprentissage en profondeur qui repose sur la prémisse que la plupart des apprentissages humains ont lieu lorsqu'on ne reçoit qu'un ou deux exemples. Ce modèle est similaire à l'apprentissage non supervisé.

invite à une seule prise

Technique d'invite dans laquelle un seul exemple est fourni au modèle pour montrer comment effectuer la tâche.

déploiement en ligne

Méthode d'accès à un modèle ou à un déploiement de code Python via un noeud final d'API en tant que service Web pour générer des prévisions en ligne, en temps réel.

ontologie

Spécification formelle explicite de la représentation des objets, concepts et autres entités pouvant exister dans un domaine d'intérêt particulier, ainsi que des relations entre ces éléments.

actif opérationnel

Actif qui exécute du code dans un outil ou un travail.

optimisation

Le processus consistant à trouver la solution la plus appropriée à un problème défini avec précision tout en respectant les contraintes et les limitations imposées. Par exemple, déterminer comment allouer des ressources ou trouver les meilleurs éléments ou combinaisons à partir d'un grand nombre d'alternatives.

Langage de programmation d'optimisation

Langage de modélisation utilisé pour exprimer la formulation du modèle des problèmes d'optimisation dans un format qui puisse être résolu par les moteurs d'optimisation de CPLEX, tels qu'IBM CPLEX.

Métrique optimisée

Mesure utilisée pour mesurer les performances du modèle. Par exemple, la précision est l'indicateur type utilisé pour mesurer les performances d'un modèle de classification binaire.

orchestration

Processus de création d'un flux de bout en bout qui peut entraîner, exécuter, déployer, tester et évaluer un modèle d'apprentissage automatique et utiliser l'automatisation pour coordonner le système, souvent à l'aide de microservices.

dépendance excessive

Acceptation par un utilisateur d'une recommandation incorrecte faite par un modèle d'IA. Voir aussi dépendance, sous-dépendance.

P

paramètre

  • Partie configurable du modèle qui est interne à un modèle et dont les valeurs sont estimées ou apprises à partir de données. Les paramètres sont des aspects du modèle qui sont ajustés au cours du processus d'apprentissage pour aider le modèle à prévoir avec précision la sortie. Les performances et le pouvoir prédictif du modèle dépendent en grande partie des valeurs de ces paramètres.
  • Pondération à valeur réelle entre 0.0 et 1.0 indiquant la force de la connexion entre deux neurones dans un réseau de neurones.

correspondant

Dans l'apprentissage fédéré, entité qui fournit des données pour l'entraînement d'un modèle commun. Les données ne sont pas déplacées ni combinées, mais chaque partie bénéficie de l'entraînement fédéré.

contenu

Données transmises à un déploiement pour obtenir un score, une prévision ou une solution.

journalisation du contenu

Capture des données utiles et de la sortie de déploiement afin de surveiller l'état de santé en cours de l'intelligence artificielle dans des applications métier.

pipeline

  • Dans Watson Pipelines, un flux d'actifs de bout en bout, de la création au déploiement.
  • Dans l'AutoAI, un modèle candidat.

tableau de classement de pipeline

Dans l'AutoAI, un tableau qui montre la liste des modèles candidats générés automatiquement, sous forme de pipelines, classés selon les critères spécifiés.

Règle

Stratégie ou règle suivie par un agent pour déterminer l'action suivante en fonction de l'état en cours.

codage positionnel

Codage d'une séquence ordonnée de données qui inclut des informations de position, telles que le codage de mots dans une phrase qui inclut la position de chaque mot dans la phrase. Voir aussi codage.

analyse prédictive

Processus métier et ensemble de technologies associées qui s'intéressent à la prédiction des possibilités et des tendances futures. L'analyse prédictive applique des disciplines aussi diverses que la probabilité, les statistiques, l'apprentissage automatique et l'intelligence artificielle à des problèmes métier afin de trouver la meilleure action pour une situation spécifique. Voir aussi exploration de données.

modèle préentraîné

Modèle d'IA précédemment entraîné sur un ensemble de données volumineux pour accomplir une tâche spécifique. Les modèles préentraînés sont utilisés au lieu de générer un modèle à partir de zéro.

pré-entraînement

Processus d'entraînement d'un modèle d'apprentissage automatique sur un jeu de données volumineux avant de l'optimiser pour une tâche spécifique.

confidentialité

Assurance que les informations concernant une personne sont protégées contre tout accès non autorisé et toute utilisation inappropriée.

Probabiliste

La caractéristique d'être sujet au hasard ; non déterministe. Les modèles probabilistes ne produisent pas les mêmes sorties avec les mêmes entrées. Voir aussi variabilité générative.

projet

Espace de travail collaboratif permettant de travailler avec des données et d'autres actifs.

invite

  • Données, telles qu'un texte ou une image, qui préparent, instruisent ou conditionnent la sortie d'un foundation model.
  • Composant d'une action qui indique que l'utilisateur doit renseigner une zone avant de pouvoir passer avant d'effectuer la transition vers un écran de sortie.

Ingénierie des invites

Le processus de conception du langage naturel demande à un modèle de langue d'effectuer une tâche spécifique.

invites

Le processus consistant à fournir des données d'entrée à un foundation model pour l'amener à produire des données de sortie.

Optimisation des invites

Méthode efficace et peu coûteuse d'adaptation d'un modèle pré-formé à de nouvelles tâches sans réapprentissage du modèle ou mise à jour de ses pondérations. L'ajustement d'invite implique l'apprentissage d'un petit nombre de nouveaux paramètres qui sont ajoutés à l'invite d'un modèle, tout en gelant les paramètres existants du modèle.

élagage

Processus de simplification, de réduction ou de suppression d'un arbre de décision ou d'un réseau de neurones. Pour ce faire, vous supprimez les noeuds ou les couches les moins importants, ce qui réduit la complexité afin d'éviter le surajustement et d'améliorer la généralisation du modèle tout en conservant son pouvoir prédictif.

Python

Langage de programmation utilisé en science des données et en intelligence artificielle.

Fonction Python

Fonction qui contient du code Python pour prendre en charge un modèle en production.

Q

quantification

Méthode de compression des poids des foundation model pour accélérer l'inférence et réduire les besoins en mémoire du GPU.

R

R

Langage de script extensible utilisé dans la science des données et l'intelligence artificielle qui offre une grande variété de fonctions et de techniques analytiques, statistiques et graphiques.

RAG

Voir récupération de la génération augmentée.

valeur de départ aléatoire

Nombre utilisé pour initialiser un générateur de nombres pseudo-aléatoires. Les valeurs de départ aléatoires permettent la reproductibilité pour les processus qui reposent sur la génération de nombres aléatoires.

groupe de référence

Groupe identifié comme étant le plus susceptible de recevoir un résultat positif dans un modèle prédictif. Les résultats peuvent être comparés à ceux d'un groupe surveillé afin de déceler un biais potentiel dans les résultats.

affiner

Nettoyer et former les données.

modèle de régression

Modèle qui relie une variable dépendante à une ou plusieurs variables indépendantes.

apprentissage par renforcement

Technique d'apprentissage automatique dans laquelle un agent apprend à prendre des décisions séquentielles dans un environnement afin de maximiser un signal de récompense. Inspirés par l'apprentissage des essais et des erreurs, les agents interagissent avec l'environnement, reçoivent des commentaires en retour et adaptent leurs actions pour atteindre des politiques optimales.

renforcement de l'apprentissage sur la rétroaction humaine (RLHF)

Méthode d'alignement des réponses d'un modèle d'apprentissage des langues aux instructions données dans une invite. RLHF requiert que les annotateurs humains classent plusieurs sorties du modèle. Ces classements sont ensuite utilisés pour entraîner un modèle de récompense à l'aide de l'apprentissage par renforcement. Le modèle de récompense est ensuite utilisé pour affiner la sortie du modèle de langue de grande taille.

confiance

Dans les systèmes d'IA, acceptation par un utilisateur d'une recommandation faite par un modèle d'IA ou de la sortie générée par ce modèle. Voir aussi dépendance excessive, dépendance insuffisante.

représentation

Codage d'une unité d'information, souvent comme vecteur de nombres à valeurs réelles. Voir aussi imbrication.

espace de représentation

Espace mathématique à n dimensions dans lequel les instances de données sont imbriquées. Un espace latent à deux dimensions intègre des données en tant que points dans un plan 2D (voir aussi: espace latent). Voir aussi espace latent.

Nouveau classement

Processus d'IA générative permettant de classer un ensemble de passages de documents du plus au moins susceptible de répondre à une requête donnée.

récupération de génération augmentée (RAG)

Technique dans laquelle un modèle de langue de grande taille est augmenté avec des connaissances provenant de sources externes pour générer du texte. Dans l'étape d'extraction, les documents pertinents d'une source externe sont identifiés à partir de la requête de l'utilisateur. Dans l'étape de génération, des parties de ces documents sont incluses dans l'invite LLM pour générer une réponse basée sur les documents extraits.

récompense

Signal utilisé pour guider un agent, typiquement un agent d'apprentissage de renforcement, qui fournit une rétroaction sur la qualité d'une décision

RLHF

Voir renforcement de l'apprentissage sur les commentaires humains.

environnement d'exécution

Configuration matérielle et logicielle prédéfinie ou personnalisée utilisée pour exécuter des outils ou des travaux, tels que des blocs-notes.

S

évaluation

  • En apprentissage automatique, procédé de mesure de la confiance d'un résultat prédit.
  • Processus de calcul du degré de concordance entre les attributs d'une entité entrante et ceux d'une entité existante.

script

Fichier contenant des scripts Python ou R pour la prise en charge d'un modèle en production.

Auto-attention

Mécanisme d'attention qui utilise les informations des données d'entrée elles-mêmes pour déterminer les parties de l'entrée sur lesquelles se concentrer lors de la génération de la sortie.

apprentissage auto-supervisé

Méthode d'apprentissage automatique dans laquelle un modèle apprend à partir de données non étiquetées en masquant des jetons dans une séquence d'entrée, puis en essayant de les prévoir. Un exemple est "J'aime les choux de ________".

analyse des sentiments

Examen du sentiment ou de l'émotion exprimés dans le texte, par exemple pour déterminer si une critique de film est positive ou négative.

forme

Personnaliser des données en les filtrant, les triant ou en en retirant des colonnes ; en joignant des tables, en exécutant des opérations incluant des calculs, des groupements de données, des hiérarchies, etc.

minidonnées

Données accessibles et compréhensibles par les humains. Voir aussi données structurées.

conversion SQL

Dans SPSS Modeler, procédé consistant à exécuter de nombreuses opérations de préparation et d'exploration des données directement dans la base de données au moyen de code SQL.

données structurées

Données se trouvant dans des champs fixes d'un enregistrement ou d'un fichier. Les bases de données relationnelles et les feuilles de calcul sont des exemples de données structurées. Voir aussi données non structurées, données de petite taille.

information structurée

Eléments stockés dans des ressources structurées, telles que des index de moteur de recherche, des bases de données ou des bases de connaissances.

apprentissage supervisé

Méthode d'apprentissage automatique dans laquelle un modèle est entraîné sur un jeu de données étiqueté pour faire des prévisions sur de nouvelles données.

T

température

Paramètre dans un modèle génératif qui spécifie la quantité de variation dans le processus de génération. Des températures plus élevées entraînent une plus grande variabilité de la sortie du modèle.

classification de texte

Modèle qui identifie et classifie automatiquement le texte dans des catégories spécifiées.

extraction de texte

Méthode générative d'IA permettant de convertir des informations très structurées en un format textuel plus simple destiné à être utilisé comme entrée dans de grands modèles de langage.

série temporelle

Ensemble de valeurs d'une variable à des points périodiques dans le temps.

Modèle de série temporelle

Modèle qui suit et prédit les données dans le temps.

jeton

Unité discrète de signification ou d'analyse dans un texte, tel qu'un mot ou un sous-mot.

tokenisation

Processus utilisé dans le traitement du langage naturel pour fractionner une chaîne de texte en unités plus petites, telles que des mots ou des sous-mots.

modèle entraîné

Modèle entraîné avec des données réelles et prêt à être déployé pour prévoir les résultats lorsqu'il est présenté avec de nouvelles données.

entraînement

Phase initiale de la construction de modèle dans laquelle un sous-ensemble des données source est impliqué. Le modèle apprend par exemple à partir des données connues. Le modèle peut être testé avec un autre sous-ensemble de données pour lequel l'issue est déjà connue.

données d'apprentissage

Une collection de données utilisée pour former des modèles d'apprentissage automatique.

ensemble d’apprentissage

Ensemble de données étiquetées utilisé pour entraîner un modèle d'apprentissage automatique en l'exposant à des exemples et à leurs libellés correspondants, ce qui permet au modèle d'apprendre des motifs et d'effectuer des prévisions.

apprentissage par transposition

Stratégie d'apprentissage automatique dans laquelle un modèle entraîné est appliqué à un problème complètement nouveau.

transformateur

Architecture de réseau de neurones qui utilise des codages positionnels et le mécanisme d'auto-attention pour prédire le jeton suivant dans une séquence de jetons.

transparence

Partage de l'information appropriée avec les parties prenantes sur la façon dont un système d'IA a été conçu et développé. Des exemples de cette information sont les données recueillies, la façon dont elles seront utilisées et stockées, et les personnes qui y ont accès ; et les résultats des tests de précision, de robustesse et de biais.

calibrage de confiance

Processus d'évaluation et d'ajustement de la confiance dans un système d'IA en fonction de facteurs tels que son exactitude, sa fiabilité et sa crédibilité.

Test de Turing

Proposé par Alan Turing en 1950, un test de la capacité d'une machine à montrer un comportement intelligent équivalent ou indiscernable de celui d'un humain.

U

sous-utilisation

Rejet par un utilisateur d'une recommandation correcte faite par un modèle d'IA. Voir aussi dépendance excessive, dépendance.

série temporelle univariée

Expérimentation de séries temporelles ne contenant qu'une seule variable de changement. Par exemple, un modèle de séries temporelles prévoyant la température comporte une seule colonne de prévision de la température.

données non structurées

Données enregistrées dans un format non structuré plutôt que dans des champs fixés à l'avance. Exemple : les données contenues dans un document de traitement de texte. Voir aussi données structurées.

information non structurée

Données qui ne sont pas contenues dans un emplacement fixe, tel que le document texte en langage naturel.

apprentissage non supervisé

  • Modèle de deep learning autorisant l'emploi de données brutes non libellées pour entraîner un système avec peu ou pas du tout d'intervention humaine.
  • Méthode d'apprentissage automatique dans laquelle un modèle n'est pas fourni avec des données étiquetées et doit rechercher des motifs ou une structure dans les données de manière autonome.

V

Ensemble de validation

Ensemble distinct de données étiquetées qui est utilisé pour évaluer les performances et la capacité de généralisation d'un modèle d'apprentissage automatique au cours du processus d'apprentissage, en aidant à l'ajustement des hyperparamètres et à la sélection des modèles.

vecteur

Liste tridimensionnelle de nombres, telle que [ 1, 2, 5 ] ou [0.7, 0.2, -1.0].

Base de données vectorielle

Voir magasin de vecteurs.

Index de vecteur

Index qui extrait les incorporations vectorielles de documents à partir d'un magasin de vecteurs.

Magasin de vecteurs

Référentiel qui stocke les incorporations vectorielles de documents.

verbaliseur

Dans l'IA générative, modèle permettant de formater les données lors de l'optimisation et de l'inférence.

agent virtuel

Un bot de discussion préformé qui peut traiter le langage naturel pour répondre et effectuer des transactions métier simples, ou acheminer des demandes plus compliquées à un utilisateur disposant d'une expertise en la matière.

des données

Graphe, diagramme, graphique, tracé, courbe, tableau, carte ou toute autre forme de représentation visuelle de données.

W

poids

Coefficient d'un noeud qui transforme les données d'entrée dans la couche du réseau. La pondération est un paramètre qu'un modèle d'IA apprend par l'entraînement, en ajustant sa valeur pour réduire les erreurs dans les prévisions du modèle.

Z

invite zéro-shot

Technique d'invite dans laquelle le modèle exécute une tâche sans recevoir d'exemple spécifique de la manière dont elle est exécutée.

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus