0 / 0
Retourner à la version anglaise de la documentation
Glossaire
Dernière mise à jour : 11 déc. 2024
Glossaire

Ce glossaire fournit des termes et des définitions pour Cloud Pak for Data as a Service.

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W

A

raccourci clavier

Dans l'informatique de haute performance, un circuit spécialisé qui est utilisé pour prendre une partie de la charge de calcul de l'unité centrale, augmentant ainsi l'efficacité du système. Par exemple, dans le domaine de l'apprentissage profond, l'informatique accélérée par le GPU est souvent utilisée pour décharger une partie de la charge de travail de calcul sur un GPU tandis que l'application principale fonctionne sur le CPU. Voir aussi unité de traitement graphique.

responsabilité

L'attente que les organisations ou les personnes assurent le bon fonctionnement, tout au long de leur cycle de vie, des systèmes d'IA qu'elles conçoivent, développent, exploitent ou déploient, conformément à leurs rôles et aux cadres réglementaires applicables. Il s'agit notamment de déterminer qui est responsable d'une erreur d'IA, ce qui peut exiger des experts juridiques qu'ils déterminent la responsabilité au cas par cas.

fonction d'activation

Fonction définissant la sortie d'une unité neuronale en fonction d'un ensemble d'activations entrantes provenant d'autres neurones

apprentissage actif

Modèle d'apprentissage automatique dans lequel le système demande davantage de données étiquetées uniquement lorsqu'il en a besoin.

métadonnées actives

Métadonnées qui sont automatiquement mises à jour en fonction de l'analyse par les processus d'apprentissage automatique. Par exemple, le profilage et l'analyse de la qualité des données mettent automatiquement à jour les métadonnées des actifs de données.

environnement d'exécution actif

Instance d'un environnement qui fonctionne pour fournir des ressources de calcul aux actifs qui exécutent du code.

Agent

Un algorithme ou un programme qui interagit avec un environnement pour apprendre des actions ou des décisions optimales, généralement en utilisant l'apprentissage par renforcement, afin d'atteindre un objectif spécifique.

IA

Voir intelligence artificielle.

Accélérateur d'IA

Matériel de silicium spécialisé conçu pour exécuter efficacement les tâches liées à l'IA telles que l'apprentissage profond, l'apprentissage automatique et les réseaux neuronaux pour un calcul plus rapide et économe en énergie. Il peut s'agir d'une unité dédiée dans un noyau, d'une puce séparée sur une puce multi-modules ou d'une carte séparée.

Éthique de l’IA

Domaine multidisciplinaire qui étudie comment optimiser l'impact bénéfique de l'IA tout en réduisant les risques et les résultats négatifs. Les exemples de problèmes d'éthique de l'IA sont la responsabilité et la confidentialité des données, l'équité, l'explicabilité, la robustesse, la transparence, la durabilité environnementale, l'inclusion, l'agence morale, l'alignement des valeurs, la responsabilité, la confiance et l'utilisation abusive de la technologie.

Gouvernance de l'IA

L'acte d'une organisation de gouverner, par le biais de ses instructions d'entreprise, le personnel, les processus et les systèmes pour diriger, évaluer, surveiller et prendre des mesures correctives tout au long du cycle de vie de l'IA, afin de fournir l'assurance que le système d'IA fonctionne comme l'organisation l'entend, comme les parties prenantes s'y attendent, et comme l'exige la réglementation pertinente.

Sécurité de l'intelligence artificielle

Le domaine de recherche visant à s'assurer que les systèmes d'intelligence artificielle fonctionnent de manière bénéfique pour l'humanité et ne causent pas de dommages par inadvertance, en abordant des questions telles que la fiabilité, l'équité, la transparence et l'alignement des systèmes d'intelligence artificielle sur les valeurs humaines.

Système d'intelligence artificielle

Voir système d'intelligence artificielle.

algorithme

Formule appliquée aux données pour déterminer les méthodes optimales de résolution des problèmes analytiques.

analytique

Science de l'étude des données visant à dégager des modèles pertinents dans les données et à tirer des conclusions basées sur ces modèles.

intelligence artificielle (IA)

La capacité d'acquérir, de traiter, de créer et d'appliquer des connaissances sous la forme d'un modèle pour faire des prédictions, des recommandations ou des décisions.

système d'intelligence artificielle (système d'intelligence artificielle)

Système qui peut faire des prévisions, des recommandations ou des décisions qui influencent des environnements physiques ou virtuels, et dont les résultats ou les comportements ne sont pas nécessairement prédéterminés par son développeur ou son utilisateur. Les systèmes d'IA sont généralement formés avec de grandes quantités de données structurées ou non structurées, et peuvent être conçus pour fonctionner avec des niveaux d'autonomie différents ou aucun, pour atteindre des objectifs définis par l'homme.

actif

Article d'un projet ou d'un catalogue contenant des métadonnées sur des données ou une analyse de données.

règle de composition des attributs

L'une des règles qui déterminent comment les valeurs des attributs d'une entité de données de base sont sélectionnées à partir de ses enregistrements membres. Voir aussi la règle.

expérimentation AutoAI

Processus d'entraînement automatisé dans lequel une série de définitions d'entraînement et de paramètres est considérée afin de créer un jeu de pipelines classés en tant que modèles candidats.

B

déploiement par lots

Méthode permettant de déployer des modèles qui traitent des données d'entrée à partir d'un fichier, d'une connexion de données ou de données connectées dans un compartiment de stockage, puis d'écrire la sortie dans une destination sélectionnée.

pondération

Erreur systématique dans un système d'IA qui a été conçu, intentionnellement ou non, de manière à générer des décisions injustes. Le biais peut être présent à la fois dans le système d'IA et dans les données utilisées pour l'entraîner et le tester. Le biais de l'IA peut apparaître dans un système d'IA en raison d'attentes culturelles, de limites techniques ou de contextes de déploiement imprévus. Voir aussi équité.

détection de biais

Processus de calcul de l'équité des mesures visant à détecter les cas où les modèles d'intelligence artificielle fournissent des résultats biaisés d'après certains attributs.

Atténuation des biais

Réduire les biais dans les modèles d'IA en conservant les données d'entraînement et en appliquant des techniques d'équité.

classification binaire

Modèle de classification avec deux classes. Les prédictions sont un choix binaire de l'une des deux classes.

terme métier

Mot ou syntagme définissant un concept métier d'une façon standard pour une entreprise ou un secteur. Des termes spécifiques peuvent être utilisés pour enrichir les métadonnées des actifs de données et définir les critères des règles de protection des données.

vocabulaire métier

Ensemble d'artefacts de gouvernance, tels que des termes métier et des classes de données, qui décrivent et enrichissent des actifs de données.

C

catalogue

Référentiel d'actifs à l'usage d'une organisation. Les actifs qu'il contient peuvent être gouvernés par des règles de protection des données et enrichis par d'autres artefacts de gouvernance tels que classifications, classes de données et termes du métier. Un catalogue peut stocker des données structurées et non structurées, des références à des données de sources externes et d'autres actifs analytiques tels que des modèles d'apprentissage automatique.

catégorie

Pour la gouvernance des données, un espace de travail collaboratif pour organiser et gérer les artefacts de gouvernance.

classification

Pour la gouvernance des données, un artefact de gouvernance qui décrit le niveau de sensibilité des données dans un actif de données.

nettoyer

Faire en sorte que toutes les valeurs d'un jeu de données soient cohérentes et correctement enregistrées.

collaborateur

Membre d'un groupe de personnes qui travaillent ensemble pour atteindre un objectif commun.

problème combinatoire

Problème difficile à résoudre du fait qu'il requiert plusieurs décisions impliquant de trop nombreuses combinaisons de choix possibles. Il peut s'agir, par exemple, de trouver un groupement, un ordre ou l'affectation d'objets.

ressource de traitement

Ressources matérielles et logicielles définies dans un environnement pour exécuter des actifs analytiques.

matrice de confusion

Mesure de la performance qui détermine la précision entre les résultats positifs et négatifs prévus d'un modèle par rapport aux résultats positifs et négatifs réels.

Données connectées

Ensemble de données accessible via une connexion à une source de données externe.

connexion

Informations nécessaires pour la connexion à une base de données. Les informations réelles requises varient en fonction du système de gestion de base de données et de la méthode de connexion.

contrainte

Dans Decision Optimization, condition qui doit être remplie par la solution d'un problème.

apprentissage continu

Automatisation des tâches de surveillance de la performance d'un modèle, de ré-entraînement de celui-ci avec de nouvelles données et de redéploiement de celui-ci pour s'assurer de la qualité de ses prédictions.

déploiement Core ML

Processus de téléchargement d'un déploiement au format Core ML pour son utilisation dans les applications iOS.

corpus

Collection de documents sources utilisés pour entraîner un modèle d'apprentissage automatique.

Modèle CPLEX

Un modèle d'Decision Optimization formulé pour être résolu par le moteur CPLEX.

Modèle CPO

Un modèle de programmation par contraintes qui est formulé pour être résolu par le moteur Decision Optimization CP Optimizer (CPO).

organiser

  • Sélectionner, recueillir, conserver et tenir à jour les contenus relatifs à un sujet spécifique. L'organisation établit, gère et ajoute de la valeur aux données ; elle transforme les données en information fiable et en connaissances.
  • Créer un actif de données et le préparer en vue de sa publication dans un catalogue. La curation peut impliquer d'enrichir l'actif de données en lui affectant des artefacts de gouvernance tels que des termes du métier, une classification et des classes de données, et d'analyser la qualité des données qu'il contient.

D

actif de données

Actif pointant sur des données, par exemple, un fichier ayant été remonté sur le serveur. Connexions et actifs de données connectés sont également considérés comme des actifs de données.

classe de données

Artefact de gouvernance servant à catégoriser les colonnes dans les jeux de données relationnelles en fonction du type des données et de la manière dont elles sont utilisées.

gouvernance des données

Le processus de suivi et de contrôle des données afin de maintenir la qualité des données, la sécurité des données et la conformité.

intégration de données

Combinaison de processus techniques et métier utilisés pour combiner des données provenant de sources disparates en informations utiles et utiles.

lac de données

Référentiel de stockage de données à grande échelle qui stocke les données brutes dans n'importe quel format dans une architecture à plat. Les lacs de données contiennent des données structurées et non structurées ainsi que des données binaires à des fins de traitement et d'analyse.

lakehouse de données

Une architecture unifiée de stockage et de traitement des données qui combine la flexibilité d'un lac de données avec les requêtes structurées et les optimisations des performances d'un entrepôt de données, permettant une analyse de données évolutive et efficace pour les applications d'IA et d'analyse.

fouille de données

Processus permettant de collecter des informations métier stratégiques critiques à partir d'une source de données, de les mettre en corrélation et d'en déduire des associations, des modèles et des tendances. Voir aussi analyse prédictive.

modèle de données

Visualisation des éléments de données, de leurs relations et de leurs attributs.

Pipeline de données

Une série d'étapes de traitement et de transformation des données.

confidentialité des données

La protection des données contre l'accès non autorisé et l'utilisation inappropriée.

Produit de données

Collection de données optimisées ou d'actifs liés aux données qui sont conditionnées pour être réutilisées et distribuées avec un accès contrôlé. Les produits de données contiennent des données ainsi que des modèles, des tableaux de bord et d'autres types d'actifs de calcul. Contrairement aux actifs de données dans les catalogues de gouvernance, les produits de données sont gérés en tant que produits à des fins multiples pour fournir de la valeur métier.

règle de protection des données

Artefact de gouvernance spécifiant quelles données contrôler et la manière de les contrôler. Une règle de protection des données contient des critères et une action. Voir aussi la règle.

analyse de la qualité des données

L'analyse des données en fonction de l'exactitude, de l'exhaustivité, de la cohérence, de l'actualité, de l'unicité et de la validité des dimensions de la qualité.

définition de qualité des données

Une définition de qualité de données décrit une évaluation de règle ou une condition pour les règles de qualité de données.

règle de qualité des données

Lors de l'analyse de la qualité des données, règle de qualité des données qui évalue les données pour déterminer si des conditions spécifiques sont remplies et identifie les enregistrements qui ne remplissent pas les conditions en tant que violations de règle. Voir aussi la règle.

Flux Data Refinery

Source de données suivie d'une chaîne d'une ou de plusieurs opérations qui affinent et mettent en forme les données de cette source, suivie d'une cible vers laquelle les données se déplacent.

science des données

Analyse et visualisation de données structurées et non structurées dans le but de découvrir des points de vue et des connaissances.

jeu de données

Collection de données, habituellement sous la forme de lignes (enregistrements) et de colonnes (champs), contenue dans un fichier ou une table de base de données.

source de données

Un dépôt, une file d'attente ou un flux de lecture de données, tel qu'une base de données.

Flux DataStage

Un actif basé sur un ensemble ordonné d'étapes pour extraire, transformer et charger des données.

table de données

Collection de données, habituellement sous la forme de lignes (enregistrements) et de colonnes (champs), contenue dans une table.

entrepôt de données

Un grand référentiel centralisé de données collectées à partir de diverses sources qui est utilisé pour la génération de rapports et l'analyse de données. Il stocke principalement des données structurées et semi-structurées, ce qui permet aux entreprises de prendre des décisions éclairées.

Expérimentation Decision Optimization

Actif contenant un groupe de scénarios qui représentent différentes formulations de modèles ou différents jeux de données relatifs au même problème à résoudre.

modèle Decision Optimization

Modèle prescriptif qui peut être résolu avec l'optimisation afin de fournir la meilleure solution à un problème Decision Optimization.

variable de décision

Une variable particulière du jeu de variables représentant les décisions à prendre, dont les valeurs sont déterminées par le moteur d'optimisation en veillant au respect de toutes les contraintes et à l'optimisation de l'objectif.

apprentissage en profondeur

Un modèle de calcul qui utilise plusieurs couches de nœuds interconnectés, organisés en couches hiérarchiques, pour transformer les données d'entrée (première couche) par une série de calculs afin de produire une sortie (couche finale). L'apprentissage en profondeur s'inspire de la structure et du fonctionnement du cerveau humain.

expérimentation d'apprentissage en profondeur (deep learning)

Processus de formation de modèles basé sur un regroupement logique d'une ou plusieurs définitions de formation de modèles connectées dans un réseau neuronal.

réseau neuronal profond

Un réseau neuronal avec plusieurs couches cachées, permettant des représentations plus complexes des données.

déploiement

Package de modèle ou d'application prêt à servir.

espace de déploiement

Espace de travail dans lequel les modèles sont déployés et les déploiements sont gérés.

DOcplex

Une API Python pour la modélisation et la résolution de problèmes Decision Optimization .

E

URL de point d'extrémité

Adresse de destination réseau qui identifie des ressources telles que des services et des objets. Par exemple, une URL de point d'extrémité est utilisée pour identifier l'emplacement d'un déploiement de modèle ou de fonction lorsque l'utilisateur envoie des données utiles à ce déploiement.

environnement

Ressources de calcul pour les travaux en cours d'exécution.

environnement d'exécution

Une instanciation du modèle d'environnement pour exécuter les actifs.

canevas d'environnement

Définition qui spécifie les ressources matérielles et logicielles nécessaires à l'instanciation d'un environnement d'exécution (runtime).

explicabilité

  • Capacité des utilisateurs humains à suivre, vérifier et comprendre les prévisions émises par des applications qui utilisent des systèmes d'intelligence artificielle.
  • Capacité d'un système d'IA à fournir des connaissances que les humains peuvent utiliser pour comprendre les causes des prédictions du système.

F

équité

Dans un système d'IA, le traitement équitable des individus ou des groupes d'individus. Le choix d'une notion spécifique d'équité pour un système d'IA dépend du contexte dans lequel il est utilisé. Voir aussi biais.

fonction

Propriété ou caractéristique d'un élément dans un jeu de données, par exemple, une colonne dans une feuille de calcul. Dans certains cas, les fonctions sont conçues comme des combinaisons d'autres fonctions de l'ensemble de données.

Ingénierie des fonctions

Processus de sélection, de transformation et de création de nouvelles fonctions à partir de données brutes pour améliorer les performances et le pouvoir prédictif des modèles d'apprentissage automatique.

sélection de fonction

Identification des colonnes de données qui prennent le mieux en charge une prévision ou un score précis dans un modèle d'apprentissage automatique.

magasin de fonctions

Référentiel ou système centralisé qui gère et organise les fonctions, offrant un moyen évolutif et efficace de stocker, d'extraire et de partager des données de fonction entre les pipelines et les applications d'apprentissage automatique.

transformation des fonctions

Dans AutoAI, phase de la création de pipeline qui applique des algorithmes pour transformer et optimiser les données d'entraînement en vue d'obtenir le meilleur résultat compte tenu du type de modèle.

apprentissage fédéré

Entraînement d'un modèle d'apprentissage automatique commun qui utilise plusieurs sources de données qui ne sont pas déplacées, jointes ou partagées. Il en résulte un modèle mieux entraîné sans que la sécurité des données soit compromise.

flux

Collection de noeuds qui définissent un ensemble d'étapes pour le traitement des données ou l'entraînement d'un modèle.

Modèle de base

Un modèle d'IA qui peut être adapté à un large éventail de tâches en aval. Les modèles de base sont généralement des modèles génératifs à grande échelle qui sont formés sur des données non étiquetées à l'aide de l'auto-supervision. En tant que modèles à grande échelle, les modèles de fondations peuvent inclure des milliards de paramètres.

G

Diagramme de Gantt

Représentation graphique de la chronologie (ligne de temps) et de la durée d'un projet, dans laquelle les données de l'emploi du temps sont figurées par des barres horizontales le long d'une échelle de temps.

IA générative

Voir IA générative.

iA générative (gen AI)

Une classe d'algorithmes d'IA qui peuvent produire divers types de contenu, notamment du texte, du code source, des images, du son et des données synthétiques.

artefact de gouvernance

articles de gouvernance qui enrichissent ou contrôlent les actifs de données. Les artefacts de gouvernance incluent les termes du métier, les classifications, les classes de données, les politiques, les règles et les jeux de données de référence.

règle de gouvernance

Artefact de gouvernance fournissant une description en langage naturel des critères utilisés pour déterminer si des actifs de données sont conformes aux objectifs métier. Voir aussi la règle.

flux de travaux de gouvernance

Processus composé de tâches pour contrôler la création, la modification et la suppression d'artefacts de gouvernance.

catalogue gouverné

Catalogue dans lequel des règles de protection des données sont en vigueur.

Processeur graphique (GPU)

Voir unité de traitement graphique.

générateur graphique

Outil permettant de créer des actifs de flux par codage visuel. Un canevas est une aire sur laquelle on place des objets ou des noeuds que l'on connecte pour créer un flux.

Unité de traitement graphique (GPU)

Processeur spécialisé conçu pour manipuler et modifier rapidement la mémoire afin d'accélérer la création d'images dans un tampon de trame destiné à la sortie vers un affichage. Les GPU sont fortement utilisés dans l'apprentissage automatique en raison de leurs capacités de traitement parallèle. Voir aussi accélérateur.

mise à la terre

Fournir des informations à un grand modèle linguistique afin d'améliorer la précision des résultats.

H

Détection HAP (détection HAP)

  • La capacité de détecter et de filtrer les propos haineux, abusifs et blasphématoires à la fois dans les invites soumises par les utilisateurs et dans les réponses générées par un modèle d'intelligence artificielle.

Détecteur HAP (détecteur HAP)

  • Un classificateur de phrases qui supprime les contenus potentiellement nuisibles, tels que les discours haineux, les abus et les blasphèmes, de la sortie et de l'entrée du modèle de fondation.

ensemble d'attente

Ensemble de données étiquetées qui sont volontairement exclues des ensembles d'apprentissage et de validation, servant d'évaluation non biaisée des performances du modèle final sur les données invisibles.

surveillance humaine

Participation humaine à l'examen des décisions rendues par un système d'IA, permettant l'autonomie humaine et la responsabilité de la décision.

hyperparamètre

En apprentissage automatique, paramètre dont la valeur est fixée avant l'entraînement du modèle afin d'accroître la justesse de celui-ci.

I

image

Package logiciel contenant un ensemble de bibliothèques.

inférence

Le processus consistant à faire passer des données réelles par un modèle d'IA entraîné afin de faire une prédiction ou de résoudre une tâche.

verser

  • Pour introduire des données dans un système dans le but de créer une base de connaissances.
  • Ajouter continuellement un gros volume de données temps réel dans une base de données.

analyse

Une compréhension précise ou approfondie de quelque chose. Les connaissances sont dérivées à l'aide de l'analyse cognitive pour fournir des instantanés et des prévisions à jour des comportements et des attitudes des clients.

intention

Objectif exprimé par l'entrée du client dans un agent conversationnel, tel que la réponse à une question ou le traitement d'un paiement de facture.

J

travail

Unité de travail exécutable séparément.

K

base de connaissances

Voir corpus.

L

données étiquetées

Données brutes auxquelles des libellés sont affectés pour ajouter un contexte ou une signification afin qu'elles puissent être utilisées pour entraîner des modèles d'apprentissage automatique. Par exemple, les valeurs numériques peuvent être libellées sous forme de codes postaux ou d'âges afin de fournir un contexte pour les entrées et les sorties de modèle.

grand modèle linguistique (LLM)

Modèle de langue avec un grand nombre de paramètres, entraîné sur une grande quantité de texte.

lignée

  • Historique du flux de données traversant les actifs.
  • Historique des événements exécutés sur un actif.

Grand modèle de langage

Voir grand modèle linguistique.

modèle logique

Représentation logique des objets de données associés à un domaine métier.

M

apprentissage automatique (ML)

Une branche de l'intelligence artificielle (IA) et de l'informatique qui se concentre sur l'utilisation de données et d'algorithmes pour imiter la façon dont les humains apprennent, améliorant progressivement la précision des modèles d'IA.

infrastructure d'apprentissage automatique

Bibliothèques et environnement d'exécution (runtime) utilisés pour l'entraînement et le déploiement d'un modèle.

modèle d'apprentissage automatique

Un modèle d'IA qui est entraîné sur un ensemble de données pour développer des algorithmes qu'il peut utiliser pour analyser et apprendre à partir de nouvelles données.

masque

Pour remplacer des valeurs de données sensibles dans une colonne d'un jeu de données. Les méthodes de masquage varient dans l'utilitaire de données et la confidentialité, de la fourniture de valeurs de remplacement formatées de manière similaire qui conservent l'intégrité référentielle à la fourniture de la même valeur de remplacement pour l'ensemble de la colonne.

Flux de masquage

Flux qui produit des copies de données masquées de façon permanente.

données maître

  • Pour l'entraînement de modèle, données de référence qui restent les mêmes pour plusieurs travaux sur le même modèle mais qui peuvent être modifiées, si nécessaire.
  • Dans Match 360, vue consolidée des données provenant de sources disparates.

entité de données de base

Composition d'enregistrements qu'un algorithme d'appariement a déterminé comme représentant la même entité du monde réel, telle qu'une personne ou une organisation. Chaque entité comprend un ou plusieurs enregistrements membres que l'algorithme d'appariement a reliés entre eux.

programmation mathématique (PM)

Domaine des mathématiques ou de la recherche opérationnelle utilisé pour modéliser et résoudre les problèmes d'optimisation décisionnelle (Decision Optimization). Concerne les techniques de programmation linéaire, en nombres entiers, mixte en nombres entiers et non linéaire.

importation de métadonnées

Méthode d'importation des métadonnées associées aux actifs de données, y compris les métadonnées de processus qui décrivent le lignage des actifs de données et les métadonnées techniques qui décrivent la structure des actifs de données.

défaut d'alignement

Différence entre les objectifs ou les comportements qu'un système d'IA est optimisé pour atteindre et les objectifs réels, souvent complexes, de ses utilisateurs ou concepteurs humains

ML

Voir apprentissage automatique.

MLOps

  • La pratique de la collaboration entre les spécialistes des données et les professionnels des opérations pour aider à gérer le cycle de vie de l'apprentissage automatique de la production (ou apprentissage en profondeur). MLOps cherche à accroître l'automatisation et à améliorer la qualité du ML de production tout en se concentrant sur les exigences métier et réglementaires. Il implique le développement de modèles, la formation, la validation, le déploiement, la surveillance et la gestion et utilise des méthodes telles que CI/CD.
  • Méthodologie qui utilise un modèle d'apprentissage automatique du développement à la production.

modèle

  • Dans un contexte d'apprentissage automatique, ensemble de fonctions et d'algorithmes ayant été entraînés et testés sur un jeu de données pour fournir des prédictions ou des décisions.
  • Dans Decision Optimization, formulation mathématique d'un problème qui peut être résolue avec les moteurs d'optimisation de CPLEX en utilisant différents jeux de données.

élaboration de modèle

Dans Decision Optimization, formulation mathématique d'un modèle exprimée par une liste de variables de décision, une ou plusieurs fonctions objectif à maximiser ou minimiser et des contraintes à satisfaire.

ModelOps

Méthodologie de gestion du cycle de vie complet d'un modèle d'IA, y compris l'entraînement, le déploiement, le scoring, l'évaluation, le ré-entraînement et la mise à jour.

programmation mathématique

Voir programmation mathématique.

N

langage naturel

Syntaxe de modélisation ressemblant à un langage humain naturel (en anglais) et servant à formuler des modèles.

traitement automatique du langage naturel (NLP)

Branche de l'intelligence artificielle et de la linguistique qui étudie les problèmes inhérents au traitement et à la manipulation du langage naturel dans le but d'accroître la capacité des ordinateurs à comprendre les langues humaines.

bibliothèque de traitement automatique du langage naturel

Bibliothèque qui fournit des fonctions de traitement du langage naturel de base pour l'analyse de la syntaxe et des modèles pré-entraînés prêts à l'emploi pour une grande variété de tâches de traitement de texte.

réseau de neurones

Modèle mathématique permettant de prédire ou de classer des observations en utilisant un schéma mathématique complexe qui simule une version abstraite des cellules du cerveau. Pour entraîner un réseau de neurones, on lui présente, un par un, un grand nombre de cas observés. Le réseau se met à jour de manière répétée jusqu'à ce qu'il apprenne la tâche.

traitement automatique du langage naturel

Voir traitement automatique du langage naturel.

noeud

Représentation graphique d'une opération sur des données dans un stream ou un flux. Les différents types de noeuds ont des formes différentes reflétant le type d'opération qu'ils effectuent.

bloc-notes

Document interactif contenant un code exécutable, une description texte de ce code et le résultat de son exécution.

noyau du bloc-notes

Partie de l'éditeur de bloc-notes qui exécute le code et renvoie les résultats de calcul.

O

brouiller

Remplacer des données dans une colonne par des valeurs dont le format ressemble à celui des données d'origine. Forme de masquage.

fonction d'objectif

Dans Decision Optimization et la recherche opérationnelle, expression à optimiser (c'est-à-dire à minimiser ou maximiser) tout en satisfaisant les autres contraintes du problème.

stockage d"objets

Méthode de stockage de données généralement employée dans le cloud, avec laquelle les données sont stockées en tant qu'unités discrètes, ou objets, dans un pool de stockage ou un référentiel qui n'utilise pas de hiérarchie de fichiers mais qui stocke tous les objets au même niveau.

déploiement en ligne

Méthode d'accès à un modèle ou à un déploiement de code Python via un noeud final d'API en tant que service Web pour générer des prévisions en ligne, en temps réel.

ontologie

Spécification formelle explicite de la représentation des objets, concepts et autres entités pouvant exister dans un domaine d'intérêt particulier, ainsi que des relations entre ces éléments.

actif opérationnel

Actif qui exécute du code dans un outil ou un travail.

modèle OPL

Formulation d'un modèle exprimée en langage de modélisation OPL.

solution optimale

En recherche opérationnelle, solution à un problème qui optimise la fonction objectif (qu'elle soit linéaire ou quadratique) et satisfait toutes les autres contraintes du problème.

optimisation

Le processus consistant à trouver la solution la plus appropriée à un problème défini avec précision tout en respectant les contraintes et les limitations imposées. Par exemple, déterminer comment allouer des ressources ou trouver les meilleurs éléments ou combinaisons à partir d'un grand nombre d'alternatives.

orchestration

Processus de création d'un flux de bout en bout qui peut entraîner, exécuter, déployer, tester et évaluer un modèle d'apprentissage automatique et utiliser l'automatisation pour coordonner le système, souvent à l'aide de microservices.

P

Examen de paires

Processus au cours duquel un utilisateur de l'administration des données compare les enregistrements pour déterminer s'ils correspondent. Les résultats de l'examen par paires permettent d'entraîner un algorithme de mise en correspondance qui décide des enregistrements à mettre en correspondance avec les entités de données de base.

paramètre

Partie configurable du modèle qui est interne à un modèle et dont les valeurs sont estimées ou apprises à partir de données. Les paramètres sont des aspects du modèle qui sont ajustés au cours du processus d'apprentissage pour aider le modèle à prévoir avec précision la sortie. Les performances et le pouvoir prédictif du modèle dépendent en grande partie des valeurs de ces paramètres.

correspondant

Dans l'apprentissage fédéré, entité qui fournit des données pour l'entraînement d'un modèle commun. Les données ne sont pas déplacées ni combinées, mais chaque partie bénéficie de l'entraînement fédéré.

payload

Données transmises à un déploiement pour obtenir un score, une prévision ou une solution.

journalisation du contenu

Capture des données utiles et de la sortie de déploiement afin de surveiller l'état de santé en cours de l'intelligence artificielle dans des applications métier.

Modèle physique

Définition des structures physiques et des relations des données.

pipeline

  • Dans Watson Pipelines, un flux d'actifs de bout en bout, de la création au déploiement.
  • Dans l'AutoAI, un modèle candidat.

tableau de classement de pipeline

Dans l'AutoAI, un tableau qui montre la liste des modèles candidats générés automatiquement, sous forme de pipelines, classés selon les critères spécifiés.

marque de réservation

Champ ou variable à remplacer par une valeur.

politique

  • Stratégie ou règle suivie par un agent pour déterminer l'action suivante en fonction de l'état en cours.
  • Ensemble de règles protégeant les données en contrôlant l'accès aux actifs de données ou en anonymisant les données sensibles dans les actifs de données.
  • Artefact de gouvernance consistant en une ou plusieurs règles de protection et de gouvernance des données.

analyse prédictive

Processus métier et ensemble de technologies associées qui s'intéressent à la prédiction des possibilités et des tendances futures. L'analyse prédictive applique des disciplines aussi diverses que la probabilité, les statistiques, l'apprentissage automatique et l'intelligence artificielle à des problèmes métier afin de trouver la meilleure action pour une situation spécifique. Voir aussi exploration de données.

modèle préentraîné

Modèle d'IA précédemment entraîné sur un ensemble de données volumineux pour accomplir une tâche spécifique. Les modèles préentraînés sont utilisés au lieu de générer un modèle à partir de zéro.

catégorie principale

Pour la gouvernance des données, la catégorie qui contient l'artefact de gouvernance. Une catégorie est similaire à un dossier ou un répertoire dans lequel sont organisés les artefacts de gouvernance d'un utilisateur.

confidentialité

Assurance que les informations concernant une personne sont protégées contre tout accès non autorisé et toute utilisation inappropriée.

profil

Métadonnées générées et statistiques relatives au contenu textuel des données.

projet

Espace de travail collaboratif permettant de travailler avec des données et d'autres actifs.

élagage

Le processus de simplification, de réduction ou d'élagage d'un arbre de décision ou d'un réseau neuronal. Cela se fait en supprimant les nœuds ou les couches les moins importants, en réduisant la complexité pour éviter l'ajustement excessif et améliorer la généralisation du modèle tout en conservant son pouvoir prédictif.

publish

Copier un actif dans un catalogue.

Python

Langage de programmation utilisé en science des données et en intelligence artificielle.

Modèle Python DOcplex

Formulation d'un modèle exprimée en Python.

Fonction Python

Fonction qui contient du code Python pour prendre en charge un modèle en production.

Q

règle de qualité

Une ou plusieurs conditions requises pour qu'un enregistrement de données respecte les normes de qualité. Lors de l'analyse de la qualité des données, les enregistrements de données sont vérifiés par rapport à ces conditions. Voir aussi la règle.

quantification

Méthode de compression des poids des modèles de fondation pour accélérer l'inférence et réduire les besoins en mémoire du GPU.

R

R

Langage de script extensible utilisé dans la science des données et l'intelligence artificielle qui offre une grande variété de fonctions et de techniques analytiques, statistiques et graphiques.

lecture

Copier des données dans une application pour les manipuler ou les analyser.

rétrorédiger

Remplacer toutes les valeurs de données d'une colonne par la même chaîne pour masquer les valeurs sensibles, le format de données et les relations entre les valeurs. Une forme de masquage ..

jeu de données de référence

Artefact de gouvernance qui définit les valeurs pour des types de colonnes spécifiques.

affiner

Nettoyer et former les données.

apprentissage par renforcement

Technique d'apprentissage automatique dans laquelle un agent apprend à prendre des décisions séquentielles dans un environnement afin de maximiser un signal de récompense. Inspirés par l'apprentissage des essais et des erreurs, les agents interagissent avec l'environnement, reçoivent des commentaires en retour et adaptent leurs actions pour atteindre des politiques optimales.

récompense

Signal utilisé pour guider un agent, généralement un agent d'apprentissage par renforcement, qui fournit un retour d'information sur la qualité d'une décision

règle

Un artefact qui contient des informations, des critères ou une logique permettant d'analyser ou de protéger les données. Voir aussi règle de protection des données, règle de qualité des données, règle de gouvernance, règle de qualité, règle de composition des attributs.

environnement d'exécution

Configuration matérielle et logicielle prédéfinie ou personnalisée utilisée pour exécuter des outils ou des travaux, tels que des blocs-notes.

S

évaluation

  • En apprentissage automatique, procédé de mesure de la confiance d'un résultat prédit.
  • Processus de calcul du degré de concordance entre les attributs d'une entité entrante et ceux d'une entité existante.

script

Fichier contenant des scripts Python ou R pour la prise en charge d'un modèle en production.

catégorie secondaire

Catégorie optionnelle faisant référence à l'artefact de gouvernance.

Auto-attention

Mécanisme d'attention qui utilise les informations des données d'entrée elles-mêmes pour déterminer les parties de l'entrée sur lesquelles se concentrer lors de la génération de la sortie.

apprentissage auto-supervisé

Méthode d'apprentissage automatique dans laquelle un modèle apprend à partir de données non étiquetées en masquant des jetons dans une séquence d'entrée, puis en essayant de les prévoir. Un exemple est "J'aime les choux de ________".

recherche sémantique

Une recherche par mot-clé qui intègre une analyse linguistique et contextuelle. Dans une recherche sémantique, l'intention de la requête est précisée à l'aide d'un ou plusieurs spécificateurs. Par exemple, il est possible de spécifier une personne nommée "Bush" et une telle requête ne renverrait pas de résultats sur le type de buissons qui poussent dans un jardin, mais plutôt sur des personnes nommées Bush.

données sensibles

Données contenant des informations qui doivent être protégées contre un accès ou une divulgation non autorisés. Les catégories de données sensibles peuvent être des informations de santé protégées, des informations personnelles identifiables, des secrets commerciaux ou des résultats financiers.

analyse des sentiments

Examen du sentiment ou de l'émotion exprimée dans un texte, par exemple pour déterminer si une critique de film est positive ou négative.

forme

Personnaliser des données en les filtrant, les triant ou en en retirant des colonnes ; en joignant des tables, en exécutant des opérations incluant des calculs, des groupements de données, des hiérarchies, etc.

minidonnées

Données accessibles et compréhensibles par les humains. Voir aussi données structurées.

SQL Pushback

Dans SPSS Modeler, procédé consistant à exécuter de nombreuses opérations de préparation et d'exploration des données directement dans la base de données au moyen de code SQL.

données structurées

Données se trouvant dans des champs fixes d'un enregistrement ou d'un fichier. Les bases de données relationnelles et les feuilles de calcul sont des exemples de données structurées. Voir aussi données non structurées, données de petite taille.

information structurée

Eléments stockés dans des ressources structurées, telles que des index de moteur de recherche, des bases de données ou des bases de connaissances.

remplaçant

Remplacer des données dans une colonne par des valeurs dont le format est différent de celui des données d'origine mais préservent l'intégrité référentielle.

super noeud

Noeud SPSS Modeler qui rétrécit le flux de données en encapsulant plusieurs noeud en un seul.

apprentissage supervisé

Méthode d'apprentissage automatique dans laquelle un modèle est entraîné sur un jeu de données étiqueté pour faire des prévisions sur de nouvelles données.

T

classification de texte

Modèle qui identifie et classifie automatiquement le texte dans des catégories spécifiées.

séries temporelles

Ensemble de valeurs d'une variable à des points périodiques dans le temps.

modèle entraîné

Modèle entraîné avec des données réelles et prêt à être déployé pour prévoir les résultats lorsqu'il est présenté avec de nouvelles données.

entraînement

Phase initiale de la construction de modèle dans laquelle un sous-ensemble des données source est impliqué. Le modèle apprend par exemple à partir des données connues. Le modèle peut être testé avec un autre sous-ensemble de données pour lequel l'issue est déjà connue.

données d'apprentissage

Une collection de données utilisée pour former des modèles d'apprentissage automatique.

ensemble d’apprentissage

Ensemble de données étiquetées utilisé pour entraîner un modèle d'apprentissage automatique en l'exposant à des exemples et à leurs libellés correspondants, ce qui permet au modèle d'apprendre des motifs et d'effectuer des prévisions.

apprentissage par transposition

Stratégie d'apprentissage automatique dans laquelle un modèle entraîné est appliqué à un problème complètement nouveau.

transformateur

Une architecture de réseau neuronal qui utilise les encodages positionnels et le mécanisme d'auto-attention pour prédire le prochain élément d'une séquence d'éléments.

transparence

Partage de l'information appropriée avec les parties prenantes sur la façon dont un système d'IA a été conçu et développé. Des exemples de cette information sont les données recueillies, la façon dont elles seront utilisées et stockées, et les personnes qui y ont accès ; et les résultats des tests de précision, de robustesse et de biais.

Test de Turing

Proposé par Alan Turing en 1950, un test de la capacité d'une machine à montrer un comportement intelligent équivalent ou indiscernable de celui d'un humain.

U

problème sans limite

Problème d'optimisation décisionnelle (notamment dans Decision Optimization) pour lequel il existe un nombre infini de solutions et dont l'objectif peut prendre des valeurs jusqu'à l'infini. Les problèmes non bornés sont souvent causés par des contraintes manquantes dans la formulation du modèle.

données non structurées

Données enregistrées dans un format non structuré plutôt que dans des champs fixés à l'avance. Exemple : les données contenues dans un document de traitement de texte. Voir aussi données structurées.

information non structurée

Données qui ne sont pas contenues dans un emplacement fixe, tel que le document texte en langage naturel.

apprentissage non supervisé

Méthode d'apprentissage automatique dans laquelle un modèle n'est pas fourni avec des données étiquetées et doit rechercher des motifs ou une structure dans les données de manière autonome.

V

Ensemble de validation

Ensemble distinct de données étiquetées qui est utilisé pour évaluer les performances et la capacité de généralisation d'un modèle d'apprentissage automatique au cours du processus d'apprentissage, en aidant à l'ajustement des hyperparamètres et à la sélection des modèles.

visualisation

Graphe, diagramme, graphique, tracé, courbe, tableau, carte ou toute autre forme de représentation visuelle de données.

W

poids

Coefficient d'un noeud qui transforme les données d'entrée dans la couche du réseau. La pondération est un paramètre qu'un modèle d'IA apprend par l'entraînement, en ajustant sa valeur pour réduire les erreurs dans les prévisions du modèle.

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus