Ce glossaire fournit des termes et des définitions pour Cloud Pak for Data as a Service.
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W
A
raccourci clavier
Dans l'informatique de haute performance, un circuit spécialisé qui est utilisé pour prendre une partie de la charge de calcul de l'unité centrale, augmentant ainsi l'efficacité du système. Par exemple, dans le domaine de l'apprentissage profond, l'informatique accélérée par le GPU est souvent utilisée pour décharger une partie de la charge de travail de calcul sur un GPU tandis que l'application principale fonctionne sur le CPU. Voir aussi unité de traitement graphique.
responsabilité
L'attente que les organisations ou les personnes assurent le bon fonctionnement, tout au long de leur cycle de vie, des systèmes d'IA qu'elles conçoivent, développent, exploitent ou déploient, conformément à leurs rôles et aux cadres réglementaires applicables. Il s'agit notamment de déterminer qui est responsable d'une erreur d'IA, ce qui peut exiger des experts juridiques qu'ils déterminent la responsabilité au cas par cas.
fonction d'activation
Fonction définissant la sortie d'une unité neuronale en fonction d'un ensemble d'activations entrantes provenant d'autres neurones
apprentissage actif
Modèle d'apprentissage automatique dans lequel le système demande davantage de données étiquetées uniquement lorsqu'il en a besoin.
métadonnées actives
Métadonnées qui sont automatiquement mises à jour en fonction de l'analyse par les processus d'apprentissage automatique. Par exemple, le profilage et l'analyse de la qualité des données mettent automatiquement à jour les métadonnées des actifs de données.
environnement d'exécution actif
Instance d'un environnement qui fonctionne pour fournir des ressources de calcul aux actifs qui exécutent du code.
Agent
Un algorithme ou un programme qui interagit avec un environnement pour apprendre des actions ou des décisions optimales, généralement en utilisant l'apprentissage par renforcement, afin d'atteindre un objectif spécifique.
IA
Accélérateur d'IA
Matériel de silicium spécialisé conçu pour exécuter efficacement les tâches liées à l'IA telles que l'apprentissage profond, l'apprentissage automatique et les réseaux neuronaux pour un calcul plus rapide et économe en énergie. Il peut s'agir d'une unité dédiée dans un noyau, d'une puce séparée sur une puce multi-modules ou d'une carte séparée.
Éthique de l’IA
Domaine multidisciplinaire qui étudie comment optimiser l'impact bénéfique de l'IA tout en réduisant les risques et les résultats négatifs. Les exemples de problèmes d'éthique de l'IA sont la responsabilité et la confidentialité des données, l'équité, l'explicabilité, la robustesse, la transparence, la durabilité environnementale, l'inclusion, l'agence morale, l'alignement des valeurs, la responsabilité, la confiance et l'utilisation abusive de la technologie.
Gouvernance de l'IA
L'acte d'une organisation de gouverner, par le biais de ses instructions d'entreprise, le personnel, les processus et les systèmes pour diriger, évaluer, surveiller et prendre des mesures correctives tout au long du cycle de vie de l'IA, afin de fournir l'assurance que le système d'IA fonctionne comme l'organisation l'entend, comme les parties prenantes s'y attendent, et comme l'exige la réglementation pertinente.
Sécurité de l'intelligence artificielle
Le domaine de recherche visant à s'assurer que les systèmes d'intelligence artificielle fonctionnent de manière bénéfique pour l'humanité et ne causent pas de dommages par inadvertance, en abordant des questions telles que la fiabilité, l'équité, la transparence et l'alignement des systèmes d'intelligence artificielle sur les valeurs humaines.
Système d'intelligence artificielle
algorithme
Formule appliquée aux données pour déterminer les méthodes optimales de résolution des problèmes analytiques.
analytique
Science de l'étude des données visant à dégager des modèles pertinents dans les données et à tirer des conclusions basées sur ces modèles.
intelligence artificielle (IA)
La capacité d'acquérir, de traiter, de créer et d'appliquer des connaissances sous la forme d'un modèle pour faire des prédictions, des recommandations ou des décisions.
système d'intelligence artificielle (système d'intelligence artificielle)
Système qui peut faire des prévisions, des recommandations ou des décisions qui influencent des environnements physiques ou virtuels, et dont les résultats ou les comportements ne sont pas nécessairement prédéterminés par son développeur ou son utilisateur. Les systèmes d'IA sont généralement formés avec de grandes quantités de données structurées ou non structurées, et peuvent être conçus pour fonctionner avec des niveaux d'autonomie différents ou aucun, pour atteindre des objectifs définis par l'homme.
actif
Article d'un projet ou d'un catalogue contenant des métadonnées sur des données ou une analyse de données.
règle de composition des attributs
L'une des règles qui déterminent comment les valeurs des attributs d'une entité de données de base sont sélectionnées à partir de ses enregistrements membres. Voir aussi la règle.
expérimentation AutoAI
Processus d'entraînement automatisé dans lequel une série de définitions d'entraînement et de paramètres est considérée afin de créer un jeu de pipelines classés en tant que modèles candidats.
B
déploiement par lots
Méthode permettant de déployer des modèles qui traitent des données d'entrée à partir d'un fichier, d'une connexion de données ou de données connectées dans un compartiment de stockage, puis d'écrire la sortie dans une destination sélectionnée.
pondération
Erreur systématique dans un système d'IA qui a été conçu, intentionnellement ou non, de manière à générer des décisions injustes. Le biais peut être présent à la fois dans le système d'IA et dans les données utilisées pour l'entraîner et le tester. Le biais de l'IA peut apparaître dans un système d'IA en raison d'attentes culturelles, de limites techniques ou de contextes de déploiement imprévus. Voir aussi équité.
détection de biais
Processus de calcul de l'équité des mesures visant à détecter les cas où les modèles d'intelligence artificielle fournissent des résultats biaisés d'après certains attributs.
Atténuation des biais
Réduire les biais dans les modèles d'IA en conservant les données d'entraînement et en appliquant des techniques d'équité.
classification binaire
Modèle de classification avec deux classes. Les prédictions sont un choix binaire de l'une des deux classes.
terme métier
Mot ou syntagme définissant un concept métier d'une façon standard pour une entreprise ou un secteur. Des termes spécifiques peuvent être utilisés pour enrichir les métadonnées des actifs de données et définir les critères des règles de protection des données.
vocabulaire métier
Ensemble d'artefacts de gouvernance, tels que des termes métier et des classes de données, qui décrivent et enrichissent des actifs de données.
C
catalogue
Référentiel d'actifs à l'usage d'une organisation. Les actifs qu'il contient peuvent être gouvernés par des règles de protection des données et enrichis par d'autres artefacts de gouvernance tels que classifications, classes de données et termes du métier. Un catalogue peut stocker des données structurées et non structurées, des références à des données de sources externes et d'autres actifs analytiques tels que des modèles d'apprentissage automatique.
catégorie
Pour la gouvernance des données, un espace de travail collaboratif pour organiser et gérer les artefacts de gouvernance.
classification
Pour la gouvernance des données, un artefact de gouvernance qui décrit le niveau de sensibilité des données dans un actif de données.
nettoyer
Faire en sorte que toutes les valeurs d'un jeu de données soient cohérentes et correctement enregistrées.
collaborateur
Membre d'un groupe de personnes qui travaillent ensemble pour atteindre un objectif commun.
problème combinatoire
Problème difficile à résoudre du fait qu'il requiert plusieurs décisions impliquant de trop nombreuses combinaisons de choix possibles. Il peut s'agir, par exemple, de trouver un groupement, un ordre ou l'affectation d'objets.
ressource de traitement
Ressources matérielles et logicielles définies dans un environnement pour exécuter des actifs analytiques.
matrice de confusion
Mesure de la performance qui détermine la précision entre les résultats positifs et négatifs prévus d'un modèle par rapport aux résultats positifs et négatifs réels.
Données connectées
Ensemble de données accessible via une connexion à une source de données externe.
connexion
Informations nécessaires pour la connexion à une base de données. Les informations réelles requises varient en fonction du système de gestion de base de données et de la méthode de connexion.
contrainte
Dans Decision Optimization, condition qui doit être remplie par la solution d'un problème.
apprentissage continu
Automatisation des tâches de surveillance de la performance d'un modèle, de ré-entraînement de celui-ci avec de nouvelles données et de redéploiement de celui-ci pour s'assurer de la qualité de ses prédictions.
déploiement Core ML
Processus de téléchargement d'un déploiement au format Core ML pour son utilisation dans les applications iOS.
corpus
Collection de documents sources utilisés pour entraîner un modèle d'apprentissage automatique.
Modèle CPLEX
Un modèle d'Decision Optimization formulé pour être résolu par le moteur CPLEX.
Modèle CPO
Un modèle de programmation par contraintes qui est formulé pour être résolu par le moteur Decision Optimization CP Optimizer (CPO).
organiser
- Sélectionner, recueillir, conserver et tenir à jour les contenus relatifs à un sujet spécifique. L'organisation établit, gère et ajoute de la valeur aux données ; elle transforme les données en information fiable et en connaissances.
- Créer un actif de données et le préparer en vue de sa publication dans un catalogue. La curation peut impliquer d'enrichir l'actif de données en lui affectant des artefacts de gouvernance tels que des termes du métier, une classification et des classes de données, et d'analyser la qualité des données qu'il contient.
D
actif de données
Actif pointant sur des données, par exemple, un fichier ayant été remonté sur le serveur. Connexions et actifs de données connectés sont également considérés comme des actifs de données.
classe de données
Artefact de gouvernance servant à catégoriser les colonnes dans les jeux de données relationnelles en fonction du type des données et de la manière dont elles sont utilisées.
gouvernance des données
Le processus de suivi et de contrôle des données afin de maintenir la qualité des données, la sécurité des données et la conformité.
intégration de données
Combinaison de processus techniques et métier utilisés pour combiner des données provenant de sources disparates en informations utiles et utiles.
lac de données
Référentiel de stockage de données à grande échelle qui stocke les données brutes dans n'importe quel format dans une architecture à plat. Les lacs de données contiennent des données structurées et non structurées ainsi que des données binaires à des fins de traitement et d'analyse.
lakehouse de données
Une architecture unifiée de stockage et de traitement des données qui combine la flexibilité d'un lac de données avec les requêtes structurées et les optimisations des performances d'un entrepôt de données, permettant une analyse de données évolutive et efficace pour les applications d'IA et d'analyse.
fouille de données
Processus permettant de collecter des informations métier stratégiques critiques à partir d'une source de données, de les mettre en corrélation et d'en déduire des associations, des modèles et des tendances. Voir aussi analyse prédictive.
modèle de données
Visualisation des éléments de données, de leurs relations et de leurs attributs.
Pipeline de données
Une série d'étapes de traitement et de transformation des données.
confidentialité des données
La protection des données contre l'accès non autorisé et l'utilisation inappropriée.
Produit de données
Collection de données optimisées ou d'actifs liés aux données qui sont conditionnées pour être réutilisées et distribuées avec un accès contrôlé. Les produits de données contiennent des données ainsi que des modèles, des tableaux de bord et d'autres types d'actifs de calcul. Contrairement aux actifs de données dans les catalogues de gouvernance, les produits de données sont gérés en tant que produits à des fins multiples pour fournir de la valeur métier.
règle de protection des données
Artefact de gouvernance spécifiant quelles données contrôler et la manière de les contrôler. Une règle de protection des données contient des critères et une action. Voir aussi la règle.
analyse de la qualité des données
L'analyse des données en fonction de l'exactitude, de l'exhaustivité, de la cohérence, de l'actualité, de l'unicité et de la validité des dimensions de la qualité.
définition de qualité des données
Une définition de qualité de données décrit une évaluation de règle ou une condition pour les règles de qualité de données.
règle de qualité des données
Lors de l'analyse de la qualité des données, règle de qualité des données qui évalue les données pour déterminer si des conditions spécifiques sont remplies et identifie les enregistrements qui ne remplissent pas les conditions en tant que violations de règle. Voir aussi la règle.
Flux Data Refinery
Source de données suivie d'une chaîne d'une ou de plusieurs opérations qui affinent et mettent en forme les données de cette source, suivie d'une cible vers laquelle les données se déplacent.
science des données
Analyse et visualisation de données structurées et non structurées dans le but de découvrir des points de vue et des connaissances.
jeu de données
Collection de données, habituellement sous la forme de lignes (enregistrements) et de colonnes (champs), contenue dans un fichier ou une table de base de données.
source de données
Un dépôt, une file d'attente ou un flux de lecture de données, tel qu'une base de données.
Flux DataStage
Un actif basé sur un ensemble ordonné d'étapes pour extraire, transformer et charger des données.
table de données
Collection de données, habituellement sous la forme de lignes (enregistrements) et de colonnes (champs), contenue dans une table.
entrepôt de données
Un grand référentiel centralisé de données collectées à partir de diverses sources qui est utilisé pour la génération de rapports et l'analyse de données. Il stocke principalement des données structurées et semi-structurées, ce qui permet aux entreprises de prendre des décisions éclairées.
Expérimentation Decision Optimization
Actif contenant un groupe de scénarios qui représentent différentes formulations de modèles ou différents jeux de données relatifs au même problème à résoudre.
modèle Decision Optimization
Modèle prescriptif qui peut être résolu avec l'optimisation afin de fournir la meilleure solution à un problème Decision Optimization.
variable de décision
Une variable particulière du jeu de variables représentant les décisions à prendre, dont les valeurs sont déterminées par le moteur d'optimisation en veillant au respect de toutes les contraintes et à l'optimisation de l'objectif.
apprentissage en profondeur
Un modèle de calcul qui utilise plusieurs couches de nœuds interconnectés, organisés en couches hiérarchiques, pour transformer les données d'entrée (première couche) par une série de calculs afin de produire une sortie (couche finale). L'apprentissage en profondeur s'inspire de la structure et du fonctionnement du cerveau humain.
expérimentation d'apprentissage en profondeur (deep learning)
Processus de formation de modèles basé sur un regroupement logique d'une ou plusieurs définitions de formation de modèles connectées dans un réseau neuronal.
réseau neuronal profond
Un réseau neuronal avec plusieurs couches cachées, permettant des représentations plus complexes des données.
déploiement
Package de modèle ou d'application prêt à servir.
espace de déploiement
Espace de travail dans lequel les modèles sont déployés et les déploiements sont gérés.
DOcplex
Une API Python pour la modélisation et la résolution de problèmes Decision Optimization .
E
URL de point d'extrémité
Adresse de destination réseau qui identifie des ressources telles que des services et des objets. Par exemple, une URL de point d'extrémité est utilisée pour identifier l'emplacement d'un déploiement de modèle ou de fonction lorsque l'utilisateur envoie des données utiles à ce déploiement.
environnement
Ressources de calcul pour les travaux en cours d'exécution.
environnement d'exécution
Une instanciation du modèle d'environnement pour exécuter les actifs.
canevas d'environnement
Définition qui spécifie les ressources matérielles et logicielles nécessaires à l'instanciation d'un environnement d'exécution (runtime).
explicabilité
- Capacité des utilisateurs humains à suivre, vérifier et comprendre les prévisions émises par des applications qui utilisent des systèmes d'intelligence artificielle.
- Capacité d'un système d'IA à fournir des connaissances que les humains peuvent utiliser pour comprendre les causes des prédictions du système.
F
équité
Dans un système d'IA, le traitement équitable des individus ou des groupes d'individus. Le choix d'une notion spécifique d'équité pour un système d'IA dépend du contexte dans lequel il est utilisé. Voir aussi biais.
fonction
Propriété ou caractéristique d'un élément dans un jeu de données, par exemple, une colonne dans une feuille de calcul. Dans certains cas, les fonctions sont conçues comme des combinaisons d'autres fonctions de l'ensemble de données.
Ingénierie des fonctions
Processus de sélection, de transformation et de création de nouvelles fonctions à partir de données brutes pour améliorer les performances et le pouvoir prédictif des modèles d'apprentissage automatique.
sélection de fonction
Identification des colonnes de données qui prennent le mieux en charge une prévision ou un score précis dans un modèle d'apprentissage automatique.
magasin de fonctions
Référentiel ou système centralisé qui gère et organise les fonctions, offrant un moyen évolutif et efficace de stocker, d'extraire et de partager des données de fonction entre les pipelines et les applications d'apprentissage automatique.
transformation des fonctions
Dans AutoAI, phase de la création de pipeline qui applique des algorithmes pour transformer et optimiser les données d'entraînement en vue d'obtenir le meilleur résultat compte tenu du type de modèle.
apprentissage fédéré
Entraînement d'un modèle d'apprentissage automatique commun qui utilise plusieurs sources de données qui ne sont pas déplacées, jointes ou partagées. Il en résulte un modèle mieux entraîné sans que la sécurité des données soit compromise.
flux
Collection de noeuds qui définissent un ensemble d'étapes pour le traitement des données ou l'entraînement d'un modèle.
Modèle de base
Un modèle d'IA qui peut être adapté à un large éventail de tâches en aval. Les modèles de base sont généralement des modèles génératifs à grande échelle qui sont formés sur des données non étiquetées à l'aide de l'auto-supervision. En tant que modèles à grande échelle, les modèles de fondations peuvent inclure des milliards de paramètres.
G
Diagramme de Gantt
Représentation graphique de la chronologie (ligne de temps) et de la durée d'un projet, dans laquelle les données de l'emploi du temps sont figurées par des barres horizontales le long d'une échelle de temps.
IA générative
Voir IA générative.
iA générative (gen AI)
Une classe d'algorithmes d'IA qui peuvent produire divers types de contenu, notamment du texte, du code source, des images, du son et des données synthétiques.
artefact de gouvernance
articles de gouvernance qui enrichissent ou contrôlent les actifs de données. Les artefacts de gouvernance incluent les termes du métier, les classifications, les classes de données, les politiques, les règles et les jeux de données de référence.
règle de gouvernance
Artefact de gouvernance fournissant une description en langage naturel des critères utilisés pour déterminer si des actifs de données sont conformes aux objectifs métier. Voir aussi la règle.
flux de travaux de gouvernance
Processus composé de tâches pour contrôler la création, la modification et la suppression d'artefacts de gouvernance.
catalogue gouverné
Catalogue dans lequel des règles de protection des données sont en vigueur.
Processeur graphique (GPU)
générateur graphique
Outil permettant de créer des actifs de flux par codage visuel. Un canevas est une aire sur laquelle on place des objets ou des noeuds que l'on connecte pour créer un flux.
Unité de traitement graphique (GPU)
Processeur spécialisé conçu pour manipuler et modifier rapidement la mémoire afin d'accélérer la création d'images dans un tampon de trame destiné à la sortie vers un affichage. Les GPU sont fortement utilisés dans l'apprentissage automatique en raison de leurs capacités de traitement parallèle. Voir aussi accélérateur.
mise à la terre
Fournir des informations à un grand modèle linguistique afin d'améliorer la précision des résultats.
H
Détection HAP (détection HAP)
- La capacité de détecter et de filtrer les propos haineux, abusifs et blasphématoires à la fois dans les invites soumises par les utilisateurs et dans les réponses générées par un modèle d'intelligence artificielle.
Détecteur HAP (détecteur HAP)
- Un classificateur de phrases qui supprime les contenus potentiellement nuisibles, tels que les discours haineux, les abus et les blasphèmes, de la sortie et de l'entrée du modèle de fondation.
ensemble d'attente
Ensemble de données étiquetées qui sont volontairement exclues des ensembles d'apprentissage et de validation, servant d'évaluation non biaisée des performances du modèle final sur les données invisibles.
surveillance humaine
Participation humaine à l'examen des décisions rendues par un système d'IA, permettant l'autonomie humaine et la responsabilité de la décision.
hyperparamètre
En apprentissage automatique, paramètre dont la valeur est fixée avant l'entraînement du modèle afin d'accroître la justesse de celui-ci.
I
image
Package logiciel contenant un ensemble de bibliothèques.
inférence
Le processus consistant à faire passer des données réelles par un modèle d'IA entraîné afin de faire une prédiction ou de résoudre une tâche.
verser
- Pour introduire des données dans un système dans le but de créer une base de connaissances.
- Ajouter continuellement un gros volume de données temps réel dans une base de données.
analyse
Une compréhension précise ou approfondie de quelque chose. Les connaissances sont dérivées à l'aide de l'analyse cognitive pour fournir des instantanés et des prévisions à jour des comportements et des attitudes des clients.
intention
Objectif exprimé par l'entrée du client dans un agent conversationnel, tel que la réponse à une question ou le traitement d'un paiement de facture.
J
travail
Unité de travail exécutable séparément.
K
base de connaissances
Voir corpus.
L
données étiquetées
Données brutes auxquelles des libellés sont affectés pour ajouter un contexte ou une signification afin qu'elles puissent être utilisées pour entraîner des modèles d'apprentissage automatique. Par exemple, les valeurs numériques peuvent être libellées sous forme de codes postaux ou d'âges afin de fournir un contexte pour les entrées et les sorties de modèle.
grand modèle linguistique (LLM)
Modèle de langue avec un grand nombre de paramètres, entraîné sur une grande quantité de texte.
lignée
- Historique du flux de données traversant les actifs.
- Historique des événements exécutés sur un actif.
Grand modèle de langage
modèle logique
Représentation logique des objets de données associés à un domaine métier.
M
apprentissage automatique (ML)
Une branche de l'intelligence artificielle (IA) et de l'informatique qui se concentre sur l'utilisation de données et d'algorithmes pour imiter la façon dont les humains apprennent, améliorant progressivement la précision des modèles d'IA.
infrastructure d'apprentissage automatique
Bibliothèques et environnement d'exécution (runtime) utilisés pour l'entraînement et le déploiement d'un modèle.
modèle d'apprentissage automatique
Un modèle d'IA qui est entraîné sur un ensemble de données pour développer des algorithmes qu'il peut utiliser pour analyser et apprendre à partir de nouvelles données.
masque
Pour remplacer des valeurs de données sensibles dans une colonne d'un jeu de données. Les méthodes de masquage varient dans l'utilitaire de données et la confidentialité, de la fourniture de valeurs de remplacement formatées de manière similaire qui conservent l'intégrité référentielle à la fourniture de la même valeur de remplacement pour l'ensemble de la colonne.
Flux de masquage
Flux qui produit des copies de données masquées de façon permanente.
données maître
- Pour l'entraînement de modèle, données de référence qui restent les mêmes pour plusieurs travaux sur le même modèle mais qui peuvent être modifiées, si nécessaire.
- Dans Match 360, vue consolidée des données provenant de sources disparates.
entité de données de base
Composition d'enregistrements qu'un algorithme d'appariement a déterminé comme représentant la même entité du monde réel, telle qu'une personne ou une organisation. Chaque entité comprend un ou plusieurs enregistrements membres que l'algorithme d'appariement a reliés entre eux.
programmation mathématique (PM)
Domaine des mathématiques ou de la recherche opérationnelle utilisé pour modéliser et résoudre les problèmes d'optimisation décisionnelle (Decision Optimization). Concerne les techniques de programmation linéaire, en nombres entiers, mixte en nombres entiers et non linéaire.
importation de métadonnées
Méthode d'importation des métadonnées associées aux actifs de données, y compris les métadonnées de processus qui décrivent le lignage des actifs de données et les métadonnées techniques qui décrivent la structure des actifs de données.
défaut d'alignement
Différence entre les objectifs ou les comportements qu'un système d'IA est optimisé pour atteindre et les objectifs réels, souvent complexes, de ses utilisateurs ou concepteurs humains
ML
MLOps
- La pratique de la collaboration entre les spécialistes des données et les professionnels des opérations pour aider à gérer le cycle de vie de l'apprentissage automatique de la production (ou apprentissage en profondeur). MLOps cherche à accroître l'automatisation et à améliorer la qualité du ML de production tout en se concentrant sur les exigences métier et réglementaires. Il implique le développement de modèles, la formation, la validation, le déploiement, la surveillance et la gestion et utilise des méthodes telles que CI/CD.
- Méthodologie qui utilise un modèle d'apprentissage automatique du développement à la production.
modèle
- Dans un contexte d'apprentissage automatique, ensemble de fonctions et d'algorithmes ayant été entraînés et testés sur un jeu de données pour fournir des prédictions ou des décisions.
- Dans Decision Optimization, formulation mathématique d'un problème qui peut être résolue avec les moteurs d'optimisation de CPLEX en utilisant différents jeux de données.
élaboration de modèle
Dans Decision Optimization, formulation mathématique d'un modèle exprimée par une liste de variables de décision, une ou plusieurs fonctions objectif à maximiser ou minimiser et des contraintes à satisfaire.
ModelOps
Méthodologie de gestion du cycle de vie complet d'un modèle d'IA, y compris l'entraînement, le déploiement, le scoring, l'évaluation, le ré-entraînement et la mise à jour.
programmation mathématique
N
langage naturel
Syntaxe de modélisation ressemblant à un langage humain naturel (en anglais) et servant à formuler des modèles.
traitement automatique du langage naturel (NLP)
Branche de l'intelligence artificielle et de la linguistique qui étudie les problèmes inhérents au traitement et à la manipulation du langage naturel dans le but d'accroître la capacité des ordinateurs à comprendre les langues humaines.
bibliothèque de traitement automatique du langage naturel
Bibliothèque qui fournit des fonctions de traitement du langage naturel de base pour l'analyse de la syntaxe et des modèles pré-entraînés prêts à l'emploi pour une grande variété de tâches de traitement de texte.
réseau de neurones
Modèle mathématique permettant de prédire ou de classer des observations en utilisant un schéma mathématique complexe qui simule une version abstraite des cellules du cerveau. Pour entraîner un réseau de neurones, on lui présente, un par un, un grand nombre de cas observés. Le réseau se met à jour de manière répétée jusqu'à ce qu'il apprenne la tâche.
traitement automatique du langage naturel
noeud
Représentation graphique d'une opération sur des données dans un stream ou un flux. Les différents types de noeuds ont des formes différentes reflétant le type d'opération qu'ils effectuent.
bloc-notes
Document interactif contenant un code exécutable, une description texte de ce code et le résultat de son exécution.
noyau du bloc-notes
Partie de l'éditeur de bloc-notes qui exécute le code et renvoie les résultats de calcul.
O
brouiller
Remplacer des données dans une colonne par des valeurs dont le format ressemble à celui des données d'origine. Forme de masquage.
fonction d'objectif
Dans Decision Optimization et la recherche opérationnelle, expression à optimiser (c'est-à-dire à minimiser ou maximiser) tout en satisfaisant les autres contraintes du problème.
stockage d"objets
Méthode de stockage de données généralement employée dans le cloud, avec laquelle les données sont stockées en tant qu'unités discrètes, ou objets, dans un pool de stockage ou un référentiel qui n'utilise pas de hiérarchie de fichiers mais qui stocke tous les objets au même niveau.
déploiement en ligne
Méthode d'accès à un modèle ou à un déploiement de code Python via un noeud final d'API en tant que service Web pour générer des prévisions en ligne, en temps réel.
ontologie
Spécification formelle explicite de la représentation des objets, concepts et autres entités pouvant exister dans un domaine d'intérêt particulier, ainsi que des relations entre ces éléments.
actif opérationnel
Actif qui exécute du code dans un outil ou un travail.
modèle OPL
Formulation d'un modèle exprimée en langage de modélisation OPL.
solution optimale
En recherche opérationnelle, solution à un problème qui optimise la fonction objectif (qu'elle soit linéaire ou quadratique) et satisfait toutes les autres contraintes du problème.
optimisation
Le processus consistant à trouver la solution la plus appropriée à un problème défini avec précision tout en respectant les contraintes et les limitations imposées. Par exemple, déterminer comment allouer des ressources ou trouver les meilleurs éléments ou combinaisons à partir d'un grand nombre d'alternatives.
orchestration
Processus de création d'un flux de bout en bout qui peut entraîner, exécuter, déployer, tester et évaluer un modèle d'apprentissage automatique et utiliser l'automatisation pour coordonner le système, souvent à l'aide de microservices.
P
Examen de paires
Processus au cours duquel un utilisateur de l'administration des données compare les enregistrements pour déterminer s'ils correspondent. Les résultats de l'examen par paires permettent d'entraîner un algorithme de mise en correspondance qui décide des enregistrements à mettre en correspondance avec les entités de données de base.
paramètre
Partie configurable du modèle qui est interne à un modèle et dont les valeurs sont estimées ou apprises à partir de données. Les paramètres sont des aspects du modèle qui sont ajustés au cours du processus d'apprentissage pour aider le modèle à prévoir avec précision la sortie. Les performances et le pouvoir prédictif du modèle dépendent en grande partie des valeurs de ces paramètres.
correspondant
Dans l'apprentissage fédéré, entité qui fournit des données pour l'entraînement d'un modèle commun. Les données ne sont pas déplacées ni combinées, mais chaque partie bénéficie de l'entraînement fédéré.
payload
Données transmises à un déploiement pour obtenir un score, une prévision ou une solution.
journalisation du contenu
Capture des données utiles et de la sortie de déploiement afin de surveiller l'état de santé en cours de l'intelligence artificielle dans des applications métier.
Modèle physique
Définition des structures physiques et des relations des données.
pipeline
- Dans Watson Pipelines, un flux d'actifs de bout en bout, de la création au déploiement.
- Dans l'AutoAI, un modèle candidat.
tableau de classement de pipeline
Dans l'AutoAI, un tableau qui montre la liste des modèles candidats générés automatiquement, sous forme de pipelines, classés selon les critères spécifiés.
marque de réservation
Champ ou variable à remplacer par une valeur.
politique
- Stratégie ou règle suivie par un agent pour déterminer l'action suivante en fonction de l'état en cours.
- Ensemble de règles protégeant les données en contrôlant l'accès aux actifs de données ou en anonymisant les données sensibles dans les actifs de données.
- Artefact de gouvernance consistant en une ou plusieurs règles de protection et de gouvernance des données.
analyse prédictive
Processus métier et ensemble de technologies associées qui s'intéressent à la prédiction des possibilités et des tendances futures. L'analyse prédictive applique des disciplines aussi diverses que la probabilité, les statistiques, l'apprentissage automatique et l'intelligence artificielle à des problèmes métier afin de trouver la meilleure action pour une situation spécifique. Voir aussi exploration de données.
modèle préentraîné
Modèle d'IA précédemment entraîné sur un ensemble de données volumineux pour accomplir une tâche spécifique. Les modèles préentraînés sont utilisés au lieu de générer un modèle à partir de zéro.
catégorie principale
Pour la gouvernance des données, la catégorie qui contient l'artefact de gouvernance. Une catégorie est similaire à un dossier ou un répertoire dans lequel sont organisés les artefacts de gouvernance d'un utilisateur.
confidentialité
Assurance que les informations concernant une personne sont protégées contre tout accès non autorisé et toute utilisation inappropriée.
profil
Métadonnées générées et statistiques relatives au contenu textuel des données.
projet
Espace de travail collaboratif permettant de travailler avec des données et d'autres actifs.
élagage
Le processus de simplification, de réduction ou d'élagage d'un arbre de décision ou d'un réseau neuronal. Cela se fait en supprimant les nœuds ou les couches les moins importants, en réduisant la complexité pour éviter l'ajustement excessif et améliorer la généralisation du modèle tout en conservant son pouvoir prédictif.
publish
Copier un actif dans un catalogue.
Python
Langage de programmation utilisé en science des données et en intelligence artificielle.
Modèle Python DOcplex
Formulation d'un modèle exprimée en Python.
Fonction Python
Fonction qui contient du code Python pour prendre en charge un modèle en production.
Q
règle de qualité
Une ou plusieurs conditions requises pour qu'un enregistrement de données respecte les normes de qualité. Lors de l'analyse de la qualité des données, les enregistrements de données sont vérifiés par rapport à ces conditions. Voir aussi la règle.
quantification
Méthode de compression des poids des modèles de fondation pour accélérer l'inférence et réduire les besoins en mémoire du GPU.
R
R
Langage de script extensible utilisé dans la science des données et l'intelligence artificielle qui offre une grande variété de fonctions et de techniques analytiques, statistiques et graphiques.
lecture
Copier des données dans une application pour les manipuler ou les analyser.
rétrorédiger
Remplacer toutes les valeurs de données d'une colonne par la même chaîne pour masquer les valeurs sensibles, le format de données et les relations entre les valeurs. Une forme de masquage ..
jeu de données de référence
Artefact de gouvernance qui définit les valeurs pour des types de colonnes spécifiques.
affiner
Nettoyer et former les données.
apprentissage par renforcement
Technique d'apprentissage automatique dans laquelle un agent apprend à prendre des décisions séquentielles dans un environnement afin de maximiser un signal de récompense. Inspirés par l'apprentissage des essais et des erreurs, les agents interagissent avec l'environnement, reçoivent des commentaires en retour et adaptent leurs actions pour atteindre des politiques optimales.
récompense
Signal utilisé pour guider un agent, généralement un agent d'apprentissage par renforcement, qui fournit un retour d'information sur la qualité d'une décision
règle
Un artefact qui contient des informations, des critères ou une logique permettant d'analyser ou de protéger les données. Voir aussi règle de protection des données, règle de qualité des données, règle de gouvernance, règle de qualité, règle de composition des attributs.
environnement d'exécution
Configuration matérielle et logicielle prédéfinie ou personnalisée utilisée pour exécuter des outils ou des travaux, tels que des blocs-notes.
S
évaluation
- En apprentissage automatique, procédé de mesure de la confiance d'un résultat prédit.
- Processus de calcul du degré de concordance entre les attributs d'une entité entrante et ceux d'une entité existante.
script
Fichier contenant des scripts Python ou R pour la prise en charge d'un modèle en production.
catégorie secondaire
Catégorie optionnelle faisant référence à l'artefact de gouvernance.
Auto-attention
Mécanisme d'attention qui utilise les informations des données d'entrée elles-mêmes pour déterminer les parties de l'entrée sur lesquelles se concentrer lors de la génération de la sortie.
apprentissage auto-supervisé
Méthode d'apprentissage automatique dans laquelle un modèle apprend à partir de données non étiquetées en masquant des jetons dans une séquence d'entrée, puis en essayant de les prévoir. Un exemple est "J'aime les choux de ________".
recherche sémantique
Une recherche par mot-clé qui intègre une analyse linguistique et contextuelle. Dans une recherche sémantique, l'intention de la requête est précisée à l'aide d'un ou plusieurs spécificateurs. Par exemple, il est possible de spécifier une personne nommée "Bush" et une telle requête ne renverrait pas de résultats sur le type de buissons qui poussent dans un jardin, mais plutôt sur des personnes nommées Bush.
données sensibles
Données contenant des informations qui doivent être protégées contre un accès ou une divulgation non autorisés. Les catégories de données sensibles peuvent être des informations de santé protégées, des informations personnelles identifiables, des secrets commerciaux ou des résultats financiers.
analyse des sentiments
Examen du sentiment ou de l'émotion exprimée dans un texte, par exemple pour déterminer si une critique de film est positive ou négative.
forme
Personnaliser des données en les filtrant, les triant ou en en retirant des colonnes ; en joignant des tables, en exécutant des opérations incluant des calculs, des groupements de données, des hiérarchies, etc.
minidonnées
Données accessibles et compréhensibles par les humains. Voir aussi données structurées.
SQL Pushback
Dans SPSS Modeler, procédé consistant à exécuter de nombreuses opérations de préparation et d'exploration des données directement dans la base de données au moyen de code SQL.
données structurées
Données se trouvant dans des champs fixes d'un enregistrement ou d'un fichier. Les bases de données relationnelles et les feuilles de calcul sont des exemples de données structurées. Voir aussi données non structurées, données de petite taille.
information structurée
Eléments stockés dans des ressources structurées, telles que des index de moteur de recherche, des bases de données ou des bases de connaissances.
remplaçant
Remplacer des données dans une colonne par des valeurs dont le format est différent de celui des données d'origine mais préservent l'intégrité référentielle.
super noeud
Noeud SPSS Modeler qui rétrécit le flux de données en encapsulant plusieurs noeud en un seul.
apprentissage supervisé
Méthode d'apprentissage automatique dans laquelle un modèle est entraîné sur un jeu de données étiqueté pour faire des prévisions sur de nouvelles données.
T
classification de texte
Modèle qui identifie et classifie automatiquement le texte dans des catégories spécifiées.
séries temporelles
Ensemble de valeurs d'une variable à des points périodiques dans le temps.
modèle entraîné
Modèle entraîné avec des données réelles et prêt à être déployé pour prévoir les résultats lorsqu'il est présenté avec de nouvelles données.
entraînement
Phase initiale de la construction de modèle dans laquelle un sous-ensemble des données source est impliqué. Le modèle apprend par exemple à partir des données connues. Le modèle peut être testé avec un autre sous-ensemble de données pour lequel l'issue est déjà connue.
données d'apprentissage
Une collection de données utilisée pour former des modèles d'apprentissage automatique.
ensemble d’apprentissage
Ensemble de données étiquetées utilisé pour entraîner un modèle d'apprentissage automatique en l'exposant à des exemples et à leurs libellés correspondants, ce qui permet au modèle d'apprendre des motifs et d'effectuer des prévisions.
apprentissage par transposition
Stratégie d'apprentissage automatique dans laquelle un modèle entraîné est appliqué à un problème complètement nouveau.
transformateur
Une architecture de réseau neuronal qui utilise les encodages positionnels et le mécanisme d'auto-attention pour prédire le prochain élément d'une séquence d'éléments.
transparence
Partage de l'information appropriée avec les parties prenantes sur la façon dont un système d'IA a été conçu et développé. Des exemples de cette information sont les données recueillies, la façon dont elles seront utilisées et stockées, et les personnes qui y ont accès ; et les résultats des tests de précision, de robustesse et de biais.
Test de Turing
Proposé par Alan Turing en 1950, un test de la capacité d'une machine à montrer un comportement intelligent équivalent ou indiscernable de celui d'un humain.
U
problème sans limite
Problème d'optimisation décisionnelle (notamment dans Decision Optimization) pour lequel il existe un nombre infini de solutions et dont l'objectif peut prendre des valeurs jusqu'à l'infini. Les problèmes non bornés sont souvent causés par des contraintes manquantes dans la formulation du modèle.
données non structurées
Données enregistrées dans un format non structuré plutôt que dans des champs fixés à l'avance. Exemple : les données contenues dans un document de traitement de texte. Voir aussi données structurées.
information non structurée
Données qui ne sont pas contenues dans un emplacement fixe, tel que le document texte en langage naturel.
apprentissage non supervisé
Méthode d'apprentissage automatique dans laquelle un modèle n'est pas fourni avec des données étiquetées et doit rechercher des motifs ou une structure dans les données de manière autonome.
V
Ensemble de validation
Ensemble distinct de données étiquetées qui est utilisé pour évaluer les performances et la capacité de généralisation d'un modèle d'apprentissage automatique au cours du processus d'apprentissage, en aidant à l'ajustement des hyperparamètres et à la sélection des modèles.
visualisation
Graphe, diagramme, graphique, tracé, courbe, tableau, carte ou toute autre forme de représentation visuelle de données.
W
poids
Coefficient d'un noeud qui transforme les données d'entrée dans la couche du réseau. La pondération est un paramètre qu'un modèle d'IA apprend par l'entraînement, en ajustant sa valeur pour réduire les erreurs dans les prévisions du modèle.