Este glosario proporciona términos y definiciones para watsonx.ai y watsonx.governance.
En este glosario se utilizan las siguientes referencias cruzadas:
- Véase le remite desde un término no preferido al término preferido o desde una abreviatura a la forma completa.
- Véase también le remite a un término relacionado u opuesto.
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W | Z
A
acelerador
En informática de alto rendimiento, un circuito especializado que se utiliza para tomar parte de la carga computacional de la CPU, aumentando la eficiencia del sistema. Por ejemplo, en el aprendizaje profundo, la informática acelerada por GPU se suele emplear para descargar parte de la carga de trabajo de cálculo en una GPU mientras la aplicación principal se ejecuta fuera de la CPU. Véase también unidad de proceso de gráficos.
responsabilidad
La expectativa de que las organizaciones o las personas garantizarán el funcionamiento adecuado, a lo largo de su ciclo de vida, de los sistemas de IA que diseñan, desarrollan, operan o despliegan, de acuerdo con sus roles y marcos normativos aplicables. Esto incluye determinar quién es responsable de un error de IA que puede requerir que los expertos legales determinen la responsabilidad caso por caso.
función de activación
Una función que define la salida de una unidad neuronal dado un conjunto de activaciones entrantes de otras neuronas
Aprendizaje activo
Modelo de aprendizaje automático en el que el sistema solicita más datos etiquetados sólo cuando los necesita.
metadatos activos
Metadatos que se actualizan automáticamente basándose en el análisis realizado por los procesos de aprendizaje automático. Por ejemplo, la creación de perfiles y el análisis de calidad de datos actualizan automáticamente los metadatos de los activos de datos.
tiempo de ejecución activo
Instancia de un entorno que se ejecuta para proporcionar recursos informáticos a los activos que ejecutan código.
agente
Algoritmo o programa que interactúa con un entorno para aprender acciones o decisiones óptimas, normalmente utilizando el aprendizaje de refuerzo, para lograr un objetivo específico.
agentic IA
Flujo de IA generativo que puede descomponer una solicitud en varias tareas, asignar tareas a agentes de IA de generación adecuados y sintetizar una respuesta sin intervención humana.
IA
Véase inteligencia artificial.
Acelerador de IA
Hardware de silicio especializado diseñado para ejecutar de forma eficiente tareas relacionadas con IA como deep learning, machine learning y redes neuronales para una informática más rápida y eficiente desde el punto de vista energético. Puede ser una unidad dedicada en un núcleo, un chiplet separado en un chip multimódulo o una tarjeta separada.
Ética de la IA
Un campo multidisciplinar que estudia cómo optimizar el impacto beneficioso de la IA a la vez que reduce los riesgos y los resultados adversos. Ejemplos de cuestiones éticas de IA son la responsabilidad y la privacidad de los datos, la equidad, la explicabilidad, la robustez, la transparencia, la sostenibilidad ambiental, la inclusión, la agencia moral, la alineación de valores, la responsabilidad, la confianza y el mal uso de la tecnología.
Gobierno de IA
El acto de gobernar de una organización, a través de sus instrucciones corporativas, el personal, los procesos y los sistemas para dirigir, evaluar, monitorizar y tomar medidas correctivas a lo largo del ciclo de vida de la IA, para proporcionar la garantía de que el sistema de IA está funcionando como la organización pretende, como esperan sus partes interesadas, y como lo requiere la normativa pertinente.
Seguridad de IA
El campo de investigación con el objetivo de garantizar que los sistemas de inteligencia artificial operen de una manera que sea beneficiosa para la humanidad y no causen inadvertidamente daños, abordando cuestiones como la fiabilidad, la equidad, la transparencia y la alineación de los sistemas de IA con los valores humanos.
Servicio de IA
Unidad de código desplegable que contiene la lógica de un caso de uso de IA generativa y proporciona un punto final para la inferencia desde una aplicación.
Sistema de IA
algoritmo
Fórmula aplicada a los datos para determinar formas óptimas de resolver problemas analíticos.
análisis
Ciencia que estudia los datos para encontrar patrones significativos en estos y extraer conclusiones basadas en dichos patrones.
confianza adecuada
En un sistema de IA, cantidad de confianza que se calibra según su precisión, fiabilidad y credibilidad.
inteligencia artificial (IA)
La capacidad de adquirir, procesar, crear y aplicar conocimientos en forma de modelo para realizar predicciones, recomendaciones o decisiones.
sistema de inteligencia artificial (sistema IA)
Sistema que puede realizar predicciones, recomendaciones o decisiones que influyen en entornos físicos o virtuales, y cuyos resultados o comportamientos no están necesariamente predeterminados por su desarrollador o usuario. Los sistemas de IA normalmente se entrenan con grandes cantidades de datos estructurados o no estructurados, y pueden estar diseñados para operar con distintos niveles de autonomía o ninguno, para lograr objetivos definidos por el ser humano.
activo
Elemento que contiene información sobre datos, otra información valiosa o código que funciona con datos. Véase también activo de datos.
mecanismo de atención
Mecanismo en los modelos de aprendizaje profundo que determina en qué partes de la entrada se centra un modelo al producir la salida.
Experimento de AutoAI
Un proceso de entrenamiento automatizado que tiene en cuenta una serie de definiciones y parámetros de entrenamiento para crear un conjunto de interconexiones clasificadas como candidatos de modelo.
B
despliegue por lotes
Método para desplegar modelos que procesan datos de entrada de un archivo, conexión de datos o datos conectados en un grupo de almacenamiento y, a continuación, escribe la salida en un destino seleccionado.
bias
Error sistemático en un sistema de IA que ha sido diseñado, intencionadamente o no, de una manera que puede generar decisiones injustas. El sesgo puede estar presente tanto en el sistema de IA como en los datos utilizados para entrenarlo y probarlo. El sesgo de IA puede surgir en un sistema de IA como resultado de expectativas culturales; limitaciones técnicas; o contextos de despliegue no previstos. Véase también equidad.
detección de sesgos
El proceso de calcular la equidad a las métricas para detectar cuándo los modelos de IA están entregando resultados sesgados con base en determinados atributos.
Mitigación de sesgo
Reducción de sesgos en los modelos de IA mediante la organización de datos de entrenamiento y la aplicación de técnicas de equidad.
Clasificación binaria
Un modelo de clasificación con dos clases. Las predicciones son una opción binaria de una de las dos clases.
C
modelo de clasificación
Un modelo predictivo que predice datos en categorías distintas. Las clasificaciones pueden ser binarias, con dos clases de datos o de varias clases cuando hay más de 2 categorías.
limpiar
Asegurar que todos los valores de un archivo son coherentes y están registrados correctamente.
CNN
Véase red neuronal convolucional.
función de forzamiento cognitivo
Una intervención que se aplica en un momento de toma de decisiones para interrumpir el razonamiento heurístico y hacer que una persona se involucre en el pensamiento analítico; los ejemplos incluyen una lista de comprobación, un tiempo de espera de diagnóstico, o pedirle a una persona que descarte una alternativa.
lingüística computacional
Campo interdisciplinario que explora enfoques para modelar computacionalmente lenguajes naturales.
recurso de cálculo
Los recursos de hardware y software definidos por una plantilla de entorno para ejecutar activos en herramientas.
matriz de confusión
Medida de rendimiento que determina la precisión entre los resultados pronosticados positivos y negativos de un modelo en comparación con los resultados reales positivos y negativos.
activo de datos conectado
Un puntero a los datos a los que se accede mediante una conexión a un origen de datos externo.
Activo de carpeta conectado
Un puntero a una carpeta en IBM Cloud Object Storage.
conexión
La información necesaria para conectarse a una base de datos. La información real que se necesita varía según el DBMS y el método de conexión.
activo de conexión
Un activo que contiene información que habilita la conexión a un origen de datos.
restricción
- En bases de datos, relación entre tablas.
- En Decision Optimization, condición que debe satisfacer la solución de un problema.
aprendizaje continuo
La automatización de las tareas de supervisión de rendimiento de modelo, reentrenamiento con datos nuevos y redespliegue para garantizar la calidad de la predicción.
red neuronal convolucional (CNN)
Clase de red neuronal utilizada habitualmente en tareas de visión de sistema que utiliza capas convolucionales para procesar datos de imagen.
despliegue de Core ML
El proceso de descargar un despliegue en formato ML Core para su uso en aplicaciones iOS.
corpus
Una colección de documentos de origen que se utilizan para entrenar un modelo de aprendizaje automático.
Modelo CPLEX
Un modelo de Decision Optimization formulado para ser resuelto por el motor de CPLEX.
Modelo de CPO
Un modelo de programación de restricciones formulado para ser resuelto por el motor de Decision Optimization CP Optimizer (CPO).
validación cruzada
Una técnica para probar qué tan bien se generaliza un modelo en ausencia de una muestra de prueba de espera. La validación cruzada divide los datos de entrenamiento en un número de subconjuntos y, a continuación, crea el mismo número de modelos, con cada subconjunto retenido a su vez. Cada uno de estos modelos se prueba en la muestra reservada, y la precisión media de los modelos en esas muestras reservadas se utiliza para estimar la precisión del modelo cuando se aplica a nuevos datos.
conservar
Seleccionar, recopilar, conservar y mantener contenido relevante para un tema específico. La conservación establece, mantiene y añade valor a los datos; transforma datos en información y conocimiento de confianza.
D
activo de datos
Un activo que apunta a datos, por ejemplo, a un archivo cargado. Las conexiones y los activos de datos conectados también se consideran activos de datos. Véase también activo.
Imputación de datos
Sustitución de valores perdidos en un conjunto de datos con valores estimados o explícitos.
lago de datos
Repositorio de almacenamiento de datos a gran escala que almacena datos en bruto en cualquier formato en una arquitectura plana. Los lagos de datos contienen datos estructurados y no estructurados, así como datos binarios, con el fin de procesarlos y analizarlos.
casa de lago de datos
Una arquitectura unificada de procesamiento y almacenamiento de datos que combina la flexibilidad de un lago de datos con las consultas estructuradas y las optimizaciones de rendimiento de un almacén de datos, lo que permite un análisis de datos escalable y eficiente para aplicaciones de IA y analítica.
minería de datos
El proceso de recopilar información empresarial crítica de un origen de datos, correlacionarla y descubrir asociaciones, patrones y tendencias. Véase también análisis predictivo.
Flujo de Data Refinery
Conjunto de pasos que limpian y dan forma a los datos para producir un nuevo activo de datos.
ciencia de datos
El análisis y la visualización de datos estructurados y no estructurados para descubrir detalles e información útil.
conjunto de datos
Una recopilación de datos, normalmente en forma de filas (registros) y columnas (campos), contenidos en un archivo o tabla de base de datos.
origen de datos
Repositorio, cola o canal de información para leer datos, como por ejemplo una base de datos.
tabla de datos
Una recopilación de datos, normalmente en forma de filas (registros) y columnas (campos), contenidos en una tabla.
almacén de datos
Un repositorio grande y centralizado de datos recopilados de varias fuentes que se utiliza para la creación de informes y el análisis de datos. Almacena principalmente datos estructurados y semiestructurados, lo que permite a las empresas tomar decisiones informadas.
DDL
límite de decisión
División de puntos de datos en un espacio en grupos o clasificaciones distintos.
modelo de solo decodificador
Modelo que genera texto de salida palabra por palabra por inferencia a partir de la secuencia de entrada. Los modelos de solo decodificador se utilizan para tareas como generar texto y responder preguntas.
Aprendizaje profundo
Modelo computacional que utiliza varias capas de nodos interconectados, que se organizan en capas jerárquicas, para transformar datos de entrada (primera capa) a través de una serie de cálculos para producir una salida (capa final). El aprendizaje profundo se inspira en la estructura y la función del cerebro humano. Véase también aprendizaje profundo distribuido.
red neuronal profunda
Una red neuronal con varias capas ocultas, lo que permite representaciones más complejas de los datos.
razonamiento profundo
Una clase de aprendizaje automático en la que los sistemas generan conocimientos a partir de los datos para apoyar tareas cognitivas más allá de la percepción y la clasificación, como el sentido común, el cambio de situaciones, la planificación y la toma de decisiones.
despliegue
Un modelo o paquete de aplicación disponible para su uso.
espacio de despliegue
Un espacio de trabajo donde se despliegan los modelos y se gestionan los despliegues.
deterministic
Describe una característica de los sistemas informáticos cuando sus salidas están completamente determinadas por sus entradas.
IA discriminativa
Clase de algoritmo que se centra en buscar un límite que separe diferentes clases en los datos.
aprendizaje profundo distribuido (DDL)
Un enfoque para la formación de aprendizaje profundo que aprovecha los métodos de la informática distribuida. En un entorno DDL, la carga de trabajo de cálculo se distribuye entre la unidad de proceso central y la unidad de proceso de gráficos. Véase también aprendizaje profundo.
DOcplex
Una API de Python para modelar y resolver problemas de Decision Optimization .
E
incorporar
Representación numérica de una unidad de información, como una palabra o una frase, como vector de números con valor real. Las incorporaciones se aprenden, representaciones de baja dimensión de datos de mayor dimensión. Véase también codificación, representación.
emergencia
Propiedad de modelos de base en los que el modelo muestra comportamientos que no se han entrenado explícitamente.
comportamiento emergente
Un comportamiento exhibido por un foundation model que no fue construido explícitamente.
modelo encoder-decoder
Modelo para comprender el texto de entrada y para generar texto de salida basado en el texto de entrada. Los modelos de codificador-decodificador se utilizan para tareas como el resumen o la conversión.
modelo de sólo codificador
Modelo que comprende el texto de entrada a nivel de frase transformando las secuencias de entrada en vectores representativos denominados incorporaciones. Los modelos de sólo codificador se utilizan para tareas como, por ejemplo, clasificar los comentarios de los clientes y extraer información de documentos de gran tamaño.
codificación
Representación de una unidad de información, como un carácter o una palabra, como un conjunto de números. Véase también inclusión, codificación posicional.
URL de punto final
Una dirección de destino de red que identifica recursos como, por ejemplo, servicios y objetos. Por ejemplo, un URL de punto final se utiliza para identificar la ubicación de un modelo o despliegue de función cuando un usuario envía datos de carga útil al despliegue.
entorno de
Los recursos de cálculo para ejecutar trabajos.
tiempo de ejecución del entorno
Una instanciación de la plantilla de entorno para ejecutar activos.
Plantilla de entorno
Una definición que especifica recursos de hardware y software para crear instancias de tiempos de ejecución del entorno.
característica exógena
Característica que puede influir en el modelo predictivo pero que no se puede influir a cambio. Por ejemplo, las temperaturas pueden afectar a las ventas previstas de helados, pero las ventas de helados no pueden influir en las temperaturas.
experimento
Proceso de entrenamiento de modelos que tiene en cuenta una serie de definiciones y parámetros de entrenamiento para determinar la configuración de modelo más precisa.
explicabilidad
- Capacidad de un usuario humano de realizar un rastreo, auditar y comprender las predicciones realizadas en aplicaciones que utilizan sistemas de inteligencia artificial.
- La capacidad de un sistema de IA para proporcionar información que los humanos pueden utilizar para comprender las causas de las predicciones del sistema.
F
Equidad
En un sistema de IA, el trato equitativo de los individuos o grupos de individuos. La elección de una noción específica de equidad para un sistema de IA depende del contexto en el que se utiliza. Véase también sesgo.
característica
Propiedad o característica de un elemento dentro de un conjunto de datos, por ejemplo, una columna en una hoja de cálculo. En algunos casos, las características se diseñan como combinaciones de otras características en el conjunto de datos.
Ingeniería de características
Proceso de selección, transformación y creación de nuevas características a partir de datos en bruto para mejorar el rendimiento y la potencia predictiva de los modelos de aprendizaje automático.
Grupo de características
Conjunto de columnas de un activo de datos determinado junto con los metadatos que se utilizan para el aprendizaje automático.
selección de características
Identificación de las columnas de datos que mejor dan soporte a una predicción o puntuación precisa en un modelo de aprendizaje automático.
almacén de características
Un repositorio o sistema centralizado que gestiona y organiza características, proporcionando una forma escalable y eficiente de almacenar, recuperar y compartir datos de características entre interconexiones y aplicaciones de aprendizaje automático.
transformación de característica
En AutoAI, una fase de creación de interconexiones que aplica algoritmos para transformar y optimizar los datos de entrenamiento para lograr el mejor resultado para el tipo de modelo.
Federated Learning
El entrenamiento de un modelo de aprendizaje automático común que utiliza varios orígenes de datos que no se mueven, se unen o se comparten. El resultado es un modelo mejor entrenado sin poner en peligro la seguridad de los datos.
solicitud de pocos disparos
Técnica de solicitud en la que se proporciona un pequeño número de ejemplos al modelo para demostrar cómo completar la tarea.
Ajuste preciso
El proceso de adaptación de un modelo preentrenado para realizar una tarea específica mediante la realización de un entrenamiento adicional. El ajuste fino puede implicar (1) actualizar los parámetros existentes del modelo, conocidos como ajuste fino completo, o (2) actualizar un subconjunto de los parámetros existentes del modelo o añadir nuevos parámetros al modelo y entrenarlos mientras se congelan los parámetros existentes del modelo, conocidos como ajuste fino eficiente de parámetros.
flujo
Una colección de nodos que definen un conjunto de pasos para procesar datos o entrenar un modelo.
foundation model
Un modelo de IA que se puede adaptar a una amplia gama de tareas en sentido descendente. Los modelos de base suelen ser modelos generativos a gran escala que se entrenan sobre datos no etiquetados utilizando la autosupervisión. Como modelos a gran escala, los modelos de base pueden incluir miles de millones de parámetros.
G
Gráfica de Gantt
Una representación gráfica de la línea de tiempo y duración de un proyecto en las que aparecen los datos de la planificación como barras horizontales a lo largo de una escala de tiempo.
IA generativa
Véase IA generativa.
IA generativa (IA de generación)
Clase de algoritmos de IA que pueden producir varios tipos de contenido, incluyendo texto, código fuente, imágenes, audio y datos sintéticos.
variabilidad generativa
La característica de los modelos generativos para producir salidas variadas, incluso cuando la entrada al modelo se mantiene constante. Véase también probabilístico.
Soporte
Creador gráfico
Una herramienta para crear activos de flujo mediante codificación visual. Un lienzo es un área en la que se colocan objetos o nodos que se pueden conectar para crear un flujo.
Unidad de proceso de gráficos (GPU)
Procesador especializado diseñado para manipular y alterar rápidamente la memoria para acelerar la creación de imágenes en un almacenamiento intermedio de tramas destinado a la salida a una pantalla. Las GPU se utilizan mucho en el aprendizaje automático debido a sus capacidades de procesamiento paralelo. Véase también acelerador.
Base
Proporcionar un modelo de lenguaje grande con información para mejorar la precisión de los resultados.
H
Alucinación
Una respuesta de un foundation model fundación que incluye contenido fuera de tema, repetitivo, incorrecto o inventado. Las alucinaciones que implican la fabricación de detalles pueden suceder cuando se solicita a un modelo que genere texto, pero el modelo no tiene suficiente texto relacionado para generar un resultado que contenga los detalles correctos.
Detección de HAP (detección de HAP)
- La capacidad de detectar y filtrar el odio, el abuso y el lenguaje obsceno en ambas solicitudes enviadas por los usuarios y en las respuestas generadas por un modelo de IA.
Detector HAP (detector HAP)
- Un clasificador de frases que elimina los contenidos potencialmente nocivos, como las expresiones de odio, los insultos y las blasfemias, de la salida y la entrada foundation model.
conjunto de espera
Conjunto de datos etiquetados que se retienen intencionadamente de los conjuntos de entrenamiento y validación, lo que sirve como una evaluación imparcial del rendimiento del modelo final en datos no vistos.
homogeneización
La tendencia en la investigación de aprendizaje automático en la que un pequeño número de arquitecturas de redes neuronales profundas, como el transformador, están logrando resultados de última generación a través de una amplia variedad de tareas.
HPO
supervisión humana
Participación humana en la revisión de las decisiones tomadas por un sistema de IA, permitiendo la autonomía humana y la rendición de cuentas de las decisiones.
hiperparámetro
En el aprendizaje automático, un parámetro cuyo valor se define antes del entrenamiento como una forma de mejorar la precisión del modelo.
optimización de hiperparámetros (HPO)
El proceso para establecer valores de hiperparámetros en las configuraciones que proporcionan el modelo más preciso.
I
imagen
Un paquete de software que contiene un conjunto de bibliotecas.
Aprendizaje incremental
Proceso de entrenamiento de un modelo utilizando datos que se actualizan continuamente sin olvidar los datos obtenidos de las tareas anteriores. Esta técnica se utiliza para entrenar un modelo con lotes de datos de un origen de datos de entrenamiento grande.
inferencia
Proceso de ejecutar datos en directo a través de un modelo de IA entrenado para realizar una predicción o resolver una tarea.
ingerir
- Añadir de forma continua un gran volumen de datos en tiempo real a una base de datos.
- Alimentar datos en un sistema con el fin de crear una base de conocimiento.
conocimiento
Una comprensión precisa o profunda de algo. Los conocimientos se obtienen utilizando la analítica cognitiva para proporcionar instantáneas y predicciones actuales de comportamientos y actitudes de los clientes.
inteligencia artificial
Sistemas de inteligencia artificial que pueden comprender, aprender, adaptarse e implementar el conocimiento, demostrando habilidades como la toma de decisiones, la resolución de problemas y la comprensión de conceptos complejos, al igual que la inteligencia humana.
intención
Propósito o objetivo expresado por la entrada de cliente a un chatbot, como responder a una pregunta o procesar un pago de factura.
J
trabajo
Una unidad de trabajo ejecutable por separado.
K
base de conocimiento
Véase corpus.
L
etiqueta
Una clase o categoría asignada a un punto de datos en el learning.Labels se pueden derivar de los datos, pero a menudo las aplican los etiquetadores o anotadores humanos.
datos etiquetados
Datos sin formato a los que se asignan etiquetas para añadir contexto o significado para que se puedan utilizar para entrenar modelos de aprendizaje automático. Por ejemplo, los valores numéricos pueden estar etiquetados como códigos postales o edades para proporcionar contexto para entradas y salidas de modelo.
modelo de lenguaje grande (LLM)
Un modelo de lenguaje con un gran número de parámetros, entrenados en una gran cantidad de texto.
espacio latente
Espacio matemático n-dimensional en el que se incorporan instancias de datos. Un espacio latente bidimensional incorpora datos como puntos dentro de un plano 2D (consulte también: espacio de representación). Véase también espacio representativo.
LLM
Véase modelo de lenguaje grande.
M
aprendizaje automático (ML)
Una rama de la inteligencia artificial (IA) y la informática que se centra en el uso de datos y algoritmos para imitar la forma en que los humanos aprenden, mejorando gradualmente la precisión de los modelos de IA.
infraestructura de aprendizaje automático
Las bibliotecas y el tiempo de ejecución para entrenar y desplegar un modelo.
modelo de aprendizaje automático
Un modelo de IA que se entrena en un conjunto de datos para desarrollar algoritmos que puede utilizar para analizar y aprender de nuevos datos.
modelo mental
Comprensión individual de cómo funciona un sistema y cómo sus acciones afectan a los resultados del sistema. Cuando estas expectativas no coinciden con las capacidades reales de un sistema, puede provocar frustración, abandono o mal uso.
desalineación
Una discrepancia entre los objetivos o comportamientos que un sistema de IA está optimizado para alcanzar y los verdaderos, a menudo complejos, objetivos de sus usuarios o diseñadores humanos
ML
Véase aprendizaje automático.
MLOps
- Metodología que lleva un modelo de aprendizaje automático del desarrollo a la producción.
- La práctica de colaboración entre científicos de datos y profesionales de operaciones para ayudar a gestionar el ciclo de vida de machine learning (o deep learning) de producción. MLOps busca aumentar la automatización y mejorar la calidad de la producción ML al tiempo que se centra en los requisitos empresariales y normativos. Implica el desarrollo de modelos, el entrenamiento, la validación, el despliegue, la supervisión y la gestión y utiliza métodos como CI/CD.
modelo
- En un contexto de aprendizaje automático, un conjunto de funciones y algoritmos que se han entrenado y probado en un conjunto de datos para proporcionar predicciones o decisiones.
- En Decision Optimization, una formulación matemática de un problema que se puede resolver con motores de optimización de CPLEX utilizando distintos conjuntos de datos.
ModelOps
Una metodología para gestionar el ciclo de vida completo de un modelo de IA, incluidos el entrenamiento, el despliegue, la puntuación, la evaluación, entrenarlo de nuevo y la actualización.
Grupo supervisado
Clase de datos que se supervisa para determinar si los resultados de un modelo predictivo difieren significativamente de los resultados del grupo de referencia. Los grupos se monitorizan comúnmente en función de las características que incluyen raza, género o edad.
modelo de clasificación multiclase
Una tarea de clasificación con más de dos clases. Por ejemplo, cuando un modelo de clasificación binaria predice valores sí o no, un modelo de varias clases predice sí, no, tal vez, o no aplicable.
modelo multimodal
Un modelo de IA generativo que puede procesar varios tipos de datos, como texto, imágenes y audio, y convertir entre ellos. Por ejemplo, un modelo multimodal puede tomar entrada de texto y generar salida de imagen.
serie temporal multivariante
Experimento de serie temporal que contiene dos o más variables cambiantes. Por ejemplo, un modelo de serie temporal que prevé el uso de electricidad de tres clientes.
N
procesamiento del lenguaje natural (PLN)
Un campo de la inteligencia artificial y la lingüística que estudia los problemas inherentes en el proceso y en la manipulación del lenguaje natural, con el fin de aumentar la capacidad de los ordenadores de comprender los idiomas humanos.
biblioteca de procesamiento de lenguaje natural
Biblioteca que proporciona funciones básicas de procesamiento de lenguaje natural para el análisis de sintaxis y modelos preentrenados listos para usar para una amplia variedad de tareas de procesamiento de texto.
red neuronal
Un modelo matemático para predecir o clasificar casos utilizando un esquema matemático complejo que simula una versión abstracta de las células del cerebro. Para entrenar una red neuronal se le presenta un gran número de casos observados, uno por uno, y se le permite actualizarse automática y repetidamente hasta que aprende la tarea.
PLN
Véase proceso de lenguaje natural.
nodo
En un flujo de SPSS Modeler , la representación gráfica de una operación de datos.
cuaderno
Un documento interactivo que contiene código ejecutable, texto descriptivo para ese código y los resultados del código que se ejecutan.
kernel de cuaderno
Parte del editor de cuadernos que ejecuta código y devuelve los resultados de cálculo.
O
almacenamiento de objetos
Un método de almacenamiento de datos, que se utiliza normalmente en la nube, en el que los datos se almacenan como unidades individuales u objetos en una agrupación de almacenamiento o repositorio que no utiliza una jerarquía de archivos, sino que almacena todos los objetos en el mismo nivel.
aprendizaje de una sola vez
Un modelo para el aprendizaje profundo que se basa en la premisa de que la mayoría del aprendizaje humano tiene lugar al recibir solo uno o dos ejemplos. Este modelo es similar al aprendizaje no supervisado.
solicitud de una sola vez
Técnica de solicitud en la que se proporciona un único ejemplo al modelo para demostrar cómo completar la tarea.
despliegue en línea
Método de acceso a un modelo o despliegue de código Python a través de un punto final de API como un servicio web para generar predicciones en línea, en tiempo real.
ontología
Especificación formal explícita de la representación de los objetos, conceptos y otras entidades que pueden existir en un área de interés y las relaciones entre ellos.
activo operativo
Activo que ejecuta código en una herramienta o un trabajo.
optimización
El proceso de encontrar la solución más adecuada a un problema definido con precisión, respetando al mismo tiempo las restricciones y limitaciones impuestas. Por ejemplo, determinar cómo asignar recursos o cómo encontrar los mejores elementos o combinaciones de un gran conjunto de alternativas.
Lenguaje de programación de optimización
Un lenguaje de modelado para expresar las formulaciones de modelos de problemas de optimización en un formato que puedan resolver los motores de optimización de CPLEX como, por ejemplo, IBM CPLEX.
Métrica optimizada
Métrica utilizada para medir el rendimiento del modelo. Por ejemplo, la precisión es la métrica típica que se utiliza para medir el rendimiento de un modelo de clasificación binario.
Heat
Proceso de creación de un flujo de extremo a extremo que puede entrenar, ejecutar, desplegar, probar y evaluar un modelo de aprendizaje automático, y utiliza la automatización para coordinar el sistema, a menudo utilizando microservicios.
exceso de confianza
Aceptación de un usuario de una recomendación incorrecta realizada por un modelo de IA. Véase también dependencia, dependencia insuficiente.
P
Parámetro
- Parte configurable del modelo que es interna de un modelo y cuyos valores se estiman o se aprenden de los datos. Los parámetros son aspectos del modelo que se ajustan durante el proceso de entrenamiento para ayudar al modelo a predecir con precisión la salida. El rendimiento y la potencia predictiva del modelo dependen en gran medida de los valores de estos parámetros.
- Una ponderación de valor real entre 0.0 y 1.0 que indica la fuerza de conexión entre dos neuronas en una red neuronal.
parte
En Federated Learning, entidad que aporta datos para entrenar un modelo común. Los datos no se mueven ni combinan, pero cada parte obtiene las ventajas de Federated Training.
carga útil
Los datos que se pasan a un despliegue para volver a obtener una puntuación, predicción o solución.
registro de carga útil
Captura de datos de carga útil y salida de despliegue para supervisar el estado continuo de IA en aplicaciones de la empresa.
interconexión
- En Watson Pipelines, un flujo integral de activos desde la creación hasta la implantación.
- En AutoAI,, un modelo candidato.
tabla de clasificación de interconexiones
En AutoAI, tabla que muestra la lista de modelos candidatos generados automáticamente, como pipelines, clasificados según los criterios especificados.
política
Estrategia o regla que sigue un agente para determinar la siguiente acción basándose en el estado actual.
codificación posicional
Una codificación de una secuencia ordenada de datos que incluye información posicional, tal como la codificación de palabras en una oración que incluye la posición de cada palabra dentro de la oración. Véase también codificación.
análisis predictivo
Un proceso empresarial y un conjunto de tecnologías relacionadas que se ocupan de la predicción de posibilidades y tendencias futuras. El análisis predictivo aplica disciplinas tan diversas como la probabilidad, la estadística, el aprendizaje automático y la inteligencia artificial a los problemas de negocio para encontrar la mejor acción para una situación específica. Véase también minería de datos.
modelo preentrenado
Un modelo de IA que se ha entrenado previamente en un conjunto de datos grande para realizar una tarea específica. Los modelos entrenados previamente se utilizan en lugar de crear un modelo desde cero.
formación previa
Proceso de entrenamiento de un modelo de aprendizaje automático en un conjunto de datos grande antes de ajustarlo para una tarea específica.
privacidad
Garantía de que la información sobre una persona está protegida contra el acceso no autorizado y el uso inadecuado.
Probabilístico
La característica de estar sujeto a aleatoriedad; no determinista. Los modelos probabilísticos no producen las mismas salidas dadas las mismas entradas. Véase también variabilidad generativa.
proyecto
Un espacio de trabajo de colaboración para trabajar con datos y otros activos.
solicitud
- Datos, como un texto o una imagen, que preparan, instruyen o condicionan la salida de un foundation model.
- Un componente de una acción que indica que la entrada de usuario es necesaria para un campo antes de pasar a una pantalla de salida.
Ingeniería de solicitud
El proceso de diseño del lenguaje natural solicita un modelo de lenguaje para realizar una tarea específica.
solicitud
Proceso por el que se introducen datos en un foundation model para inducirle a producir resultados.
Ajuste de solicitudes
Una forma eficiente y de bajo coste de adaptar un modelo preentrenado a nuevas tareas sin volver a entrenar el modelo ni actualizar sus pesos. El ajuste de solicitud implica el aprendizaje de un pequeño número de parámetros nuevos que se añaden a la solicitud de un modelo, al tiempo que se bloquean los parámetros existentes del modelo.
poda
Proceso de simplificar, reducir o recortar un árbol de decisiones o una red neuronal. Esto se hace eliminando los nodos o capas menos importantes, reduciendo la complejidad para evitar el sobreajuste y mejorar la generalización del modelo, manteniendo al mismo tiempo su poder predictivo.
Python
Lenguaje de programación que se utiliza en ciencia de datos e IA.
Función de Python
Una función que contiene código Python para dar soporte a un modelo en producción.
Q
cuantificación
Un método de compresión de pesos de foundation model para acelerar la inferencia y reducir las necesidades de memoria de la GPU.
R
R
Un lenguaje de scripts extensible que se utiliza en la ciencia de datos y la IA que ofrece una amplia variedad de funciones y técnicas analíticas, estadísticas y gráficas.
RAG
semilla aleatoria
Número utilizado para inicializar un generador de números pseudoaleatorios. Las semillas aleatorias permiten la reproducibilidad para procesos que se basan en la generación de números aleatorios.
grupo de referencia
Grupo que se identifica como el más propenso a recibir un resultado positivo en un modelo predictivo. Los resultados se pueden comparar con un grupo monitoreado para buscar un sesgo potencial en los resultados.
refinar
Limpiar y dar forma a datos.
Modelo de regresión
Modelo que relaciona una variable dependiente con una o más variables independientes.
Aprendizaje por incentivos («reinforcement learning»)
Técnica de aprendizaje automático en la que un agente aprende a tomar decisiones secuenciales en un entorno para maximizar una señal de recompensa. Inspirados en el aprendizaje de prueba y error, los agentes interactúan con el entorno, reciben comentarios y ajustan sus acciones para lograr políticas óptimas.
refuerzo del aprendizaje sobre la retroalimentación humana (RLHF)
Método para alinear las respuestas de un modelo de aprendizaje de idioma a las instrucciones proporcionadas en una solicitud. RLHF requiere que los anotadores humanos clasifiquen varias salidas del modelo. Estas clasificaciones se utilizan entonces para entrenar un modelo de recompensa utilizando el aprendizaje de refuerzo. A continuación, el modelo de recompensa se utiliza para ajustar la salida del modelo de lenguaje grande.
dependencia
En sistemas de IA, la aceptación de un usuario de una recomendación realizada por, o la salida generada por, un modelo de IA. Véase también dependencia excesiva, dependencia insuficiente.
representación
Codificación de una unidad de información, a menudo como vector de números con valor real. Véase también inclusión.
espacio de representación
Espacio matemático n-dimensional en el que se incorporan instancias de datos. Un espacio latente bidimensional incorpora datos como puntos dentro de un plano 2D (consulte también: espacio latente). Véase también espacio latente.
Nueva clasificación
Un proceso generativo de IA para clasificar un conjunto de pasajes de documentos de mayor a menor probabilidad de responder a una consulta especificada.
generación aumentada de recuperación (RAG)
Técnica en la que se aumenta un modelo de lenguaje grande con conocimientos de fuentes externas para generar texto. En el paso de recuperación, los documentos relevantes de un origen externo se identifican a partir de la consulta del usuario. En el paso de generación, partes de esos documentos se incluyen en la solicitud LLM para generar una respuesta conectada a tierra en los documentos recuperados.
recompensa
Una señal utilizada para guiar a un agente, normalmente un agente de aprendizaje de refuerzo, que proporciona retroalimentación sobre la bondad de una decisión
RLHF
entorno de ejecución
La configuración de hardware y software predefinida o personalizada que se utiliza para ejecutar herramientas o trabajos, como por ejemplo cuadernos.
S
puntuación
- En aprendizaje automático, el proceso de medir la confianza de un resultado previsto.
- El proceso que calcula el grado de coincidencia de los atributos de una identidad de entrada con los atributos de una entidad existente.
script
Archivo que contiene Python o scripts R para dar soporte a un modelo en producción.
autoatención
Mecanismo de atención que utiliza la información de los propios datos de entrada para determinar en qué partes de la entrada debe centrarse al generar la salida.
aprendizaje autosupervisado
Método de entrenamiento de aprendizaje automático en el que un modelo aprende de datos no etiquetados enmascarando señales en una secuencia de entrada y, a continuación, intentando predecirlas. Un ejemplo es "Me gusta ________ brotes".
análisis de opiniones
Examen del sentimiento o emoción expresada en texto, como determinar si una revisión de película es positiva o negativa.
dar forma
Personalizar los datos filtrando, ordenando, eliminando columnas; uniendo tablas; realizando operaciones que incluyen cálculos, agrupaciones de datos, jerarquías y más.
datos pequeños
Datos que son accesibles y comprensibles para los humanos. Véase también datos estructurados.
retrotracción de SQL
En SPSS Modeler, el proceso de realizar muchas operaciones de preparación de datos y minería directamente en la base de datos mediante código SQL.
datos no estructurados
Datos que residen en campos fijos en un registro o archivo. Las hojas de cálculo y las bases de datos relacionales son ejemplos de datos estructurados. Véase también datos no estructurados, datos pequeños.
información estructurada
Elementos almacenados en recursos estructurados, como índices de motor de búsqueda, bases de datos o bases de conocimiento.
Aprendizaje supervisado
Método de entrenamiento de aprendizaje automático en el que se entrena un modelo en un conjunto de datos etiquetado para realizar predicciones sobre nuevos datos.
T
temperature
Parámetro de un modelo generativo que especifica la cantidad de variación en el proceso de generación. Las temperaturas más altas dan como resultado una mayor variabilidad en el resultado del modelo.
clasificación de texto
Modelo que identifica y clasifica automáticamente el texto en categorías especificadas.
extracción de texto
Un método de IA generativa para convertir información muy estructurada en un formato textual más sencillo que sirva de entrada a grandes modelos lingüísticos.
variables de series temporales
Conjunto de valores de una variable en puntos periódicos en el tiempo.
Modelo de serie temporal
Modelo que realiza un seguimiento y predice los datos a lo largo del tiempo.
señal
Unidad discreta de significado o análisis en un texto, como una palabra o subpalabra.
creación de unidades léxicas
Proceso utilizado en el proceso de lenguaje natural para dividir una serie de texto en unidades más pequeñas, como palabras o subpalabras.
modelo entrenado
Un modelo que se entrena con datos reales y está listo para ser desplegado para predecir resultados cuando se presentan nuevos datos.
entrenamiento
La etapa inicial de la creación de modelos, que incluye un subconjunto de los datos de origen. El modelo aprende por ejemplo de los datos conocidos. A continuación, el modelo se puede probar en un subconjunto distinto para el que ya se conoce el resultado.
datos de entrenamiento
Una colección de datos que se utiliza para entrenar modelos de aprendizaje automático.
Conjunto de entrenamiento
Conjunto de datos etiquetados que se utiliza para entrenar un modelo de aprendizaje automático exponiéndolo a ejemplos y sus etiquetas correspondientes, lo que permite al modelo aprender patrones y realizar predicciones.
aprendizaje de transferencia
Estrategia de aprendizaje automático en la que un modelo entrenado se aplica a un problema completamente nuevo.
Transformador
Arquitectura de red neuronal que utiliza codificaciones posicionales y el mecanismo de autoatención para predecir la siguiente señal en una secuencia de señales.
transparencia
Compartir información adecuada con las partes interesadas sobre cómo se ha diseñado y desarrollado un sistema de IA. Ejemplos de esta información son qué datos se recopilan, cómo se utilizarán y almacenarán, y quién tiene acceso a ellos; y los resultados de las pruebas de precisión, robustez y sesgo.
calibración de confianza
Proceso de evaluación y ajuste de la confianza en un sistema de IA basado en factores como su precisión, fiabilidad y credibilidad.
Prueba de Turing
Propuesto por Alan Turing en 1950, una prueba de la capacidad de una máquina para exhibir un comportamiento inteligente equivalente a, o indistinguible de, el de un humano.
U
subfiancia
Rechazo de un usuario de unas recomendaciones correctas realizadas por un modelo de IA. Véase también dependencia excesiva, dependencia.
serie temporal univariada
Experimento de serie temporal que contiene sólo una variable que cambia. Por ejemplo, un modelo de serie temporal que pronostica la temperatura tiene una única columna de predicción de la temperatura.
datos no estructurados
Datos almacenados en un formato no estructurado y no en campos fijos. Los datos de un documento de procesador de textos son un ejemplo de datos no estructurados. Véase también datos estructurados.
información no estructurada
Datos que no están contenidos en una ubicación fija, como el documento de texto en lenguaje natural.
aprendizaje no supervisado
- Un modelo de aprendizaje profundo que permite utilizar datos en bruto sin etiquetar para entrenar un sistema con poco o ningún esfuerzo humano.
- Método de entrenamiento de aprendizaje automático en el que un modelo no se proporciona con datos etiquetados y debe encontrar patrones o estructura en los datos por sí mismo.
V
Conjunto de validación
Conjunto separado de datos etiquetados que se utiliza para evaluar el rendimiento y la capacidad de generalización de un modelo de aprendizaje automático durante el proceso de entrenamiento, ayudando en el ajuste de hiperparámetros y la selección de modelos.
vector
Una lista ordenada y unidimensional de números, como por ejemplo [1, 2, 5] o [0.7, 0.2, -1.0].
Base de datos vectorial
Véase almacén de vectores.
índice de vector
Índice que recupera las incorporaciones vectorizadas de documentos de un almacén de vectores.
Almacén de vectores
Repositorio que almacena incorporaciones vectorizadas de documentos.
Verbalizador
En IA generativa, una plantilla para formatear los datos durante el ajuste y la inferencia.
agente virtual
Un bot de chat preentrenado que puede procesar lenguaje natural para responder y completar transacciones empresariales simples, o direccionar solicitudes más complicadas a un humano con experiencia en la materia.
visualización
Una gráfica, un diagrama, un gráfico, una tabla, un mapa o cualquier otra representación visual de los datos.
W
peso
Coeficiente para un nodo que transforma los datos de entrada dentro de la capa de la red. El peso es un parámetro que un modelo de IA aprende a través del entrenamiento, ajustando su valor para reducir los errores en las predicciones del modelo.
Z
solicitud de disparo cero
Técnica de solicitud en la que el modelo completa una tarea sin que se le dé un ejemplo específico de cómo.