Este glosario proporciona términos y definiciones para Cloud Pak for Data as a Service.
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W
A
acelerador
En informática de alto rendimiento, circuito especializado que se utiliza para quitar parte de la carga computacional a la CPU, aumentando la eficiencia del sistema. Por ejemplo, en el aprendizaje profundo, la computación acelerada en la GPU se emplea a menudo para descargar parte de la carga de trabajo computacional en una GPU mientras la aplicación principal se ejecuta en la CPU. Véase también unidad de procesamiento gráfico.
responsabilidad
La expectativa de que las organizaciones o las personas garantizarán el funcionamiento adecuado, a lo largo de su ciclo de vida, de los sistemas de IA que diseñan, desarrollan, operan o despliegan, de acuerdo con sus roles y marcos normativos aplicables. Esto incluye determinar quién es responsable de un error de IA que puede requerir que los expertos legales determinen la responsabilidad caso por caso.
función de activación
Función que define la salida de una unidad neuronal dada una serie de activaciones entrantes de otras neuronas
Aprendizaje activo
Modelo de aprendizaje automático en el que el sistema solicita más datos etiquetados sólo cuando los necesita.
metadatos activos
Metadatos que se actualizan automáticamente basándose en el análisis realizado por los procesos de aprendizaje automático. Por ejemplo, la creación de perfiles y el análisis de calidad de datos actualizan automáticamente los metadatos de los activos de datos.
tiempo de ejecución activo
Instancia de un entorno que se ejecuta para proporcionar recursos informáticos a los activos que ejecutan código.
agente
Algoritmo o programa que interactúa con un entorno para aprender las acciones o decisiones óptimas, normalmente mediante aprendizaje por refuerzo, para alcanzar un objetivo específico.
AI
Véase inteligencia artificial.
Acelerador de IA
Hardware de silicio especializado diseñado para ejecutar eficientemente tareas relacionadas con la IA como el aprendizaje profundo, el aprendizaje automático y las redes neuronales para una computación más rápida y eficiente energéticamente. Puede ser una unidad dedicada en un núcleo, un chiplet independiente en un chip multimódulo o una tarjeta independiente.
Ética de la IA
Un campo multidisciplinar que estudia cómo optimizar el impacto beneficioso de la IA a la vez que reduce los riesgos y los resultados adversos. Ejemplos de cuestiones éticas de IA son la responsabilidad y la privacidad de los datos, la equidad, la explicabilidad, la robustez, la transparencia, la sostenibilidad ambiental, la inclusión, la agencia moral, la alineación de valores, la responsabilidad, la confianza y el mal uso de la tecnología.
Gobierno de IA
El acto de gobernar de una organización, a través de sus instrucciones corporativas, el personal, los procesos y los sistemas para dirigir, evaluar, monitorizar y tomar medidas correctivas a lo largo del ciclo de vida de la IA, para proporcionar la garantía de que el sistema de IA está funcionando como la organización pretende, como esperan sus partes interesadas, y como lo requiere la normativa pertinente.
Seguridad de IA
El campo de investigación con el objetivo de garantizar que los sistemas de inteligencia artificial operen de una manera que sea beneficiosa para la humanidad y no causen inadvertidamente daños, abordando cuestiones como la fiabilidad, la equidad, la transparencia y la alineación de los sistemas de IA con los valores humanos.
Sistema de IA
algoritmo
Fórmula aplicada a los datos para determinar formas óptimas de resolver problemas analíticos.
análisis
Ciencia que estudia los datos para encontrar patrones significativos en estos y extraer conclusiones basadas en dichos patrones.
inteligencia artificial (IA)
Capacidad de adquirir, procesar, crear y aplicar conocimientos en forma de modelo para hacer predicciones, recomendaciones o tomar decisiones.
sistema de inteligencia artificial (sistema IA)
Sistema que puede realizar predicciones, recomendaciones o decisiones que influyen en entornos físicos o virtuales, y cuyos resultados o comportamientos no están necesariamente predeterminados por su desarrollador o usuario. Los sistemas de IA normalmente se entrenan con grandes cantidades de datos estructurados o no estructurados, y pueden estar diseñados para operar con distintos niveles de autonomía o ninguno, para lograr objetivos definidos por el ser humano.
activo
Elemento de un proyecto o catálogo que contiene metadatos sobre datos o análisis de datos.
norma de composición de atributos
Una de las reglas que determinan cómo se seleccionan los valores de los atributos de una entidad de datos maestros a partir de sus registros miembros. Véase también la regla.
Experimento AutoAI
Un proceso de entrenamiento automatizado que tiene en cuenta una serie de definiciones y parámetros de entrenamiento para crear un conjunto de interconexiones clasificadas como candidatos de modelo.
B
despliegue por lotes
Método para desplegar modelos que procesan datos de entrada de un archivo, conexión de datos o datos conectados en un grupo de almacenamiento y, a continuación, escribe la salida en un destino seleccionado.
bias
Error sistemático en un sistema de IA que ha sido diseñado, intencionadamente o no, de una manera que puede generar decisiones injustas. El sesgo puede estar presente tanto en el sistema de IA como en los datos utilizados para entrenarlo y probarlo. El sesgo de IA puede surgir en un sistema de IA como resultado de expectativas culturales; limitaciones técnicas; o contextos de despliegue no previstos. Véase también equidad.
detección de sesgos
El proceso de calcular la equidad a las métricas para detectar cuándo los modelos de IA están entregando resultados sesgados con base en determinados atributos.
Mitigación de sesgo
Reducción de los sesgos en los modelos de IA mediante la selección de datos de entrenamiento y la aplicación de técnicas de imparcialidad.
Clasificación binaria
Un modelo de clasificación con dos clases. Las predicciones son una opción binaria de una de las dos clases.
término empresarial
Una palabra o expresión que define un concepto empresarial de forma estándar para una empresa. Los términos se pueden utilizar para enriquecer los metadatos de los activos de datos y para definir los criterios de las reglas de protección de datos.
vocabulario empresarial
Conjunto de artefactos de gobernabilidad, como términos empresariales y clases de datos, que describen y enriquecen activos de datos.
C
catálogo
Repositorio de activos de una unidad compartida de la organización. Los activos de los catálogos pueden regirse por reglas de protección de datos y enriquecerse con otros artefactos de gobierno como, por ejemplo, clasificaciones, clases de datos y términos empresariales. Los catálogos pueden almacenar datos estructurados y no estructurados, referencias a datos en orígenes de datos externos y otros activos analíticos, como los modelos de aprendizaje automático.
categoría
Para la gobernanza de datos, un espacio de trabajo colaborativo para organizar y gestionar artefactos de gobernanza.
clasificación
Para la gobernanza de datos, un artefacto de gobernanza que describe el nivel de sensibilidad de los datos en un activo de datos.
limpiar
Asegurar que todos los valores de un archivo son coherentes y están registrados correctamente.
colaborador
Un miembro de un grupo de personas que trabajan juntas para lograr un objetivo común.
problema combinatorio
Un problema difícil de resolver porque requiere que se tomen múltiples decisiones que implican demasiadas combinaciones de opciones posibles. Por ejemplo, la búsqueda de una agrupación, la ordenación o la asignación de objetos.
recursos de cálculo
Los recursos de hardware y software definidos por una definición de entorno para ejecutar activos analíticos.
matriz de confusión
Medida de rendimiento que determina la precisión entre los resultados pronosticados positivos y negativos de un modelo en comparación con los resultados reales positivos y negativos.
Datos conectados
Conjunto de datos al que se accede a través de una conexión con un origen de datos externo.
conexión
La información necesaria para conectarse a una base de datos. La información real que se necesita varía según el DBMS y el método de conexión.
restricción
En Decision Optimization, condición que debe satisfacer la solución de un problema.
aprendizaje continuo
La automatización de las tareas de supervisión de rendimiento de modelo, reentrenamiento con datos nuevos y redespliegue para garantizar la calidad de la predicción.
despliegue de Core ML
El proceso de descargar un despliegue en formato ML Core para su uso en aplicaciones iOS.
corpus
Una colección de documentos de origen que se utilizan para entrenar un modelo de aprendizaje automático.
Modelo CPLEX
Un modelo de Decision Optimization que se formula para ser resuelto por el motor CPLEX.
Modelo CPO
Un modelo de programación de restricciones que se formula para ser resuelto por el motor de Optimización Decision Optimization CP Optimizer (CPO).
conservar
- Seleccionar, recopilar, conservar y mantener contenido relevante para un tema específico. La conservación establece, mantiene y añade valor a los datos; transforma datos en información y conocimiento de confianza.
- Crear un activo de datos y prepararlo para su publicación en un catálogo. La conservación puede incluir el enriquecimiento del activo de datos asignando artefactos de gobierno como, por ejemplo, términos empresariales, clasificación y clases de datos, y el análisis de la calidad de los datos en el activo de datos.
D
activo de datos
Un activo que apunta a datos, por ejemplo, a un archivo cargado. Las conexiones y los activos de datos conectados también se consideran activos de datos.
clase de datos
Un artefacto de gobierno que clasifica las columnas en conjuntos de datos relacionales según el tipo de datos y cómo se utilizan.
gobierno de datos
Proceso de seguimiento y control de los datos para mantener su calidad, seguridad y conformidad.
integración de datos
Combinación de procesos técnicos y de negocio que se utilizan para combinar datos de fuentes dispares en información significativa y valiosa.
lago de datos
Repositorio de almacenamiento de datos a gran escala que almacena datos en bruto en cualquier formato en una arquitectura plana. Los lagos de datos contienen datos estructurados y no estructurados, así como datos binarios, con el fin de procesarlos y analizarlos.
casa de lago de datos
Una arquitectura unificada de procesamiento y almacenamiento de datos que combina la flexibilidad de un lago de datos con las consultas estructuradas y las optimizaciones de rendimiento de un almacén de datos, lo que permite un análisis de datos escalable y eficiente para aplicaciones de IA y analítica.
minería de datos
El proceso de recopilar información empresarial crítica de un origen de datos, correlacionarla y descubrir asociaciones, patrones y tendencias. Véase también análisis predictivo.
modelo de datos
Visualización de elementos de datos, sus relaciones y sus atributos.
Interconexión de datos
Una serie de etapas de tratamiento y transformación de datos.
privacidad de datos
La protección de los datos frente a accesos no autorizados y usos inadecuados.
Producto de datos
Colección de datos optimizados o activos relacionados con datos que se empaquetan para su reutilización y distribución con acceso controlado. Los productos de datos contienen datos, así como modelos, paneles de control y otros tipos de activos computacionales. A diferencia de los activos de datos en los catálogos de gobierno, los productos de datos se gestionan como productos con varias finalidades para proporcionar valor de negocio.
regla de protección de datos
Un artefacto de gobierno que especifica qué datos se deben controlar y cómo controlarlos. Una regla de protección de datos que contiene criterios y una acción. Véase también la regla.
análisis de calidad de datos
El análisis de los datos en relación con la precisión, la integridad, la coherencia, la puntualidad, la exclusividad y la validez de las dimensiones de calidad.
definición de calidad de datos
Una definición de calidad de datos describe una condición o evaluación de regla para reglas de calidad de datos.
regla de calidad de datos
Durante el análisis de calidad de datos, regla de calidad de datos que evalúa los datos para determinar si se cumplen las condiciones específicas e identifica los registros que no cumplen las condiciones como infracciones de regla. Véase también la regla.
Flujo de Data Refinery
Un origen de datos, una cadena de una o más operaciones que refinen y modelan el origen de datos, y un objetivo al que se mueven los datos.
ciencia de datos
El análisis y la visualización de datos estructurados y no estructurados para descubrir detalles e información útil.
conjunto de datos
Una recopilación de datos, normalmente en forma de filas (registros) y columnas (campos), contenidos en un archivo o tabla de base de datos.
origen de datos
Repositorio, cola o fuente de lectura de datos, como una base de datos.
Flujo de DataStage
Un activo que se basa en un conjunto ordenado de pasos para extraer, transformar y cargar datos.
tabla de datos
Una recopilación de datos, normalmente en forma de filas (registros) y columnas (campos), contenidos en una tabla.
almacén de datos
Un repositorio grande y centralizado de datos recopilados de varias fuentes que se utiliza para la creación de informes y el análisis de datos. Almacena principalmente datos estructurados y semiestructurados, lo que permite a las empresas tomar decisiones informadas.
Experimento de Decision Optimization
Un activo que contiene un grupo de escenarios que representan distintas formulaciones de modelos o conjuntos de datos relacionados con el mismo problema que se está resolviendo.
Modelo de Decision Optimization
Modelo prescriptivo que se puede resolver con optimización para proporcionar la mejor solución a un problema de Decision Optimization.
variable de decisión
Una de un conjunto de variables que representan decisiones que se deben tomar, cuyos valores los determina el motor de optimización al tiempo que se garantiza que se cumplen todas las restricciones y se optimiza el objetivo.
Aprendizaje profundo
Un modelo computacional que utiliza múltiples capas de nodos interconectados, que se organizan en capas jerárquicas, para transformar los datos de entrada (primera capa) a través de una serie de cálculos para producir una salida (capa final). El aprendizaje profundo se inspira en la estructura y el funcionamiento del cerebro humano.
experimento de aprendizaje profundo
Proceso de entrenamiento de modelos que se basa en la agrupación lógica de una o más definiciones de entrenamiento de modelos que están conectadas en una red neuronal.
red neuronal profunda
Una red neuronal con múltiples capas ocultas, que permite representaciones más complejas de los datos.
despliegue
Un modelo o paquete de aplicación disponible para su uso.
espacio de despliegue
Un espacio de trabajo donde se despliegan los modelos y se gestionan los despliegues.
DOcplex
Una API de Python para modelar y resolver problemas de Decision Optimization .
E
URL de punto final
Una dirección de destino de red que identifica recursos como, por ejemplo, servicios y objetos. Por ejemplo, un URL de punto final se utiliza para identificar la ubicación de un modelo o despliegue de función cuando un usuario envía datos de carga útil al despliegue.
entorno de
Los recursos de cálculo para ejecutar trabajos.
tiempo de ejecución del entorno
Una instanciación de la plantilla de entorno para ejecutar activos.
Plantilla de entorno
Una definición que especifica recursos de hardware y software para crear instancias de tiempos de ejecución del entorno.
explicabilidad
- Capacidad de un usuario humano de realizar un rastreo, auditar y comprender las predicciones realizadas en aplicaciones que utilizan sistemas de inteligencia artificial.
- La capacidad de un sistema de IA para proporcionar información que los humanos pueden utilizar para comprender las causas de las predicciones del sistema.
F
Equidad
En un sistema de IA, el trato equitativo de los individuos o grupos de individuos. La elección de una noción específica de equidad para un sistema de IA depende del contexto en el que se utiliza. Véase también sesgo.
característica
Propiedad o característica de un elemento dentro de un conjunto de datos, por ejemplo, una columna en una hoja de cálculo. En algunos casos, las características se diseñan como combinaciones de otras características en el conjunto de datos.
Ingeniería de características
Proceso de selección, transformación y creación de nuevas características a partir de datos en bruto para mejorar el rendimiento y la potencia predictiva de los modelos de aprendizaje automático.
selección de características
Identificación de las columnas de datos que mejor dan soporte a una predicción o puntuación precisa en un modelo de aprendizaje automático.
almacén de características
Un repositorio o sistema centralizado que gestiona y organiza características, proporcionando una forma escalable y eficiente de almacenar, recuperar y compartir datos de características entre interconexiones y aplicaciones de aprendizaje automático.
transformación de característica
En AutoAI, una fase de creación de interconexiones que aplica algoritmos para transformar y optimizar los datos de entrenamiento para lograr el mejor resultado para el tipo de modelo.
Federated Learning
El entrenamiento de un modelo de aprendizaje automático común que utiliza varios orígenes de datos que no se mueven, se unen o se comparten. El resultado es un modelo mejor entrenado sin poner en peligro la seguridad de los datos.
flujo
Una colección de nodos que definen un conjunto de pasos para procesar datos o entrenar un modelo.
Modelo base
Un modelo de IA que puede adaptarse a una amplia gama de tareas posteriores. Los modelos de base suelen ser modelos generativos a gran escala que se entrenan con datos no etiquetados mediante autosupervisión. Como modelos a gran escala, los modelos de cimentación pueden incluir miles de millones de parámetros.
G
Gráfica de Gantt
Una representación gráfica de la línea de tiempo y duración de un proyecto en las que aparecen los datos de la planificación como barras horizontales a lo largo de una escala de tiempo.
IA generativa
Véase IA generativa.
iA generativa (gen AI)
Clase de algoritmos de IA que pueden producir varios tipos de contenidos, como texto, código fuente, imágenes, audio y datos sintéticos.
artefacto de gobernabilidad
Elementos de gobernabilidad que enriquecen o controlan activos de datos. Los artefactos de gobernabilidad incluyen términos empresariales, clasificaciones, clases de datos, políticas, reglas y conjuntos de datos de referencia.
regla de gobernabilidad
Artefacto de gobierno que proporciona una descripción en lenguaje natural de los criterios que se utilizan para determinar si los activos de datos cumplen con los objetivos de negocio. Véase también la regla.
flujo de trabajo de gobierno
Proceso basado en tareas para controlar la creación, modificación y supresión de artefactos de gobierno.
catálogo gobernado
Un catálogo que tiene habilitada la aplicación de reglas de protección de datos.
GPU
Creador gráfico
Una herramienta para crear activos de flujo mediante codificación visual. Un lienzo es un área en la que se colocan objetos o nodos que se pueden conectar para crear un flujo.
Unidad de proceso de gráficos (GPU)
Procesador especializado diseñado para manipular y alterar rápidamente la memoria para acelerar la creación de imágenes en un almacenamiento intermedio de tramas destinado a la salida a una pantalla. Las GPU se utilizan mucho en el aprendizaje automático debido a sus capacidades de procesamiento paralelo. Véase también acelerador.
Base
Proporcionar un modelo lingüístico amplio con información para mejorar la precisión de los resultados.
H
Detección de HAP
- La capacidad de detectar y filtrar el odio, el abuso y las blasfemias tanto en los mensajes enviados por los usuarios como en las respuestas generadas por un modelo de inteligencia artificial.
Detector de HAP
- Un clasificador de frases que elimina los contenidos potencialmente nocivos, como las expresiones de odio, los insultos y las blasfemias, de la salida y la entrada del modelo de la fundación.
conjunto de espera
Conjunto de datos etiquetados que se retienen intencionadamente de los conjuntos de entrenamiento y validación, lo que sirve como una evaluación imparcial del rendimiento del modelo final en datos no vistos.
supervisión humana
Participación humana en la revisión de las decisiones tomadas por un sistema de IA, permitiendo la autonomía humana y la rendición de cuentas de las decisiones.
hiperparámetro
En el aprendizaje automático, un parámetro cuyo valor se define antes del entrenamiento como una forma de mejorar la precisión del modelo.
I
imagen
Un paquete de software que contiene un conjunto de bibliotecas.
inferencias
El proceso de pasar datos reales por un modelo de IA entrenado para hacer una predicción o resolver una tarea.
ingerir
- Alimentar datos en un sistema con el fin de crear una base de conocimiento.
- Añadir de forma continua un gran volumen de datos en tiempo real a una base de datos.
conocimiento
Una comprensión precisa o profunda de algo. Los conocimientos se obtienen utilizando la analítica cognitiva para proporcionar instantáneas y predicciones actuales de comportamientos y actitudes de los clientes.
intención
Propósito o objetivo expresado por la entrada de cliente a un chatbot, como responder a una pregunta o procesar un pago de factura.
J
trabajo
Una unidad de trabajo ejecutable por separado.
K
base de conocimiento
Véase corpus.
L
datos etiquetados
Datos sin formato a los que se asignan etiquetas para añadir contexto o significado para que se puedan utilizar para entrenar modelos de aprendizaje automático. Por ejemplo, los valores numéricos pueden estar etiquetados como códigos postales o edades para proporcionar contexto para entradas y salidas de modelo.
gran modelo lingüístico (LLM)
Un modelo de lenguaje con un gran número de parámetros, entrenados en una gran cantidad de texto.
linaje
- Historial del flujo de datos a través de activos.
- Historial de los sucesos realizados en un activo.
LLM
Véase gran modelo lingüístico.
modelo lógico
Representación lógica de objetos de datos que están relacionados con un dominio de negocio.
M
aprendizaje automático (ML)
Una rama de la inteligencia artificial (IA) y la informática que se centra en el uso de datos y algoritmos para imitar la forma en que los humanos aprenden, mejorando gradualmente la precisión de los modelos de IA.
infraestructura de aprendizaje automático
Las bibliotecas y el tiempo de ejecución para entrenar y desplegar un modelo.
modelo de aprendizaje automático
Un modelo de IA que se entrena en un conjunto de datos para desarrollar algoritmos que puede utilizar para analizar y aprender de nuevos datos.
enmascarar
Para sustituir valores de datos confidenciales en una columna de un conjunto de datos. Los métodos de enmascaramiento varían en el programa de utilidad de datos y en la privacidad de proporcionar valores de sustitución con formato similar que conserven la integridad referencial para proporcionar el mismo valor de sustitución para toda la columna.
flujo de enmascaramiento
Flujo que produce copias de datos enmascaradas de forma permanente.
datos maestros
- Para el entrenamiento de modelos, datos de referencia que siguen siendo los mismos para varios trabajos en el mismo modelo, pero que se pueden cambiar, si es necesario.
- En Match 360, una vista consolidada de los datos de los orígenes dispares.
entidad de datos maestros
Composición de registros que un algoritmo de correspondencia ha determinado que representan a la misma entidad del mundo real, como una persona u organización. Cada entidad incluye uno o varios registros miembros que el algoritmo de correspondencia ha vinculado entre sí.
programación matemática (MP)
Un campo matemático o de investigación operativa, utilizado para modelar y resolver problemas de Decision Optimization. Abarca la programación lineal, de enteros, de enteros mixta y no lineal.
importación de metadatos
Método de importación de metadatos que está asociado con activos de datos, incluyendo metadatos de proceso que describen el linaje de activos de datos y metadatos técnicos que describen la estructura de activos de datos.
desalineación
Una discrepancia entre los objetivos o comportamientos que un sistema de IA está optimizado para alcanzar y los verdaderos, a menudo complejos, objetivos de sus usuarios o diseñadores humanos
ML
Véase aprendizaje automático.
MLOps
- La práctica de colaboración entre científicos de datos y profesionales de operaciones para ayudar a gestionar el ciclo de vida de machine learning (o deep learning) de producción. MLOps busca aumentar la automatización y mejorar la calidad de la producción ML al tiempo que se centra en los requisitos empresariales y normativos. Implica el desarrollo de modelos, el entrenamiento, la validación, el despliegue, la supervisión y la gestión y utiliza métodos como CI/CD.
- Metodología que lleva un modelo de aprendizaje automático del desarrollo a la producción.
modelo
- En un contexto de aprendizaje automático, un conjunto de funciones y algoritmos que se han entrenado y probado en un conjunto de datos para proporcionar predicciones o decisiones.
- En Decision Optimization, una formulación matemática de un problema que se puede resolver con motores de optimización de CPLEX utilizando distintos conjuntos de datos.
formulación de modelos
En Decision Optimization, formulación matemática de un modelo expresada como una lista de variables de decisión, una o más funciones de objetivo que se deben maximizar o minimizar, y algunas restricciones que se deben satisfacer.
ModelOps
Una metodología para gestionar el ciclo de vida completo de un modelo de IA, incluidos el entrenamiento, el despliegue, la puntuación, la evaluación, entrenarlo de nuevo y la actualización.
MP
Véase programación matemática.
N
lenguaje natural
Una sintaxis de modelado que se asemeja al lenguaje humano natural (en inglés) para formular modelos.
procesamiento del lenguaje natural (PLN)
Un campo de la inteligencia artificial y la lingüística que estudia los problemas inherentes en el proceso y en la manipulación del lenguaje natural, con el fin de aumentar la capacidad de los ordenadores de comprender los idiomas humanos.
biblioteca de procesamiento de lenguaje natural
Biblioteca que proporciona funciones básicas de procesamiento de lenguaje natural para el análisis de sintaxis y modelos preentrenados listos para usar para una amplia variedad de tareas de procesamiento de texto.
red neuronal
Un modelo matemático para predecir o clasificar casos utilizando un esquema matemático complejo que simula una versión abstracta de las células del cerebro. Para entrenar una red neuronal se le presenta un gran número de casos observados, uno por uno, y se le permite actualizarse automática y repetidamente hasta que aprende la tarea.
PLN
Véase proceso de lenguaje natural.
nodo
La representación gráfica de una operación de datos en un flujo o secuencia. Distintos tipos de nodos tienen distintas formas para indicar el tipo de operación que realizan.
cuaderno
Un documento interactivo que contiene código ejecutable, texto descriptivo para ese código y los resultados del código que se ejecutan.
kernel de cuaderno
Parte del editor de cuadernos que ejecuta código y devuelve los resultados de cálculo.
O
ofuscar
Sustituir datos en una columna con valores de formato similar que coincidan con el formato original. Forma de enmascaramiento.
función de objetivo
En Decision Optimization y la investigación de operaciones, una expresión para optimizar (es decir, minimizar o maximizar) al tiempo que se cumplen otras restricciones del problema.
almacenamiento de objetos
Un método de almacenamiento de datos, que se utiliza normalmente en la nube, en el que los datos se almacenan como unidades individuales u objetos en una agrupación de almacenamiento o repositorio que no utiliza una jerarquía de archivos, sino que almacena todos los objetos en el mismo nivel.
despliegue en línea
Método de acceso a un modelo o despliegue de código Python a través de un punto final de API como un servicio web para generar predicciones en línea, en tiempo real.
ontología
Especificación formal explícita de la representación de los objetos, conceptos y otras entidades que pueden existir en un área de interés y las relaciones entre ellos.
activo operativo
Activo que ejecuta código en una herramienta o un trabajo.
modelo OPL
Una formulación de modelo expresada en lenguaje de modelado de OPL.
solución óptima
En la investigación de operaciones, una solución a un problema que optimiza la función de objetivo (ya sea lineal o cuadrática) y que cumple las demás restricciones del problema.
optimización
El proceso de encontrar la solución más adecuada a un problema definido con precisión, respetando al mismo tiempo las restricciones y limitaciones impuestas. Por ejemplo, determinar cómo asignar recursos o cómo encontrar los mejores elementos o combinaciones de un gran conjunto de alternativas.
Heat
Proceso de creación de un flujo de extremo a extremo que puede entrenar, ejecutar, desplegar, probar y evaluar un modelo de aprendizaje automático, y utiliza la automatización para coordinar el sistema, a menudo utilizando microservicios.
P
Revisión de pares
Proceso durante el cual un usuario del administrador de datos compara registros para determinar si coinciden. Los resultados de la revisión por pares entrenan a un algoritmo de correspondencia para decidir qué registros se corresponden con las entidades de datos maestros.
Parámetro
Parte configurable del modelo que es interna de un modelo y cuyos valores se estiman o se aprenden de los datos. Los parámetros son aspectos del modelo que se ajustan durante el proceso de entrenamiento para ayudar al modelo a predecir con precisión la salida. El rendimiento y la potencia predictiva del modelo dependen en gran medida de los valores de estos parámetros.
parte
En Federated Learning, entidad que aporta datos para entrenar un modelo común. Los datos no se mueven ni combinan, pero cada parte obtiene las ventajas de Federated Training.
carga útil
Los datos que se pasan a un despliegue para volver a obtener una puntuación, predicción o solución.
registro de carga útil
Captura de datos de carga útil y salida de despliegue para supervisar el estado continuo de IA en aplicaciones de la empresa.
modelo físico
Definición de las estructuras físicas y las relaciones de los datos.
pipeline
- En Watson Pipelines, un flujo integral de activos desde la creación hasta la implantación.
- En AutoAI,, un modelo candidato.
tabla de clasificación de interconexiones
En AutoAI, tabla que muestra la lista de modelos candidatos generados automáticamente, como pipelines, clasificados según los criterios especificados.
marcador
Un campo o una variable que se sustituirá por un valor.
política
- Estrategia o regla que sigue un agente para determinar la siguiente acción basándose en el estado actual.
- Conjunto de reglas que protegen los datos controlando el acceso a los activos de datos o anonimizando datos confidenciales en los activos de datos.
- Artefacto de gobierno que consta de una o más reglas de protección y gobierno de datos.
análisis predictivo
Un proceso empresarial y un conjunto de tecnologías relacionadas que se ocupan de la predicción de posibilidades y tendencias futuras. El análisis predictivo aplica disciplinas tan diversas como la probabilidad, la estadística, el aprendizaje automático y la inteligencia artificial a los problemas de negocio para encontrar la mejor acción para una situación específica. Véase también minería de datos.
modelo preentrenado
Un modelo de IA que se ha entrenado previamente en un conjunto de datos grande para realizar una tarea específica. Los modelos entrenados previamente se utilizan en lugar de crear un modelo desde cero.
categoría primaria
Para la gobernanza de datos, la categoría que contiene el artefacto de gobernanza. Una categoría es similar a una carpeta o directorio que organiza los artefactos de gobierno de un usuario.
privacidad
Garantía de que la información sobre una persona está protegida contra el acceso no autorizado y el uso inadecuado.
perfil
Los metadatos y estadísticas generados sobre el contenido textual de los datos.
proyecto
Un espacio de trabajo de colaboración para trabajar con datos y otros activos.
poda
Proceso de simplificación, reducción o recorte de un árbol de decisión o una red neuronal. Esto se hace eliminando los nodos o capas menos importantes, reduciendo la complejidad para evitar el sobreajuste y mejorar la generalización del modelo, manteniendo al mismo tiempo su poder predictivo.
publicar
Copiar un activo en un catálogo.
Python
Lenguaje de programación que se utiliza en ciencia de datos e IA.
modelo DOcplex de Python
Una formulación de modelo expresada en Python.
Función de Python
Una función que contiene código Python para dar soporte a un modelo en producción.
Q
regla de calidad
Una o más condiciones necesarias para que un registro de datos cumpla los estándares de calidad. Durante el análisis de calidad de datos, los registros de datos se comparan con estas condiciones. Véase también la regla.
cuantificación
Un método de compresión de pesos de modelos de cimentación para acelerar la inferencia y reducir las necesidades de memoria de la GPU.
R
R
Un lenguaje de scripts extensible que se utiliza en la ciencia de datos y la IA que ofrece una amplia variedad de funciones y técnicas analíticas, estadísticas y gráficas.
leído
Copiar datos en una aplicación para manipularlos o analizarlos.
redactar
Para sustituir todos los valores de datos de una columna por la misma serie para ocultar los valores confidenciales, el formato de datos y cualquier relación entre valores. Una forma de enmascaramiento ..
conjunto de datos de referencia
Artefacto de gobierno que define valores para tipos específicos de columnas.
refinar
Limpiar y dar forma a datos.
Aprendizaje por incentivos («reinforcement learning»)
Técnica de aprendizaje automático en la que un agente aprende a tomar decisiones secuenciales en un entorno para maximizar una señal de recompensa. Inspirados en el aprendizaje de prueba y error, los agentes interactúan con el entorno, reciben comentarios y ajustan sus acciones para lograr políticas óptimas.
recompensa
Señal utilizada para guiar a un agente, normalmente un agente de aprendizaje por refuerzo, que proporciona retroalimentación sobre la bondad de una decisión
Regla
Artefacto que contiene información, criterios o lógica para analizar o proteger datos. Véase también norma de protección de datos, norma de calidad de datos, norma de gobernanza, norma de calidad, norma de composición de atributos.
entorno de tiempo de ejecución
La configuración de hardware y software predefinida o personalizada que se utiliza para ejecutar herramientas o trabajos, como por ejemplo cuadernos.
S
puntuación
- En aprendizaje automático, el proceso de medir la confianza de un resultado previsto.
- El proceso que calcula el grado de coincidencia de los atributos de una identidad de entrada con los atributos de una entidad existente.
script
Archivo que contiene Python o scripts R para dar soporte a un modelo en producción.
categoría secundaria
Categoría opcional que hace referencia al artefacto de gobierno.
autoatención
Mecanismo de atención que utiliza la información de los propios datos de entrada para determinar en qué partes de la entrada debe centrarse al generar la salida.
aprendizaje autosupervisado
Método de entrenamiento de aprendizaje automático en el que un modelo aprende de datos no etiquetados enmascarando señales en una secuencia de entrada y, a continuación, intentando predecirlas. Un ejemplo es "Me gusta ________ brotes".
búsqueda semántica
Una búsqueda de palabras clave que incorpora el análisis lingüístico y contextual. En una búsqueda semántica, la intención de la consulta se especifica mediante uno o varios especificadores. Por ejemplo, es posible especificar una persona llamada "Bush", y una consulta de este tipo no devolvería resultados sobre el tipo de arbustos que crecen en un jardín, sino sólo sobre personas llamadas Bush.
datos sensibles
Datos que contienen información que debe protegerse del acceso o la divulgación no autorizados. Las categorías de datos sensibles pueden ser información sanitaria protegida, información personal identificable, secretos comerciales o resultados financieros.
análisis de opiniones
Examen del sentimiento o la emoción expresados en un texto, como determinar si la crítica de una película es positiva o negativa.
forma
Personalizar los datos filtrando, ordenando, eliminando columnas; uniendo tablas; realizando operaciones que incluyen cálculos, agrupaciones de datos, jerarquías y más.
datos pequeños
Datos que son accesibles y comprensibles para los humanos. Véase también datos estructurados.
retrotracción de SQL
En SPSS Modeler, el proceso de realizar muchas operaciones de preparación de datos y minería directamente en la base de datos mediante código SQL.
datos no estructurados
Datos que residen en campos fijos en un registro o archivo. Las hojas de cálculo y las bases de datos relacionales son ejemplos de datos estructurados. Véase también datos no estructurados, datos pequeños.
información estructurada
Elementos almacenados en recursos estructurados, como índices de motor de búsqueda, bases de datos o bases de conocimiento.
sustituir
Reemplazar datos en una columna por valores que no coinciden con el formato original pero que conservan la integridad referencial.
supernodo
Un nodo de SPSS Modeler que reduce una secuencia de datos encapsulando varios nodos en uno.
Aprendizaje supervisado
Método de entrenamiento de aprendizaje automático en el que se entrena un modelo en un conjunto de datos etiquetado para realizar predicciones sobre nuevos datos.
T
clasificación de texto
Modelo que identifica y clasifica automáticamente el texto en categorías especificadas.
variables de series temporales
Conjunto de valores de una variable en puntos periódicos en el tiempo.
modelo entrenado
Un modelo que se entrena con datos reales y está listo para ser desplegado para predecir resultados cuando se presentan nuevos datos.
entrenamiento
La etapa inicial de la creación de modelos, que incluye un subconjunto de los datos de origen. El modelo aprende por ejemplo de los datos conocidos. A continuación, el modelo se puede probar en un subconjunto distinto para el que ya se conoce el resultado.
datos de entrenamiento
Una colección de datos que se utiliza para entrenar modelos de aprendizaje automático.
Conjunto de entrenamiento
Conjunto de datos etiquetados que se utiliza para entrenar un modelo de aprendizaje automático exponiéndolo a ejemplos y sus etiquetas correspondientes, lo que permite al modelo aprender patrones y realizar predicciones.
aprendizaje de transferencia
Estrategia de aprendizaje automático en la que un modelo entrenado se aplica a un problema completamente nuevo.
Transformador
Una arquitectura de red neuronal que utiliza codificaciones posicionales y el mecanismo de autoatención para predecir la siguiente ficha de una secuencia de fichas.
transparencia
Compartir información adecuada con las partes interesadas sobre cómo se ha diseñado y desarrollado un sistema de IA. Ejemplos de esta información son qué datos se recopilan, cómo se utilizarán y almacenarán, y quién tiene acceso a ellos; y los resultados de las pruebas de precisión, robustez y sesgo.
Prueba de Turing
Propuesto por Alan Turing en 1950, una prueba de la capacidad de una máquina para exhibir un comportamiento inteligente equivalente a, o indistinguible de, el de un humano.
U
problema ilimitado
Un problema de Decision Optimization en el que existe un número infinito de soluciones y el objetivo puede utilizar valores hasta el infinito. Los problemas ilimitados suelen deberse a la falta de restricciones en la formulación del modelo.
datos no estructurados
Datos almacenados en un formato no estructurado y no en campos fijos. Los datos de un documento de procesador de textos son un ejemplo de datos no estructurados. Véase también datos estructurados.
información no estructurada
Datos que no están contenidos en una ubicación fija, como el documento de texto en lenguaje natural.
aprendizaje no supervisado
Método de entrenamiento de aprendizaje automático en el que un modelo no se proporciona con datos etiquetados y debe encontrar patrones o estructura en los datos por sí mismo.
V
Conjunto de validación
Conjunto separado de datos etiquetados que se utiliza para evaluar el rendimiento y la capacidad de generalización de un modelo de aprendizaje automático durante el proceso de entrenamiento, ayudando en el ajuste de hiperparámetros y la selección de modelos.
visualización
Una gráfica, un diagrama, un gráfico, una tabla, un mapa o cualquier otra representación visual de los datos.
W
peso
Coeficiente para un nodo que transforma los datos de entrada dentro de la capa de la red. El peso es un parámetro que un modelo de IA aprende a través del entrenamiento, ajustando su valor para reducir los errores en las predicciones del modelo.