0 / 0

Gráficos de evaluación

Última actualización: 26 mar 2025
Gráficos de evaluación
Los gráficos de evaluación son similares a los histogramas o los gráficos de colección. Los gráficos de evaluación muestran la precisión de los modelos en la predicción de resultados concretos. Funcionan ordenando los registros basándose en el valor predicho y la confianza de la predicción, dividiendo los registros en grupos de igual tamaño (cuantiles) y, a continuación, trazando el valor del criterio para cada cuantil, de mayor a menor. El gráfico muestra múltiples modelos como líneas independientes.

Los resultados se manejan definiendo un valor específico o un rango de valores como un "hit". Los aciertos suelen indicar algún tipo de éxito (como una venta a un cliente) o un evento de interés (como un diagnóstico médico específico).

Distintivo
Los campos de salida son directos; los aciertos corresponden a los valores de true .
Nominal
Para los campos de resultados nominales, el primer valor del conjunto define un acierto.
Continuo
Para los campos de resultados continuos, los aciertos equivalen a valores mayores que el punto medio del rango del campo.

Los gráficos de evaluación también pueden ser acumulativos para que cada punto sea igual al valor del cuantil correspondiente más todos los cuantiles superiores. Los gráficos acumulados suelen mostrar mejor el rendimiento global de modelos, mientras que los gráficos no acumulados suelen ser mejores para indicar determinadas áreas de problemas para los modelos.

Creación de un gráfico de evaluación simple

  1. En la sección Tipo de gráfico , pulse el icono Evaluación .

    El lienzo se actualiza para mostrar una plantilla de gráfico de evaluación.

  2. Establezca las variables Campo objetivo, Campo de predicción y Campo de confianza. El campo objetivo puede ser cualquier distintivo o campo nominal instanciado con dos o más valores. El campo de predicción define la variable que se utiliza como valor pronosticado. El campo de confianza define la variable que se utiliza para establecer la confianza de la predicción.
    Nota: El tipo de variable Campo de predicción debe coincidir con el tipo de variable seleccionado para el Campo objetivo.
  3. Especifique una condición personalizada utilizada para indicar el Acierto definido por el usuario. Esta opción resulta útil para definir el resultado de interés en lugar de deducirlo del tipo de campo objetivo y el orden de valores.

    Debe especificar una expresión CLEM para una condición de acierto. Por ejemplo, @TARGET = "YES" es una condición válida que indica que un valor de Yes para el campo objetivo se cuenta como un acierto en la evaluación. La condición especificada se utiliza para todos los campos objetivo.

  4. Pulse el control Guardar visualización en el proyecto . Seleccione Crear un activo nuevo o Añadir a activo existente. Proporcione un nombre de activo de visualización, una descripción opcional y un nombre de gráfico.
  5. Pulse Aplicar para guardar la visualización en el proyecto. El nuevo activo de visualización está ahora disponible en la pestaña Activos .

Opciones

Campo de destino
Lista las variables de campo nominal o marca instanciada con dos o más valores.
Acierto definido por el usuario
Especifique un valor de hit. Los aciertos indican eventos de interés (por ejemplo, un diagnóstico médico específico).
Campo de predicción
Lista las variables que se pueden utilizar como valor predicho.
Campo de confianza
Lista las variables que pueden establecer la confianza de la predicción.
Gráfico acumulado
Cree un gráfico acumulado cuando esté habilitado. Los valores de los gráficos acumulados se dibujan para cada cuantil más todos los cuantiles mayores.
Modalidad de visualización
Estos valores controlan qué gráficos se muestran en el modo de vista previa y en la salida.
Modalidad única
Cuando está seleccionado, el gráfico de ajuste de clasificación de modelos es el único gráfico que se muestra en el modo de vista previa y en la salida.
Modalidad clásica
Cuando está seleccionado, se muestran los gráficos de Ajuste de clasificación de modelos, de Corte, de Barra matriz, ROC, de Ganancias, ROI y de Beneficios en el modo de vista previa y en la salida.
Modalidad completa
Cuando está seleccionado, se muestran los gráficos de Ajuste de clasificación de modelos, de Corte, de Barra matriz, ROC, de Ganancias, ROI, de Beneficios, GINI, de Elevación y de Respuesta en el modo de vista previa y en la salida.
Gráficos de evaluación
Corte
El gráfico de corte muestra los valores pronosticados frente a los reales para las variables seleccionadas para un valor de corte especificado.
Barra matriz
Los gráficos de barras de matriz son una buena forma de determinar si existen correlaciones lineales entre varias variables.
ROC
ROC (características operativas del receptor) evalúa el rendimiento de los esquemas de clasificación en los que los sujetos se clasifican para una variable con dos categorías.
Ganancias
Las ganancias se definen como la proporción de aciertos totales que se produce en cada cuantil. Las ganancias se calculan como (number of hits in quantile / total number of hits) × 100%.
Rendimiento de la inversión
La rentabilidad de la inversión (ROI, del inglés 'Return On Investment') es similar al beneficio en cuanto a que implica la definición de ingresos y costes. La rentabilidad de la inversión compara los beneficios con los costes del cuantil. El ROI se calcula como (profits for quantile / costs for quantile) × 100%.
Beneficio
El beneficio es igual a los ingresos para cada registro menos el coste del registro. Los beneficios de un cuantil son la suma de los beneficios de todos los registros del cuantil. Se asume que los ingresos se aplican sólo a los aciertos, pero los costes se aplican a todos los registros. Los beneficios y los costes se pueden fijar o estar definidos por campos en los datos. Los beneficios se calculan como el resultado de: (suma de los ingresos de los registros del cuantil − suma de los costes de los registros del cuantil).
Kolmogorov-Smirnov
Compara la función de distribución acumulada observada para una variable con una distribución teórica especificada, que puede ser normal, uniforme, exponencial o Poisson.
GINI
GINI mide la dispersión estadística y está pensado para representar los ingresos o la distribución de la riqueza. Es la medición de desigualdad más comúnmente utilizada.
Elevación
La elevación compara el porcentaje de registros de cada cuantil que supone aciertos con el porcentaje global de aciertos de los datos de entrenamiento. Se calcula como (hits in quantile / records in quantile) / (total hits / total records).
Respuesta
La respuesta es el porcentaje de registros en el cuantil que son coincidencias. La respuesta se calcula como (hits in quantile / records in quantile) × 100%.
Valores de gráficos de evaluación
Los valores siguientes se aplican únicamente a los gráficos de beneficios y ROI.
Costes
Especifique el coste fijo asociado a cada registro.
Facturación
Especifique los ingresos fijos asociados con cada registro que representan un acierto.
peso
Si los registros de los datos representan más de una unidad, puede utilizar ponderaciones de frecuencias para ajustar los resultados. Especifique la ponderación fija asociada a cada registro.