Gráficos de evaluación
Los resultados se manejan definiendo un valor específico o un rango de valores como un "hit". Los aciertos suelen indicar algún tipo de éxito (como una venta a un cliente) o un evento de interés (como un diagnóstico médico específico).
- Distintivo
- Los campos de salida son directos; los aciertos corresponden a los valores de
true
. - Nominal
- Para los campos de resultados nominales, el primer valor del conjunto define un acierto.
- Continuo
- Para los campos de resultados continuos, los aciertos equivalen a valores mayores que el punto medio del rango del campo.
Los gráficos de evaluación también pueden ser acumulativos para que cada punto sea igual al valor del cuantil correspondiente más todos los cuantiles superiores. Los gráficos acumulados suelen mostrar mejor el rendimiento global de modelos, mientras que los gráficos no acumulados suelen ser mejores para indicar determinadas áreas de problemas para los modelos.
Creación de un gráfico de evaluación simple
- En la sección Tipo de gráfico , pulse el icono Evaluación .
El lienzo se actualiza para mostrar una plantilla de gráfico de evaluación.
- Establezca las variables Campo objetivo, Campo de predicción y Campo de confianza. El campo objetivo puede ser cualquier distintivo o campo nominal instanciado con dos o más valores. El campo de predicción define
la variable que se utiliza como valor pronosticado. El campo de confianza define la variable que se utiliza para establecer la confianza de la predicción.Nota: El tipo de variable Campo de predicción debe coincidir con el tipo de variable seleccionado para el Campo objetivo.
- Especifique una condición personalizada utilizada para indicar el Acierto definido por el usuario. Esta opción resulta útil para definir el resultado de interés en lugar de deducirlo del tipo de campo objetivo y el orden de valores.
Debe especificar una expresión CLEM para una condición de acierto. Por ejemplo,
@TARGET = "YES"
es una condición válida que indica que un valor deYes
para el campo objetivo se cuenta como un acierto en la evaluación. La condición especificada se utiliza para todos los campos objetivo. - Pulse el control Guardar visualización en el proyecto . Seleccione Crear un activo nuevo o Añadir a activo existente. Proporcione un nombre de activo de visualización, una descripción opcional y un nombre de gráfico.
- Pulse Aplicar para guardar la visualización en el proyecto. El nuevo activo de visualización está ahora disponible en la pestaña Activos .
Opciones
- Campo de destino
- Lista las variables de campo nominal o marca instanciada con dos o más valores.
- Acierto definido por el usuario
- Especifique un valor de hit. Los aciertos indican eventos de interés (por ejemplo, un diagnóstico médico específico).
- Campo de predicción
- Lista las variables que se pueden utilizar como valor predicho.
- Campo de confianza
- Lista las variables que pueden establecer la confianza de la predicción.
- Gráfico acumulado
- Cree un gráfico acumulado cuando esté habilitado. Los valores de los gráficos acumulados se dibujan para cada cuantil más todos los cuantiles mayores.
- Modalidad de visualización
- Estos valores controlan qué gráficos se muestran en el modo de vista previa y en la salida.
- Modalidad única
- Cuando está seleccionado, el gráfico de ajuste de clasificación de modelos es el único gráfico que se muestra en el modo de vista previa y en la salida.
- Modalidad clásica
- Cuando está seleccionado, se muestran los gráficos de Ajuste de clasificación de modelos, de Corte, de Barra matriz, ROC, de Ganancias, ROI y de Beneficios en el modo de vista previa y en la salida.
- Modalidad completa
- Cuando está seleccionado, se muestran los gráficos de Ajuste de clasificación de modelos, de Corte, de Barra matriz, ROC, de Ganancias, ROI, de Beneficios, GINI, de Elevación y de Respuesta en el modo de vista previa y en la salida.
- Gráficos de evaluación
- Corte
- El gráfico de corte muestra los valores pronosticados frente a los reales para las variables seleccionadas para un valor de corte especificado.
- Barra matriz
- Los gráficos de barras de matriz son una buena forma de determinar si existen correlaciones lineales entre varias variables.
- ROC
- ROC (características operativas del receptor) evalúa el rendimiento de los esquemas de clasificación en los que los sujetos se clasifican para una variable con dos categorías.
- Ganancias
- Las ganancias se definen como la proporción de aciertos totales que se produce en cada cuantil. Las ganancias se calculan como
(number of hits in quantile / total number of hits) × 100%
. - Rendimiento de la inversión
- La rentabilidad de la inversión (ROI, del inglés 'Return On Investment') es similar al beneficio en cuanto a que implica la definición de ingresos y costes. La rentabilidad de la inversión compara los beneficios con los costes del cuantil. El ROI se calcula como
(profits for quantile / costs for quantile) × 100%
. - Beneficio
- El beneficio es igual a los ingresos para cada registro menos el coste del registro. Los beneficios de un cuantil son la suma de los beneficios de todos los registros del cuantil. Se asume que los ingresos se aplican sólo a los aciertos, pero los costes se aplican a todos los registros. Los beneficios y los costes se pueden fijar o estar definidos por campos en los datos. Los beneficios se calculan como el resultado de: (suma de los ingresos de los registros del cuantil − suma de los costes de los registros del cuantil).
- Kolmogorov-Smirnov
- Compara la función de distribución acumulada observada para una variable con una distribución teórica especificada, que puede ser normal, uniforme, exponencial o Poisson.
- GINI
- GINI mide la dispersión estadística y está pensado para representar los ingresos o la distribución de la riqueza. Es la medición de desigualdad más comúnmente utilizada.
- Elevación
- La elevación compara el porcentaje de registros de cada cuantil que supone aciertos con el porcentaje global de aciertos de los datos de entrenamiento. Se calcula como
(hits in quantile / records in quantile) / (total hits / total records)
. - Respuesta
- La respuesta es el porcentaje de registros en el cuantil que son coincidencias. La respuesta se calcula como
(hits in quantile / records in quantile) × 100%
.
- Valores de gráficos de evaluación
- Los valores siguientes se aplican únicamente a los gráficos de beneficios y ROI.
- Costes
- Especifique el coste fijo asociado a cada registro.
- Facturación
- Especifique los ingresos fijos asociados con cada registro que representan un acierto.
- peso
- Si los registros de los datos representan más de una unidad, puede utilizar ponderaciones de frecuencias para ajustar los resultados. Especifique la ponderación fija asociada a cada registro.