0 / 0
Volver a la versión inglesa de la documentación
Nodo Sim Fit
Última actualización: 04 jul 2024
Nodo Sim Fit (SPSS Modeler)

El nodo Ajustar simulación ajusta un conjunto de distribuciones estadísticas candidatas a cada campo de los datos. El ajuste de cada distribución a un campo se evalúa mediante un criterio de bondad de ajuste. Cuando se ejecuta un nodo Ajustar simulación, se construye un nodo Generar simulación (o se actualiza un nodo existente). A cada campo se le asigna la distribución que mejor se le ajusta. El nodo Generar simulación podrá entonces utilizarse para generar datos simulados para cada campo.

Aunque el nodo Ajustar simulación es un nodo terminal, no añade salida al panel de salidas ni exporta datos.

Nota: Si los datos históricos son dispersos (es decir, hay muchos valores perdidos), puede ser difícil para el componente de ajuste encontrar suficientes valores válidos para ajustar las distribuciones a los datos. En aquellos casos en los que los datos estén dispersos, antes de procederse con el ajuste deberán eliminarse los campos dispersos si no son necesarios o imputar los valores que faltan. Mediante las opciones de CALIDAD del nodo Auditoría de datos, puede ver el número de registros completos, identificar los campos que están dispersos y seleccionar un método de imputación. Si el número de registros es insuficiente para ajustar la distribución, podrá utilizarse un nodo Equilibrar para aumentar el número de registros.

Utilización de un nodo Ajustar simulación para crear automáticamente un nodo Generar simulación

La primera vez que se ejecuta el nodo Ajustar simulación, se crea un nodo Generar simulación con un enlace de actualización al nodo Ajustar simulación. Si se vuelve a ejecutar el nodo Ajustar simulación, solo se creará un nodo Generar simulación si se ha eliminado el enlace de actualización. También puede utilizar un nodo Ajustar simulación para actualizar un nodo Generar simulación conectado. El resultado dependerá de si los mismos campos están presentes en ambos nodos y de si los campos están desbloqueados en el nodo Generación de simulación. Consulte Nodo Sim Gen para obtener más información.

Un nodo Ajustar simulación solo puede tener un enlace de actualización a un nodo Generar simulación. Para definir un enlace de actualización a un nodo Generar simulación, siga estos pasos:

  1. Pulse con el botón derecho del ratón en el nodo Ajustar simulación y seleccione Definir enlace de actualización.
  2. Pulse en el nodo Generar simulación al que desee definir un enlace de actualización.

Para eliminar un enlace de actualización entre un nodo Ajustar simulación y un nodo Generar simulación, pulse con el botón derecho en el enlace de actualización y seleccione Eliminar enlace.

Ajuste de distribuciones

Una distribución estadística es la frecuencia teórica de la ocurrencia de los valores que puede tomar una variable. En el nodo Ajustar simulación, se compara un conjunto de distribuciones estadísticas teóricas con cada uno de los campos de datos. Los parámetros de la distribución teórica se ajustan para dar el mejor ajuste a los datos de acuerdo con una medición de la bondad de ajuste; ya sea el criterio Anderson-Darling o el criterio Kolmogorov-Smirnov . El resultado del ajuste de distribución llevado cabo por el nodo Ajustar simulación muestra qué distribuciones se han ajustado, las mejores estimaciones de parámetros para cada distribución y en qué medida la distribución se ajusta a los datos. Durante el ajuste de distribución, también se calculan las correlaciones entre los campos con tipos de almacenamiento numérico y las contingencias entre campos con una distribución categórica. Los resultados del ajuste de distribución se utilizan para crear un nodo Generar simulación.

Antes de que ajustarse las distribuciones a los datos, se examinan los primeros 1000 registros en busca de datos ausentes. Si faltan demasiados valores, el ajuste de distribuciones no será posible. En tal caso, deberá decidir cuál de las opciones siguientes procede:
  • Utilizar un nodo anterior en la ruta para eliminar los registros a los que les falten valores.
  • Utilizar un nodo anterior en la ruta para asignar los valores que falten.
El ajuste de distribuciones no excluye los valores de usuario ausente. Si los datos tienen valores perdidos por el usuario y desea excluir dichos valores del ajuste de distribuciones, debe establecer estos valores como perdidos del sistema.

El rol de un campo no se tiene en cuenta cuando se ajustan las distribuciones. Por ejemplo, los campos con el rol Destino se tratan del igual que los campos con los roles de Entrada, Ninguno, Ambos, Partición División, Frecuencia e ID.

Los campos se tratan de forma diferente durante el ajuste de distribuciones según su tipo de almacenamiento y nivel de medición. El tratamiento de los campos durante el ajuste de distribuciones se describen en la tabla siguiente.

Tabla 1. Ajuste de distribuciones en función del tipo de almacenamiento y del nivel de medición de los campos
Tipo de almacenamiento     Nivel de medición      
  Continuo Categórica Distintivo Nominal Ordinal Sin tipo
Serie Imposible   Se ajustan las distribuciones categórica, dice y fija.      
Entero          
Real          
Hora Se ajustan todas las distribuciones. Se calculan las correlaciones y las contingencias. Se ajusta la distribución categórica. No se calculan las correlaciones.   Se ajustan las distribuciones binomial, binomial negativa y Poisson, y se calculan las correlaciones. El campo se ignora y no se pasa al nodo Generar simulación.
Fecha          
Indicación de fecha y hora          
Desconocido   El tipo de almacenamiento correspondiente se determina a partir de los datos.    

Los campos con el nivel de medición ordinal se tratan como campos continuos y se incluyen en la tabla de correlaciones del nodo Generar simulación. Si se desea ajustar una distribución distinta de la binomial, binomial negativa o Poisson a un campo ordinal, deberá cambiar a continuo el nivel de medición del campo. Si se ha definido previamente una etiqueta para cada valor de un campo ordinal y luego se cambia el nivel de medición a continuo, se perderán las etiquetas.

Durante el ajuste de distribución, los campos que tienen valores únicos no se tratan de forma distinta de los campos con varios valores. Los campos con tipo de almacenamiento hora, fecha o fecha y hora se tratan como numéricos.

Ajuste de distribuciones a campos de división

Si los datos contienen un campo de división y se desea que el ajuste de distribución se lleve a cabo de forma independiente para cada división, deberán transformarse los datos utilizando un nodo Reestructurar anterior en la ruta. Mediante un nodo Reestructurar, genere un campo nuevo para cada valor del campo de división. Luego puede utilizar estos datos reestructurados en un ajuste de distribución en el nodo Ajustar simulación.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información