El nodo Ajustar simulación ajusta un conjunto de distribuciones estadísticas candidatas a cada campo de los datos. El ajuste de cada distribución a un campo se evalúa mediante un criterio de bondad de ajuste. Cuando se ejecuta un nodo Ajustar simulación, se construye un nodo Generar simulación (o se actualiza un nodo existente). A cada campo se le asigna la distribución que mejor se le ajusta. El nodo Generar simulación podrá entonces utilizarse para generar datos simulados para cada campo.
Aunque el nodo Ajustar simulación es un nodo terminal, no añade salida al panel de salidas ni exporta datos.
Utilización de un nodo Ajustar simulación para crear automáticamente un nodo Generar simulación
La primera vez que se ejecuta el nodo Ajustar simulación, se crea un nodo Generar simulación con un enlace de actualización al nodo Ajustar simulación. Si se vuelve a ejecutar el nodo Ajustar simulación, solo se creará un nodo Generar simulación si se ha eliminado el enlace de actualización. También puede utilizar un nodo Ajustar simulación para actualizar un nodo Generar simulación conectado. El resultado dependerá de si los mismos campos están presentes en ambos nodos y de si los campos están desbloqueados en el nodo Generación de simulación. Consulte Nodo Sim Gen para obtener más información.
Un nodo Ajustar simulación solo puede tener un enlace de actualización a un nodo Generar simulación. Para definir un enlace de actualización a un nodo Generar simulación, siga estos pasos:
- Pulse con el botón derecho del ratón en el nodo Ajustar simulación y seleccione Definir enlace de actualización.
- Pulse en el nodo Generar simulación al que desee definir un enlace de actualización.
Para eliminar un enlace de actualización entre un nodo Ajustar simulación y un nodo Generar simulación, pulse con el botón derecho en el enlace de actualización y seleccione Eliminar enlace.
Ajuste de distribuciones
Una distribución estadística es la frecuencia teórica de la ocurrencia de los valores que puede tomar una variable. En el nodo Ajustar simulación, se compara un conjunto de distribuciones estadísticas teóricas con cada uno de los campos de datos. Los parámetros de la distribución teórica se ajustan para dar el mejor ajuste a los datos de acuerdo con una medición de la bondad de ajuste; ya sea el criterio Anderson-Darling o el criterio Kolmogorov-Smirnov . El resultado del ajuste de distribución llevado cabo por el nodo Ajustar simulación muestra qué distribuciones se han ajustado, las mejores estimaciones de parámetros para cada distribución y en qué medida la distribución se ajusta a los datos. Durante el ajuste de distribución, también se calculan las correlaciones entre los campos con tipos de almacenamiento numérico y las contingencias entre campos con una distribución categórica. Los resultados del ajuste de distribución se utilizan para crear un nodo Generar simulación.
- Utilizar un nodo anterior en la ruta para eliminar los registros a los que les falten valores.
- Utilizar un nodo anterior en la ruta para asignar los valores que falten.
El rol de un campo no se tiene en cuenta cuando se ajustan las distribuciones. Por ejemplo, los campos con el rol Destino se tratan del igual que los campos con los roles de Entrada, Ninguno, Ambos, Partición División, Frecuencia e ID.
Los campos se tratan de forma diferente durante el ajuste de distribuciones según su tipo de almacenamiento y nivel de medición. El tratamiento de los campos durante el ajuste de distribuciones se describen en la tabla siguiente.
Tipo de almacenamiento | Nivel de medición | |||||
---|---|---|---|---|---|---|
Continuo | Categórica | Distintivo | Nominal | Ordinal | Sin tipo | |
Serie | Imposible | Se ajustan las distribuciones categórica, dice y fija. | ||||
Entero | ||||||
Real | ||||||
Hora | Se ajustan todas las distribuciones. Se calculan las correlaciones y las contingencias. | Se ajusta la distribución categórica. No se calculan las correlaciones. | Se ajustan las distribuciones binomial, binomial negativa y Poisson, y se calculan las correlaciones. | El campo se ignora y no se pasa al nodo Generar simulación. | ||
Fecha | ||||||
Indicación de fecha y hora | ||||||
Desconocido | El tipo de almacenamiento correspondiente se determina a partir de los datos. |
Los campos con el nivel de medición ordinal se tratan como campos continuos y se incluyen en la tabla de correlaciones del nodo Generar simulación. Si se desea ajustar una distribución distinta de la binomial, binomial negativa o Poisson a un campo ordinal, deberá cambiar a continuo el nivel de medición del campo. Si se ha definido previamente una etiqueta para cada valor de un campo ordinal y luego se cambia el nivel de medición a continuo, se perderán las etiquetas.
Durante el ajuste de distribución, los campos que tienen valores únicos no se tratan de forma distinta de los campos con varios valores. Los campos con tipo de almacenamiento hora, fecha o fecha y hora se tratan como numéricos.
Ajuste de distribuciones a campos de división
Si los datos contienen un campo de división y se desea que el ajuste de distribución se lleve a cabo de forma independiente para cada división, deberán transformarse los datos utilizando un nodo Reestructurar anterior en la ruta. Mediante un nodo Reestructurar, genere un campo nuevo para cada valor del campo de división. Luego puede utilizar estos datos reestructurados en un ajuste de distribución en el nodo Ajustar simulación.