El nodo Auditoría de datos proporciona un primer vistazo completo a los datos que aporta a SPSS Modeler. Los datos se presentan en una matriz interactiva y fácil de leer que se puede ordenar y utilizar para generar gráficos de tamaño completo.
Cuando ejecuta un nodo Auditoría de datos, se genera una salida interactiva que incluye la siguiente información:
- Información como, por ejemplo, estadísticos de resumen, histogramas, diagramas de caja, gráficos de barras, gráficos circulares, etc., que puede ser útil para obtener una comprensión preliminar de los datos.
- Información sobre valores atípicos, extremos y valores perdidos.
Utilización del nodo Auditoría de datos
El nodo Auditoría de datos se puede conectar directamente a un nodo de importación o a nodos posteriores a un nodo Tipo instanciado.
Cribado o muestreo de datos. Puesto que una auditoría inicial es efectiva al tratar con big data, puede utilizar un nodo Sample para reducir el tiempo de proceso durante la exploración inicial seleccionando sólo un subconjunto de registros. El nodo Auditoría de datos también se puede utilizar con nodos como Selección de características y Detección de anomalías en las etapas exploratorias del análisis.
- Asimetría ajustada
- La vista de datos calcula el valor de asimetría ajustado.
- Asimetría tradicional
- El valor de asimetría ajustado se calcula mediante SPSS Modeler y Python.