Este tutorial se centra en la monitorización de la información de estado de una máquina y en el problema de reconocer y predecir estados de fallo.
Los datos se crean a partir de una simulación ficticia y constan de varias series concatenadas que se miden a lo largo del tiempo. Cada registro es un informe instantáneo de la máquina e incluye los siguientes campos:
Time
. Un entero.Power
. Un entero.Temperature
. Un entero.Pressure
.0
si es normal,1
para una advertencia de presión momentánea.Uptime
. Tiempo desde la última vez que se le dio servicio.Status
. Normalmente0
, cambia a un código de error si se produce un error (101
,202
o303
).Outcome
. El código de error que aparece en esta serie temporal o0
si no se produce ningún error. (Estos códigos están solo disponibles a posteriori).
El siguiente proceso es habitual en la mayoría de los proyectos de minería de datos:
- Examinar los datos para determinar qué atributos podrían ser relevantes para la predicción o el reconocimiento de los estados de interés.
- Conserve esos atributos (si todavía están presentes) o derívelos y añádalos a los datos si fuese necesario.
- Utilice los datos resultantes para entrenar reglas y redes neuronales.
- Pruebe los sistemas entrenados utilizando datos de prueba independientes.
Pruebe el tutorial
En esta guía de aprendizaje, realizará estas tareas:
Ejemplo de flujo de modelización y conjunto de datos
Este tutorial utiliza el flujo de Condition Monitoring en el proyecto de ejemplo. El archivo de datos utilizado es cond1n.csv. La siguiente imagen muestra el flujo del modelador de muestra.
Para cada serie temporal, hay una serie de registros de un periodo de funcionamiento normal seguido de un periodo que conduce al fallo, como se muestra en la siguiente imagen:
Tarea 1: Abrir el proyecto de ejemplo
El proyecto de muestra contiene varios conjuntos de datos y flujos de modelado de muestra. Si aún no tiene el proyecto de ejemplo, consulte el tema Tutoriales para crear el proyecto de ejemplo. A continuación, siga estos pasos para abrir el proyecto de ejemplo:
- En Cloud Pak for Data, en el menú de navegación ' , seleccione Proyectos > Ver todos los proyectos.
- Haga clic en ProyectoSPSS Modeler.
- Haga clic en la pestaña Activos para ver los conjuntos de datos y los flujos del modelador.
' Comprueba tu progreso
La siguiente imagen muestra la pestaña Activos del proyecto. Ya está preparado para trabajar con el flujo del modelador de ejemplo asociado a este tutorial.
Tarea 2: Examinar el activo de datos
El flujo del modelador de Condition Monitoring incluye varios nodos. Siga estos pasos para examinar el nodo Activo de datos:
- En la pestaña Activos, abra el flujo del modelador de Condition Monitoring y espere a que se cargue el lienzo.
- Haga doble clic en el nodo cond1n.csv. Este nodo es un nodo de Activo de Datos que apunta al archivo cond1n.csv en el proyecto.
- Revise las propiedades del formato de archivo.
- En la sección Operaciones de grabación de la paleta, arrastre el nodo Seleccionar al lienzo. Pase el ratón por encima del nodo, haga clic en Editar título y cámbiele el nombre a "
Select (101)
. Conéctelo al nodo de activos de datos cond1n.csv. Haga doble clic en el nodo Seleccionar e introduzca un valor 'Outcome == 101
' para Condición. - Pulse Guardar.
- A continuación, en la sección Gráfico de la paleta, arrastre el nodo Trazar al lienzo. Pasa el ratón por encima del nodo, haz clic en el botón Editar título y cámbiale el nombre a " Hora v. Power contra Temperatura (101). A continuación, conéctalo al nodo Select.
- Haga doble clic en el nodo Plot y pulse el botón 3-D graph para añadir un tercer eje a su gráfico. En la lista, seleccione los campos que desea visualizar en el gráfico 3D. En este caso: '
Time
, 'Power
y 'Temperature
. - Pase el ratón por encima del nodo Plot y haga clic en el icono Ejecutar ' .
- En el panel Salidas y modelos, haga clic en los resultados de salida con el nombre " Hora v. Power contra Temperatura (101) ' para ver los resultados.
Este gráfico muestra 101 errores en el aumento de la temperatura y la fluctuación de la potencia a lo largo del tiempo. Experimente seleccionando otras condiciones de error y visualice otros gráficos.
A partir de estos gráficos, la presencia y la tasa de cambio tanto de la temperatura como de la potencia, junto con la presencia y el grado de fluctuación, son relevantes para predecir y distinguir fallos. Estos atributos pueden añadirse a los datos antes de aplicar los sistemas de aprendizaje.
- Opcional: Elimine los nodos Select y Plot para evitar un posible error cuando el usuario ejecute el flujo más adelante.
' Comprueba tu progreso
La imagen siguiente muestra el flujo. Ya está listo para preparar los datos.
Tarea 3: Preparar los datos
Basándose en los resultados de la exploración de los datos, el flujo siguiente deriva los datos relevantes y aprende a predecir errores.
Este ejemplo utiliza el flujo denominado Condition Monitoring, disponible en el proyecto de ejemplo instalado con el producto. Los archivos de datos son cond1n.csv y cond2n.csv.
- Nodo de importación de Activo de datos. Lee el archivo de datos cond1n.csv.
- Advertencias de presión (Derivar). Cuenta el número de advertencias de presión pasajeras. Restablecer cuando el tiempo vuelve a 0.
- Inctemp (Derivar). Calcula la tasa momentánea de cambio de temperatura utilizando '
@DIFF1
. - Incpot (Derivar). Calcula la tasa momentánea de cambio de potencia utilizando '
@DIFF1
. - Flujopot (Derivar). Una marca, que es verdadera si la potencia varió en direcciones opuestas en el último registro y en el actual (es decir, durante un pico o una bajada de potencia).
- Estadopot (Derivar). Un estado que comienza como "
Stable
" y cambia a "Fluctuating
" cuando se detectan dos flujos de potencia sucesivos. Vuelve al 'Stable
' sólo cuando no hay flujo de corriente durante cinco intervalos de tiempo o cuando se restablece el 'Time
'. - Cambiopot (Derivar). Promedio de
PowerInc
durante los últimos cinco intervalos de tiempo. - Cambiotemp (Derivar). Promedio de
TempInc
durante los últimos cinco intervalos de tiempo. - Descartar inicial (Seleccionar). Discards the first record of each time series to avoid large (incorrect) jumps in
Power
andTemperature
at boundaries. - Descartar campos (Filtrar). Reduce los registros a "
Uptime
", "Status
, "Outcome
, "Pressure Warnings
, "PowerState
, "PowerChange
y "TempChange
. - Tipo. Define el papel de '
Outcome
' como Target (el campo a predecir). Además, define el nivel de medición de "Outcome
" como Nominal, "Pressure Warnings
" como Continuo y "PowerState
" como Indicador.
' Comprueba tu progreso
La siguiente imagen muestra los nodos Derive. Ya está listo para entrenar el modelo.
Tarea 4: Entrenar el modelo
La ejecución del flujo entrena la regla C5.0 y la red neuronal (red). La red puede tardar algún tiempo en entrenarse, pero el entrenamiento puede interrumpirse pronto para guardar una red que produzca resultados razonables. Una vez completado el aprendizaje, se generan nuggets del modelo: uno representa la red neuronal y otro la regla.
Estos nuggets del modelo permiten probar el sistema o exportar los resultados del modelo. En este ejemplo, se comprueban los resultados del modelo. Siga estos pasos para entrenar el modelo:
- Haga clic en Ejecutar todo y genere los modelos C5.0 y Red neuronal.
- Vea cada uno de los modelos. Haga doble clic en el modelo Outcome (C5.0) y haga clic en Ver modelo para comprobar los resultados. Repita este paso para el modelo Outcome (Neural Net).
' Comprueba tu progreso
La siguiente imagen muestra los resultados del modelo. Ya está listo para probar el modelo.
Tarea 5: Probar el modelo
Sigue estos pasos para probar el modelo:
- Reposiciona los nuggets, de forma que el nodo Type se conecte con el nugget de red neuronal, que a su vez se conecta con el nugget C5.0.
- En la sección Salidas de la paleta, arrastre el nodo Análisis al lienzo y conéctelo a la pepita C5.0.
- Haga doble clic en el nodo Activo de datos.
- Haga clic en Cambiar activo de datos.
- Seleccione Activo de datos > cond2n.csv.
- Pulse Seleccionar.
- Pulse Guardar.
- Pase el ratón por encima del nodo Análisis y haga clic en el icono Ejecutar ' . Al hacerlo se generan cifras que reflejan la precisión de la regla y la red entrenadas.
- En el panel Salidas y modelos, haga clic en los resultados de salida con el nombre Análisis para ver los resultados.
- Revisa los resultados y compara el análisis de cada modelo.
' Comprueba tu progreso
La siguiente imagen muestra el flujo completado.
Resumen
Este ejemplo le ha mostrado cómo supervisar la información de estado de una máquina en relación con los problemas de reconocimiento y predicción de estados de fallo. Ha utilizado una serie de nodos Derive para preparar los datos y, a continuación, ha construido un modelo C5.0.
Próximos pasos
Ahora está preparado para probar otros tutorialesSPSS® Modeler.