Utilice AutoAI para crear un experimento de serie temporal para predecir la actividad futura, como por ejemplo los precios de existencias o las temperaturas, a lo largo de un rango de fechas o horas especificado.
Visión general de series temporales
Un experimento de series temporales es un método de pronóstico que utiliza observaciones históricas para predecir los valores futuros. El experimento crea automáticamente muchas interconexiones utilizando modelos de aprendizaje automático, como por ejemplo regresión de bosque aleatoria y máquinas de vectores de soporte (MVSs), así como modelos de series temporales estadísticas, como por ejemplo ARIMA y Holt-Winters. A continuación, el experimento recomienda la mejor interconexión de acuerdo con el rendimiento de la interconexión evaluado en un conjunto de datos reservados o conjuntos de datos de prueba posterior.
A diferencia de un experimento estándar de AutoAI , que crea un conjunto de interconexiones hasta su finalización, las clasifica. Un experimento de serie temporal evalúa las interconexiones anteriormente en el proceso y sólo completa y prueba las interconexiones con mejor rendimiento.
Para obtener detalles acerca de las diferentes etapas del entrenamiento y cómo realizar la prueba de un experimento de series temporales, consulte Detalles de la implementación de series temporales.
Utilización de características de soporte para mejorar las predicciones
Al configurar el experimento de serie temporal, puede optar por especificar características de soporte, también conocidas como características exógenas. Las características de soporte son características que influyen o añaden contexto al destino de predicción. Por ejemplo, si está pronosticando ventas de helados, la temperatura diaria sería una característica lógica de soporte que haría que la previsión fuera más precisa.
Aprovechar los valores futuros para las características de soporte
Si conoce los valores futuros para las características de soporte, puede aprovechar estos valores futuros al desplegar el modelo. Por ejemplo, si está entrenando un modelo para prever futuras ventas de camisetas, puede incluir descuentos promocionales como característica de soporte para mejorar la predicción. La entrada del valor futuro de la promoción hace que la previsión sea más precisa.
Requisitos de datos
Estos son los requisitos de datos actuales para entrenar un experimento de serie temporal:
Lo datos de entrenamiento deben ser un único archivo con formato CSV.
El archivo debe contener una o varias columnas de series temporales y opcionalmente una columna de indicación de fecha y hora. Para obtener una lista de los formatos de fecha/hora soportados, consulte Detalles de implementación de series temporales deAutoAI.
Si el origen de datos contiene una columna de indicación de fecha y hora, asegúrese de que los datos se muestrean con una frecuencia uniforme. Es decir, la diferencia de las indicaciones de fecha y hora de las filas adyacentes es la misma. Por ejemplo, los datos pueden estar en incrementos de 1 minuto, 1 hora o un día. La indicación de fecha y hora especificada se utiliza para determinar la ventana de búsqueda para mejorar la precisión del modelo.
Nota:Si el tamaño del archivo es mayor que 1 GB, ordene los datos en orden descendente por la indicación de fecha y hora, y solo se utilizarán los primeros 1 GB para entrenar el experimento.
Si el origen de datos no contiene una columna de indicación de fecha y hora, asegúrese de que los datos se muestrean a intervalos regulares y se ordenan en orden ascendente de acuerdo con la fecha/hora de la muestra. Es decir, el valor de la primera fila es el más antiguo y el valor de la última fila es el más reciente.
Nota: Si el tamaño del archivo es mayor que 1 GB, trunque el archivo para que sea menor que 1 GB.Seleccione los datos que se deben utilizar al entrenar las interconexiones finales. Si elige incluir solo datos de entrenamiento, los cuadernos generados incluirán una celda para recuperar los datos de retención utilizados para evaluar cada interconexión.
Elija los datos del proyecto o cárguelos desde el sistema de archivos o desde el navegador de activos y, a continuación, pulse Continuar. Haga clic en el icono Vista previa , después del nombre de la fuente de datos para revisar sus datos. Opcionalmente, puede añadir un segundo archivo como datos reservados para probar las interconexiones entrenadas.
Configuración de un experimento de series temporales
Cuando configure los detalles de un experimento, pulse Sí para Habilitar serie temporal y complete los detalles del experimento.
Campo | Descripción |
---|---|
Columnas de predicción | Las columnas de series temporales que desea pronosticar en función de los valores anteriores. Puede especificar una o varias columnas para la predicción. |
Columna Fecha/hora | La columna que indica la fecha/hora en la que ocurren las series temporales. |
Ventana de búsqueda | Un parámetro que indica cuántos valores de series temporales anteriores se utilizan para pronosticar el punto temporal actual. |
Ventana de predicción | El rango que desea predecir basándose en los datos de la ventana de búsqueda. |
El resumen de predicción muestra el tipo de experimento y la métrica seleccionada para optimizar el experimento.
Configuración de valores de experimento
Para configurar más detalles para el experimento de serie temporal, pulse Valores de experimento.
Valores de predicción generales
En el panel General para los valores de predicción, puede cambiar opcionalmente la métrica utilizada para optimizar el experimento o especificar los algoritmos a tener en cuenta o el número de interconexiones a generar.
Campo | Descripción |
---|---|
Tipo de predicción | Ver o cambiar el tipo de predicción en función de la columna de predicción del experimento. Para experimentos de series temporales, Previsión de series temporales está seleccionado de forma predeterminada. Nota: Si cambia el tipo de predicción, se cambiarán automáticamente otros valores de predicción para el experimento. |
Métrica optimizada | Ver o cambiar la métrica optimizada recomendada para el experimento. |
Selección de algoritmos optimizados | No soportado para experimentos de series temporales. |
Algoritmos a incluir | Seleccione algoritmos basados en los que desea que el experimento cree interconexiones. Los algoritmos y las interconexiones que dan soporte al uso de características de soporte se indican mediante una marca de selección. |
Interconexiones para completar | Ver o cambiar el número de interconexiones que se van a generar para el experimento. |
Detalles de la configuración de las series temporales
En el panel Serie temporal para valores de predicción, configure los detalles sobre cómo entrenar el experimento y generar predicciones.
Campo | Descripción |
---|---|
Columna Fecha/hora | Ver o cambiar la columna de fecha/hora para el experimento. |
Ventana de búsqueda | Ver o actualizar el número de valores de series temporales anteriores utilizados para predecir el punto temporal actual. |
Ventana de predicción | Visualice o actualice el rango que desea predecir basándose en. |
Configuración de valores de origen de datos
Para configurar los detalles de los datos de entrada, pulse Valores de experimento y seleccione Origen de datos.
Valores generales de origen de datos
En el panel General para los valores de origen de datos, puede modificar el conjunto de datos para interpolar los valores perdidos, dividir el conjunto de datos en datos de entrenamiento y reserva, y especificar las características de soporte.
Campo | Descripción |
---|---|
Filas duplicadas | No soportado para experimentos de series temporales. |
Datos de submuestra | No soportado para experimentos de series temporales. |
Ingeniería de características de texto | No soportado para experimentos de series temporales. |
Conjunto de datos de entrenamiento final | Seleccione qué datos utilizar al entrenar las interconexiones finales: sólo los datos de entrenamiento o los datos de entrenamiento y reserva. Si elige incluir sólo datos de entrenamiento, los cuadernos generados para este experimento incluirán una celda para recuperar los datos reservados utilizados para evaluar cada interconexión. |
Características de soporte | Elija columnas adicionales del conjunto de datos como características de soporte para dar soporte a las predicciones y aumentar la precisión del modelo. También puede utilizar valores futuros para las características de soporte habilitando Aprovechar los valores futuros de las características de soporte. Nota: Sólo puede utilizar características de soporte con algoritmos e interconexiones seleccionados. Para obtener más información sobre algoritmos e interconexiones que dan soporte al uso de características de soporte, consulte Detalles de implementación de series temporales. |
Imputación de datos | Utilice la imputación de datos para sustituir los valores perdidos en el conjunto de datos por valores sustituidos. Al habilitar esta opción, puede especificar cómo deben interpolarse los valores perdidos en los datos. Para obtener más información sobre la imputación de datos, consulte Imputación de datos en experimentos de AutoAI . |
Entrenamiento y reserva de datos | Elija reservar algunos datos del conjunto de datos de entrenamiento para probar el experimento. De forma alternativa, cargue un archivo separado de datos de reserva. El archivo de datos de reserva debe coincidir con el esquema de los datos de entrenamiento. |
Configuración de los datos de series temporales
Para configurar los datos de serie temporal, puede ajustar los valores para los datos de serie temporal relacionados con la prueba posterior del experimento. Las pruebas de retroceso proporcionan un medio de validar un modelo de serie temporal utilizando datos históricos.
En un experimento de aprendizaje de máquina típico, puede retener aleatoriamente parte de los datos para probar la redundancia del modelo resultante. Para validar un modelo de serie temporal, debe conservar la relación de orden temporal entre los datos de entrenamiento y los datos de prueba.
Los pasos siguientes describen el método de prueba de retroceso:
- La longitud de los datos de entrenamiento se determina en función del número de pruebas de retroceso, la longitud de intervalo y el tamaño de retención. Para obtener más información sobre estos parámetros, consulte Creación de un experimento de serie temporal.
- A partir de los datos más antiguos, el experimento se entrena utilizando los datos de entrenamiento.
- El experimento se evalúa en el primer conjunto de datos de validación. Si la longitud del espacio es distinta de cero, los datos del espacio se omiten.
- La ventana de datos de entrenamiento se avanza aumentando el tamaño de reserva y la longitud de espacio para formar un nuevo conjunto de entrenamiento.
- Se entrena un experimento nuevo con estos nuevos datos y se evalúa con el siguiente conjunto de datos de validación.
- Los dos pasos anteriores se repiten para los periodos de prueba posterior restantes.
Para ajustar la configuración de la prueba de retroceso:
- Abra Valores de experimento.
- En Orígenes de datos, pulse Serie temporal.
- (Opcional): Ajuste los valores tal como se muestra en la tabla.
Campo | Descripción |
---|---|
Número de pruebas de retroceso | Las pruebas de retroceso son similares a la validación cruzada de periodos de fecha/hora. Opcionalmente personalice el número de pruebas de retroceso para su experimento. |
Retención | El tamaño del conjunto de retención y cada conjunto de validación para la prueba de retroceso. La longitud de validación se puede ajustar cambiando la longitud de retención. |
Longitud de intervalo | El número de puntos temporales entre el conjunto de datos de entrenamiento y el conjunto de datos de validación para cada prueba de retroceso. Cuando el valor del parámetro no es cero, los valores de series temporales del intervalo no se utilizarán para entrenar el experimento o para evaluar la prueba de retroceso. |
La visualización de los valores de configuración ilustra el flujo de pruebas de retroceso. El gráfico es interactivo, por lo que puede manipular los valores desde el gráfico o desde los campos de configuración. Por ejemplo, si ajusta la longitud de intervalo, puede ver los resultados de la validación del modelo en periodos de tiempo de los datos anteriores sin aumentar el número de pruebas de retroceso.
Interpretación de los resultados del experimento
Después de ejecutar el experimento de series temporales, puede examinar las interconexiones resultantes en los detalles del experimento. Las interconexiones que utilizan características de soporte se indican mediante la etiqueta de mejora SUP para distinguirlas de las interconexiones que no utilizan estas características. Para ver los detalles:
- Pase el cursor por los nodos de la visualización para obtener detalles acerca de las interconexiones a medida que se generan.
- Cambie a la vista del mapa de progreso para ver una vista diferente del proceso de entrenamiento. Puede pasar el cursor por cada nodo del proceso para obtener detalles.
- Cuando se hayan completado las interconexiones y se hayan grabado en el marcador de interconexión, puede pulsar una interconexión para ver los detalles del rendimiento.
- Pulse Ver interconexiones descartadas para ver los algoritmos que se utilizan para las interconexiones que no están seleccionadas como de mayor rendimiento.
- Guarde el código de experimento como cuaderno que puede revisar.
- Guarde un conducto determinado como un cuaderno que pueda revisar.
Vea este vídeo para ver cómo ejecutar un experimento de series temporales y crear un modelo en un cuaderno Jupyter utilizando datos de entrenamiento y de retención.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Próximos pasos
- Siga una guía de aprendizaje paso a paso para entrenar un modelo de serie temporal univariado para predecir temperaturas mínimas utilizando datos de muestra.
- Siga una guía de aprendizaje paso a paso para entrenar un experimento de serie temporal con características de soporte.
- Obtenga información sobre cómo puntuar un modelo de series temporales desplegado.
- Aprenda a utilizar la API para experimentos de series temporales de AutoAI.
Recursos adicionales
- Para una introducción a la previsión con experimentos de series temporales de AutoAI, consulte la entrada de blog Right on time(series): Presentación de AutoAI Time Series de Watson Studio Studio.
- Para más información sobre la creación de un experimento de series temporales, consulte esta entrada del blog sobre ' crear un nuevo experimento de series temporales.
- Lea una entrada de blog sobre cómo añadir funciones de apoyo a un experimento de series temporales.
- Revise un cuaderno de muestra para un experimento de series temporales con características de apoyo.
- Lea una entrada de blog sobre cómo añadir funciones de apoyo a un experimento de series temporales utilizando la API.
Próximos pasos
- Guía de aprendizaje: experimento de serie temporal univariante de AutoAI
- Guía de aprendizaje: AutoAI
- Detalles de implementación del experimento de series temporales
- Puntuación de un modelo de series temporales
Tema principal: Visión general de AutoAI