0 / 0
Volver a la versión inglesa de la documentación
Creación de un experimento de series temporales
Última actualización: 28 nov 2024
Creación de un experimento de series temporales

Utilice AutoAI para crear un experimento de serie temporal para predecir la actividad futura, como por ejemplo los precios de existencias o las temperaturas, a lo largo de un rango de fechas o horas especificado.

Visión general de series temporales

Un experimento de series temporales es un método de pronóstico que utiliza observaciones históricas para predecir los valores futuros. El experimento crea automáticamente muchas interconexiones utilizando modelos de aprendizaje automático, como por ejemplo regresión de bosque aleatoria y máquinas de vectores de soporte (MVSs), así como modelos de series temporales estadísticas, como por ejemplo ARIMA y Holt-Winters. A continuación, el experimento recomienda la mejor interconexión de acuerdo con el rendimiento de la interconexión evaluado en un conjunto de datos reservados o conjuntos de datos de prueba posterior.

A diferencia de un experimento estándar de AutoAI , que crea un conjunto de interconexiones hasta su finalización, las clasifica. Un experimento de serie temporal evalúa las interconexiones anteriormente en el proceso y sólo completa y prueba las interconexiones con mejor rendimiento.

Proceso de generación de interconexión de series temporales de AutoAI

Para obtener detalles acerca de las diferentes etapas del entrenamiento y cómo realizar la prueba de un experimento de series temporales, consulte Detalles de la implementación de series temporales.

Utilización de características de soporte para mejorar las predicciones

Al configurar el experimento de serie temporal, puede optar por especificar características de soporte, también conocidas como características exógenas. Las características de soporte son características que influyen o añaden contexto al destino de predicción. Por ejemplo, si está pronosticando ventas de helados, la temperatura diaria sería una característica lógica de soporte que haría que la previsión fuera más precisa.

Aprovechar los valores futuros para las características de soporte

Si conoce los valores futuros para las características de soporte, puede aprovechar estos valores futuros al desplegar el modelo. Por ejemplo, si está entrenando un modelo para prever futuras ventas de camisetas, puede incluir descuentos promocionales como característica de soporte para mejorar la predicción. La entrada del valor futuro de la promoción hace que la previsión sea más precisa.

Requisitos de datos

Estos son los requisitos de datos actuales para entrenar un experimento de serie temporal:

  • Lo datos de entrenamiento deben ser un único archivo con formato CSV.

  • El archivo debe contener una o varias columnas de series temporales y opcionalmente una columna de indicación de fecha y hora. Para obtener una lista de los formatos de fecha/hora soportados, consulte Detalles de implementación de series temporales deAutoAI.

  • Si el origen de datos contiene una columna de indicación de fecha y hora, asegúrese de que los datos se muestrean con una frecuencia uniforme. Es decir, la diferencia de las indicaciones de fecha y hora de las filas adyacentes es la misma. Por ejemplo, los datos pueden estar en incrementos de 1 minuto, 1 hora o un día. La indicación de fecha y hora especificada se utiliza para determinar la ventana de búsqueda para mejorar la precisión del modelo.

    Nota:

    Si el tamaño del archivo es mayor que 1 GB, ordene los datos en orden descendente por la indicación de fecha y hora, y solo se utilizarán los primeros 1 GB para entrenar el experimento.

  • Si el origen de datos no contiene una columna de indicación de fecha y hora, asegúrese de que los datos se muestrean a intervalos regulares y se ordenan en orden ascendente de acuerdo con la fecha/hora de la muestra. Es decir, el valor de la primera fila es el más antiguo y el valor de la última fila es el más reciente.

    Nota: Si el tamaño del archivo es mayor que 1 GB, trunque el archivo para que sea menor que 1 GB.
  • Seleccione los datos que se deben utilizar al entrenar las interconexiones finales. Si elige incluir solo datos de entrenamiento, los cuadernos generados incluirán una celda para recuperar los datos de retención utilizados para evaluar cada interconexión.

Elija los datos del proyecto o cárguelos desde el sistema de archivos o desde el navegador de activos y, a continuación, pulse Continuar. Haga clic en el icono Vista previa alt="AutoAI preview data set icon", después del nombre de la fuente de datos para revisar sus datos. Opcionalmente, puede añadir un segundo archivo como datos reservados para probar las interconexiones entrenadas.

Configuración de un experimento de series temporales

Cuando configure los detalles de un experimento, pulse para Habilitar serie temporal y complete los detalles del experimento.

Campo Descripción
Columnas de predicción Las columnas de series temporales que desea pronosticar en función de los valores anteriores. Puede especificar una o varias columnas para la predicción.
Columna Fecha/hora La columna que indica la fecha/hora en la que ocurren las series temporales.
Ventana de búsqueda Un parámetro que indica cuántos valores de series temporales anteriores se utilizan para pronosticar el punto temporal actual.
Ventana de predicción El rango que desea predecir basándose en los datos de la ventana de búsqueda.

El resumen de predicción muestra el tipo de experimento y la métrica seleccionada para optimizar el experimento.

Configuración de valores de experimento

Para configurar más detalles para el experimento de serie temporal, pulse Valores de experimento.

Valores de predicción generales

En el panel General para los valores de predicción, puede cambiar opcionalmente la métrica utilizada para optimizar el experimento o especificar los algoritmos a tener en cuenta o el número de interconexiones a generar.

Campo Descripción
Tipo de predicción Ver o cambiar el tipo de predicción en función de la columna de predicción del experimento. Para experimentos de series temporales, Previsión de series temporales está seleccionado de forma predeterminada.
Nota: Si cambia el tipo de predicción, se cambiarán automáticamente otros valores de predicción para el experimento.
Métrica optimizada Ver o cambiar la métrica optimizada recomendada para el experimento.
Selección de algoritmos optimizados No soportado para experimentos de series temporales.
Algoritmos a incluir Seleccione algoritmos basados en los que desea que el experimento cree interconexiones. Los algoritmos y las interconexiones que dan soporte al uso de características de soporte se indican mediante una marca de selección.
Interconexiones para completar Ver o cambiar el número de interconexiones que se van a generar para el experimento.

Detalles de la configuración de las series temporales

En el panel Serie temporal para valores de predicción, configure los detalles sobre cómo entrenar el experimento y generar predicciones.

Campo Descripción
Columna Fecha/hora Ver o cambiar la columna de fecha/hora para el experimento.
Ventana de búsqueda Ver o actualizar el número de valores de series temporales anteriores utilizados para predecir el punto temporal actual.
Ventana de predicción Visualice o actualice el rango que desea predecir basándose en.

Configuración de valores de origen de datos

Para configurar los detalles de los datos de entrada, pulse Valores de experimento y seleccione Origen de datos.

Valores generales de origen de datos

En el panel General para los valores de origen de datos, puede modificar el conjunto de datos para interpolar los valores perdidos, dividir el conjunto de datos en datos de entrenamiento y reserva, y especificar las características de soporte.

Campo Descripción
Filas duplicadas No soportado para experimentos de series temporales.
Datos de submuestra No soportado para experimentos de series temporales.
Ingeniería de características de texto No soportado para experimentos de series temporales.
Conjunto de datos de entrenamiento final Seleccione qué datos utilizar al entrenar las interconexiones finales: sólo los datos de entrenamiento o los datos de entrenamiento y reserva. Si elige incluir sólo datos de entrenamiento, los cuadernos generados para este experimento incluirán una celda para recuperar los datos reservados utilizados para evaluar cada interconexión.
Características de soporte Elija columnas adicionales del conjunto de datos como características de soporte para dar soporte a las predicciones y aumentar la precisión del modelo. También puede utilizar valores futuros para las características de soporte habilitando Aprovechar los valores futuros de las características de soporte.
Nota: Sólo puede utilizar características de soporte con algoritmos e interconexiones seleccionados. Para obtener más información sobre algoritmos e interconexiones que dan soporte al uso de características de soporte, consulte Detalles de implementación de series temporales.
Imputación de datos Utilice la imputación de datos para sustituir los valores perdidos en el conjunto de datos por valores sustituidos. Al habilitar esta opción, puede especificar cómo deben interpolarse los valores perdidos en los datos. Para obtener más información sobre la imputación de datos, consulte Imputación de datos en experimentos de AutoAI .
Entrenamiento y reserva de datos Elija reservar algunos datos del conjunto de datos de entrenamiento para probar el experimento. De forma alternativa, cargue un archivo separado de datos de reserva. El archivo de datos de reserva debe coincidir con el esquema de los datos de entrenamiento.

Configuración de los datos de series temporales

Para configurar los datos de serie temporal, puede ajustar los valores para los datos de serie temporal relacionados con la prueba posterior del experimento. Las pruebas de retroceso proporcionan un medio de validar un modelo de serie temporal utilizando datos históricos.

En un experimento de aprendizaje de máquina típico, puede retener aleatoriamente parte de los datos para probar la redundancia del modelo resultante. Para validar un modelo de serie temporal, debe conservar la relación de orden temporal entre los datos de entrenamiento y los datos de prueba.

Los pasos siguientes describen el método de prueba de retroceso:

  1. La longitud de los datos de entrenamiento se determina en función del número de pruebas de retroceso, la longitud de intervalo y el tamaño de retención. Para obtener más información sobre estos parámetros, consulte Creación de un experimento de serie temporal.
  2. A partir de los datos más antiguos, el experimento se entrena utilizando los datos de entrenamiento.
  3. El experimento se evalúa en el primer conjunto de datos de validación. Si la longitud del espacio es distinta de cero, los datos del espacio se omiten.
  4. La ventana de datos de entrenamiento se avanza aumentando el tamaño de reserva y la longitud de espacio para formar un nuevo conjunto de entrenamiento.
  5. Se entrena un experimento nuevo con estos nuevos datos y se evalúa con el siguiente conjunto de datos de validación.
  6. Los dos pasos anteriores se repiten para los periodos de prueba posterior restantes.

Para ajustar la configuración de la prueba de retroceso:

  1. Abra Valores de experimento.
  2. En Orígenes de datos, pulse Serie temporal.
  3. (Opcional): Ajuste los valores tal como se muestra en la tabla.
Campo Descripción
Número de pruebas de retroceso Las pruebas de retroceso son similares a la validación cruzada de periodos de fecha/hora. Opcionalmente personalice el número de pruebas de retroceso para su experimento.
Retención El tamaño del conjunto de retención y cada conjunto de validación para la prueba de retroceso. La longitud de validación se puede ajustar cambiando la longitud de retención.
Longitud de intervalo El número de puntos temporales entre el conjunto de datos de entrenamiento y el conjunto de datos de validación para cada prueba de retroceso. Cuando el valor del parámetro no es cero, los valores de series temporales del intervalo no se utilizarán para entrenar el experimento o para evaluar la prueba de retroceso.

Valores de experimento en la página Origen de datos

La visualización de los valores de configuración ilustra el flujo de pruebas de retroceso. El gráfico es interactivo, por lo que puede manipular los valores desde el gráfico o desde los campos de configuración. Por ejemplo, si ajusta la longitud de intervalo, puede ver los resultados de la validación del modelo en periodos de tiempo de los datos anteriores sin aumentar el número de pruebas de retroceso.

Interpretación de los resultados del experimento

Después de ejecutar el experimento de series temporales, puede examinar las interconexiones resultantes en los detalles del experimento. Las interconexiones que utilizan características de soporte se indican mediante la etiqueta de mejora SUP para distinguirlas de las interconexiones que no utilizan estas características. Para ver los detalles:

  • Pase el cursor por los nodos de la visualización para obtener detalles acerca de las interconexiones a medida que se generan.
  • Cambie a la vista del mapa de progreso para ver una vista diferente del proceso de entrenamiento. Puede pasar el cursor por cada nodo del proceso para obtener detalles.
  • Cuando se hayan completado las interconexiones y se hayan grabado en el marcador de interconexión, puede pulsar una interconexión para ver los detalles del rendimiento.
  • Pulse Ver interconexiones descartadas para ver los algoritmos que se utilizan para las interconexiones que no están seleccionadas como de mayor rendimiento.
  • Guarde el código de experimento como cuaderno que puede revisar.
  • Guarde un conducto determinado como un cuaderno que pueda revisar.

Vea este vídeo para ver cómo ejecutar un experimento de series temporales y crear un modelo en un cuaderno Jupyter utilizando datos de entrenamiento y de retención.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Próximos pasos

Recursos adicionales

Próximos pasos

Tema principal: Visión general de AutoAI

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información