Utilice AutoAI's para realizar análisis de texto de sus experimentos. Por ejemplo, realice un análisis de opinión básico para pronosticar un resultado basado en comentarios de texto.
Visión general del análisis de texto
Cuando crea un experimento que utiliza la característica de análisis de texto, el proceso AutoAI utiliza el algoritmo word2vec
para transformar el texto en vectores y, a continuación, compara los vectores para establecer el impacto en la columna de predicción.
El algoritmo word2vec
toma un corpus de texto como entrada y genera un conjunto de vectores. Al convertir el texto en una representación numérica, puede detectar y comparar palabras similares. Cuando se entrena con suficientes datos, word2vec
puede hacer predicciones precisas sobre el significado de una palabra o su relación con otras palabras. Las predicciones se pueden utilizar para analizar texto y adivinar el significado en las aplicaciones de análisis de opinión.
Durante la fase de ingeniería de características del entrenamiento de experimento, se generan 20 características para la columna de texto, utilizando el algoritmo word2vec
. La detección automática de las características de texto se basa en el análisis del número de valores exclusivos en una columna y el número de señales en un registro (número mínimo = 3). Si el número de valores exclusivos es menor que el número de todos los valores divididos por 5, la columna no se trata como texto.
Cuando finaliza el experimento, puede revisar los resultados de ingeniería de características de la página de detalles de la interconexión. También puede guardar una interconexión como un cuaderno, donde puede revisar las transformaciones y ver una visualización de las transformaciones.
Ejemplo: análisis de comentarios de clientes
En este ejemplo, los comentarios de una empresa de alquiler de coches ficticia se utilizan para entrenar un modelo que predice una calificación de satisfacción cuando se especifica un comentario nuevo.
Vea este breve video para ver este ejemplo y luego lea más detalles sobre la función de texto debajo del video.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Transcripción de vídeo Hora Transcripción 00:00 En este vídeo verá cómo crear un experimento AutoAI para realizar análisis de sentimiento en un archivo de texto. 00:09 Puede utilizar la ingeniería de características de texto para realizar análisis de texto en sus experimentos. 00:15 Por ejemplo, realice un análisis de opinión básico para pronosticar un resultado basado en comentarios de texto. 00:22 Empiece en un proyecto y añada un activo a ese proyecto, un nuevo experimento de AutoAI. 00:29 Simplemente proporcione un nombre, una descripción, seleccione un servicio de aprendizaje automático y, a continuación, cree el experimento. 00:38 Cuando se visualice el constructor de experimentos AutoAI, puede añadir el conjunto de datos. 00:43 En este caso, el conjunto de datos ya está almacenado en el proyecto como un activo de datos. 00:48 Seleccione el activo que desea añadir al experimento. 00:53 Antes de continuar, obtenga una vista preliminar de los datos. 00:56 Este conjunto de datos tiene dos columnas. 00:59 La primera contiene los comentarios de los clientes y la segunda contiene 0 para "No satisfecho" o 1 para "Satisfecho". 01:08 Esta no es una previsión de series temporales, por lo que seleccione "No" para esa opción. 01:13 A continuación, seleccione la columna que desea pronosticar, que en este ejemplo es "Satisfacción". 01:19 AutoAI determina que la columna de satisfacción contiene dos valores posibles, por lo que es adecuado para un modelo de clasificación binario. 01:28 Y la clase positiva es 1, correspondiente a "Satisfecho". 01:32 Abra la configuración del experimento si desea personalizar el experimento. 01:36 En el panel de origen de datos, verá algunas opciones para la ingeniería de características de texto. 01:41 Puede seleccionar automáticamente las columnas de texto o puede ejercer más control especificando manualmente las columnas para la ingeniería de características de texto. 01:52 También puede seleccionar cuántos vectores crear para cada columna durante la ingeniería de características de texto. 01:58 Un número inferior es más rápido y un número superior es más preciso pero más lento. 02:03 Ahora ejecute el experimento para ver las transformaciones y el progreso. 02:09 Cuando crea un experimento que utiliza la característica de análisis de texto, el proceso de AutoAI utiliza el algoritmo word2vec para transformar el texto en vectores y luego compara los vectores para establecer el impacto en la columna de predicción. 02:23 Durante la fase de ingeniería de características del entrenamiento del experimento, se generan veinte características para la columna de texto utilizando el algoritmo word2vec. 02:33 Cuando finaliza el experimento, puede revisar los resultados de ingeniería de características de la página de detalles de la interconexión. 02:40 En el panel Resumen de características, puede revisar las transformaciones de texto. 02:45 Puede ver que AutoAI ha creado varias funciones de texto aplicando la función de algoritmo a los elementos de columna, junto con la importancia de la característica que muestra qué características contribuyen más al resultado de la predicción. 02:59 Puede guardar esta interconexión como un modelo o como un cuaderno. 03:03 El cuaderno contiene el código para ver las transformaciones y visualizaciones de dichas transformaciones. 03:09 En este caso, cree un modelo. 03:13 Utilice el enlace para ver el modelo. 03:16 Ahora promocione el modelo a un espacio de despliegue. 03:23 Estos son los detalles del modelo y desde aquí puede desplegar el modelo. 03:28 En este caso, será un despliegue en línea. 03:36 Cuando se complete, abra el despliegue. 03:39 En la aplicación de prueba, puede especificar uno o varios comentarios para analizar. 03:46 A continuación, pulse "Pronosticar". 03:49 Se prevé que el primer cliente no esté satisfecho con el servicio. 03:54 Y se prevé que el segundo cliente esté satisfecho con el servicio. 03:59 Busque más vídeos en la documentación de Cloud Pak for Data as a Service.
Dado un conjunto de datos que contiene una columna de comentarios de revisión para la experiencia de alquiler (Customer_service), y una columna que contiene una valoración de satisfacción binaria (Satisfacción) donde 0 representa un comentario negativo y 1 representa un comentario positivo, el experimento se entrena para predecir una valoración de satisfacción cuando se entran nuevos comentarios.
Entrenamiento de un experimento de transformación de texto
Después de cargar el conjunto de datos y especificar la columna de predicción (Satisfacción), Valores de experimento selecciona la opción Utilizar ingeniería de características de texto .
Tenga en cuenta algunos de los detalles para ajustar el experimento de análisis de texto:
- Puede aceptar la selección predeterminada de seleccionar automáticamente las columnas de texto o puede ejercer más control especificando manualmente las columnas para la ingeniería de características de texto.
- A medida que se ejecuta el experimento, se genera un valor predeterminado de 20 características para la columna de texto utilizando el algoritmo
word2vec
. Puede editar dicho valor para aumentar o reducir el número de características. Cuantos más vectores genere, más preciso será el modelo, pero más larga será la toma de formación. - El resto de las opciones se aplica a todos los tipos de experimentos para que pueda afinar la forma de manejar los datos de entrenamiento finales.
Ejecute el experimento para ver las transformaciones en curso.
Seleccione el nombre de una interconexión y, a continuación, pulse Resumen de características para revisar las transformaciones de texto.
También puede guardar la interconexión de experimento como un cuaderno y revisar las transformaciones como una visualización.
Despliegue y puntuación de un modelo de transformación de texto
Cuando puntúe este modelo, especifique nuevos comentarios para obtener una predicción con una puntuación de confianza para si el comentario da como resultado una puntuación de satisfacción positiva o negativa.
Por ejemplo, si se escribe el comentario "Tardaron casi tres horas en darnos el coche. Fue absurdo " predice una calificación de satisfacción de 0 con un puntaje de confianza de 95%.
Próximos pasos
Creación de un experimento de previsión de serie temporal
Tema padre: Creación de un modelo de AutoAI