0 / 0
Retourner à la version anglaise de la documentation
Création d'une expérience d'analyse de texte
Dernière mise à jour : 04 oct. 2024
Création d'une expérience d'analyse de texte

Utilisez la fonction d'analyse de texte d AutoAI's pour effectuer une analyse de texte de vos expériences. Par exemple, effectuez une analyse des sentiments pour prédire une issue basée sur des commentaires texte.

Remarque: l'analyse de texte n'est disponible que pour les expérimentations de classification et de régression AutoAI . Cette fonction n'est pas disponible pour les expérimentations de séries temporelles.

Vue d'ensemble de l'analyse de texte

Lorsque vous créez une expérimentation qui utilise la fonction d'analyse de texte, le processus AutoAI utilise l'algorithme word2vec pour transformer le texte en vecteurs, puis compare les vecteurs pour établir l'impact sur la colonne de prévision.

L'algorithme word2vec utilise un corpus de texte comme entrée et génère un ensemble de vecteurs. En transformant le texte en une représentation numérique, il peut détecter et comparer les mots similaires. Lorsqu'il est formé avec suffisamment de données, word2vec peut faire des prédictions précises sur le sens ou la relation d'un mot à d'autres mots. Les prédictions peuvent être utilisées pour analyser le texte et deviner le sens dans les applications d'analyse des sentiments.

Au cours de la phase d'ingénierie des fonctions de l'entraînement de l'expérimentation, 20 fonctions sont générées pour la colonne de texte à l'aide de l'algorithme word2vec . La détection automatique des fonctions de texte est basée sur l'analyse du nombre de valeurs uniques dans une colonne et sur le nombre de jetons dans un enregistrement (nombre minimal = 3). Si le nombre de valeurs uniques est inférieur au nombre de toutes les valeurs divisées par 5, la colonne n'est pas traitée comme du texte.

Lorsque l'expérimentation prend fin, vous pouvez passer en revue les résultats de l'ingénierie des caractéristiques sur la page de détails du pipeline. Vous pouvez également enregistrer un pipeline sous forme de bloc-notes, où vous pouvez examiner les transformations et voir une visualisation des transformations.

Remarque : Lorsque vous passez en revue l'expérimentation, si vous déterminez qu'une colonne de texte n'a pas été détectée et traitée par la détection automatique, vous pouvez spécifier la colonne de texte manuellement dans les paramètres de l'expérimentation.

Exemple : analyser les commentaires des clients

Dans cet exemple, les commentaires d'une société de location de voitures fictive sont utilisés pour entraîner un modèle qui prévoit une évaluation de la satisfaction lorsqu'un nouveau commentaire est entré.

Regardez cette courte vidéo pour voir cet exemple, puis lisez davantage de détails sur la caractéristique du texte en dessous de la vidéo.

Avertissement vidéo: Certaines étapes mineures et certains éléments graphiques de cette vidéo peuvent différer de votre plateforme.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.

  • Retranscription de la vidéo
    Heure Transcription
    00:00 Dans cette vidéo, vous allez voir comment créer une expérience AutoAI pour effectuer une analyse de sentiment sur un fichier texte.
    00:09 Vous pouvez utiliser l'ingénierie de la fonction de texte pour effectuer une analyse de texte dans vos expériences.
    00:15 Par exemple, effectuez une analyse des sentiments pour prédire une issue basée sur des commentaires texte.
    00:22 Démarrez dans un projet et ajoutez un actif à ce projet, une nouvelle expérimentation AutoAI.
    00:29 Il suffit de fournir un nom, une description, un service d'apprentissage automatique, puis de créer l'expérimentation.
    00:38 Lorsque le générateur d'expérimentation AutoAI s'affiche, vous pouvez ajouter le fichier.
    00:43 Dans ce cas, le fichier est déjà stocké dans le projet en tant qu'actif de données.
    00:48 Sélectionnez l'actif à ajouter à l'expérimentation.
    00:53 Avant de continuer, prévisualisez les données.
    00:56 Ce fichier comporte deux colonnes.
    00:59 Le premier contient les commentaires des clients et le second contient 0, pour " Pas satisfait ", ou 1, pour " Satisfait ".
    01:08 Il ne s'agit pas d'une prévision de séries chronologiques, alors sélectionnez " Non " pour cette option.
    01:13 Sélectionnez ensuite la colonne à prévoir, ce qui est " Satisfaction " dans cet exemple.
    01:19 AutoAI détermine que la colonne de satisfaction contient deux valeurs possibles, ce qui la rend appropriée pour un modèle de classification binaire.
    01:28 Et la classe positive est 1, pour " Satisfait ".
    01:32 Ouvrez les paramètres de l'expérimentation si vous souhaitez personnaliser l'expérimentation.
    01:36 Dans le panneau de la source de données, vous verrez des options pour l'ingénierie de la fonction de texte.
    01:41 Vous pouvez sélectionner automatiquement les colonnes de texte, ou vous pouvez exercer un plus grand contrôle en spécifiant manuellement les colonnes pour l'ingénierie des fonctions texte.
    01:52 Vous pouvez également sélectionner le nombre de vecteurs à créer pour chaque colonne lors de l'ingénierie de la fonction de texte.
    01:58 Un nombre plus faible est plus rapide et un nombre plus élevé est plus précis, mais plus lent.
    02:03 Maintenant, exécutez l'expérimentation pour afficher les transformations et les progrès.
    02:09 Lorsque vous créez une expérimentation qui utilise la fonction d'analyse de texte, le processus AutoAI utilise l'algorithme word2vec pour transformer le texte en vecteurs, puis compare les vecteurs pour établir l'impact sur la colonne de prévision.
    02:23 Au cours de la phase d'ingénierie des fonctions de la formation expérimentale, une vingtaine de fonctions sont générées pour la colonne de texte à l'aide de l'algorithme word2vec.
    02:33 Lorsque l'expérimentation prend fin, vous pouvez passer en revue les résultats de l'ingénierie des caractéristiques sur la page de détails du pipeline.
    02:40 Dans le panneau Récapitulatif des fonctions, vous pouvez consulter les transformations de texte.
    02:45 Vous pouvez voir que AutoAI a créé plusieurs fonctions de texte en appliquant la fonction d'algorithme aux éléments de la colonne, ainsi que l'importance de la fonction qui indique les fonctions qui contribuent le plus à votre sortie de prévision.
    02:59 Vous pouvez enregistrer ce pipeline en tant que modèle ou en tant que bloc-notes.
    03:03 Le bloc-notes contient le code pour voir les transformations et les visualisations de ces transformations.
    03:09 Dans ce cas, créez un modèle.
    03:13 Utilisez le lien pour afficher le modèle.
    03:16 Maintenant, promouvez le modèle dans un espace de déploiement.
    03:23 Voici les détails du modèle, et à partir de là, vous pouvez déployer le modèle.
    03:28 Dans ce cas, il s'agit d'un déploiement en ligne.
    03:36 Lorsque cette opération est terminée, ouvrez le déploiement.
    03:39 Sur l'application de test, vous pouvez spécifier un ou plusieurs commentaires à analyser.
    03:46 Cliquez ensuite sur " Prédire ".
    03:49 On prévoit que le premier client ne sera pas satisfait du service.
    03:54 Et le deuxième client devrait être satisfait du service.
    03:59 Trouvez d'autres vidéos dans la documentation de Cloud Pak for Data as a Service.

Compte tenu d'un ensemble de données qui contient une colonne de commentaires de revue pour l'expérience de location (Customer_service) et une colonne qui contient un taux de satisfaction binaire (Satisfaction) où 0 représente un commentaire négatif et 1 représente un commentaire positif, l'expérience est entraînée pour prédire un taux de satisfaction lorsque de nouveaux commentaires sont entrés.

Entraînement d'une expérimentation de transformation de texte

Après avoir chargé le jeu de données et spécifié la colonne de prévision (Satisfaction), l'option Paramètres de l'expérimentation sélectionne l'option Utiliser l'ingénierie de la fonction de texte .

Paramètres de source de données pour l'utilisation de l'ingénierie de la fonction de texte

Notez certains détails pour l'optimisation de votre expérience d'analyse de texte :

  • Vous pouvez accepter la sélection par défaut de la sélection automatique des colonnes de texte ou vous pouvez exercer un plus grand contrôle en spécifiant manuellement les colonnes pour l'ingénierie des fonctions texte.
  • Au fur et à mesure de l'exécution de l'expérimentation, une valeur par défaut de 20 fonctions est générée pour la colonne de texte à l'aide de l'algorithme word2vec . Vous pouvez modifier cette valeur pour augmenter ou diminuer le nombre de fonctions. Plus vous générez de vecteurs, plus votre modèle est précis, mais plus l'apprentissage est long.
  • Le reste des options s'applique à tous les types d'expérimentation afin que vous puissiez affiner la gestion des données d'apprentissage finales.

Exécutez l'expérimentation pour afficher les transformations en cours.

Tableau de classement de pipeline de l'algorithme

Sélectionnez le nom d'un pipeline, puis cliquez sur Récapitulatif des fonctions pour passer en revue les transformations de texte.

Récapitulatif des fonctions de chaque pipeline

Vous pouvez aussi sauvegarder le pipeline de l'expérimentation sous forme de bloc-notes et passer en revue les transformations en tant que visualisation.

Déploiement et évaluation d'un modèle de transformation de texte

Lorsque vous évaluez ce modèle, entrez de nouveaux commentaires pour obtenir une prévision avec une cote de confiance indiquant si le commentaire génère un taux de satisfaction positif ou négatif.

Par exemple, entrez le commentaire " Il nous a fallu près de trois heures pour obtenir une voiture. Il était absurde " prédit un taux de satisfaction de 0 avec un score de confiance de 95%.

Prévision d'un score de satisfaction

Etapes suivantes

Génération d'une expérimentation de prévision de série temporelle

Rubrique parent: Génération d'un modèle AutoAI

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus