0 / 0
Retourner à la version anglaise de la documentation
Automatiser la modélisation pour un objectif continu
Dernière mise à jour : 11 déc. 2024
Automatiser la modélisation pour un objectif continu

Ce tutoriel utilise le nœud Auto Numeric pour créer et comparer automatiquement différents modèles pour des résultats continus (plage numérique), tels que la prédiction de la valeur imposable d'une propriété. Avec un seul noeud, vous pouvez estimer et comparer un ensemble de modèles candidats et générer un sous-ensemble de modèles pour des analyses ultérieures. Ce nœud fonctionne de la même manière que le nœud Auto Classifier, mais pour des cibles continues plutôt que pour des cibles à drapeaux ou nominales.

Il combine le meilleur des modèles candidats dans un nugget de modèle agrégé (d'ensemble) unique. Cette approche conjugue la facilité de l'automatisation aux avantages de combiner plusieurs modèles ce qui permet généralement des prédictions plus précises que celles de tout autre modèle.

Cet exemple se concentre sur un responsable de municipalité fictif qui ajuste et estime les taxes foncières. Pour atteindre cet objectif avec plus de précision, vous construisez un modèle qui prédit la valeur des biens immobiliers en fonction du type de bâtiment, du quartier, de la taille et d'autres facteurs connus.

Essayez le tutoriel

Dans ce tutoriel, vous exécutez les tâches suivantes :

Exemple de flux de modélisateurs et d'ensembles de données

Ce tutoriel utilise le flux " Modélisation automatisée d'une cible continue dans le projet d'exemple. Le fichier de données utilisé est property_values_train.csv. L'image suivante montre un exemple de flux de modélisation.

Figure 1 : Flux du modeleur d'échantillon
Exemple de flux avec Numérisation automatique

Le fichier de données comprend un champ nommé " taxable_value, qui est le champ cible, ou la valeur, que vous souhaitez prédire. Les autres champs contiennent des informations telles que le quartier, le type de bâtiment et le volume intérieur, et peuvent être utilisés comme prédicteurs.

Nom de champ Libellé
property_id ID de la propriété
neighborhood Secteur de la ville
building_type Type de construction
year_built Année de construction
volume_interior Volume intérieur
volume_other Volume du garage et des dépendances
lot_size Taille du lot
taxable_value Valeur imposable
L'image suivante montre l'échantillon de données.
Figure 2. Exemple de données
Exemple de données

Tâche 1 : Ouvrir le projet d'exemple

L'exemple de projet contient plusieurs ensembles de données et des exemples de flux de modélisation. Si vous n'avez pas encore le projet exemple, reportez-vous à la rubrique Tutoriels pour créer le projet exemple. Suivez ensuite les étapes suivantes pour ouvrir l'exemple de projet :

  1. Dans Cloud Pak for Data, à partir du menu de navigation 'Menu de navigation, choisissez Projets > Voir tous les projets.
  2. Cliquez sur SPSS Modeler Project.
  3. Cliquez sur l'onglet Actifs pour voir les ensembles de données et les flux du modélisateur.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre l'onglet Actifs du projet. Vous êtes maintenant prêt à travailler avec l'exemple de flux du modeleur associé à ce tutoriel.

Exemple de projet

haut de page

Tâche 2 : Examiner les nœuds Data Asset et Type

La modélisation automatisée d'une cible continue comprend plusieurs nœuds. Procédez comme suit pour examiner les nœuds Data Asset et Type:

  1. Dans l'onglet Actifs, ouvrez le flux du modeleur Modélisation automatisée pour une cible continue et attendez que le canevas se charge.
  2. Double-cliquez sur le nœud property_values_train.csv. Ce nœud est un nœud de ressources de données qui pointe vers le fichier property_values_train.csv du projet.
  3. Examinez les propriétés du format de fichier.
  4. Facultatif : cliquez sur "Aperçu des données" pour voir l'ensemble des données : Cliquez sur Aperçu des données pour voir l'ensemble des données.
  5. Double-cliquez sur le nœud Type.
  6. Pour le champ taxable_value, définissez le rôle sur Target. D'autres champs sont utilisés comme prédicteurs.
    Figure 3 Définir le niveau et le rôle de la mesure
    Définir le rôle
  7. Facultatif : Cliquez sur Aperçu des données pour voir l'ensemble des données filtrées.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre le nœud Type. Vous êtes maintenant prêt à configurer le nœud de modélisation.

noeud Typer

haut de page

Tâche 3 : Configurer le nœud de modélisation

Cet exemple utilise un nœud de modélisation numérique automatique qui estime et compare les modèles afin d'essayer différentes approches pour une plage numérique continue. Procédez comme suit pour configurer le nœud de modélisation:

  1. Double-cliquez sur le nœud de la valeur imposable pour afficher ses propriétés.
  2. Développez la section Basics et définissez les propriétés suivantes :
    1. Dans le champ Classer les modèles par, sélectionnez Corrélation.
    2. Dans le champ Nombre de modèles à utiliser, tapez " 3. Cela signifie que les trois meilleurs modèles seront construits lorsque vous exécutez le noeud.
    Figure 4 Nœud numérique automatique Section de base
    Définir les propriétés de base
  3. Développez la section Expert. Six algorithmes sont sélectionnés, ce qui fait que le nœud estime un seul modèle pour chaque algorithme, soit un total de six modèles. (Vous pouvez également modifier ces paramètres pour comparer plusieurs variantes pour chaque type de modèle.) Parce que vous avez défini la propriété Nombre de modèles à utiliser sur " 3 dans la section Bases, le nœud calcule la précision des six algorithmes et construit une pépite de modèle unique contenant les trois plus précis.
    Figure 5. Nœud numérique automatique Section Expert
    Définir les propriétés de l'expert
  4. Développez la section Ensemble pour afficher les paramètres par défaut. Étant donné que vous utilisez une cible continue dans cet exemple, le score de l'ensemble est généré en faisant la moyenne des scores des modèles individuels.
    Figure 6 Nœud numérique automatique Section de l'ensemble
    Options d'ensemble

Icône de point de contrôle Vérifier votre progression

L'image suivante montre le nœud de modélisation. Vous êtes maintenant prêt à comparer les modèles.

Noeud de modélisation

haut de page

Tâche 4 : Comparer les modèles

Maintenant que vous avez spécifié les trois modèles à construire, suivez les étapes suivantes pour générer et comparer les modèles :

  1. Survolez le nœud taxable_value et cliquez sur l'icône Run 'Icône d'exécution.
  2. Dans le volet Sorties et modèles, cliquez sur les résultats portant le nom valeur_imposable pour afficher les résultats.

    Vous verrez des détails sur chacun des modèles créés au cours de l'exécution. (Dans une situation réelle, où des centaines de modèles sont estimés sur un grand ensemble de données, l'exécution du flux peut prendre plusieurs heures) La table contient un ensemble de modèles générés par le nœud de modélisation.

  3. Pour explorer plus avant l'un des modèles individuels, cliquez sur le nom d'un modèle dans la colonne Estimateur pour afficher les résultats du modèle individuel.
    1. Afficher la page d'information sur le modèle. Ce tableau contient des informations sur le type de modèle adapté, identifie le champ cible, le nombre de caractéristiques d'entrée, les fonctions d'activation et la taille du réseau résultant.
    2. Afficher les autres pages du modèle.
    3. Fermez les détails du modèle.

    Par défaut, les modèles sont triés par précision (corrélation) car vous avez sélectionné la corrélation comme mesure dans les propriétés du nœud Auto Numeric. A des fins de classement, la valeur absolue de l'exactitude est utilisée, les valeurs les plus proches de 1 indiquant une relation très forte.

    Vous pouvez faire porter le tri sur une autre colonne en cliquant sur son en-tête.

    En fonction de ces résultats, vous pouvez décider d'utiliser les trois modèles les plus précis. En combinant les prédictions de plusieurs modèles, les limites des modèles individuels peuvent être évitées, ce qui se traduit par une plus grande précision globale.

  4. Vérifiez que les trois modèles sont sélectionnés dans la colonne Utilisation.
  5. Fermez la fenêtre Modèle de vue : valeur_imposable.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre le tableau de comparaison des modèles. Vous êtes maintenant prêt à effectuer l'analyse du modèle.

Résultats de modèles

haut de page

Tâche 5 : Exécuter le nœud d'analyse

Maintenant que vous avez visualisé une comparaison des trois modèles, vous pouvez suivre les étapes suivantes pour effectuer une analyse des modèles :

  1. Survolez le nœud Analyse et cliquez sur l'icône Exécuter " Icône d'exécution.
  2. Dans le volet Sorties et modèles, cliquez sur les résultats de sortie portant le nom Analyse pour afficher les résultats.

    Le score moyen généré par le modèle assemblé est ajouté dans un champ nommé " $XR-taxable_value, avec une corrélation de 0.934, ce qui est plus élevé que les scores des trois modèles individuels. Les scores de l'ensemble montrent également une faible erreur absolue moyenne et pourraient être plus performants que n'importe lequel des modèles individuels lorsqu'ils sont appliqués à d'autres ensembles de données.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre la comparaison de modèles à partir du nœud d'analyse.

Résultats d'analyse

haut de page

Récapitulatif

Dans cet exemple de flux " Modélisation automatisée d'une cible de drapeau, vous avez utilisé le nœud " Auto Numérique pour comparer plusieurs modèles différents, sélectionner les trois modèles les plus précis et les ajouter au flux au sein d'une pépite de modèle Auto Numeric assemblé.

Le modèle assemblé a montré des performances supérieures à celles de deux des modèles individuels et pourrait être plus performant lorsqu'il est appliqué à d'autres ensembles de données. Si votre objectif est d'automatiser le processus autant que possible, cette approche permet d'obtenir un modèle robuste dans la plupart des circonstances sans avoir à approfondir les spécificités d'un modèle en particulier.

Etapes suivantes

Vous êtes maintenant prêt à essayer d'autres didacticielsSPSS® Modeler.

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus