La visualisation des informations de manière graphique vous permet de mieux comprendre vos données. Vous pouvez ajouter des étapes à votre flux de Data Refinery lorsque vous visualisez les données et que voyez les changements. En explorant des données depuis diverses perspectives avec des visualisations, vous pouvez identifier les masques, les connexions et les relations au sein de ces données, et comprendre de grandes quantités d'informations très rapidement.
Vous pouvez également visualiser vos données avec ces mêmes graphiques dans un flux SPSS Modeler. Utilisez le noeud Graphiques, disponible sous la section Graphiques de la palette de noeuds. Double-cliquez sur le noeud Graphiques pour ouvrir le panneau de propriétés. Cliquez ensuite sur Générateur de graphiques de lancement pour ouvrir le générateur de graphique et créer une ou plusieurs définitions de graphique à associer au nœud.
Pour visualiser vos données :
- Dans Data Refinery, cliquez sur l'onglet Visualisations.
- Commencez par un graphique ou sélectionnez des colonnes :
- Cliquez sur l'un des graphiques disponibles. Ensuite, ajoutez des colonnes dans la sous-fenêtre DÉTAILS qui s'ouvre sur le côté gauche de la page.
- Sélectionnez les colonnes que vous souhaitez utiliser. Les graphiques suggérés sont signalés par un point. Cliquez sur un graphique pour visualiser vos données.
Graphiques
Les graphiques suivants sont inclus :
Les graphiques 3D affichent les données dans un système de coordonnées 3D en dessinant chaque colonne sous forme de cube pour créer un effet 3D.
Les graphiques à barres sont pratiques pour afficher et comparer des catégories de données côte à côte. Les barres peuvent être disposées dans n'importe quel ordre. Vous pouvez également les organiser de haut en bas ou de faible à élevé.
Les graphiques à surfaces comparent les distributions entre plusieurs groupes ou jeux de données. Ils affichent la variation dans les groupes de données : la dispersion et l'asymétrie de ces données et les valeurs extrêmes.
Les graphiques à bulles affichent chaque catégorie d'un groupe sous forme de bulles.
Les graphiques en chandeliers sont un type de graphique financier qui affiche les mouvements de prix d'une sécurité, d'un dérivé ou d'une devise.
Les graphiques de remplissage circulaires affichent les données hiérarchiques sous forme de zones imbriquées.
Les graphiques personnalisés vous permettent d'afficher des graphiques en fonction de l'entrée JSON.
Les graphiques à deux axes Y utilisent deux variables d'axe Y pour montrer les relations entre les données.
Les barres d'erreur indiquent l'erreur ou l'incertitude dans une valeur. Elles donnent une indication sur sa précision ou, au contraire, sur son éloignement de la valeur réelle.
Les graphiques d'évaluation sont des graphiques combinés qui mesurent la qualité d'un classificateur binaire. Trois colonnes sont nécessaires pour les entrées : valeur effective (cible), valeur prédite et confiance (0 ou 1). Déplacez le curseur dans le graphique où figure la coupure pour mettre à jour dynamiquement les autres graphiques. Le graphique ROC et les autres graphiques sont des mesures standard du classificateur.
Les graphiques de carte de densité affichent les données sous forme de couleur pour transmettre les niveaux d'activité ou la densité. En général, les valeurs faibles sont affichées sous forme de couleurs plus froides, tandis que les valeurs élevées sont affichées sous forme de couleurs plus chaudes.
Les graphiques à histogramme montrent la distribution de fréquences des données.
Les graphiques à courbes présentent les tendances de données au fil du temps en calculant une statistique récapitulative d'une colonne pour chaque valeur d'une autre colonne, puis en traçant une ligne qui relie les valeurs.
Les graphiques de type carte affichent des données de points géographiques, et vous permettent de comparer des valeurs et d'afficher les catégories entre les régions géographiques.
Les graphiques mathématiques affichent un groupe de courbes correspondant aux équations que vous entrez. Avec ce type de graphique, vous n'utilisez pas de jeu de données. Il sert en effet à comparer les résultats avec ceux du jeu de données d'un autre graphique, tel que le nuage de points.
Les graphiques multiples affichent jusqu'à quatre combinaisons de graphiques à barres, à courbes, circulaires et de nuages de points. Vous pouvez afficher le même type de graphique plus d'une fois avec des données différentes. Par exemple, deux graphiques circulaires avec des données provenant de différentes colonnes.
Les graphiques à plusieurs séries affichent des données provenant de plusieurs jeux de données ou de plusieurs colonnes sous la forme d'une série de points qui sont reliés par des lignes droites ou des barres.
Les graphiques de coordonnées parallèles affichent et comparent des lignes de données (appelées profils) pour trouver des similitudes. Chaque rangée correspond à une ligne et la valeur de chaque colonne est représentée par un point sur cette ligne.
Les graphiques circulaires présentent des proportions. Chaque valeur d'une série est affichée sous la forme d'une tranche proportionnelle du camembert. Cette tranche représente la somme totale des valeurs.
Les graphiques de pyramide de population montrent la distribution de fréquences d'une variable selon les catégories. Ils servent généralement à afficher les changements dans les données démographiques.
Les graphiques à courbe quantile comparent les valeurs de distribution prévues avec les valeurs observées en traçant leurs quantiles.
Les graphiques radar intègrent au moins trois variables quantitatives qui sont représentées sur des axes (radii) en une seule figure radiale. Les données sont représentées sur chaque axe, puis reportées sur des axes adjacents à l'aide de lignes de connexion. Les graphiques radar sont utiles pour afficher les corrélations et comparer les données catégorisées.
Les graphiques de relations illustrent, en utilisant différents types de lignes, la relation entre les colonnes de données et la force de cette relation.
Les matrices de dispersion confronte les colonnes les unes aux autres et affiche leur nuage de points et leur corrélation. Utilisez ce type de graphique pour comparer plusieurs colonnes et déterminer la force de leur corrélation.
Les graphiques de nuages de points indiquent la corrélation (dans quelle mesure une variable est affectée par une autre) en affichant et en comparant les valeurs de deux colonnes.
Les graphiques en rayons de soleil sont similaires à des graphiques circulaires en couches dans lesquels les différentes proportions des différentes catégories sont figurées sur plusieurs niveaux.
Les graphiques de type rivière à thème utilisent un graphique de flux spécialisé qui affiche les changements au fil du temps.
Les graphiques à courbe illustrent les points de données à intervalles successifs.
Les graphiques t-SNE vous aident à visualiser des jeux de données de grande dimension. Ils sont pratiques pour intégrer les données à dimensions nombreuses dans un espace de deux ou trois dimensions, qui peuvent ensuite être visualisées dans un nuage de points.
Les graphiques en arbre affichent des données hiérarchiques en les divisant en différentes branches qui représentent autant de catégories. Utilisez-les pour classer différents jeux de données dans différentes catégories. Chacun se compose d'un noeud racine, de lignes plus communément appelées branches qui représentent les relations et les connexions entre les membres et de noeuds feuilles, ainsi appelés parce qu'ils figurent aux extrémités et n'ont pas de noeuds enfants.
Les graphiques en carte d'arbre affichent les données hiérarchiques sous forme d'ensemble de zones imbriquées. Utilisez-les pour comparer les tailles entre les groupes et les éléments individuels qui sont imbriqués dans ces groupes.
Les graphiques de type nuage de mots décrivent la fréquence des mots dans le texte, en établissant une règle de proportionnalité entre la taille de chaque mot et sa fréquence.
Actions
Vous pouvez effectuer l'une des actions suivantes :
Démarrer : Effacez la visualisation et la sous-fenêtre DÉTAILS et retournez à la page de démarrage pour les visualisations
Indiquez si la valeur de champ ou le libellé de champ doit être affiché. Cette option s'applique uniquement à SPSS Modeler lorsque vous définissez des libellés. Par exemple, si vous avez une zone "Sexe" et que vous avez défini une étiquette comme femelle avec la valeur 0, puis l'étiquette mâle pour la valeur 1. Si aucun libellé n'est défini, la valeur s'affiche.
Télécharger la visualisation :
Télécharger l'image du graphique : télécharge un fichier PNG contenant une image du graphique en cours.
Télécharger les détails du graphique : télécharge un fichier JSON contenant les détails du graphique en cours.
Définir les préférences globales qui s'appliquent à tous les graphiques
Actions de graphique
Les actions de graphique disponibles dépendent du graphique. Les actions de graphique sont les suivantes :
Zoom
Restaurer : affiche le graphique à l'échelle normale.
Sélectionner des données : met en évidence les données de l'onglet Données que vous sélectionnez dans le graphique.
Effacer la sélection : supprime la mise en évidence des données dans l'onglet Données.
En savoir plus
Data Visualization – How to Pick the Right Chart Type?
Rubrique parent : Affinage des données