0 / 0
Retourner à la version anglaise de la documentation

Niveaux de mesure

Dernière mise à jour : 12 févr. 2025
Niveaux de mesure (SPSS Modeler)

La mesure, également appelée niveau de mesure, décrit l'utilisation des zones de données dans SPSS Modeler.

Vous pouvez spécifier la Mesure dans les propriétés de noeud d'un noeud d'importation ou d'un noeud Typer. Par exemple, vous pouvez définir la mesure d'un champ entier avec les valeurs 1 et 0 sur Indicateur. Cela indique généralement que 1 = True et 0 = False.

Stockage et mesure. Le type niveau de mesure d'un champ est différent de son type de stockage, lequel indique si les données sont stockées sous la forme d'une chaîne, d'un entier, d'un nombre réel, d'une date, d'une heure ou d'un horodatage. Si vous pouvez modifier des types de données en tout point d'un flux à l'aide d'un noeud Typer, le stockage doit être déterminé à la source lors de la lecture des données (bien que vous puissiez le modifier ultérieurement à l'aide d'une fonction de conversion).

Les niveaux de mesure suivants sont disponibles :
  • Valeur par défaut. Les données dont le type de stockage et les valeurs sont inconnus (par exemple, car elles n'ont pas encore été lues) sont affichées sous la forme Par défaut.
  • Continu. Permet de décrire des valeurs numériques, par exemple une plage de 0 à 100 ou de 0,75 à 1,25. Une valeur continue peut être un entier, un nombre réel ou une date/heure.
  • Catégorielle. Utilisé pour les valeurs de chaîne lorsque le nombre exact de valeurs distinctes est inconnu. Il s'agit d'un type de données non instancié, ce qui signifie que toutes les informations possibles sur le stockage et l'utilisation des données ne sont pas encore connues. Une fois les données lues, le niveau de mesure sera Indicateur, Nominalou Sans type, en fonction du nombre maximal de membres pour les champs nominaux spécifiés.
  • Booléen. Utilisé pour les données comportant deux valeurs distinctes qui indiquent la présence ou l'absence d'un trait, par exemple true et false, Yes et No ou 0 et 1. Les valeurs utilisées peuvent varier, mais il faut toujours les désigner comme la valeur « true », et l'autre comme valeur « false ». Vous pouvez représenter les données sous forme de texte, d'entier, de nombre réel, de date, d'heure ou d'horodatage.
  • Nominal : Utilisé pour décrire des données comportant plusieurs valeurs distinctes, chacune étant traitée comme un membre d'un ensemble, tel que small/medium/large. Les données nominales peuvent bénéficier de n'importe quel stockage numérique, chaînes ou date/heure. Le fait de définir le niveau de mesure Nominal n'a pas pour effet de convertir automatiquement les valeurs en stockage de chaîne.
  • Ordinal: Utilisé pour décrire les données comportant plusieurs valeurs distinctes ayant un ordre inhérent. Par exemple, les catégories de salaire ou l'indice de satisfaction peuvent avoir le type données ordinales. L'ordre est défini par l'ordre de tri naturel des éléments des données. Par exemple, 1, 3, 5 est l'ordre de tri par défaut d'un ensemble d'entiers, alors que HIGH, LOW, NORMAL (ordre alphabétique croissant) est l'ordre d'un ensemble de chaînes. Le niveau de mesure ordinal vous permet de définir un ensemble de données catégorielles comme des données ordinales, pour la visualisation, la création de modèles et l'exportation vers d'autres applications (telles que IBM SPSS Statistics) qui reconnaissent les données ordinales comme un type distinct. Vous pouvez utiliser le champ ordinal partout où un champ nominal peut être utilisé. De plus, les champs de n'importe quel type de stockage (réel, entier, chaîne, date, heure, etc.) peuvent être définis comme ordinal.
  • Sans type. Utilisé pour les données qui ne sont pas conformes aux types Par défaut, Continu, Catégorie, Drapeau, Nominal ou Ordinal, pour les zones ayant une valeur unique ou pour les données nominales dans lesquelles l'ensemble a plus de membres que le nombre maximal défini. Sans type est également utile pour les cas où le niveau de mesure serait par ailleurs un ensemble avec de nombreux membres (comme un numéro de compte). Lorsque vous sélectionnez Sans type pour un champ, le rôle est automatiquement paramétré sur Aucun, avec ID d'enregistrement comme seule alternative. La taille maximale par défaut des ensembles est de 250 valeurs uniques.
  • Collection. Utilisé pour identifier des données non géospatiales qui sont enregistrées dans une liste. Une collection est une zone de liste de profondeur zéro, dans laquelle les éléments de la liste sont associés à l'un des autres niveaux de mesure.
  • Données géospatiales. Utilisé avec le type de stockage Liste pour identifier des données géospatiales. Les listes peuvent être des zones Liste d'entiers ou Liste des vrais avec une profondeur de liste comprise entre zéro et deux, inclusives.

Vous pouvez indiquer manuellement des niveaux de mesure, ou laisser le logiciel lire les données et déterminer le niveau de mesure en fonction des valeurs lues. Vous pouvez aussi sélectionner une option, si vous avez plusieurs champs de données continues qui doivent être traitées comme des données catégorielles, afin de les convertir. Voir Conversion de données continues.

Utiliser la saisir automatique

  1. Dans un noeud Typer, définissez la colonne Mode Valeur sur Lire pour les champs souhaités. Les métadonnées sont ainsi disponibles pour tous les noeuds situés en aval.
  2. Cliquez sur Lire les valeurs pour lire les valeurs directement à partir de la source de données.

Définir manuellement le niveau de mesure d'un champ

  1. Sélectionnez un champ dans le tableau.
  2. Dans la liste déroulante de la colonne Mesure, sélectionnez le niveau de mesure du champ.
  3. Vous pouvez aussi utiliser les cases à cocher pour sélectionner plusieurs champs, puis utiliser la liste déroulante de niveau supérieur pour définir le niveau de mesure pour toutes les zones sélectionnées à la fois.