Impostazione delle opzioni per i valori
La colonna Modalità valore sotto le impostazioni del nodo Tipo visualizza un elenco a discesa di valori predefiniti. Scegliendo l'opzione Specifica in questo elenco e quindi facendo clic sull'icona ingranaggio si apre una nuova schermata in cui è possibile impostare le opzioni per la lettura, la specifica, l'etichettatura e la gestione dei valori per il campo selezionato.
Molti controlli sono comuni a tutti i tipi di dati. Tali controlli comuni vengono illustrati di seguito.
Misura. Visualizza il livello di misurazione selezionato. È possibile modificare
questa impostazione per indicare il modo in cui si intende utilizzare i dati. Ad
esempio, se un campo denominato
day_of_week
contiene numeri che rappresentano i singoli
giorni, è possibile che si desideri modificare i valori in dati nominali
per creare un nodo di distribuzione che esamina singolarmente ciascuna
categoria.
Ruolo. Utilizzato per indicare ai nodi modellazione se i campi saranno considerati Input (campi predittore) o Obiettivo (campi previsti) per un processo di machine-learning. Sono disponibili anche altri ruoli come Entrambi, Nessuno, Partizione, Suddivisione, Frequenza o ID record.
- Leggi. Selezionare per leggere i valori durante l'esecuzione del nodo.
- Passa. Selezionare questa opzione per non leggere i dati per il campo corrente.
- Specifica. Le opzioni sono utilizzate per specificare i valori e le etichette per il campo selezionato. Utilizzare questa opzione insieme al controllo dei valori per specificare i valori basati sulla conoscenza del campo corrente. Questa opzione attiva controlli univoci per ciascun tipo di campo. Non è possibile specificare valori o etichette per un campo il cui livello di misurazione è Senza tipo.
- Estendi. Selezionare questa opzione per accodare ai dati correnti i valori
immessi qui. Ad esempio, sefield_1ha un intervallo da
(0,10)
e si immette un intervallo di valori da(8,16)
, l'intervallo viene esteso aggiungendo16
senza rimuovere il minimo originale. Il nuovo intervallo sarebbe(0,16)
. - Corrente. Selezionare per mantenere i valori di dati correnti.
Etichette valori (Aggiungi/Modifica etichette). In questa sezione è possibile immettere etichette personalizzate per ogni valore del campo selezionato.
Lunghezza massima elenco. Disponibile solo per i dati con livello di misurazione Geospaziale o Raccolta. Impostare la lunghezza massima dell'elenco specificando il numero di elementi che l'elenco può contenere.
Lunghezza massima stringa. Disponibile solo per i dati senza tipo. Utilizzare questo campo quando si genera SQL per creare una tabella. Immettere il valore della stringa più grande nei propri dati; nella tabella viene generata una colonna abbastanza grande per la stringa. Se il valore di lunghezza della stringa non è disponibile, viene utilizzata una dimensione di stringa predefinita che potrebbe non essere appropriata per i dati (ad esempio, se il valore è troppo piccolo, è possibile che si verifichino errori durante la scrittura dei dati nella tabella; un valore troppo grande potrebbe influire negativamente sulle prestazioni).
Controllo. Selezionare un metodo per forzare i valori in modo che siano conformi ai
valori continui, nominali o indicatori specificati. Questa opzione corrisponde alla colonna
Controllo nelle impostazioni del nodo Tipo, e una selezione effettuata qui
sovrascriverà quella nelle impostazioni principali. Utilizzato con le opzioni per la specifica di valori ed
etichette, il controllo del valore consente di conformare i valori nei dati con i valori previsti. Ad esempio, se si specificano valori come 1,
0
e si utilizza l'opzione Scarta , è possibile scartare tutti i record con
valori diversi da 1
o 0
.
- Valori mancanti. Utilizzare questo campo per definire valori specifici (come
99
o0
) come spazi. Il valore deve essere appropriato per il tipo di archiviazione del campo. - Intervallo. Utilizzato per specificare una serie di valori mancanti (ad
esempio età
1–17
o superiore a65
). Se un valore di limite è vuoto, l'intervallo non è limitato. Ad esempio, se si specifica un limite inferiore di100
senza alcun limite superiore, tutti i valori maggiori o uguali a100
sono definiti come mancanti. I valori limite sono inclusi. Ad esempio, un intervallo con un limite inferiore di5
e un limite superiore di10
include5
e10
nella definizione di intervallo. È possibile definire un intervallo di valori mancanti per qualsiasi tipo di archiviazione, inclusi data/ora e stringa (in questo caso, per determinare se un valore è compreso nell'intervallo, viene utilizzato il criterio di ordinamento alfabetico). - Null/Spazio. È inoltre possibile definire come vuoti i valori di sistema
null (visualizzati nei dati come
$null$
) e spazio (valori stringa senza caratteri visibili). Ai fini dell'analisi, anche il nodo Tipo considera le stringhe vuote come spazi, nonostante vengano archiviate in maniera diversa internamente e possano, in determinati casi, essere gestite diversamente.
$null$
, utilizzare il nodo Riempimento.