Impostazione delle proprietà per i flussi

Ultimo aggiornamento: 12 feb 2025
Impostazione delle proprietà per i flussi di SPSS Modeler

È possibile specificare le proprietà da applicare al flusso corrente.

Per impostare le proprietà del flusso, fare clic sull'icona Proprietà del flusso .

È possibile configurare le seguenti proprietà.

Opzioni

Generale
Numero massimo di righe da mostrare in Anteprima dati
Quando si visualizza l'anteprima dei dati per un nodo, è possibile specificare il numero di righe da visualizzare.
Limita membri per campi nominali
Il tipo di dati dei campi nominali (insieme) diventa Senza tipo quando il numero di membri supera il numero massimo di membri impostato in Numero massimo di membri. Questa opzione è utile quando si utilizzano campi nominali di grandi dimensioni. Quando il livello di misurazione di un campo viene impostato su Senza tipo, il relativo ruolo viene automaticamente impostato su Nessuno. I campi impostati su Nessuno non sono disponibili per la modellazione.
Data/ora
Importa data/ora/timestamp come
Selezionare se utilizzare un formato di data e ora per memorizzare i dati nei campi di data e ora o se importarli come variabili stringa.
Utilizza microsecondi nei campi data/ora
Se si dispone di dati data / ora misurati in microsecondi, è possibile abilitare questa opzione per utilizzare i dati più precisi nei flussi. Per abilitare l'opzione, selezionare la seguente casella di spunta e Stringa per l'impostazione Importa data/ora/timestamp come .
Nota: Questa opzione funziona solo per i connettori che supportano il pushback SQL.
Formato data
Selezionare un formato di data da utilizzare per i campi di archiviazione data o quando le stringhe sono interpretate come date dalle funzioni di data CLEM.
Formato ora
Selezionare un formato di ora da utilizzare per i campi di archiviazione dell'orario o per le stringhe interpretate come orario dalle funzioni di orario CLEM.
Rollover giorni/min
Per i formati di ora, specificare se le differenze di ora negative devono essere interpretate come riferite al giorno o all'ora precedenti.
Data di riferimento (1 gen)
Selezionare gli anni di riferimento (sempre 1 gennaio) che devono essere utilizzati dalle funzioni di data CLEM che utilizzano una data singola.
Date di 2 cifre a partire da
Specificare l'anno di riferimento per l'aggiunta delle cifre del secolo negli anni a due cifre. Ad esempio, se si specifica 1930 come anno di riferimento, i presuppone che 05/11/02 sia nell'anno 2002. La medesima impostazione utilizzerà il 20esimo secolo per le date successive all'anno 1930. Di conseguenza, si presupporrà che il 05/11/73 sia nell'anno 1973.
Fuso orario
Selezionare il modo in cui viene scelto il fuso orario da utilizzare con l'espressione CLEM datetime_now.
  • Se si seleziona Server, il fuso orario viene utilizzato da dove è in esecuzione il runtime di SPSS Modeler (a volte questo orario è lo stesso dell'opzione Client ). Oppure se il flusso utilizza dati da un database e il database supportato utilizza il push back SQL, l'espressione datetime_now utilizza l'ora del database.
  • Se si seleziona Client, viene utilizzato il fuso orario della macchina su cui è installato SPSS Modeler.
  • In alternativa, è possibile selezionare qualsiasi valore UTC (Tempo coordinato universale) come fuso orario.
Formati numerici
È possibile specificare il numero di posizioni decimali da utilizzare quando SPSS Modeler visualizza i numeri reali in formati di visualizzazione standard, scientifici o di valuta.
Ottimizzazione
È possibile utilizzare queste impostazioni per ottimizzare le prestazioni del flusso.
Abilita riscrittura flusso
La riscrittura del flusso consente di riordinare in background i nodi in un flusso per migliorarne il funzionamento, senza modificare la semantica del flusso.
Ottimizza espressioni CLEM
Questa opzione consente all'ottimizzatore di ricercare le espressioni CLEM che possono essere pre - elaborate prima dell'esecuzione del flusso per aumentare la velocità di elaborazione. Ad esempio, se si dispone di un'espressione come log(salary), l'ottimizzatore calcola il valore effettivo dello stipendio e lo trasmette per l'elaborazione. Questa opzione può essere utilizzata per migliorare le prestazioni di SQL pushback e SPSS Modeler .
Ottimizza esecuzione sintassi
Questo metodo di riscrittura del flusso aumenta l'efficienza delle operazioni che dispongono di più di un nodo che contiene la sintassi SPSS Statistics . L'ottimizzazione si ottiene combinando i comandi di sintassi all'interno di un'unica operazione, invece di eseguirli singolarmente come operazioni separate.
Ottimizza altre esecuzioni
Questo metodo di riscrittura del flusso incrementa l'efficienza delle operazioni che non possono essere delegate al database. L'ottimizzazione si ottiene riducendo la quantità di dati nel flusso appena possibile. Il flusso viene riscritto per spingere le operazioni più vicino all'origine dati, mantenendo l'integrità dei dati. Questa modifica riduce il downstream dei dati per operazioni costose, come le unioni.
Attiva elaborazione parallela
Quando si esegue su un elaboratore con più processori, questa opzione consente al sistema di bilanciare il carico tra tali processori, il che può risultare in prestazioni più veloci. L'utilizzo di più nodi o l'utilizzo dei seguenti singoli nodi può trarre vantaggio dall'elaborazione parallela: C5.0, Unisci (per chiave), Ordina, Scomparto (metodi rango e riquadro) e Aggregato (utilizzando uno o più campi chiave).
Genera SQL
  • Questa opzione riporta l'elaborazione SQL al database. L'attivazione o la disattivazione di questa opzione influisce solo sui nuovi flussi creati. Non è possibile cambiare l'impostazione per un flusso esistente. Per ulteriori informazioni sull'utilizzo di questa opzione con i flussi, consultare Ottimizzazione SQL.
    • Cache del database (solo SQL). Per i flussi che generano SQL da eseguire nel database, i dati possono essere memorizzati nella cache a metà del flusso in una tabella temporanea nel database piuttosto che nel file system. Se combinata con l'ottimizzazione SQL, questa opzione può determinare significativi miglioramenti delle prestazioni. Ad esempio, l'output da un flusso che unisce più tabelle per creare una vista di data mining può essere memorizzato in cache e riutilizzato poi in base alle esigenze. Con la memorizzazione nella cache del database abilitata, passare con il mouse su qualsiasi nodo non terminale nel flusso, quindi fare clic sul menu di overflow e selezionare Cache > Abilita. I dati vengono ora memorizzati in cache su questo nodo e la cache viene automaticamente creata direttamente nel database la volta successiva che il flusso viene eseguito. Ciò consente la generazione di SQL per i nodi downstream, migliorando ulteriormente le prestazioni. In alternativa, se lo si desidera, è possibile disattivare questa opzione, per esempio se i criteri o le autorizzazioni precludono la scrittura dei dati nel database. Se la memorizzazione nella cache del database o l'ottimizzazione SQL non è abilitata, la cache viene scritta nel file system.
    • Utilizza conversione flessibile (solo SQL). Questa opzione consente la conversione dei dati da stringhe a numeri o da numeri a stringhe, purché siano archiviati in un formato adatto. Ad esempio, se i dati sono conservati nel database sotto forma di stringa, ma contengono un numero significativo, possono essere convertiti per essere utilizzati quando si esegue il pushback.
Registrazione
Visualizza SQL nel log dei messaggi durante il runtime
Specifica se il codice SQL generato durante l'esecuzione del flusso viene passato al log dei messaggi.
Visualizza la generazione SQL nel log dei messaggi durante la preparazione
Durante l'anteprima del flusso, specifica se un'anteprima del codice SQL che verrà generato viene passata al log dei messaggi.
Formato SQL
Specifica se qualsiasi SQL visualizzato nel log deve contenere funzioni SQL native o funzioni ODBC standard del formato {fn FUNC(…)}, come generato da SPSS Modeler. Le prime si basano sulla funzionalità dei driver ODBC che non è possibile implementare.
Riformatta SQL per una migliore leggibilità
Specifica se l'SQL visualizzato nel registro debba essere formattato per migliorarne la leggibilità.
Mostra stato dei record
Specifica quando devono essere registrati i record al loro arrivo ai nodi terminali. Specificare un numero da utilizzare per aggiornare lo stato ogni N record.

Parametri

I parametri sono variabili definite dall'utente che vengono salvate e rese persistenti con il flusso corrente o con il SuperNode. I parametri vengono spesso utilizzati negli script per controllare il comportamento dello script e sono accessibili anche dall'interfaccia utente.

È possibile definire parametri da utilizzare in espressioni CLEM e negli script. I parametri definiti nelle proprietà del flusso sono disponibili per tutti i nodi nel flusso. I parametri impostati per SuperNode non sono disponibili all'esterno del SuperNode. Se si salva un flusso, vengono salvati anche i parametri impostati per tale flusso.

Per ulteriori informazioni sui parametri, consultare Parametri del flusso e del SuperNode.

Fare clic su Aggiungi valore e immettere le seguenti informazioni per i nuovi parametri:

Nome
Questo è il nome con cui si fa riferimento al parametro nelle espressioni. Ad esempio, per creare un parametro per una temperatura minima, è possibile immettere minvalue.

Quando i parametri vengono utilizzati nelle espressioni CLEM, vengono inseriti tra virgolette singole, ad esempio '$P-minvalue'. Non immettere il prefisso $P- . Indica un parametro nelle espressioni CLEM.

Etichetta
Elenca un nome descrittivo per ciascun parametro creato.
Archiviazione
La classe archiviazione indica come sono stati archiviati i valori dei dati nel parametro. Ad esempio, se i valori hanno degli zeri iniziali che si desidera conservare (come 008), selezionare Stringa come tipo di archiviazione. Altrimenti, gli zeri vengono rimossi dal valore.
Valore
Elenca il valore corrente per ciascun parametro, che è possibile modificare in base alle esigenze. I valori per i parametri data devono essere specificati nella notazione standard ISO (YYYY - MM - DD).
Misura
Selezionare il livello di misurazione, che viene utilizzato per descrivere le caratteristiche del parametro. È possibile modificare questo valore per riflettere il modo in cui si intende utilizzare il parametro. Ad esempio, Senza tipo indica che il parametro può avere qualsiasi valore compatibile con la sua memoria.
Prompt?
Selezionare questa opzione se si desidera che agli utenti venga richiesto di immettere un valore per questo parametro quando avviano il tempo di esecuzione. È possibile utilizzare questa opzione quando potrebbe essere necessario immettere valori differenti per lo stesso parametro in diverse occasioni.

Valori globali

Nella scheda Globali delle proprietà del flusso, è possibile visualizzare i valori globali impostati per il flusso corrente. I valori globali vengono creati utilizzando un nodo Calcola globali per determinare statistiche quali media, somma o deviazione standard per i campi selezionati.

Dopo l'esecuzione di un nodo Calcola globali , questi valori diventano disponibili per vari utilizzi nelle operazioni di flusso.

Non è possibile modificare i valori globali nella tabella qui nelle proprietà del flusso, ma è possibile cancellare tutti i valori globali per un flusso.

Annotazioni

Se è necessario descrivere un flusso ad altri nella propria organizzazione, è possibile allegare commenti esplicativi a flussi, nodi e nugget del modello. Altri possono quindi visualizzare questi commenti sullo schermo o anche stampare un'immagine del flusso che include i propri commenti.

Utilizzare il separatore Annotazioni delle proprietà del flusso per aggiungere annotazioni di testo al flusso. Queste note sono visibili solo quando la scheda Annotazioni è aperta, tranne che le annotazioni del flusso possono essere visualizzate anche come commenti sullo schermo.