0 / 0
Torna alla versione inglese della documentazione

Nodo Unione

Ultimo aggiornamento: 12 feb 2025
Nodo Unione (SPSS Modeler)

Un nodo Unione consente di utilizzare più record di input per creare un singolo record di output contenente alcuni o tutti i campi di input. Questa operazione risulta utile se si desidera unire dati da origini diverse, per esempio dati interni sui clienti e dati demografici acquisiti dall'esterno.

È possibile unire i dati nei seguenti modi.

  • L'unione in base all'ordine consente di concatenare i record corrispondenti da tutte le origini nell'ordine di input fino a quando non viene esaurita la più piccola origine dati. Per utilizzare questa opzione è importante che i dati siano stati ordinati tramite un nodo Ordina.
  • Eseguire l'unione utilizzando un campo Chiave , ad esempio Customer ID, per specificare come associare i record di un'origine dati ai record di un'altra origine dati. Sono supportati diversi tipi di unioni, quali unione interna, unione esterna completa, unione esterna parziale e anti-unione.
  • L'unione mediante la Condizione consente di specificare una condizione che deve essere soddisfatta affinché l'unione venga eseguita. È possibile specificare la condizione direttamente nel nodo, oppure crearla con il Builder di espressioni.

Tipi di unioni

Quando si utilizza un campo chiave per l'unione dei dati, potrebbe essere utile dedicare del tempo a riflettere su quali record verranno esclusi e quali verranno inclusi. Ci sono una varietà di unioni, che sono discussi qui. I due tipi di unioni di base vengono definiti unioni interne e unioni esterne. Questi metodi vengono utilizzati di frequente per unire le tabelle da dataset correlati in base ai valori comuni di un campo chiave, come Customer ID. Le unioni interne consentono di ottenere un'unione corretta, con un insieme di dati di output comprendente solo record completi. Oltre a comprendere i record completi dei dati uniti, le unioni esterne consentono di includere dati univoci da una o più tabelle di input.

I tipi di unioni consentiti sono descritti in modo più dettagliato come segue.

Unione interna Un join interno include solo i record in cui il valore del campo chiave è comune a tutte le tabelle di input. In altre parole, i record non corrispondenti non verranno inclusi nel dataset di output.

Unione esterna completa Una join esterna completa include tutti i record, corrispondenti e non, delle tabelle di input. Le unioni esterne di sinistra e di destra vengono definite unioni esterne parziali.

Unione esterna parziale Un join esterno parziale include tutti i record corrispondenti al campo chiave e i record non corrispondenti delle tabelle specificate. In altre parole, tutti i record di alcune tabelle e solo i record corrispondenti di altre. È possibile selezionare le tabelle (come A e B mostrate qui) da includere nell'unione esterna sotto le opzioni di unione delle proprietà del nodo. Quando vengono unite soltanto due tabelle, le unioni parziali vengono denominate anche unione esterna sinistra o unione esterna destra. Poiché SPSS Modeler consente l'unione di più di due tabelle, si fa riferimento a questo come a un'unione esterna parziale.

Anti-unione Un'anti-join include solo i record non corrispondenti della prima tabella di input (la tabella A mostrata qui). Questo tipo di unione è l'opposto di un'unione interna e non include record completi nel set di dati di output.

Per esempio, se si hanno informazioni sulle aziende agricole in un insieme di dati e le richieste di risarcimento relative alle aziende agricole in un altro, è possibile abbinare i record della prima origine alla seconda origine utilizzando le opzioni di unione. Per determinare se un cliente dell'azienda agricola campione ha presentato una richiesta di risarcimento, utilizzare l'opzione unione interna per restituire un elenco che mostra i punti di corrispondenza di tutti gli ID dei due campioni.

Figura 1. Esempio di output per un'integrazione di unione interna
Esempio di output per un'integrazione di unione interna

L'utilizzo dell'opzione unione esterna completa restituisce tutti i record corrispondenti e non corrispondenti delle tabelle di input. Per i valori incompleti verrà utilizzato il valore mancante di sistema ($null$).

Figura 2. Esempio di output per un'integrazione di unione esterna completa
Esempio di output per un'integrazione di unione esterna completa

Un'unione esterna parziale comprende tutti i record corrispondenti in base al campo chiave e i record non corrispondenti delle tabelle specificate. La tabella visualizza tutti i record corrispondenti del campo ID e i record corrispondenti del primo insieme di dati.

Figura 3. Esempio di output per un'integrazione di unione esterna parziale
Esempio di output per un'integrazione di unione esterna parziale

Se si utilizza l'opzione anti - join, la tabella restituisce solo i record non corrispondenti per la prima tabella di input.

Figura 4. Esempio di output per un'integrazione anti-unione
Esempio di output per un'integrazione anti-unione