0 / 0
Torna alla versione inglese della documentazione
Nodo Adattamento simulazione
Ultimo aggiornamento: 04 lug 2024
Nodo Sim Fit (SPSS Modeler)

Il nodo Adattamento simulazione adatta una serie di distribuzioni statistiche candidate a ciascun campo dei dati. L'adattamento di ciascuna distribuzione ad un campo viene valutato utilizzando un criterio di bontà di adattamento. Quando viene eseguito un nodo Adattamento simulazione, viene creato un nodo Genera simulazione (o viene aggiornato un nodo esistente). Ad ogni campo viene assegnata la distribuzione con l'adattamento migliore. Il nodo Genera simulazione può quindi essere utilizzato per generare i dati simulati per ciascun campo.

Sebbene il nodo Adattamento simulazione sia un nodo terminale, non aggiunge un output al pannello Output, o esporta i dati.

Nota: se i dati cronologici sono scarsi (vale a dire, ci sono molti valori mancanti), potrebbe essere difficile per il componente di adattamento trovare valori validi sufficienti per adattare le distribuzioni ai dati. Nei casi in cui i dati sono scarsi, prima di eseguire l'adattamento rimuovere i campi privi di valori, se non sono necessari, o assegnare i valori mancanti. Utilizzando le opzioni della scheda Qualità del nodo Verifica dati è possibile visualizzare il numero di record completi, identificare quali sono i campi con valori mancanti e selezionare un metodo di assegnazione. Se non vi è un numero sufficiente di record per l'adattamento delle distribuzioni, è possibile utilizzare un nodo di bilanciamento per aumentare il numero di record.

Utilizzo di un nodo Adattamento simulazione per creare automaticamente un nodo Genera simulazione

La prima volta che viene eseguito il nodo Adattamento simulazione, viene creato un nodo Genera simulazione con un link di aggiornamento al nodo Adattamento simulazione. Se il nodo Adattamento simulazione viene eseguito di nuovo, viene creato un nuovo nodo Genera simulazione solo se il link di aggiornamento è stato rimosso. È inoltre possibile utilizzare un nodo Adattamento simulazione per aggiornare un nodo Genera simulazione connesso. Il risultato dipende dalla presenza o meno degli stessi campi in entrambi i nodi e se i campi sono sbloccati nel nodo Genera simulazione. Per ulteriori informazioni, consultare Nodo Sim Gen .

Un nodo Adattamento simulazione può avere un solo collegamento di aggiornamento ad un nodo Genera simulazione. Per definire un collegamento di aggiornamento ad un nodo Genera simulazione, effettuare le seguenti operazioni:

  1. Fare clic con il tasto destro del mouse sul nodo Adattamento simulazione e selezionare Definisci link di aggiornamento.
  2. Fare clic sul nodo Genera simulazione al quale si desidera definire un collegamento di aggiornamento.

Per rimuovere un link di aggiornamento tra un nodo Adattamento simulazione e un nodo Genera simulazione, fare clic con il tasto destro del mouse sul link di aggiornamento e selezionare Rimuovi link.

Adattamento delle distribuzioni

Una distribuzione statistica è la frequenza teorica delle occorrenze dei valori che una variabile può assumere. Nel nodo Adattamento simulazione, un insieme di distribuzioni statistiche teoriche viene confrontato con ciascun campo di dati. I parametri della distribuzione teorica vengono regolati per fornire il miglior adattamento ai dati in base alla misurazione della bontà di adattamento; il criterio Anderson-Darling o il criterio Kolmogorov-Smirnov . I risultati dell'adattamento delle distribuzioni in base al nodo Adattamento simulazione mostrano quali distribuzioni sono adattate, le migliori stime dei parametri per ciascuna distribuzione e in che misura la distribuzione si adatta ai dati. Durante l'adattamento delle distribuzioni, vengono calcolate anche le correlazioni tra i campi con tipi di archiviazione numerica e le contingenze tra i campi con distribuzione di categoria. I risultati dell'adattamento delle distribuzioni vengono utilizzati per creare un nodo Genera simulazione.

Prima di adattare qualsiasi distribuzione ai dati, vengono esaminati i primi 1000 record per la presenza di valori mancanti. Se sono presenti troppi valori mancanti, l'adattamento delle distribuzioni non è possibile. In questo caso, è necessario decidere se una delle seguenti opzioni è appropriata:
  • Utilizzare un nodo upstream per rimuovere i record con i valori mancanti
  • Utilizzare un nodo upstream per assegnare i valori per i valori mancanti.
L'adattamento delle distribuzioni non esclude i valori mancanti dell'utente. Se i dati contengono valori utente mancanti e si desidera che tali valori siano esclusi dall'adattamento delle distribuzioni, impostare tali valori su mancanti di sistema.

Il ruolo di un campo non viene preso in considerazione quando le distribuzioni vengono adattate. Ad esempio, i campi con ruolo Target vengono trattati allo stesso modo dei campi con i ruoli Input, Nessuno, Entrambi, Partizione, Suddivisione, Frequenza e ID.

I campi vengono trattati in modo diverso durante l'adattamento delle distribuzioni in base al tipo di archiviazione e al livello di misurazione. Il trattamento dei campi durante l'adattamento delle distribuzioni è descritto nella tabella riportata di seguito.

Tabella 1. Adattamento delle distribuzioni in base al tipo di archiviazione e al livello di misurazione dei campi
Tipo di archiviazione     Livello di misurazione      
  Continuo Categoriale Contrassegno Nominale Ordinale Senza tipo
Stringa Impossibile   Vengono adattate le distribuzioni di categoria, cubo e fisse      
Numero intero          
Reale          
Ora Vengono adattate tutte le distribuzioni. Vengono calcolate le correlazioni e le contingenze. Viene adattata la distribuzione di categoria. Le correlazioni non vengono calcolate.   Vengono adattate le distribuzioni binomiale, binomiale negativa e Poisson, e le correlazioni vengono calcolate. Il campo viene ignorato e non viene trasmesso al nodo Genera simulazione.
Data          
Data/ora          
Sconosciuto   Il tipo di archiviazione appropriato viene determinato dai dati.    

I campi con livello di misurazione ordinale vengono trattati come campi continui e vengono inclusi nella tabella di correlazioni nel nodo Genera simulazione. Se si desidera che una distribuzione diversa da binomiale, binomiale negativa o Poisson venga adattata ad un campo ordinale, è necessario modificare il livello di misurazione del campo in continuo. Se in precedenza è stata definita un'etichetta per ciascun valore di campo ordinale e si modifica il livello di misurazione su continuo, le etichette andranno perse.

I campi che hanno valori singoli non vengono trattati in modo diverso durante l'adattamento delle distribuzioni rispetto ai campi con valori multipli. I campi con tipo di archiviazione ora, data o timestamp vengono trattati come numerici.

Adattamento delle distribuzioni ai campi di suddivisione

Se i dati contengono un campo di suddivisione e si desidera eseguire l'adattamento delle distribuzioni separatamente per ciascuna suddivisione, è necessario trasformare i dati utilizzando un nodo upstream Riorganizza. Utilizzando il nodo Riorganizza, generare un nuovo campo per ogni valore del campo di suddivisione. Questi dati riorganizzati possono quindi essere utilizzati per l'adattamento delle distribuzioni nel nodo Adattamento simulazione.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni