Il flusso di lavoro in SPSS Modeler si basa sulla metodologia Cross-Industry Standard Process for Data Mining (CRISP-DM). Questa metodologia inserisce il vostro lavoro in SPSS Modeler in un progetto più ampio con diverse fasi. Le fasi di lavoro in SPSS Modeler utilizzano i progetti per gestire il lavoro e le risorse.
Fasi del data mining
La metodologia CRISP-DM prevede le seguenti fasi.
- Business Understanding
- Durante questa fase, cercate di capire il più possibile quali sono gli obiettivi aziendali del data mining. Incontrare gli stakeholder e stabilire in che modo il lavoro svolto con SPSS Modeler risponde agli obiettivi o ai problemi aziendali.
Per ulteriori informazioni, vedere Comprensione e preparazione dei dati.
- Data Understanding
- È necessario raccogliere e comprendere i dati prima di creare flussi in SPSS Modeler. Prendete il tempo necessario per comprendere la struttura dei dati, le relazioni e gli schemi presenti nei vostri dati.
Per ulteriori informazioni, vedere Comprensione e preparazione dei dati.
- Preparazione dati
- È necessario preparare i dati prima di addestrare i modelli in SPSS Modeler. Prendete il tempo necessario per elaborare i vostri dati in modo che siano ottimizzati per l'uso nel data mining.
Per ulteriori informazioni, vedere Comprensione e preparazione dei dati.
- Modellazione
- Costruite i flussi di SPSS Modeler per esplorare i vostri dati, provare diversi modelli e analizzare le relazioni per trovare informazioni utili.
Per ulteriori informazioni, vedere Creazione di flussi e modelli.
- Distribuzione
Dopo aver costruito e addestrato un modello predittivo, è possibile promuoverlo su watsonx.ai Runtime se si dispone del servizio watsonx.ai Runtime.
Per ulteriori informazioni, vedere Promozione dei flussi e dei modelli di SPSS Modeler.
- Valutazione
- Valutare la qualità dei modelli e delle loro previsioni. Ad esempio, è possibile aggiungere nodi di analisi ai flussi per valutare l'accuratezza delle previsioni del modello. È anche possibile utilizzare un nodo di valutazione per confrontare i modelli predittivi e trovare il migliore.
Lavorare con progetti e asset di dati
Tutto il lavoro con SPSS Modeler viene svolto all'interno di un progetto. Un progetto contiene tutte le risorse e i flussi di dati.
- Per ulteriori informazioni sui progetti, vedere Lavorare nei progetti
- Per ulteriori informazioni sull'aggiunta di dati al progetto da utilizzare in un flusso, vedere Aggiunta di dati a un progetto.
È possibile collegare SPSS Modeler a un'origine dati come un database per facilitare l'accesso ai dati in SPSS Modeler.
Per ulteriori informazioni sulla connessione dei dati, vedere Sorgenti di dati supportate
È possibile importare un flusso ( .str ) creato in SPSS Modeler Subscription o SPSS Modeler client. Se il flusso importato contiene uno o più nodi di importazione o esportazione, all'apertura del flusso viene richiesto di convertire i nodi.
Per ulteriori informazioni, vedere Importazione di un flusso SPSS Modeler.
Script
È possibile utilizzare lo scripting in SPSS Modeler per automatizzare le attività. È possibile scrivere script in R, Python o Python for Spark e Control Language for Expression Manipulation (CLEM). CLEM è un linguaggio per analizzare e manipolare i flussi di dati attraverso i flussi.
Per ulteriori informazioni, vedere Scripting e automazione.