I servizi di base per Cloud Pak for Data as a Service forniscono una gamma di strumenti per gli utenti con tutti i livelli di esperienza nella preparazione, analisi e modellazione dei dati, dal principiante all'esperto. Lo strumento giusto per te dipende dal tipo di dati di cui disponi, dalle attività che intendi eseguire e dalla quantità di automazione che vuoi.
Per vedere quali strumenti si utilizzano in un progetto e quali servizi tali strumenti richiedono, aprire la mappa di strumenti e servizi.
Per scegliere lo strumento giusto, considerare questi fattori.
Il tipo di dati di cui si dispone
- Dati tabulari in file delimitati o dati relazionali in origini dati remote
- File di immagini
- Dati testuali (non strutturati) nei documenti
Il tipo di attività da eseguire
- Preparare i dati: pulire, modellare, visualizzare, organizzare e convalidare i dati.
- Analizzare i dati: identificare i modelli e le relazioni nei dati e visualizzare le informazioni dettagliate.
- Creare modelli: creare, addestrare, testare e implementare modelli per fare previsioni o ottimizzare le decisioni.
Quanto automazione si desidera
- Strumenti dell'editor di codice: utilizzare per scrivere il codice in Python o R, anche con Spark.
- Strumenti di creazione grafici: utilizzare i menu e la funzionalità di trascinamento e rilascio su un programma di creazione per programmare visivamente.
- Strumenti di creazione automatizzati: utilizzare per configurare attività automatizzate che richiedono un input utente limitato.
Trova lo strumento giusto:
- Strumenti per dati tabulari o relazionali
- Strumenti per i dati di testo
- Strumenti per dati immagine
- Accesso agli strumenti
Strumenti per dati tabulari o relazionali
Strumenti per dati tabulari o relazionali per attività:
Strumento | Tipo di strumento | Prepara dati | Analizzare dati | Crea modelli |
---|---|---|---|---|
Editor di notebook Jupyter | Editor di codice | ✓ | ✓ | ✓ |
Apprendimento federato | Editor di codice | ✓ | ||
RStudio | Editor di codice | ✓ | ✓ | ✓ |
Data Refinery | Builder grafico | ✓ | ✓ | |
Flusso di mascheramento | Builder automatico | ✓ | ||
Data Virtualization | Builder grafico | ✓ | ||
DataStage | Builder grafico | ✓ | ||
Data Replication | Builder grafico | ✓ | ||
SPSS Modeler | Builder grafico | ✓ | ✓ | ✓ |
generatore di modelli Decision Optimization | Editor di codice e builder grafico | ✓ | ✓ | |
AutoAI | Builder automatico | ✓ | ✓ | |
Metadata import | Builder automatico | ✓ | ||
Arricchimento dei metadati | Builder automatico | ✓ | ✓ | |
Regola di qualità dei dati | Editor di codice e builder automatizzato | ✓ | ||
IBM Match 360 with Watson (Beta) | Builder automatico | ✓ | ||
Pipeline di orchestrazione | Builder grafico | ✓ | ✓ | ✓ |
Strumenti per dati testuali
Strumenti per la creazione di un modello che funziona con i dati testuali:
Strumento | Editor di codice | Builder grafico | Builder automatico |
---|---|---|---|
Editor di notebook Jupyter | ✓ | ||
RStudio | ✓ | ||
SPSS Modeler | ✓ | ||
Pipeline di orchestrazione | ✓ |
Strumenti per i dati immagine
Strumenti per la creazione di un modello che classifica le immagini:
Strumento | Editor di codice | Builder grafico | Builder automatico |
---|---|---|---|
Editor di notebook Jupyter | ✓ | ||
RStudio | ✓ | ||
Pipeline di orchestrazione | ✓ |
Accesso agli strumenti
Per utilizzare un'attrezzatura, è necessario creare un asset specifico per tale attrezzatura oppure aprire un asset esistente per tale attrezzatura. Per creare un asset, fare clic su Nuovo asset o Importa asset e scegliere il tipo di asset desiderato. Questa tabella mostra il tipo di asset da scegliere per ogni attrezzatura.
Per utilizzare questo strumento | Scegli questo tipo di asset |
---|---|
Editor di notebook Jupyter | Editor di notebook Jupyter |
Data Refinery | Flusso Data Refinery |
Flussi di mascheramento | Flussi di mascheramento |
DataStage | Flusso DataStage |
SPSS Modeler | Flusso Modeler |
generatore di modelli Decision Optimization | Decision Optimization |
AutoAI | Esperimento AutoAI |
Apprendimento federato | Esperimento di apprendimento federato |
Metadata import | Metadata import |
Arricchimento dei metadati | Arricchimento dei metadati |
Regole di qualità dei dati | Regola di qualità dei dati |
IBM Match 360 with Watson (Beta) | Configurazione di dati master |
Per modificare i notebook con RStudio, fare clic su Avvia IDE> RStudio.
Editor di notebook Jupyter
Usate l'editor di taccuini Jupyter per creare un taccuino in cui eseguire codice per preparare, visualizzare e analizzare i dati o costruire e addestrare un modello.
- Servizi richiesti
- studio watsonx.ai
- Formato dati
- Qualsiasi
- Dimensione dati
- Qualsiasi
- Come preparare i dati, analizzare i dati o creare modelli
- Scrivi codice in Python o R, anche con Spark.
- Includi rich text e media con il tuo codice.
- Gestire qualsiasi tipo di dati nel modo desiderato.
- Utilizzare o installare altre librerie e package open source e IBM .
- Pianifica le esecuzioni del codice
- Importare un notebook da un file, un URL o l'hub di risorse.
- Condividere le copie di sola lettura del notebook esternamente.
- Introduzione
- Per creare un taccuino, fare clic su Nuova risorsa > Lavora con dati e modelli inPython o taccuini R .
- Ulteriori informazioni
- Documentazione sui notebook
- Video sui notebook
- Notebook di esempio
Guardate un video per imparare le basi del notebook Jupyter
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Data Refinery
Utilizzare Data Refinery per preparare e visualizzare i dati tabulari con un editor di flusso grafico. Si crea ed esegue un flusso Data Refinery come una serie di operazioni ordinate sui dati.
- Servizi richiesti
- watsonx.ai Studio o IBM Knowledge Catalog
- Formato dati
- Tabella: Avro, CSV, JSON, Microsoft Excel (formati xls e xlsx. Solo primo foglio, ad eccezione delle connessioni e degli asset di dati connessi.), Parquet, SAS con estensione "sas7bdat" (sola lettura), TSV (sola lettura) o asset di dati di testo delimitato
- Relazionale: tabelle in origini dati relazionali
- Dimensione dati
- Qualsiasi
- Come preparare i dati
- Pulisci, forma, organizza i dati con oltre 60 operazioni.
- Salvare i dati rifiniti come un nuovo dataset o aggiornare i dati originali.
- Dati del profilo per convalidarli.
- Utilizzare modelli interattivi per manipolare i dati con operazioni di codice, funzioni e operatori logici.
- Pianificare le operazioni ricorrenti sui dati.
- Come analizzare i dati
- Identificare modelli, connessioni e relazioni all'interno dei dati in più grafici di visualizzazione.
- Introduzione
- Per creare un flusso Data Refinery , fare clic su Nuovo asset> Prepara e visualizza dati.
- Ulteriori informazioni
- Documentazione su Data Refinery
- Video su Data Refinery
Guardate un video per vedere come raffinare i dati
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Data Replication
Utilizzare la Data Replication per integrare e sincronizzare i dati. La Data Replication fornisce una consegna dei dati quasi in tempo reale con un basso impatto sulle fonti.
- Servizio richiesto
Data Replication
- Servizio correlato
IBM Knowledge Catalog
- Formati dei dati
La Data Replication funziona con connessioni da e verso tipi selezionati di sorgenti e formati di dati. Per ulteriori informazioni, vedere Connessioni di Data Replication supportate.
- Credenziali
Data Replication utilizza le credenziali di IBM Cloud per connettersi al servizio.
- Introduzione
Per avviare la replica dei dati in un progetto, fare clic su Nuova risorsa > Replica dati.
- Ulteriori informazioni
Guardate un video per vedere come replicare i dati
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Data Virtualization
Utilizzate la Data Virtualization per collegare più fonti di dati in un'unica raccolta autobilanciata di fonti di dati o database.
- Formato dati
- Relazionale: tabelle in origini dati relazionali
- Dimensione dati
- Qualsiasi
- Come preparare i dati
- Connettersi a più origini dati.
- Creare tabelle virtuali.
- Introduzione
- Per creare tabelle virtuali, fare clic su Dati > Data virtualization. Dal menu del servizio, fai clic su Virtualizzazione > Virtualizza > Tabelle.
- Ulteriori informazioni
- Documentazione sulla Data Virtualization
- Video sulla Data Virtualization
Guardate un video per capire come virtualizzare i dati
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
DataStage
Utilizzare DataStage per preparare e visualizzare i dati tabulari con un editor di flusso grafico. Si crea ed esegue un flusso DataStage come una serie di operazioni ordinate sui dati.
- Servizio richiesto
- DataStage
- Formato dati
- Tabulare: Avro, CSV, JSON, Parquet, TSV (sola lettura) o file di testo delimitati
- Relazionale: tabelle in origini dati relazionali
- Dimensione dati
- Qualsiasi
- Come preparare i dati
- Progetta un flusso di integrazione dei dati grafici che genera il codice Orchestrate da eseguire sul motore parallelo DataStage ad alte prestazioni.
- Eseguire operazioni quali: Join, Funnel, Checksum, Merge, Modify, Remove Duplicates e Sort.
- Introduzione
- Per creare un DataStage flusso, fare clic Nuova risorsa > Trasforma e integra i dati. IL DataStage la tessera è in Costruttori grafici sezione.
- Ulteriori informazioni
- Documentazione su DataStage
- Video su DataStage
Guardate un video per vedere come trasformare i dati
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
SPSS Modeler
Utilizzare SPSS Modeler per creare un flusso per preparare i dati e creare ed addestrare un modello con un editor di flusso su un builder grafico.
- Servizi richiesti
- studio watsonx.ai
- Formati dei dati
- Relazionale: tabelle in origini dati relazionali
- Tabulare: file Excel (.xls o .xlsx), file CSV o file SPSS Statistics (.sav)
- Testuale: in tabelle o file relazionali supportati
- Dimensione dati
- Qualsiasi
- Come preparare i dati
- Utilizzare le funzioni di preparazione automatica dati.
- Scrivere istruzioni SQL per manipolare i dati.
- Ripulitura, forma, campione, ordinamento e derivazione dei dati.
- Come analizzare i dati
- Visualizzare i dati con oltre 40 grafici.
- Identifica la lingua naturale di un campo di testo.
- Come creare modelli
- Creare modelli predittivi.
- Scegli tra oltre 40 algoritmi di modellazione.
- Utilizzare funzioni di modellazione automatica.
- Modellare le serie temporali o i dati geospaziali.
- Classificare i dati di testo.
- Identificare le relazioni tra i concetti nei dati di testo.
- Introduzione
- Per creare unSPSS Modeler flusso, fare clic Nuova risorsa > Crea modelli come flusso visivo .
- Ulteriori informazioni
- Documentazione su SPSS Modeler
- Video su SPSS Modeler
Guardate un video per vedere come si costruisce un modello con SPSS Modeler
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
generatore di modelli Decision Optimization
Utilizzate Decision Optimization per costruire ed eseguire modelli di ottimizzazione nel modellatore di Decision Optimization o in un notebook Jupyter.
- Servizi richiesti
- studio watsonx.ai
- Formati dei dati
- Tabella: file CSV
- Dimensione dati
- Qualsiasi
- Come preparare i dati
- Importare dati rilevanti in uno scenario e modificarli.
- Come creare modelli
- Sviluppare modelli di ottimizzazione delle decisioni prescrittivi.
- Crea, importa e modifica i modelli in Python DOcplex, OPL o con espressioni del linguaggio naturale.
- Creare, importare e modificare modelli in notebook.
- Come risolvere i modelli
- Eseguire e risolvere i modelli di ottimizzazione delle decisioni utilizzando i motori CPLEX.
- Esaminare e confrontare le soluzioni per più scenari.
- Creare tabelle, grafici e note per visualizzare dati e soluzioni per uno o più scenari.
- Introduzione
- Per creare unDecision Optimization modello, fare clic Nuova risorsa > Risolvi problemi di ottimizzazione oppure, per i taccuini, fare clic su Nuova risorsa > Lavora con dati e modelli inPython o taccuini R .
- Ulteriori informazioni
- Documentazione su Decision Optimization
- Video su Decision Optimization
Guardate un video per vedere come costruire un esperimento Decision Optimization
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Strumento AutoAI
Utilizzare lo strumento AutoAI per analizzare automaticamente dati tabulari e generare pipeline di modelli candidati personalizzate per il problema di modellazione predittiva.
- Servizi richiesti
- runtime watsonx.ai
- studio watsonx.ai
- Formato dati
- Tabella: file CSV
- Dimensione dati
- Dipende dal tipo di modello. Per i dettagli, vedere Panoramica diAutoAI .
- Come preparare i dati
- Trasforma automaticamente i dati, ad esempio assegna i valori mancanti e trasforma il testo in valori scalari.
- Come creare modelli
- Addestrare una classificazione binaria, una classificazione multiclasse o un modello di regressione.
- Visualizzare un'infografica della struttura ad albero che mostra le sequenze delle fasi di addestramento AutoAI .
- Generare una classifica delle pipeline del modello classificate in base ai punteggi di convalida incrociata.
- Salva una pipeline come modello.
- Introduzione
- Per creare unAutoAI esperimento, fare clic Nuova risorsa > Crea automaticamente modelli di machine learning .
- Ulteriori informazioni
- Documentazione su AutoAI
- Video su AutoAI
Guardate un video per vedere come costruire un esperimento AutoAI
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Apprendimento federato
Utilizzare lo strumento Federated Learning per addestrare un modello comune utilizzando i dati distribuiti. I dati non vengono mai combinati o condivisi, preservando l'integrità dei dati e fornendo a tutte le parti partecipanti un modello basato sui dati aggregati.
- Servizi richiesti
- studio watsonx.ai
- runtime watsonx.ai
- Formato dati
- Qualsiasi
- Dimensione dati
- Qualsiasi dimensione
- Come creare modelli
- Scegli un framework di formazione.
- Configurare il modello comune.
- Configurare un file per l'addestramento del modello comune.
- Le parti remote devono addestrare i propri dati.
- Distribuisci il modello comune.
- Introduzione
- Per creare un esperimento, fare clic su Nuova risorsa > Addestra modelli su dati distribuiti .
- Ulteriori informazioni
- Documentazione sull'apprendimento federato
- Video sull'apprendimento federato
Guardate un video per vedere come costruire un esperimento di apprendimento federato
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Metadata import
Utilizzare lo strumento di importazione dei metadati per rilevare e importare automaticamente metadati tecnici e di elaborazione per gli asset di dati in un progetto o in un catalogo.
- Servizio richiesto
- IBM Knowledge Catalog
- Formato dati
- Qualsiasi
- Dimensione dati
- Qualsiasi dimensione
- Come preparare i dati
- Importare gli asset di dati da una connessione a una origine dati.
- Introduzione
- Per importare i metadati, fare clic su Nuova risorsa > Importa metadati per risorse dati.
- Ulteriori informazioni
- Documentazione sull'importazione dei metadati
- Video su IBM Knowledge Catalog
Guardate un video per vedere come importare i metadati delle risorse
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Arricchimento dei metadati
Utilizzare lo strumento di arricchimento metadati per creare automaticamente il profilo degli asset di dati e analizzare la qualità dei dati in un progetto.
- Servizio richiesto
- IBM Knowledge Catalog
- Formato dati
- Relazionale e strutturato: tabelle e file in origini dati relazionale e non relazionale
- Tabella: file Avro, CSV o Parquet
- Dimensione dati
- Qualsiasi dimensione
- Come preparare e analizzare i dati
- Creare un profilo e analizzare una serie selezionata di asset di dati in un progetto.
- Introduzione
- Per arricchire i dati, fare clic su Nuova risorsa > Arricchisci le risorse di dati con metadati.
- Ulteriori informazioni
- Documentazione sull'arricchimento dei metadati
- Video su IBM Knowledge Catalog
Guardate un video per vedere come arricchire gli asset di dati
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Regola di qualità dei dati
Utilizzare lo strumento qualità dati per creare regole che analizzino la qualità dei dati in un progetto.
- Servizio richiesto
- IBM Knowledge Catalog
- Formato dati
- Relazionale e strutturato: tabelle e file in origini dati relazionale e non relazionale
- Tabella: file Avro, CSV o Parquet
- Dimensione dati
- Qualsiasi dimensione
- Come preparare e analizzare i dati
- Analizzare la qualità di una serie selezionata di asset di dati in un progetto.
- Introduzione
- Per creare una regola sulla qualità dei dati, fare clic su Nuova risorsa > Misura e monitora la qualità dei dati.
- Ulteriori informazioni
- Documentazione sulle regole di qualità dei dati
IBM Match 360 with Watson
Utilizza IBM Match 360 with Watson per creare entità di dati master che rappresentano i gemelli digitali dei clienti. Modellare e associare i propri dati, quindi eseguire l'algoritmo di corrispondenza per creare entità di dati master. Personalizzazione e ottimizzazione dell'algoritmo di corrispondenza per soddisfare i requisiti dell'organizzazione.
- Servizi richiesti
- IBM Match 360 with Watson IBM Knowledge Catalog
- Dimensione dati
- Fino a 1.000.000 di record (per il piano Beta Lite)
- Come preparare i dati
- Modellare e associare i dati dalle origini nell'organizzazione.
- Eseguire l'algoritmo di corrispondenza personalizzabile per creare entità di dati master.
- Visualizzare e modificare le entità di dati master e i record associati.
- Introduzione
- Per creare un IBM Match 360 risorsa di configurazione, fare clic su Nuova risorsa > Consolida i dati in visualizzazioni a 360 gradi.
- Ulteriori informazioni
- Documentazione su IBM Match 360 with Watson
- Video su IBM Match 360
Guardate un video per vedere come usare IBM Match 360
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
IDE RStudio
Utilizzare RStudio IDE per analizzare i dati o creare applicazioni Shiny scrivendo codice R.
- Servizio richiesto
- studio watsonx.ai
- Formato dati
- Qualsiasi
- Dimensione dati
- Qualsiasi dimensione
- Come preparare i dati, analizzare i dati e creare modelli
- Scrivi codice in R.
- Crea app Shiny.
- Utilizzare package e librerie open source.
- Includi rich text e media con il tuo codice.
- Preparare i dati.
- Visualizzare i dati.
- Scopri informazioni dettagliate dai dati.
- Creare e addestrare un modello utilizzando librerie open source.
- Condividi la tua applicazione Shiny in un repository Git .
- Introduzione
- Per utilizzare RStudio, fare clic su Avvia IDE > RStudio.
- Ulteriori informazioni
- Documentazione su RStudio
- Video su RStudio
Guardate un video per vedere una panoramica dell'IDE RStudio
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Flussi di mascheramento
Utilizzare lo strumento del flusso di mascheramento per preparare copie mascherate o sottoinsiemi mascherati di dati dal catalogo. I dati vengono deidentificati utilizzando opzioni di mascheramento avanzate con regole di protezione dati.
- Servizio richiesto
- IBM Knowledge Catalog
- Formato dati
- Relazionale: tabelle in origini dati relazionali
- Dimensione dati
- Qualsiasi dimensione
- Come preparare i dati, analizzare i dati o creare modelli
- Importare gli asset di dati dal catalogo gestito al progetto.
- Creare definizioni di lavoro del flusso di mascheramento per specificare quali dati mascherare con le regole di protezione dati.
- Facoltativamente, creare un sottoinsieme di dati per ridurre la dimensione dei dati copiati.
- Eseguire i job del flusso di mascheramento per caricare le copie mascherate sulle connessioni del database di destinazione.
- Introduzione
- Accertarsi che passi prerequisiti in IBM Knowledge Catalog siano stati completati. Per privatizzare i dati, eseguire una delle seguenti attività:
- Clic Nuova risorsa > Copia e maschera i dati.
- Fare clic sulle opzioni di menu per singoli asset di dati per mascherare direttamente tale asset.
- Ulteriori informazioni
- Documentazione sul mascheramento dei dati
- Video su IBM Knowledge Catalog
Guardate un video per vedere come creare un flusso di mascheratura
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Pipeline di orchestrazione
Utilizzare l'editor dell'area di disegno Pipelines per creare un flusso per preparare, visualizzare e analizzare i dati o creare e addestrare un modello.
- Formato dati
- Qualsiasi
- Dimensione dati
- Qualsiasi
- Come preparare i dati, analizzare i dati o creare modelli
- Utilizzare una varietà di nodi che contengono ognuno i propri log.
- Integra i notebook nel flusso per eseguire qualsiasi codice Python o R.
- Gestire qualsiasi tipo di dati nel modo desiderato.
- Pianificare le esecuzioni del flusso.
- Importa i dati dalla PVC montata, dal progetto o dai dati di ingest da Github.
- Crea il componente personalizzato con un codice Python .
- Condizionalizza le tue pipeline per monitorare la qualità dei dati come vuoi.
- Utilizza il webhook per inviare email o messaggi per tenerti aggiornato sullo stato del tuo flusso.
- Introduzione
- Per creare una nuova pipeline, fare clic su Nuova risorsa > Automatizza il ciclo di vita del modello .
- Ulteriori informazioni
- Documentazione sulle pipeline di orchestrazione
- Video sulle pipeline di orchestrazione
Guardate un video per vedere come creare una pipeline
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Visualizzazioni dati
Utilizzare le visualizzazioni dei dati per rilevare informazioni dettagliate dai dati. Esplorando i dati da diverse prospettive con le visualizzazioni, è possibile individuare modelli, connessioni e relazioni all'interno di tali dati e comprendere rapidamente grandi quantità di informazioni.
- Formato dati
- Tabella: file Avro, CSV, JSON, Parchetto, TSV, SAV, Microsoft Excel .xls e .xlsx, SAS, file di testo delimitati e dati connessi. Per ulteriori informazioni sulle origini dati supportate, consultare Connettori.
- Dimensione dati
- Nessun limite
- Introduzione
- Per creare una visualizzazione, fare clic su Asset dati nell'elenco di tipi di asset nel progetto e selezionare un asset di dati. Fare clic sulla scheda Visualizzazione e scegliere un tipo di grafico.
- Ulteriori informazioni
- Visualizzazione dei dati
Argomento principale: Progetti