0 / 0
Torna alla versione inglese della documentazione
Scelta di uno strumento
Ultimo aggiornamento: 26 nov 2024
Scelta di uno strumento

I servizi di base per Cloud Pak for Data as a Service forniscono una gamma di strumenti per gli utenti con tutti i livelli di esperienza nella preparazione, analisi e modellazione dei dati, dal principiante all'esperto. Lo strumento giusto per te dipende dal tipo di dati di cui disponi, dalle attività che intendi eseguire e dalla quantità di automazione che vuoi.

Per vedere quali strumenti si utilizzano in un progetto e quali servizi tali strumenti richiedono, aprire la mappa di strumenti e servizi.

Per scegliere lo strumento giusto, considerare questi fattori.

Il tipo di dati di cui si dispone

  • Dati tabulari in file delimitati o dati relazionali in origini dati remote
  • File di immagini
  • Dati testuali (non strutturati) nei documenti

Il tipo di attività da eseguire

  • Preparare i dati: pulire, modellare, visualizzare, organizzare e convalidare i dati.
  • Analizzare i dati: identificare i modelli e le relazioni nei dati e visualizzare le informazioni dettagliate.
  • Creare modelli: creare, addestrare, testare e implementare modelli per fare previsioni o ottimizzare le decisioni.

Quanto automazione si desidera

  • Strumenti dell'editor di codice: utilizzare per scrivere il codice in Python o R, anche con Spark.
  • Strumenti di creazione grafici: utilizzare i menu e la funzionalità di trascinamento e rilascio su un programma di creazione per programmare visivamente.
  • Strumenti di creazione automatizzati: utilizzare per configurare attività automatizzate che richiedono un input utente limitato.

Trova lo strumento giusto:

Strumenti per dati tabulari o relazionali

Strumenti per dati tabulari o relazionali per attività:

Strumenti per dati tabulari o relazionali
Strumento Tipo di strumento Prepara dati Analizzare dati Crea modelli
Editor di notebook Jupyter Editor di codice
Apprendimento federato Editor di codice
RStudio Editor di codice
Data Refinery Builder grafico
Flusso di mascheramento Builder automatico
Data Virtualization Builder grafico
DataStage Builder grafico
Data Replication Builder grafico
SPSS Modeler Builder grafico
generatore di modelli Decision Optimization Editor di codice e builder grafico
AutoAI Builder automatico
Metadata import Builder automatico
Arricchimento dei metadati Builder automatico
Regola di qualità dei dati Editor di codice e builder automatizzato
IBM Match 360 with Watson (Beta) Builder automatico
Pipeline di orchestrazione Builder grafico

Strumenti per dati testuali

Strumenti per la creazione di un modello che funziona con i dati testuali:

Strumenti per dati testuali
Strumento Editor di codice Builder grafico Builder automatico
Editor di notebook Jupyter
RStudio
SPSS Modeler
Pipeline di orchestrazione

Strumenti per i dati immagine

Strumenti per la creazione di un modello che classifica le immagini:

Strumenti per i dati immagine
Strumento Editor di codice Builder grafico Builder automatico
Editor di notebook Jupyter
RStudio
Pipeline di orchestrazione

Accesso agli strumenti

Per utilizzare un'attrezzatura, è necessario creare un asset specifico per tale attrezzatura oppure aprire un asset esistente per tale attrezzatura. Per creare un asset, fare clic su Nuovo asset o Importa asset e scegliere il tipo di asset desiderato. Questa tabella mostra il tipo di asset da scegliere per ogni attrezzatura.

Associazione strumenti a tipo di asset
Per utilizzare questo strumento Scegli questo tipo di asset
Editor di notebook Jupyter Editor di notebook Jupyter
Data Refinery Flusso Data Refinery
Flussi di mascheramento Flussi di mascheramento
DataStage Flusso DataStage
SPSS Modeler Flusso Modeler
generatore di modelli Decision Optimization Decision Optimization
AutoAI Esperimento AutoAI
Apprendimento federato Esperimento di apprendimento federato
Metadata import Metadata import
Arricchimento dei metadati Arricchimento dei metadati
Regole di qualità dei dati Regola di qualità dei dati
IBM Match 360 with Watson (Beta) Configurazione di dati master

Per modificare i notebook con RStudio, fare clic su Avvia IDE> RStudio.

Editor di notebook Jupyter

Usate l'editor di taccuini Jupyter per creare un taccuino in cui eseguire codice per preparare, visualizzare e analizzare i dati o costruire e addestrare un modello.

Servizi richiesti
studio watsonx.ai
Formato dati
Qualsiasi
Dimensione dati
Qualsiasi
Come preparare i dati, analizzare i dati o creare modelli
Scrivi codice in Python o R, anche con Spark.
Includi rich text e media con il tuo codice.
Gestire qualsiasi tipo di dati nel modo desiderato.
Utilizzare o installare altre librerie e package open source e IBM .
Pianifica le esecuzioni del codice
Importare un notebook da un file, un URL o l'hub di risorse.
Condividere le copie di sola lettura del notebook esternamente.
Introduzione
Per creare un taccuino, fare clic su Nuova risorsa > Lavora con dati e modelli inPython o taccuini R .
Ulteriori informazioni
Documentazione sui notebook
Video sui notebook
Notebook di esempio

Guardate un video per imparare le basi del notebook Jupyter

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Data Refinery

Utilizzare Data Refinery per preparare e visualizzare i dati tabulari con un editor di flusso grafico. Si crea ed esegue un flusso Data Refinery come una serie di operazioni ordinate sui dati.

Servizi richiesti
watsonx.ai Studio o IBM Knowledge Catalog
Formato dati
Tabella: Avro, CSV, JSON, Microsoft Excel (formati xls e xlsx. Solo primo foglio, ad eccezione delle connessioni e degli asset di dati connessi.), Parquet, SAS con estensione "sas7bdat" (sola lettura), TSV (sola lettura) o asset di dati di testo delimitato
Relazionale: tabelle in origini dati relazionali
Dimensione dati
Qualsiasi
Come preparare i dati
Pulisci, forma, organizza i dati con oltre 60 operazioni.
Salvare i dati rifiniti come un nuovo dataset o aggiornare i dati originali.
Dati del profilo per convalidarli.
Utilizzare modelli interattivi per manipolare i dati con operazioni di codice, funzioni e operatori logici.
Pianificare le operazioni ricorrenti sui dati.
Come analizzare i dati
Identificare modelli, connessioni e relazioni all'interno dei dati in più grafici di visualizzazione.
Introduzione
Per creare un flusso Data Refinery , fare clic su Nuovo asset> Prepara e visualizza dati.
Ulteriori informazioni
Documentazione su Data Refinery
Video su Data Refinery

Guardate un video per vedere come raffinare i dati

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Data Replication

Utilizzare la Data Replication per integrare e sincronizzare i dati. La Data Replication fornisce una consegna dei dati quasi in tempo reale con un basso impatto sulle fonti.

Servizio richiesto

Data Replication

Servizio correlato

IBM Knowledge Catalog

Formati dei dati

La Data Replication funziona con connessioni da e verso tipi selezionati di sorgenti e formati di dati. Per ulteriori informazioni, vedere Connessioni di Data Replication supportate.

Credenziali

Data Replication utilizza le credenziali di IBM Cloud per connettersi al servizio.

Introduzione

Per avviare la replica dei dati in un progetto, fare clic su Nuova risorsa > Replica dati.

Ulteriori informazioni

Documentazione sulla Data Replication

Video sulla Data Replication


Guardate un video per vedere come replicare i dati

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Data Virtualization

Utilizzate la Data Virtualization per collegare più fonti di dati in un'unica raccolta autobilanciata di fonti di dati o database.

Formato dati
Relazionale: tabelle in origini dati relazionali
Dimensione dati
Qualsiasi
Come preparare i dati
Connettersi a più origini dati.
Creare tabelle virtuali.
Introduzione
Per creare tabelle virtuali, fare clic su Dati > Data virtualization. Dal menu del servizio, fai clic su Virtualizzazione > Virtualizza > Tabelle.
Ulteriori informazioni
Documentazione sulla Data Virtualization
Video sulla Data Virtualization

Guardate un video per capire come virtualizzare i dati

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


DataStage

Utilizzare DataStage per preparare e visualizzare i dati tabulari con un editor di flusso grafico. Si crea ed esegue un flusso DataStage come una serie di operazioni ordinate sui dati.

Servizio richiesto
DataStage
Formato dati
Tabulare: Avro, CSV, JSON, Parquet, TSV (sola lettura) o file di testo delimitati
Relazionale: tabelle in origini dati relazionali
Dimensione dati
Qualsiasi
Come preparare i dati
Progetta un flusso di integrazione dei dati grafici che genera il codice Orchestrate da eseguire sul motore parallelo DataStage ad alte prestazioni.
Eseguire operazioni quali: Join, Funnel, Checksum, Merge, Modify, Remove Duplicates e Sort.
Introduzione
Per creare un DataStage flusso, fare clic Nuova risorsa > Trasforma e integra i dati. IL DataStage la tessera è in Costruttori grafici sezione.
Ulteriori informazioni
Documentazione su DataStage
Video su DataStage

Guardate un video per vedere come trasformare i dati

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


SPSS Modeler

Utilizzare SPSS Modeler per creare un flusso per preparare i dati e creare ed addestrare un modello con un editor di flusso su un builder grafico.

Servizi richiesti
studio watsonx.ai
Formati dei dati
Relazionale: tabelle in origini dati relazionali
Tabulare: file Excel (.xls o .xlsx), file CSV o file SPSS Statistics (.sav)
Testuale: in tabelle o file relazionali supportati
Dimensione dati
Qualsiasi
Come preparare i dati
Utilizzare le funzioni di preparazione automatica dati.
Scrivere istruzioni SQL per manipolare i dati.
Ripulitura, forma, campione, ordinamento e derivazione dei dati.
Come analizzare i dati
Visualizzare i dati con oltre 40 grafici.
Identifica la lingua naturale di un campo di testo.
Come creare modelli
Creare modelli predittivi.
Scegli tra oltre 40 algoritmi di modellazione.
Utilizzare funzioni di modellazione automatica.
Modellare le serie temporali o i dati geospaziali.
Classificare i dati di testo.
Identificare le relazioni tra i concetti nei dati di testo.
Introduzione
Per creare unSPSS Modeler flusso, fare clic Nuova risorsa > Crea modelli come flusso visivo .
Ulteriori informazioni
Documentazione su SPSS Modeler
Video su SPSS Modeler

Guardate un video per vedere come si costruisce un modello con SPSS Modeler

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


generatore di modelli Decision Optimization

Utilizzate Decision Optimization per costruire ed eseguire modelli di ottimizzazione nel modellatore di Decision Optimization o in un notebook Jupyter.

Servizi richiesti
studio watsonx.ai
Formati dei dati
Tabella: file CSV
Dimensione dati
Qualsiasi
Come preparare i dati
Importare dati rilevanti in uno scenario e modificarli.
Come creare modelli
Sviluppare modelli di ottimizzazione delle decisioni prescrittivi.
Crea, importa e modifica i modelli in Python DOcplex, OPL o con espressioni del linguaggio naturale.
Creare, importare e modificare modelli in notebook.
Come risolvere i modelli
Eseguire e risolvere i modelli di ottimizzazione delle decisioni utilizzando i motori CPLEX.
Esaminare e confrontare le soluzioni per più scenari.
Creare tabelle, grafici e note per visualizzare dati e soluzioni per uno o più scenari.
Introduzione
Per creare unDecision Optimization modello, fare clic Nuova risorsa > Risolvi problemi di ottimizzazione oppure, per i taccuini, fare clic su Nuova risorsa > Lavora con dati e modelli inPython o taccuini R .
Ulteriori informazioni
Documentazione su Decision Optimization
Video su Decision Optimization

Guardate un video per vedere come costruire un esperimento Decision Optimization

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Strumento AutoAI

Utilizzare lo strumento AutoAI per analizzare automaticamente dati tabulari e generare pipeline di modelli candidati personalizzate per il problema di modellazione predittiva.

Servizi richiesti
runtime watsonx.ai
studio watsonx.ai
Formato dati
Tabella: file CSV
Dimensione dati
Dipende dal tipo di modello. Per i dettagli, vedere Panoramica diAutoAI .
Come preparare i dati
Trasforma automaticamente i dati, ad esempio assegna i valori mancanti e trasforma il testo in valori scalari.
Come creare modelli
Addestrare una classificazione binaria, una classificazione multiclasse o un modello di regressione.
Visualizzare un'infografica della struttura ad albero che mostra le sequenze delle fasi di addestramento AutoAI .
Generare una classifica delle pipeline del modello classificate in base ai punteggi di convalida incrociata.
Salva una pipeline come modello.
Introduzione
Per creare unAutoAI esperimento, fare clic Nuova risorsa > Crea automaticamente modelli di machine learning .
Ulteriori informazioni
Documentazione su AutoAI
Video su AutoAI

Guardate un video per vedere come costruire un esperimento AutoAI

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Apprendimento federato

Utilizzare lo strumento Federated Learning per addestrare un modello comune utilizzando i dati distribuiti. I dati non vengono mai combinati o condivisi, preservando l'integrità dei dati e fornendo a tutte le parti partecipanti un modello basato sui dati aggregati.

Servizi richiesti
studio watsonx.ai
runtime watsonx.ai
Formato dati
Qualsiasi
Dimensione dati
Qualsiasi dimensione
Come creare modelli
Scegli un framework di formazione.
Configurare il modello comune.
Configurare un file per l'addestramento del modello comune.
Le parti remote devono addestrare i propri dati.
Distribuisci il modello comune.
Introduzione
Per creare un esperimento, fare clic su Nuova risorsa > Addestra modelli su dati distribuiti .
Ulteriori informazioni
Documentazione sull'apprendimento federato
Video sull'apprendimento federato

Guardate un video per vedere come costruire un esperimento di apprendimento federato

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Metadata import

Utilizzare lo strumento di importazione dei metadati per rilevare e importare automaticamente metadati tecnici e di elaborazione per gli asset di dati in un progetto o in un catalogo.

Servizio richiesto
IBM Knowledge Catalog
Formato dati
Qualsiasi
Dimensione dati
Qualsiasi dimensione
Come preparare i dati
Importare gli asset di dati da una connessione a una origine dati.
Introduzione
Per importare i metadati, fare clic su Nuova risorsa > Importa metadati per risorse dati.
Ulteriori informazioni
Documentazione sull'importazione dei metadati
Video su IBM Knowledge Catalog

Guardate un video per vedere come importare i metadati delle risorse

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Arricchimento dei metadati

Utilizzare lo strumento di arricchimento metadati per creare automaticamente il profilo degli asset di dati e analizzare la qualità dei dati in un progetto.

Servizio richiesto
IBM Knowledge Catalog
Formato dati
Relazionale e strutturato: tabelle e file in origini dati relazionale e non relazionale
Tabella: file Avro, CSV o Parquet
Dimensione dati
Qualsiasi dimensione
Come preparare e analizzare i dati
Creare un profilo e analizzare una serie selezionata di asset di dati in un progetto.
Introduzione
Per arricchire i dati, fare clic su Nuova risorsa > Arricchisci le risorse di dati con metadati.
Ulteriori informazioni
Documentazione sull'arricchimento dei metadati
Video su IBM Knowledge Catalog

Guardate un video per vedere come arricchire gli asset di dati

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Regola di qualità dei dati

Utilizzare lo strumento qualità dati per creare regole che analizzino la qualità dei dati in un progetto.

Servizio richiesto
IBM Knowledge Catalog
Formato dati
Relazionale e strutturato: tabelle e file in origini dati relazionale e non relazionale
Tabella: file Avro, CSV o Parquet
Dimensione dati
Qualsiasi dimensione
Come preparare e analizzare i dati
Analizzare la qualità di una serie selezionata di asset di dati in un progetto.
Introduzione
Per creare una regola sulla qualità dei dati, fare clic su Nuova risorsa > Misura e monitora la qualità dei dati.
Ulteriori informazioni
Documentazione sulle regole di qualità dei dati

IBM Match 360 with Watson

Utilizza IBM Match 360 with Watson per creare entità di dati master che rappresentano i gemelli digitali dei clienti. Modellare e associare i propri dati, quindi eseguire l'algoritmo di corrispondenza per creare entità di dati master. Personalizzazione e ottimizzazione dell'algoritmo di corrispondenza per soddisfare i requisiti dell'organizzazione.

Servizi richiesti
IBM Match 360 with Watson IBM Knowledge Catalog
Dimensione dati
Fino a 1.000.000 di record (per il piano Beta Lite)
Come preparare i dati
Modellare e associare i dati dalle origini nell'organizzazione.
Eseguire l'algoritmo di corrispondenza personalizzabile per creare entità di dati master.
Visualizzare e modificare le entità di dati master e i record associati.
Introduzione
Per creare un IBM Match 360 risorsa di configurazione, fare clic su Nuova risorsa > Consolida i dati in visualizzazioni a 360 gradi.
Ulteriori informazioni
Documentazione su IBM Match 360 with Watson
Video su IBM Match 360

Guardate un video per vedere come usare IBM Match 360

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


IDE RStudio

Utilizzare RStudio IDE per analizzare i dati o creare applicazioni Shiny scrivendo codice R.

Servizio richiesto
studio watsonx.ai
Formato dati
Qualsiasi
Dimensione dati
Qualsiasi dimensione
Come preparare i dati, analizzare i dati e creare modelli
Scrivi codice in R.
Crea app Shiny.
Utilizzare package e librerie open source.
Includi rich text e media con il tuo codice.
Preparare i dati.
Visualizzare i dati.
Scopri informazioni dettagliate dai dati.
Creare e addestrare un modello utilizzando librerie open source.
Condividi la tua applicazione Shiny in un repository Git .
Introduzione
Per utilizzare RStudio, fare clic su Avvia IDE > RStudio.
Ulteriori informazioni
Documentazione su RStudio
Video su RStudio

Guardate un video per vedere una panoramica dell'IDE RStudio

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Flussi di mascheramento

Utilizzare lo strumento del flusso di mascheramento per preparare copie mascherate o sottoinsiemi mascherati di dati dal catalogo. I dati vengono deidentificati utilizzando opzioni di mascheramento avanzate con regole di protezione dati.

Servizio richiesto
IBM Knowledge Catalog
Formato dati
Relazionale: tabelle in origini dati relazionali
Dimensione dati
Qualsiasi dimensione
Come preparare i dati, analizzare i dati o creare modelli
Importare gli asset di dati dal catalogo gestito al progetto.
Creare definizioni di lavoro del flusso di mascheramento per specificare quali dati mascherare con le regole di protezione dati.
Facoltativamente, creare un sottoinsieme di dati per ridurre la dimensione dei dati copiati.
Eseguire i job del flusso di mascheramento per caricare le copie mascherate sulle connessioni del database di destinazione.
Introduzione
Accertarsi che passi prerequisiti in IBM Knowledge Catalog siano stati completati. Per privatizzare i dati, eseguire una delle seguenti attività:
  • Clic Nuova risorsa > Copia e maschera i dati.
  • Fare clic sulle opzioni di menu per singoli asset di dati per mascherare direttamente tale asset.
Ulteriori informazioni
Documentazione sul mascheramento dei dati
Video su IBM Knowledge Catalog

Guardate un video per vedere come creare un flusso di mascheratura

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Pipeline di orchestrazione

Utilizzare l'editor dell'area di disegno Pipelines per creare un flusso per preparare, visualizzare e analizzare i dati o creare e addestrare un modello.

Formato dati
Qualsiasi
Dimensione dati
Qualsiasi
Come preparare i dati, analizzare i dati o creare modelli
Utilizzare una varietà di nodi che contengono ognuno i propri log.
Integra i notebook nel flusso per eseguire qualsiasi codice Python o R.
Gestire qualsiasi tipo di dati nel modo desiderato.
Pianificare le esecuzioni del flusso.
Importa i dati dalla PVC montata, dal progetto o dai dati di ingest da Github.
Crea il componente personalizzato con un codice Python .
Condizionalizza le tue pipeline per monitorare la qualità dei dati come vuoi.
Utilizza il webhook per inviare email o messaggi per tenerti aggiornato sullo stato del tuo flusso.
Introduzione
Per creare una nuova pipeline, fare clic su Nuova risorsa > Automatizza il ciclo di vita del modello .
Ulteriori informazioni
Documentazione sulle pipeline di orchestrazione
Video sulle pipeline di orchestrazione

Guardate un video per vedere come creare una pipeline

Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.


Visualizzazioni dati

Utilizzare le visualizzazioni dei dati per rilevare informazioni dettagliate dai dati. Esplorando i dati da diverse prospettive con le visualizzazioni, è possibile individuare modelli, connessioni e relazioni all'interno di tali dati e comprendere rapidamente grandi quantità di informazioni.

Formato dati
Tabella: file Avro, CSV, JSON, Parchetto, TSV, SAV, Microsoft Excel .xls e .xlsx, SAS, file di testo delimitati e dati connessi. Per ulteriori informazioni sulle origini dati supportate, consultare Connettori.
Dimensione dati
Nessun limite
Introduzione
Per creare una visualizzazione, fare clic su Asset dati nell'elenco di tipi di asset nel progetto e selezionare un asset di dati. Fare clic sulla scheda Visualizzazione e scegliere un tipo di grafico.
Ulteriori informazioni
Visualizzazione dei dati

Argomento principale: Progetti

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni