0 / 0
Torna alla versione inglese della documentazione
Differenze di funzioni tra le distribuzioni Cloud Pak for Data
Ultimo aggiornamento: 19 dic 2024
Differenze di funzioni tra le distribuzioni Cloud Pak for Data

Cloud Pak for Data as a Service e Cloud Pak for Data hanno alcune differenze nelle funzionalità e nell'implementazione. Cloud Pak for Data as a Service è una serie di servizi IBM Cloud . Cloud Pak for Data 5.1 viene offerto come software da installare e mantenere su IBM Software Hub. I servizi che sono disponibili su entrambe le distribuzioni presentano anche delle differenze nelle caratteristiche su Cloud Pak for Data as a Service rispetto a Cloud Pak for Data 5.1, 5.0 e 4.8.

Differenze piattaforma

Cloud Pak for Data as a Service e il Software Cloud Pak for Data condividono una base di codice comune, tuttavia differiscono nei seguenti modi principali:

Differenze piattaforma
Funzioni Come un servizio Software
Software, hardware e installazione Cloud Pak for Data as a Service è completamente gestito da IBM su IBM Cloud. Gli aggiornamenti software sono automatici. Il ridimensionamento delle risorse di elaborazione e dell'archiviazione è automatico. L'utente si iscrive a Try Cloud Pak for Data as a Service. L'utente fornisce e gestisce l'hardware. Installare, gestire e aggiornare il software. Vedere Requisiti del software.
Archiviazione Si fornisce un'istanza del servizio IBM Cloud Object Storage per fornire l'archiviazione. Vedere IBM Cloud Object Storage. Fornisci l'archiviazione persistente su un cluster Red Hat OpenShift . Vedere Requisiti di stoccaggio.
Risorse di calcolo per carichi di lavoro in esecuzione Gli utenti scelgono il runtime appropriato per i loro lavori. L'utilizzo del calcolo viene fatturato in base al tasso dell'ambiente di runtime e alla durata del job. Vedi Monitora l'utilizzo delle risorse dell'account. Configuri il numero di nodi Red Hat OpenShift con il numero appropriato di vCPUs. Vedere Requisiti hardware e Monitoraggio della piattaforma.
Costo Si acquista ogni servizio di cui si ha bisogno al livello di piano appropriato. Molti servizi fatturano il consumo di risorse di elaborazione. Vedere ogni pagina di servizio nel catalogoIBM Cloud o nel catalogo dei servizi su Cloud Pak for Data as a Service, selezionando Servizi > Catalogo dei servizi dal menu di navigazione. Si acquista una licenza software in base ai servizi necessari. Ad esempio, la licenza Cloud Pak for Data Enterprise Edition include il diritto a servizi quali watsonx.ai Studio e IBM Knowledge Catalog. Vedere Licenze e diritti.
Sicurezza, conformità e isolamento La sicurezza dei dati, la sicurezza della rete, la conformità degli standard di sicurezza e l'isolamento di Cloud Pak for Data as a Service sono gestiti da IBM Cloud. È possibile impostare ulteriori opzioni di sicurezza e crittografia. Vedi Sicurezza di Cloud Pak for Data as a Service. Red Hat OpenShift Container Platform fornisce le funzioni di protezione di base. Cloud Pak for Data viene valutato per le varie normative sulla privacy e sulla conformità e fornisce funzioni che è possibile utilizzare in preparazione per varie valutazioni sulla privacy e sulla conformità. L'utente è responsabile di ulteriori funzioni di sicurezza, crittografia e isolamento della rete. Vedere Considerazioni sulla sicurezza.
Servizi disponibili La maggior parte dei servizi fabric di dati sono disponibili in entrambi gli ambienti di distribuzione.
Consultare Servizi per Cloud Pak for Data as a Service.
Include molti altri servizi. Vedere i servizi.
Gestione utenti Si aggiungono utenti e gruppi di utenti e si gestiscono i ruoli e le autorizzazioni degli account con IBM Cloud Identity and Access Management. Vedi Aggiungi utenti all'account.
È possibile impostare la federazione SAML anche su IBM Cloud. Vedere i documenti IBM Cloud: Come funziona IBM Cloud IAM.
È possibile aggiungere utenti e creare gruppi di utenti dal menu Amministrazione . È possibile utilizzare Identity and Access Management Service o utilizzare il provider SAML SSO o LDAP esistente per la gestione di identità e password. È possibile creare gruppi di utenti dinamici basati su attributi. Vedere Gestione degli utenti.

Funzionalità principale comune tra i servizi

Le seguenti funzionalità di base fornite con la piattaforma sono di fatto le stesse per i servizi su Cloud Pak for Data as a Service, software Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:

  • Ricerca globale di asset e risorse utente nella piattaforma
  • Il Platform assets catalog per la condivisione delle connessioni nella piattaforma
  • Gestione degli utenti basata sui ruoli all'interno degli spazi di lavoro collaborativi della piattaforma
  • Infrastruttura comune per asset e spazi di lavoro
  • Un catalogo dei servizi per l'aggiunta di servizi
  • Visualizzare l'utilizzo del calcolo dal menu Amministrazione

La tabella seguente descrive le differenze tra le funzionalità principali dei servizi tra Cloud Pak for Data as a Service e le versioni 5.1, 5.0 e 4.8 del software Cloud Pak for Data.

Differenze nelle funzioni comuni tra i servizi
Funzione Come un servizio Software
Gestisci tutti i progetti Gli utenti con l'autorizzazione Gestione progetti dall'accesso al servizio IAM Manager per il servizio IBM Cloud Pak for Data possono unirsi a qualsiasi progetto con il ruolo Admin e quindi gestire o eliminare il progetto. Gli utenti con l'autorizzazione Gestisci progetti possono unirsi a qualsiasi progetto con il ruolo Admin e quindi gestire o eliminare il progetto.
Connessioni alle origini dati remote La maggior parte delle origini dati supportate sono comuni a entrambi gli ambienti di distribuzione.
Vedere Connettori.
Vedere Fonti di dati supportate.
Credenziali di connessione personali o condivise Le connessioni nei progetti e nei cataloghi possono richiedere credenziali personali o consentire credenziali condivise. Le credenziali condivise possono essere disabilitate a livello di account. Le connessioni della piattaforma possono richiedere credenziali personali o consentire credenziali condivise. Le credenziali condivise possono essere disabilitate a livello di piattaforma.
Credenziali di connessione da segreti in un vault Non disponibile Disponibile
Autenticazione Kerberos Non disponibile Disponibile per alcuni servizi e connessioni
Asset e progetti di esempio dall'app hub di risorse Disponibile Non disponibile
Connettore JDBC personalizzato Non disponibile Disponibile a partire da 4.8.0
Definizioni di origine dati Non disponibile Disponibile a partire da 5.0.
Consultare Data protection with data source definitions.

watsonx.ai Studio a confronto con Watson Studio

Le seguenti funzioni di watsonx.ai Studio su Cloud Pak for Data as a Service sono di fatto le stesse di Watson Studio sul software Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:

  • Collaborazione in progetti e spazi di distribuzione
  • Accesso programmatico agli asset del progetto
  • Importazione ed esportazione del progetto utilizzando un file ZIP del progetto
  • Notebook Jupyter
  • Pianificazione lavori
  • Data Refinery
  • Watson Natural Language Processing per Python
  • Conversazione con i modelli di fondazione su documenti e immagini

Questa tabella descrive le differenze di funzionalità tra il servizio watsonx.ai Studio nell'ambiente di distribuzione as-a-service e il servizio Watson Studio nell'ambiente di distribuzione software, le differenze tra i piani di offerta e l'eventuale necessità di servizi aggiuntivi. Per ulteriori informazioni sulle differenze tra i piani di offerta su Cloud Pak for Data as a Service, consultare i piani di offerta diwatsonx.ai Studio.

Differenze in watsonx.ai Studio
Funzione Come un servizio Software
Crea progetto Crea:
Un progetto vuoto
Un progetto da un esempio nell'hub risorse
Un progetto dal file
Crea:
Un progetto vuoto
Un progetto dal file
Un progetto con integrazione Git
Integrazione Git Pubblicare i notebook su GitHub
Pubblicare i notebook come gist
Integra un progetto con gli asset di sincronizzazione Git
nel repository in un progetto e utilizza tali asset in un altro progetto
Terminale di progetto per operazioni Git avanzate Non disponibile Disponibile nei progetti con integrazione Git predefinita
Organizzare gli asset in progetti con cartelle Non disponibile Disponibile a partire dalla versione 4.8.0
JupyterLab Non disponibile Disponibile nei progetti con integrazione Git
Integrazione di Visual Studio Code Non disponibile Disponibile nei progetti con integrazione Git
RStudio Impossibile eseguire l'integrazione con Git Può essere integrato con Git. Richiede un servizio RStudio Server Runtimes .
Script Python Non disponibile Utilizzare gli script Python in JupyterLab. Richiede un servizio runtime di Watson Studio .
Generare il codice per caricare i dati in un notebook utilizzando il Flight service Non disponibile Disponibile
Gestisci ciclo di vita notebook Non disponibile Utilizzare CPDCTL per la gestione del ciclo di vita del notebook
Risorse del pacchetto di codice (serie di file dipendenti in una struttura di cartelle) Non disponibile Utilizzare CPDCTL per creare asset di pacchetti di codice in uno spazio di distribuzione
Promuovi notebook a spazi Non disponibile Disponibile manualmente dalla pagina Asset del progetto o in modo programmatico utilizzando CPDCTL
Python con GPU Supporto disponibile solo per un singolo tipo GPU Supporto disponibile per più tipi di GPU Nvidia. Richiede un servizio runtime di Watson Studio .
Crea e utilizza immagini personalizzate Non disponibile Creare immagini personalizzate per gli ambienti Python (con e senza GPU), R, JupyterLab (con e senza GPU), RStudio e SPSS. Richiede un Watson Studio Runtimes e altri servizi applicabili.
Repository Anaconda Non disponibile Utilizzare per creare ambienti personalizzati e immagini personalizzate
Integrazione Hadoop Non disponibile Crea ed esegui il training dei modelli ed esegui i flussi Data Refinery su un cluster Hadoop . Richiede il servizio Execution Engine for Apache Hadoop .
Decision Optimization Disponibile Richiede il servizio Decision Optimization .
SPSS Modeler Disponibile Richiede il servizio SPSS Modeler .
Pipeline di orchestrazione Disponibile Richiede il servizio Orchestration Pipelines.

il tempo di esecuzione watsonx.ai rispetto a Watson Machine Learning

Le seguenti funzionalità di watsonx.ai Runtime su Cloud Pak for Data as a Service sono di fatto le stesse delle funzionalità di Watson Machine Learning su Cloud Pak for Data software, versioni 5.1, 5.0 e 4.8:

  • Collaborazione in progetti e spazi di distribuzione
  • Implementazione di modelli
  • Distribuisci funzioni
  • aPI REST di runtime watsonx.ai e API REST di Watson Machine Learning
  • client Python di watsonx.ai
  • Crea distribuzioni online
  • Ridimensiona e aggiorna le distribuzioni
  • Definire e utilizzare componenti personalizzati
  • Utilizzare l'apprendimento federato per formare un modello comune con origini dati separate e sicure
  • Monitorare le distribuzioni tra gli spazi
  • Moduli aggiornati per la verifica della distribuzione in linea
  • Utilizza pipeline nidificate
  • Assegnazione dati AutoAI
  • Valutazione della correttezza AutoAI
  • Funzioni di supporto delle serie temporali AutoAI

Questa tabella descrive le differenze di funzionalità tra il servizio watsonx.ai Runtime nell'ambiente di distribuzione as-a-service e il servizio Watson Machine Learning nell'ambiente di distribuzione software, le differenze tra i piani di offerta e l'eventuale necessità di servizi aggiuntivi. Per informazioni dettagliate sulle differenze di funzionalità tra i piani di offerta su Cloud Pak for Data as a Service, vedere i piani di offerta diwatsonx.ai Runtime.

Differenze di funzionalità tra le implementazioni di watsonx.ai Runtime
Funzione Come un servizio Software
Input di addestramento AutoAI origini dati supportate correnti Origini dati supportate modificate per release
Configurazione di calcolo dell'esperimento AutoAI Diverse dimensioni disponibili Diverse dimensioni disponibili
AutoAI limiti sulla dimensione dei dati
e numero di obiettivi di previsione
Imposta limiti I limiti differiscono per configurazione di elaborazione
Apprendimento incrementale AutoAI Non disponibile Disponibile
Distribuisci utilizzando i framework più diffusi
e specifiche software
Controllare le ultime versioni supportate Le versioni supportate differiscono per release
Connetti a database per distribuzioni batch Controllare supporto per tipo di distribuzione Verificare il supporto per tipo di distribuzione
e per versione
Distribuisci e calcola il punteggio degli script Python Disponibile tramite il client Python Crea script nel client JupyterLab o Python , quindi distribuisci
Distribuisci e calcola il punteggio in batch degli script R Non disponibile Disponibile
Distribuisci app Shiny Non disponibile Crea e distribuisci app Shiny
Distribuisci dal pacchetto di codice
Valutare la correttezza o la deviazione dei lavori Richiede il servizio watsonx.governance Richiede il servizio Watson OpenScale o watsonx.governance
Valutare le distribuzioni online in uno spazio
per la correttezza, la deviazione o l'esplicabilità
Non disponibile Disponibile
Richiede il servizio Watson OpenScale o watsonx.governance
Valuta i template di prompt distribuiti in uno spazio Disponibile
Valutare i modelli di prompt scollegati in uno spazio Non disponibile Disponibile a partire da 5.0
Creazione spazio di controllo Nessuna limitazione per ruolo Utilizzare le autorizzazioni per controllare chi può visualizzare e creare spazi
Importa da progetto GIT nello spazio Non disponibile Disponibile
Pacchetto di codice creato automaticamente durante l'importazione di
dal progetto Git nello spazio
Non disponibile Disponibile
Aggiorna app RShiny dal pacchetto di codice Non disponibile Disponibile
Crea e utilizza immagini personalizzate Non disponibile Creare immagini personalizzate per Python o SPSS
Notifica ai collaboratori gli eventi Pipeline Non disponibile Utilizzare Invia posta per notificare i collaboratori
Esperimenti di deep learning Non disponibile Richiede il servizio IBM Scheduler
Esegui il provisioning e gestisci le istanze di servizio IBM Cloud Aggiungere istanze per watsonx.ai Runtime
o Watson OpenScale
I servizi vengono forniti sul cluster
dall'amministratore

watsonx.governance

Le seguenti funzioni di governance sono di fatto le stesse su Cloud Pak for Data as a Service e Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:

  • Valutare le distribuzioni per la correttezza
  • Valutare la qualità delle distribuzioni
  • Monitorare le distribuzioni per la deviazione
  • Visualizzare e confrontare i risultati del modello in un pannello di controllo Insights
  • Aggiungi distribuzioni dal provider di machine learning di tua scelta
  • Imposta avvisi da attivare quando le valutazioni scendono al di sotto di una soglia specificata
  • Valutare le distribuzioni in un'interfaccia utente o in un notebook
  • Valutazioni e metriche personalizzate
  • Visualizza i dettagli sulle valutazioni nei factsheet del modello

Questa tabella descrive le differenze di funzionalità tra il servizio watsonx.governance negli ambienti di distribuzione as-a-service e software, le differenze tra i piani di offerta e l'eventuale necessità di servizi aggiuntivi.

Differenze di funzionalità trawatsonx.governance implementazioni
Funzione Come un servizio Software
Valutare i modelli di machine learning
Carica dati di test con pre - punteggio Non disponibile Disponibile
IBM SPSS Collaboration and Deployment Services Non disponibile Disponibile
Elaborazione batch Non disponibile Disponibile
Supporta il controllo accessi per gruppi di utenti Non disponibile Disponibile
Database gratuito e piani Postgres Disponibile Postgres disponibile a partire da 4.8

IBM Knowledge Catalog

Le seguenti caratteristiche sono effettivamente le stesse per IBM Knowledge Catalog on Cloud Pak for Data as a Service e sul software Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:

  • Collaborazione in progetti e cataloghi
  • Ricerca e raccomandazioni basate sull'intelligenza artificiale nei cataloghi
  • Valutazione e revisione degli asset nei cataloghi
  • Strumento Data Refinery nei progetti
  • Categorie con ruoli collaboratore
  • Classificazioni predefinite e personalizzate
  • Classi di dati predefinite e personalizzate
  • Regole di governance
  • Politiche
  • Regole di protezione dei dati
  • Regole SLA di qualità dei dati
  • Creazione di profili manuale di singoli asset di dati relazionali in un progetto o in un catalogo
  • Creazione di profili automatica degli asset di dati relazionali aggiunti a un catalogo gestito
  • Strumento di arricchimento dei metadati nei progetti per l'esecuzione di profilazione, assegnazione di termini, analisi della qualità e analisi delle chiavi o delle relazioni su grandi insiemi di dati
  • Tipi di asset personalizzati, proprietà personalizzate per gli asset e relazioni personalizzate tra gli asset nei cataloghi
  • Monitora attività del flusso di lavoro
  • Consegna di dataset mascherati in progetti con flussi di mascheramento
  • Informazioni dettagliate sulla qualità dei dati per gli asset di dati nei progetti e nei cataloghi e come parte dei risultati dell'arricchimento dei metadati
  • Flussi di lavoro di risoluzione per problemi di qualità dei dati
  • Creare asset di dati connessi e segmentati con query SQL
  • Eseguire il dashboard delle metriche e le finestre di esecuzione per i lavori di arricchimento dei metadati

Questa tabella descrive le differenze nelle funzioni tra il servizio IBM Knowledge Catalog negli ambienti di distribuzione del software e as - a - service, le differenze tra i piani di offerta e se sono richiesti ulteriori servizi. Per ulteriori informazioni sulle differenze tra le funzioni tra i piani dell'offerta su Cloud Pak for Data as a Service, consulta IBM Knowledge Catalog piani dell'offerta.

A partire dalla versione Cloud Pak for Data, è possibile installare il cartridge IBM Knowledge Catalog Premium o il cartridge IBM Knowledge Catalog Standard al posto del servizio IBM Knowledge Catalog. IBM Knowledge Catalog Premium offre le stesse funzionalità del servizio IBM Knowledge Catalog più le funzionalità di intelligenza artificiale generativa. IBM Knowledge Catalog Standard offre un sottoinsieme delle funzionalità di IBM Knowledge Catalog più le funzionalità di IA generativa.

Differenze nel IBM Knowledge Catalog
Funzione Come un servizio Software
Strumento Metadata import in progetti - rilevamento Importare gli asset di dati in progetti o cataloghi. Supporto per un sottoinsieme di connessioni di progetto e catalogo. Vedi Origini dati supportate per la cura e la qualità dei dati. Importare diversi tipi di asset:
importare gli asset di dati in progetti o cataloghi. La maggior parte delle connessioni supportate sono le stesse in entrambi gli ambienti di distribuzione.
Importare report di business intelligence, asset con i relativi script di trasformazione associati, lavori ETL o modelli di dati nei cataloghi. Richiede l'installazione di MANTA Automated Data Lineage senza chiave di licenza. Supporto per un sottoinsieme di connessioni di catalogo.
'
Vedere Sorgenti dati supportate per la cura e la qualità dei dati.
Strumento Metadata import nei progetti - derivazione Disponibile.
Il data lineage deve essere abilitato.
Limiti per piano.
- Importazione del lignaggio degli asset di dati nei cataloghi. Richiede l'installazione di IBM Manta Data Lineage o di MANTA Automated Data Lineage con una chiave di licenza.
- Acquisizione e accesso al lineage dei lavori ETL in MANTA Automated Data Lineage. Richiede l'installazione di MANTA Automated Data Lineage con una chiave di licenza.

Supporto per un sottoinsieme di connessioni di catalogo. Vedere Fonti di dati supportate per la cura e la qualità dei dati.
Arricchimento migliorato grazie all'IA generativa Disponibile, Non disponibile.
A partire da 5.0, installare IBM Knowledge Catalog Premium o IBM Knowledge Catalog Standard.
Regole di qualità dei dati nei progetti Disponibile
Richiede il servizio DataStage .
Disponibile.
Richiede il servizio DataStage .
Aggiungere più asset a un catalogo con un file Non disponibile. Disponibile,
Attività degli asset Richiede un piano a pagamento.
Disponibile in progetti e cataloghi.
Disponibile in progetti e cataloghi.
Derivazione business Non disponibile Disponibile,
Derivazione dei dati tecnici Non disponibile. Disponibile.
Richiede che sia installata una versione con licenza di MANTA Automated Data Lineage for IBM Cloud Pak for Data. Generato dall'esecuzione dello strumento di importazione metadati. È possibile accedervi dai cataloghi.
Derivazione dati Richiede l'abilitazione. Non disponibile.
Termini di business Limiti per alcuni piani. Disponibile,
Termini aziendali predefiniti I termini aziendali predefiniti e la categoria Knowledge Accelerator Sample Personal Data che li include sono disponibili solo se si crea un'istanza del servizio IBM Knowledge Catalog con un piano Lite o Standard dopo il 7 ottobre 2022. Non disponibile.
Dataset di riferimento Limiti per piano. Disponibile,
Relazioni personalizzate per gli artefatti Richiede un piano a pagamento. Disponibile,
Knowledge Accelerators Richiede un piano Enterprise
da Resource hub.
Fornito con la piattaforma.
Configurazioni personalizzate dei flussi di lavoro per gli artefatti e le richieste di governance Disponibile per gli artefatti di governance. Disponibile,
Ruoli di categoria personalizzati Limiti per piano. Disponibile,
Regole di protezione dei dati di esportazione e importazione Per esportare le regole di protezione dei dati da qualsiasi sistema e importarle nello stesso sistema o in un sistema diverso, è possibile utilizzare le API. Per i dettagli, vedere Migrazione delle regole di protezione dei dati. Per esportare le regole di protezione dei dati da qualsiasi sistema e importarle nello stesso sistema o in un sistema diverso, è possibile utilizzare le API o i comandi cpd-cli. Per i dettagli, vedere Migrazione delle regole di protezione dei dati.
Report amministrativi Richiede un piano a pagamento. Disponibile,
Migrare i dati da InfoSphere Information Server Non disponibile. Disponibile,
Esplora relazione Non disponibile. Disponibile a partire da 5.0.
Richiede l'installazione del componente opzionale Knowledge Graph con IBM Knowledge Catalog.

DataStage

La tabella seguente descrive le differenze tra le funzioni di DataStage on Cloud Pak for Data as a Service e quelle di DataStage on Cloud Pak for Data, versioni 5.1, 5.0 e 4.8.

Differenze in DataStage
Funzione Come un servizio Software
Gestione istanza PX Puoi eseguire il provisioning delle istanze da un insieme di dimensione predefinite. È possibile eseguire il provisioning delle istanze in modo più flessibile utilizzando l'amministrazione dell'istanza Cloud Pak for Data .
Compilazione job
  • OSH viene generato durante la compilazione.
  • Transformer viene compilato al runtime.
  • OSH viene generato durante la compilazione.
  • Transformer viene compilato durante il tempo di compilazione e reso disponibile per il montaggio /ds-storage .
  • La compilazione viene eseguita in modo sincrono.
Runtime del job È possibile inoltrare tutti i lavori desiderati, in base alla coda.
  • Sono supportate le esecuzioni di lavori simultanei.
  • La simultaneità è determinata dalla capacità dell'istanza e dalle impostazioni nel file /px-storage/config/wlm.config.xml .
Gestione degli asset Per i file di tipo .xls, .xlsx, .xml e .json, sono supportate solo strutture semplici. Gli schemi multilivello / nidificati non possono essere analizzati. È disponibile il supporto completo dei file di tipo .csv, .txt, .xls, .xlsx, .xml e .json.
Archiviazione
  • La memoria reale basata su file POSIXnon è disponibile.
  • L'archiviazione viene emulata dall'utilizzo di un bucket di progetti Cloud Object Storage .
Stage Java Integration Disponibile conDataStage-aaS Ovunque Disponibile
Componente libreria Java Disponibile conDataStage-aaS Ovunque Disponibile
Connessione JDBC generica Disponibile conDataStage-aaS Ovunque Disponibile
Excel Disponibile conDataStage-aaS Ovunque Disponibile
AVI Disponibile conDataStage-aaS Ovunque Disponibile
Stage External Source Disponibile conDataStage-aaS Ovunque Disponibile
Stage External Target Disponibile conDataStage-aaS Ovunque Disponibile
Stage gerarchico
  • L'opzione File singolo o Serie di file per il parser XML e il parser JSON non è disponibile.
  • L'opzione File singolo, Serie di file e Oggetto di grandi dimensioni per Composer XML e Composer JSON non è disponibile.
Disponibile
SMP S, M, L sono nodi singoli, configurazione SMP. Utilizzare un motore di runtime remoto per impostare una configurazione alternativa. I carichi di lavoro paralleli vengono gestiti mediante partizioni logiche, configurate con l'opzione APT_CONFIG_FILE.
Connessione SAP Bulk Extract Non disponibile Disponibile
Connessione SAP Delta Extract Non disponibile Disponibile
Fase in wrapping Disponibile conDataStage-aaS Ovunque Disponibile
Connessione SAP HANA Non disponibile Disponibile
Origine dati di testo nella connessione ODBC Non disponibile Disponibile
Fase di creazione Disponibile conDataStage-aaS Ovunque Disponibile
Invia report utilizzando le sottoroutine prima / dopo il lavoro Disponibile conDataStage-aaS Ovunque Disponibile
Fase personalizzata Disponibile conDataStage-aaS Ovunque Disponibile
Connessione Apache HBase Disponibile conDataStage-aaS Ovunque Disponibile
L'autenticazione Kerberos per le connessioni Apache Hive Non disponibile Disponibile
Funzioni definite dall'utente Disponibile conDataStage-aaS Ovunque Disponibile
APT_CONFIG_FILE creati dall'utente Disponibile conDataStage-aaS Ovunque Disponibile
Proprietà prima / dopo il lavoro Disponibile conDataStage-aaS Ovunque Disponibile
Connettore servizio dati Non disponibile Disponibile
Sequenza di database Db2 nello stage Lentamente Changing Dimension, stage Surrogate Key Generator e stage Transformer Disponibile conDataStage-aaS Ovunque Disponibile
Utilizzare la connessione Apache Hive come destinazione. (Disponibile quando nel connettore è selezionato Utilizza proprietà DataStage .) Disponibile conDataStage-aaS Ovunque Disponibile
Parametrizza proprietà con connessioni locali Non disponibile Disponibile
Stage Operational Decision Manager Disponibile conDataStage-aaS Ovunque Disponibile
Spazi di distribuzione Non disponibile Disponibile

Data Virtualization

Su Cloud Pak for Data as a Service, la funzionalità di virtualizzazione dei dati è fornita dal servizio Data Virtualization. Le seguenti funzionalità di virtualizzazione dei dati sono effettivamente le stesse su Cloud Pak for Data as a Service e Cloud Pak for Data software, versioni 5.1, 5.0 e 4.8.

  • Connessione alle origini dati supportate
  • Virtualizzare i dati
  • Gestione dei dati virtuali mediante politiche e regole di protezione dei dati
  • Monitoraggio ed esplorazione del servizio
  • Utilizzo dell'interfaccia SQL
  • Memorizzazione nella cache
  • Mascheramento colonna
  • Esplorare la vista e ricaricare le tabelle
  • Campionamento dei dati nella raccolta delle statistiche
  • Arricchimento dei metadati

La seguente funzionalità Data virtualization sembra essere diversa nell'interfaccia utente ma fornisce la stessa funzionalità di base:

Questa tabella descrive le differenze di funzionalità tra Data Virtualization (ex Watson Query) su Cloud Pak for Data as a Service e Data Virtualization (ex Watson Query) su Cloud Pak for Data software.

Differenze nella Data Virtualization
Funzione Come un servizio Software
Utilizzare Cloud Pak for Data Data Source Definitions (DSD) per applicare le regole di protezione dei dati IBM Knowledge Catalog Non applicabile per SaaS Disponibile a partire da 5.0
Dati di query in origini dati API REST Non applicabile per SaaS Disponibile a partire da 5.0
Tabelle di query dai cataloghi Presto e Databricks precedenti con supporto per più cataloghi Non applicabile per SaaS Disponibile a partire da 5.0
Ridimensiona automaticamente le istanze del servizio Non applicabile per SaaS Disponibile a partire da 5.0
Maschera caratteri multibyte per la privacy avanzata dei dati sensibili Non applicabile per SaaS Disponibile a partire da 5.0
Visualizzare le norme di protezione dei dati applicate a un utente Non applicabile per SaaS Disponibile a partire da 5.0
Sicurezza avanzata per i risultati di creazione profili nelle viste Data Virtualization Non applicabile per SaaS Disponibile a partire da 5.0
Le connessioni Data Virtualization nei cataloghi ora fanno riferimento alla connessione della piattaforma Non applicabile per SaaS Disponibile a partire da 5.0
Le connessioni Data Virtualization nei cataloghi ora fanno riferimento alla connessione della piattaforma Non applicabile per SaaS Disponibile a partire da 5.0
Sicurezza migliorata per il ruolo Admin: il ruolo Admin non dispone dell'accesso predefinito a tutti i dati. Non applicabile per SaaS Disponibile a partire da 4.8
Le regole di protezione dati di IBM Knowledge Catalog sono sempre abilitate per i dati Watson Query Non applicabile per SaaS Disponibile a partire da 4.8
Proteggere gli oggetti non governati: con le regole di protezione dei dati di IBM Knowledge Catalog in Watson Query, gli oggetti virtualizzati non pubblicati in un catalogo gestito seguono l'impostazione della convenzione di accesso ai dati predefinita dalle impostazioni della regola. Non applicabile per SaaS Disponibile a partire da 4.8
Query dei dati Presto : è possibile creare una connessione a Presto per accedere e interrogare i dati in Presto. Non applicabile per SaaS Disponibile a partire da 4.8
Registrazione di controllo per monitorare l'attività utente e l'accesso ai dati Disponibile Disponibile
Integrazione con IBM Knowledge Catalog Obbligatorio Facoltativo
Autorizzazione basata sui gruppi e accesso a livello di oggetto per i gruppi Non disponibile Disponibile
Supporto per connettori remoti Non applicabile per SaaS Disponibile
Supporto per origini dati basate su file system, tranne in Cloud Object Storage Non applicabile per SaaS Disponibile
Connessione alle origini dati che richiedono un driver JDBC caricato, ad esempio, SAP HANA, Generico JDBC Non applicabile per SaaS Disponibile
Raccolta delle statistiche nell'interfaccia utente Non disponibile Disponibile
Raccolta automatica delle statistiche durante la virtualizzazione degli oggetti Non disponibile Disponibile
Gestione degli accessi per più gruppi Non disponibile Disponibile
Supporto per file CSV o TSV in Cloud Object Storage Non applicabile per SaaS Disponibile
Credenziali nei vault per connessioni in Cloud Object Storage Non applicabile per SaaS Disponibile
Autocaching delle query Non disponibile Disponibile a partire dalla versione 5.0.3

Ulteriori informazioni

Argomento principale: Cloud Pak for Data as a Service