Cloud Pak for Data as a Service e Cloud Pak for Data hanno alcune differenze nelle funzionalità e nell'implementazione. Cloud Pak for Data as a Service è una serie di servizi IBM Cloud . Cloud Pak for Data 5.1 viene offerto come software da installare e mantenere su IBM Software Hub. I servizi che sono disponibili su entrambe le distribuzioni presentano anche delle differenze nelle caratteristiche su Cloud Pak for Data as a Service rispetto a Cloud Pak for Data 5.1, 5.0 e 4.8.
- Differenze di piattaforma
- Funzioni comuni nei servizi
- watsonx.ai Studio a confronto con Watson Studio
- il tempo di esecuzionewatsonx.ai rispetto a Watson Machine Learning
- watsonx.governance
- IBM Knowledge Catalog
- DataStage
- Data Virtualization
Differenze piattaforma
Cloud Pak for Data as a Service e il Software Cloud Pak for Data condividono una base di codice comune, tuttavia differiscono nei seguenti modi principali:
Funzioni | Come un servizio | Software |
---|---|---|
Software, hardware e installazione | Cloud Pak for Data as a Service è completamente gestito da IBM su IBM Cloud. Gli aggiornamenti software sono automatici. Il ridimensionamento delle risorse di elaborazione e dell'archiviazione è automatico. L'utente si iscrive a Try Cloud Pak for Data as a Service. | L'utente fornisce e gestisce l'hardware. Installare, gestire e aggiornare il software. Vedere Requisiti del software. |
Archiviazione | Si fornisce un'istanza del servizio IBM Cloud Object Storage per fornire l'archiviazione. Vedere IBM Cloud Object Storage. | Fornisci l'archiviazione persistente su un cluster Red Hat OpenShift . Vedere Requisiti di stoccaggio. |
Risorse di calcolo per carichi di lavoro in esecuzione | Gli utenti scelgono il runtime appropriato per i loro lavori. L'utilizzo del calcolo viene fatturato in base al tasso dell'ambiente di runtime e alla durata del job. Vedi Monitora l'utilizzo delle risorse dell'account. | Configuri il numero di nodi Red Hat OpenShift con il numero appropriato di vCPUs. Vedere Requisiti hardware e Monitoraggio della piattaforma. |
Costo | Si acquista ogni servizio di cui si ha bisogno al livello di piano appropriato. Molti servizi fatturano il consumo di risorse di elaborazione. Vedere ogni pagina di servizio nel catalogoIBM Cloud o nel catalogo dei servizi su Cloud Pak for Data as a Service, selezionando Servizi > Catalogo dei servizi dal menu di navigazione. | Si acquista una licenza software in base ai servizi necessari. Ad esempio, la licenza Cloud Pak for Data Enterprise Edition include il diritto a servizi quali watsonx.ai Studio e IBM Knowledge Catalog. Vedere Licenze e diritti. |
Sicurezza, conformità e isolamento | La sicurezza dei dati, la sicurezza della rete, la conformità degli standard di sicurezza e l'isolamento di Cloud Pak for Data as a Service sono gestiti da IBM Cloud. È possibile impostare ulteriori opzioni di sicurezza e crittografia. Vedi Sicurezza di Cloud Pak for Data as a Service. | Red Hat OpenShift Container Platform fornisce le funzioni di protezione di base. Cloud Pak for Data viene valutato per le varie normative sulla privacy e sulla conformità e fornisce funzioni che è possibile utilizzare in preparazione per varie valutazioni sulla privacy e sulla conformità. L'utente è responsabile di ulteriori funzioni di sicurezza, crittografia e isolamento della rete. Vedere Considerazioni sulla sicurezza. |
Servizi disponibili | La maggior parte dei servizi fabric di dati sono disponibili in entrambi gli ambienti di distribuzione. Consultare Servizi per Cloud Pak for Data as a Service. |
Include molti altri servizi. Vedere i servizi. |
Gestione utenti | Si aggiungono utenti e gruppi di utenti e si gestiscono i ruoli e le autorizzazioni degli account con IBM Cloud Identity and Access Management. Vedi Aggiungi utenti all'account. È possibile impostare la federazione SAML anche su IBM Cloud. Vedere i documenti IBM Cloud: Come funziona IBM Cloud IAM. |
È possibile aggiungere utenti e creare gruppi di utenti dal menu Amministrazione . È possibile utilizzare Identity and Access Management Service o utilizzare il provider SAML SSO o LDAP esistente per la gestione di identità e password. È possibile creare gruppi di utenti dinamici basati su attributi. Vedere Gestione degli utenti. |
Funzionalità principale comune tra i servizi
Le seguenti funzionalità di base fornite con la piattaforma sono di fatto le stesse per i servizi su Cloud Pak for Data as a Service, software Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:
- Ricerca globale di asset e risorse utente nella piattaforma
- Il Platform assets catalog per la condivisione delle connessioni nella piattaforma
- Gestione degli utenti basata sui ruoli all'interno degli spazi di lavoro collaborativi della piattaforma
- Infrastruttura comune per asset e spazi di lavoro
- Un catalogo dei servizi per l'aggiunta di servizi
- Visualizzare l'utilizzo del calcolo dal menu Amministrazione
La tabella seguente descrive le differenze tra le funzionalità principali dei servizi tra Cloud Pak for Data as a Service e le versioni 5.1, 5.0 e 4.8 del software Cloud Pak for Data.
Funzione | Come un servizio | Software |
---|---|---|
Gestisci tutti i progetti | Gli utenti con l'autorizzazione Gestione progetti dall'accesso al servizio IAM Manager per il servizio IBM Cloud Pak for Data possono unirsi a qualsiasi progetto con il ruolo Admin e quindi gestire o eliminare il progetto. | Gli utenti con l'autorizzazione Gestisci progetti possono unirsi a qualsiasi progetto con il ruolo Admin e quindi gestire o eliminare il progetto. |
Connessioni alle origini dati remote | La maggior parte delle origini dati supportate sono comuni a entrambi gli ambienti di distribuzione. Vedere Connettori. |
Vedere Fonti di dati supportate. |
Credenziali di connessione personali o condivise | Le connessioni nei progetti e nei cataloghi possono richiedere credenziali personali o consentire credenziali condivise. Le credenziali condivise possono essere disabilitate a livello di account. | Le connessioni della piattaforma possono richiedere credenziali personali o consentire credenziali condivise. Le credenziali condivise possono essere disabilitate a livello di piattaforma. |
Credenziali di connessione da segreti in un vault | Non disponibile | Disponibile |
Autenticazione Kerberos | Non disponibile | Disponibile per alcuni servizi e connessioni |
Asset e progetti di esempio dall'app hub di risorse | Disponibile | Non disponibile |
Connettore JDBC personalizzato | Non disponibile | Disponibile a partire da 4.8.0 |
Definizioni di origine dati | Non disponibile | Disponibile a partire da 5.0. Consultare Data protection with data source definitions. |
watsonx.ai Studio a confronto con Watson Studio
Le seguenti funzioni di watsonx.ai Studio su Cloud Pak for Data as a Service sono di fatto le stesse di Watson Studio sul software Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:
- Collaborazione in progetti e spazi di distribuzione
- Accesso programmatico agli asset del progetto
- Importazione ed esportazione del progetto utilizzando un file ZIP del progetto
- Notebook Jupyter
- Pianificazione lavori
- Data Refinery
- Watson Natural Language Processing per Python
- Conversazione con i modelli di fondazione su documenti e immagini
Questa tabella descrive le differenze di funzionalità tra il servizio watsonx.ai Studio nell'ambiente di distribuzione as-a-service e il servizio Watson Studio nell'ambiente di distribuzione software, le differenze tra i piani di offerta e l'eventuale necessità di servizi aggiuntivi. Per ulteriori informazioni sulle differenze tra i piani di offerta su Cloud Pak for Data as a Service, consultare i piani di offerta diwatsonx.ai Studio.
Funzione | Come un servizio | Software |
---|---|---|
Crea progetto | Crea: Un progetto vuoto Un progetto da un esempio nell'hub risorse Un progetto dal file |
Crea: Un progetto vuoto Un progetto dal file Un progetto con integrazione Git |
Integrazione Git | Pubblicare i notebook su GitHub Pubblicare i notebook come gist |
Integra un progetto con gli asset di sincronizzazione Git nel repository in un progetto e utilizza tali asset in un altro progetto |
Terminale di progetto per operazioni Git avanzate | Non disponibile | Disponibile nei progetti con integrazione Git predefinita |
Organizzare gli asset in progetti con cartelle | Non disponibile | Disponibile a partire dalla versione 4.8.0 |
JupyterLab | Non disponibile | Disponibile nei progetti con integrazione Git |
Integrazione di Visual Studio Code | Non disponibile | Disponibile nei progetti con integrazione Git |
RStudio | Impossibile eseguire l'integrazione con Git | Può essere integrato con Git. Richiede un servizio RStudio Server Runtimes . |
Script Python | Non disponibile | Utilizzare gli script Python in JupyterLab. Richiede un servizio runtime di Watson Studio . |
Generare il codice per caricare i dati in un notebook utilizzando il Flight service | Non disponibile | Disponibile |
Gestisci ciclo di vita notebook | Non disponibile | Utilizzare CPDCTL per la gestione del ciclo di vita del notebook |
Risorse del pacchetto di codice (serie di file dipendenti in una struttura di cartelle) | Non disponibile | Utilizzare CPDCTL per creare asset di pacchetti di codice in uno spazio di distribuzione |
Promuovi notebook a spazi | Non disponibile | Disponibile manualmente dalla pagina Asset del progetto o in modo programmatico utilizzando CPDCTL |
Python con GPU | Supporto disponibile solo per un singolo tipo GPU | Supporto disponibile per più tipi di GPU Nvidia. Richiede un servizio runtime di Watson Studio . |
Crea e utilizza immagini personalizzate | Non disponibile | Creare immagini personalizzate per gli ambienti Python (con e senza GPU), R, JupyterLab (con e senza GPU), RStudio e SPSS. Richiede un Watson Studio Runtimes e altri servizi applicabili. |
Repository Anaconda | Non disponibile | Utilizzare per creare ambienti personalizzati e immagini personalizzate |
Integrazione Hadoop | Non disponibile | Crea ed esegui il training dei modelli ed esegui i flussi Data Refinery su un cluster Hadoop . Richiede il servizio Execution Engine for Apache Hadoop . |
Decision Optimization | Disponibile | Richiede il servizio Decision Optimization . |
SPSS Modeler | Disponibile | Richiede il servizio SPSS Modeler . |
Pipeline di orchestrazione | Disponibile | Richiede il servizio Orchestration Pipelines. |
il tempo di esecuzione watsonx.ai rispetto a Watson Machine Learning
Le seguenti funzionalità di watsonx.ai Runtime su Cloud Pak for Data as a Service sono di fatto le stesse delle funzionalità di Watson Machine Learning su Cloud Pak for Data software, versioni 5.1, 5.0 e 4.8:
- Collaborazione in progetti e spazi di distribuzione
- Implementazione di modelli
- Distribuisci funzioni
- aPI REST di runtime watsonx.ai e API REST di Watson Machine Learning
- client Python di watsonx.ai
- Crea distribuzioni online
- Ridimensiona e aggiorna le distribuzioni
- Definire e utilizzare componenti personalizzati
- Utilizzare l'apprendimento federato per formare un modello comune con origini dati separate e sicure
- Monitorare le distribuzioni tra gli spazi
- Moduli aggiornati per la verifica della distribuzione in linea
- Utilizza pipeline nidificate
- Assegnazione dati AutoAI
- Valutazione della correttezza AutoAI
- Funzioni di supporto delle serie temporali AutoAI
Questa tabella descrive le differenze di funzionalità tra il servizio watsonx.ai Runtime nell'ambiente di distribuzione as-a-service e il servizio Watson Machine Learning nell'ambiente di distribuzione software, le differenze tra i piani di offerta e l'eventuale necessità di servizi aggiuntivi. Per informazioni dettagliate sulle differenze di funzionalità tra i piani di offerta su Cloud Pak for Data as a Service, vedere i piani di offerta diwatsonx.ai Runtime.
Funzione | Come un servizio | Software |
---|---|---|
Input di addestramento AutoAI | origini dati supportate correnti | Origini dati supportate modificate per release |
Configurazione di calcolo dell'esperimento AutoAI | Diverse dimensioni disponibili | Diverse dimensioni disponibili |
AutoAI limiti sulla dimensione dei dati e numero di obiettivi di previsione |
Imposta limiti | I limiti differiscono per configurazione di elaborazione |
Apprendimento incrementale AutoAI | Non disponibile | Disponibile |
Distribuisci utilizzando i framework più diffusi e specifiche software |
Controllare le ultime versioni supportate | Le versioni supportate differiscono per release |
Connetti a database per distribuzioni batch | Controllare supporto per tipo di distribuzione | Verificare il supporto per tipo di distribuzione e per versione |
Distribuisci e calcola il punteggio degli script Python | Disponibile tramite il client Python | Crea script nel client JupyterLab o Python , quindi distribuisci |
Distribuisci e calcola il punteggio in batch degli script R | Non disponibile | Disponibile |
Distribuisci app Shiny | Non disponibile | Crea e distribuisci app Shiny Distribuisci dal pacchetto di codice |
Valutare la correttezza o la deviazione dei lavori | Richiede il servizio watsonx.governance | Richiede il servizio Watson OpenScale o watsonx.governance |
Valutare le distribuzioni online in uno spazio per la correttezza, la deviazione o l'esplicabilità |
Non disponibile | Disponibile Richiede il servizio Watson OpenScale o watsonx.governance |
Valuta i template di prompt distribuiti in uno spazio | Disponibile | |
Valutare i modelli di prompt scollegati in uno spazio | Non disponibile | Disponibile a partire da 5.0 |
Creazione spazio di controllo | Nessuna limitazione per ruolo | Utilizzare le autorizzazioni per controllare chi può visualizzare e creare spazi |
Importa da progetto GIT nello spazio | Non disponibile | Disponibile |
Pacchetto di codice creato automaticamente durante l'importazione di dal progetto Git nello spazio |
Non disponibile | Disponibile |
Aggiorna app RShiny dal pacchetto di codice | Non disponibile | Disponibile |
Crea e utilizza immagini personalizzate | Non disponibile | Creare immagini personalizzate per Python o SPSS |
Notifica ai collaboratori gli eventi Pipeline | Non disponibile | Utilizzare Invia posta per notificare i collaboratori |
Esperimenti di deep learning | Non disponibile | Richiede il servizio IBM Scheduler |
Esegui il provisioning e gestisci le istanze di servizio IBM Cloud | Aggiungere istanze per watsonx.ai Runtime o Watson OpenScale |
I servizi vengono forniti sul cluster dall'amministratore |
watsonx.governance
Le seguenti funzioni di governance sono di fatto le stesse su Cloud Pak for Data as a Service e Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:
- Valutare le distribuzioni per la correttezza
- Valutare la qualità delle distribuzioni
- Monitorare le distribuzioni per la deviazione
- Visualizzare e confrontare i risultati del modello in un pannello di controllo Insights
- Aggiungi distribuzioni dal provider di machine learning di tua scelta
- Imposta avvisi da attivare quando le valutazioni scendono al di sotto di una soglia specificata
- Valutare le distribuzioni in un'interfaccia utente o in un notebook
- Valutazioni e metriche personalizzate
- Visualizza i dettagli sulle valutazioni nei factsheet del modello
Questa tabella descrive le differenze di funzionalità tra il servizio watsonx.governance negli ambienti di distribuzione as-a-service e software, le differenze tra i piani di offerta e l'eventuale necessità di servizi aggiuntivi.
Funzione | Come un servizio | Software |
---|---|---|
Valutare i modelli di machine learning | Sì | Sì |
Carica dati di test con pre - punteggio | Non disponibile | Disponibile |
IBM SPSS Collaboration and Deployment Services | Non disponibile | Disponibile |
Elaborazione batch | Non disponibile | Disponibile |
Supporta il controllo accessi per gruppi di utenti | Non disponibile | Disponibile |
Database gratuito e piani Postgres | Disponibile | Postgres disponibile a partire da 4.8 |
IBM Knowledge Catalog
Le seguenti caratteristiche sono effettivamente le stesse per IBM Knowledge Catalog on Cloud Pak for Data as a Service e sul software Cloud Pak for Data, versioni 5.1, 5.0 e 4.8:
- Collaborazione in progetti e cataloghi
- Ricerca e raccomandazioni basate sull'intelligenza artificiale nei cataloghi
- Valutazione e revisione degli asset nei cataloghi
- Strumento Data Refinery nei progetti
- Categorie con ruoli collaboratore
- Classificazioni predefinite e personalizzate
- Classi di dati predefinite e personalizzate
- Regole di governance
- Politiche
- Regole di protezione dei dati
- Regole SLA di qualità dei dati
- Creazione di profili manuale di singoli asset di dati relazionali in un progetto o in un catalogo
- Creazione di profili automatica degli asset di dati relazionali aggiunti a un catalogo gestito
- Strumento di arricchimento dei metadati nei progetti per l'esecuzione di profilazione, assegnazione di termini, analisi della qualità e analisi delle chiavi o delle relazioni su grandi insiemi di dati
- Tipi di asset personalizzati, proprietà personalizzate per gli asset e relazioni personalizzate tra gli asset nei cataloghi
- Monitora attività del flusso di lavoro
- Consegna di dataset mascherati in progetti con flussi di mascheramento
- Informazioni dettagliate sulla qualità dei dati per gli asset di dati nei progetti e nei cataloghi e come parte dei risultati dell'arricchimento dei metadati
- Flussi di lavoro di risoluzione per problemi di qualità dei dati
- Creare asset di dati connessi e segmentati con query SQL
- Eseguire il dashboard delle metriche e le finestre di esecuzione per i lavori di arricchimento dei metadati
Questa tabella descrive le differenze nelle funzioni tra il servizio IBM Knowledge Catalog negli ambienti di distribuzione del software e as - a - service, le differenze tra i piani di offerta e se sono richiesti ulteriori servizi. Per ulteriori informazioni sulle differenze tra le funzioni tra i piani dell'offerta su Cloud Pak for Data as a Service, consulta IBM Knowledge Catalog piani dell'offerta.
A partire dalla versione Cloud Pak for Data, è possibile installare il cartridge IBM Knowledge Catalog Premium o il cartridge IBM Knowledge Catalog Standard al posto del servizio IBM Knowledge Catalog. IBM Knowledge Catalog Premium offre le stesse funzionalità del servizio IBM Knowledge Catalog più le funzionalità di intelligenza artificiale generativa. IBM Knowledge Catalog Standard offre un sottoinsieme delle funzionalità di IBM Knowledge Catalog più le funzionalità di IA generativa.
Funzione | Come un servizio | Software |
---|---|---|
Strumento Metadata import in progetti - rilevamento | Importare gli asset di dati in progetti o cataloghi. Supporto per un sottoinsieme di connessioni di progetto e catalogo. Vedi Origini dati supportate per la cura e la qualità dei dati. | Importare diversi tipi di asset: importare gli asset di dati in progetti o cataloghi. La maggior parte delle connessioni supportate sono le stesse in entrambi gli ambienti di distribuzione. Importare report di business intelligence, asset con i relativi script di trasformazione associati, lavori ETL o modelli di dati nei cataloghi. Richiede l'installazione di MANTA Automated Data Lineage senza chiave di licenza. Supporto per un sottoinsieme di connessioni di catalogo. ' Vedere Sorgenti dati supportate per la cura e la qualità dei dati. |
Strumento Metadata import nei progetti - derivazione | Disponibile. Il data lineage deve essere abilitato. Limiti per piano. |
- Importazione del lignaggio degli asset di dati nei cataloghi. Richiede l'installazione di IBM Manta Data Lineage o di MANTA Automated Data Lineage con una chiave di licenza. - Acquisizione e accesso al lineage dei lavori ETL in MANTA Automated Data Lineage. Richiede l'installazione di MANTA Automated Data Lineage con una chiave di licenza. Supporto per un sottoinsieme di connessioni di catalogo. Vedere Fonti di dati supportate per la cura e la qualità dei dati. |
Arricchimento migliorato grazie all'IA generativa | Disponibile, | Non disponibile. A partire da 5.0, installare IBM Knowledge Catalog Premium o IBM Knowledge Catalog Standard. |
Regole di qualità dei dati nei progetti | Disponibile Richiede il servizio DataStage . |
Disponibile. Richiede il servizio DataStage . |
Aggiungere più asset a un catalogo con un file | Non disponibile. | Disponibile, |
Attività degli asset | Richiede un piano a pagamento. Disponibile in progetti e cataloghi. |
Disponibile in progetti e cataloghi. |
Derivazione business | Non disponibile | Disponibile, |
Derivazione dei dati tecnici | Non disponibile. | Disponibile. Richiede che sia installata una versione con licenza di MANTA Automated Data Lineage for IBM Cloud Pak for Data. Generato dall'esecuzione dello strumento di importazione metadati. È possibile accedervi dai cataloghi. |
Derivazione dati | Richiede l'abilitazione. | Non disponibile. |
Termini di business | Limiti per alcuni piani. | Disponibile, |
Termini aziendali predefiniti | I termini aziendali predefiniti e la categoria Knowledge Accelerator Sample Personal Data che li include sono disponibili solo se si crea un'istanza del servizio IBM Knowledge Catalog con un piano Lite o Standard dopo il 7 ottobre 2022. | Non disponibile. |
Dataset di riferimento | Limiti per piano. | Disponibile, |
Relazioni personalizzate per gli artefatti | Richiede un piano a pagamento. | Disponibile, |
Knowledge Accelerators | Richiede un piano Enterprise da Resource hub. |
Fornito con la piattaforma. |
Configurazioni personalizzate dei flussi di lavoro per gli artefatti e le richieste di governance | Disponibile per gli artefatti di governance. | Disponibile, |
Ruoli di categoria personalizzati | Limiti per piano. | Disponibile, |
Regole di protezione dei dati di esportazione e importazione | Per esportare le regole di protezione dei dati da qualsiasi sistema e importarle nello stesso sistema o in un sistema diverso, è possibile utilizzare le API. Per i dettagli, vedere Migrazione delle regole di protezione dei dati. | Per esportare le regole di protezione dei dati da qualsiasi sistema e importarle nello stesso sistema o in un sistema diverso, è possibile utilizzare le API o i comandi cpd-cli. Per i dettagli, vedere Migrazione delle regole di protezione dei dati. |
Report amministrativi | Richiede un piano a pagamento. | Disponibile, |
Migrare i dati da InfoSphere Information Server | Non disponibile. | Disponibile, |
Esplora relazione | Non disponibile. | Disponibile a partire da 5.0. Richiede l'installazione del componente opzionale Knowledge Graph con IBM Knowledge Catalog. |
DataStage
La tabella seguente descrive le differenze tra le funzioni di DataStage on Cloud Pak for Data as a Service e quelle di DataStage on Cloud Pak for Data, versioni 5.1, 5.0 e 4.8.
Funzione | Come un servizio | Software |
---|---|---|
Gestione istanza PX | Puoi eseguire il provisioning delle istanze da un insieme di dimensione predefinite. | È possibile eseguire il provisioning delle istanze in modo più flessibile utilizzando l'amministrazione dell'istanza Cloud Pak for Data . |
Compilazione job |
|
|
Runtime del job | È possibile inoltrare tutti i lavori desiderati, in base alla coda. |
|
Gestione degli asset | Per i file di tipo .xls, .xlsx, .xml e .json, sono supportate solo strutture semplici. Gli schemi multilivello / nidificati non possono essere analizzati. | È disponibile il supporto completo dei file di tipo .csv, .txt, .xls, .xlsx, .xml e .json. |
Archiviazione |
|
|
Stage Java Integration | Disponibile conDataStage-aaS Ovunque | Disponibile |
Componente libreria Java | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connessione JDBC generica | Disponibile conDataStage-aaS Ovunque | Disponibile |
Excel | Disponibile conDataStage-aaS Ovunque | Disponibile |
AVI | Disponibile conDataStage-aaS Ovunque | Disponibile |
Stage External Source | Disponibile conDataStage-aaS Ovunque | Disponibile |
Stage External Target | Disponibile conDataStage-aaS Ovunque | Disponibile |
Stage gerarchico |
|
Disponibile |
SMP | S, M, L sono nodi singoli, configurazione SMP. Utilizzare un motore di runtime remoto per impostare una configurazione alternativa. | I carichi di lavoro paralleli vengono gestiti mediante partizioni logiche, configurate con l'opzione APT_CONFIG_FILE. |
Connessione SAP Bulk Extract | Non disponibile | Disponibile |
Connessione SAP Delta Extract | Non disponibile | Disponibile |
Fase in wrapping | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connessione SAP HANA | Non disponibile | Disponibile |
Origine dati di testo nella connessione ODBC | Non disponibile | Disponibile |
Fase di creazione | Disponibile conDataStage-aaS Ovunque | Disponibile |
Invia report utilizzando le sottoroutine prima / dopo il lavoro | Disponibile conDataStage-aaS Ovunque | Disponibile |
Fase personalizzata | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connessione Apache HBase | Disponibile conDataStage-aaS Ovunque | Disponibile |
L'autenticazione Kerberos per le connessioni Apache Hive | Non disponibile | Disponibile |
Funzioni definite dall'utente | Disponibile conDataStage-aaS Ovunque | Disponibile |
APT_CONFIG_FILE creati dall'utente | Disponibile conDataStage-aaS Ovunque | Disponibile |
Proprietà prima / dopo il lavoro | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connettore servizio dati | Non disponibile | Disponibile |
Sequenza di database Db2 nello stage Lentamente Changing Dimension, stage Surrogate Key Generator e stage Transformer | Disponibile conDataStage-aaS Ovunque | Disponibile |
Utilizzare la connessione Apache Hive come destinazione. (Disponibile quando nel connettore è selezionato Utilizza proprietà DataStage .) | Disponibile conDataStage-aaS Ovunque | Disponibile |
Parametrizza proprietà con connessioni locali | Non disponibile | Disponibile |
Stage Operational Decision Manager | Disponibile conDataStage-aaS Ovunque | Disponibile |
Spazi di distribuzione | Non disponibile | Disponibile |
Data Virtualization
Su Cloud Pak for Data as a Service, la funzionalità di virtualizzazione dei dati è fornita dal servizio Data Virtualization. Le seguenti funzionalità di virtualizzazione dei dati sono effettivamente le stesse su Cloud Pak for Data as a Service e Cloud Pak for Data software, versioni 5.1, 5.0 e 4.8.
- Connessione alle origini dati supportate
- Virtualizzare i dati
- Gestione dei dati virtuali mediante politiche e regole di protezione dei dati
- Monitoraggio ed esplorazione del servizio
- Utilizzo dell'interfaccia SQL
- Memorizzazione nella cache
- Mascheramento colonna
- Esplorare la vista e ricaricare le tabelle
- Campionamento dei dati nella raccolta delle statistiche
- Arricchimento dei metadati
La seguente funzionalità Data virtualization sembra essere diversa nell'interfaccia utente ma fornisce la stessa funzionalità di base:
- Pubblicazione di dati virtuali nei catalogo
- Gestione dell'accesso agli oggetti virtuali
- Gestione di utenti e ruoli
- Ridimensionamento del servizio
- Raccolta di statistiche nel client web in Data Virtualization
Questa tabella descrive le differenze di funzionalità tra Data Virtualization (ex Watson Query) su Cloud Pak for Data as a Service e Data Virtualization (ex Watson Query) su Cloud Pak for Data software.
Funzione | Come un servizio | Software |
---|---|---|
Utilizzare Cloud Pak for Data Data Source Definitions (DSD) per applicare le regole di protezione dei dati IBM Knowledge Catalog | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Dati di query in origini dati API REST | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Tabelle di query dai cataloghi Presto e Databricks precedenti con supporto per più cataloghi | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Ridimensiona automaticamente le istanze del servizio | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Maschera caratteri multibyte per la privacy avanzata dei dati sensibili | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Visualizzare le norme di protezione dei dati applicate a un utente | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Sicurezza avanzata per i risultati di creazione profili nelle viste Data Virtualization | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Le connessioni Data Virtualization nei cataloghi ora fanno riferimento alla connessione della piattaforma | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Le connessioni Data Virtualization nei cataloghi ora fanno riferimento alla connessione della piattaforma | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Sicurezza migliorata per il ruolo Admin: il ruolo Admin non dispone dell'accesso predefinito a tutti i dati. | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Le regole di protezione dati di IBM Knowledge Catalog sono sempre abilitate per i dati Watson Query | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Proteggere gli oggetti non governati: con le regole di protezione dei dati di IBM Knowledge Catalog in Watson Query, gli oggetti virtualizzati non pubblicati in un catalogo gestito seguono l'impostazione della convenzione di accesso ai dati predefinita dalle impostazioni della regola. | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Query dei dati Presto : è possibile creare una connessione a Presto per accedere e interrogare i dati in Presto. | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Registrazione di controllo per monitorare l'attività utente e l'accesso ai dati | Disponibile | Disponibile |
Integrazione con IBM Knowledge Catalog | Obbligatorio | Facoltativo |
Autorizzazione basata sui gruppi e accesso a livello di oggetto per i gruppi | Non disponibile | Disponibile |
Supporto per connettori remoti | Non applicabile per SaaS | Disponibile |
Supporto per origini dati basate su file system, tranne in Cloud Object Storage | Non applicabile per SaaS | Disponibile |
Connessione alle origini dati che richiedono un driver JDBC caricato, ad esempio, SAP HANA, Generico JDBC | Non applicabile per SaaS | Disponibile |
Raccolta delle statistiche nell'interfaccia utente | Non disponibile | Disponibile |
Raccolta automatica delle statistiche durante la virtualizzazione degli oggetti | Non disponibile | Disponibile |
Gestione degli accessi per più gruppi | Non disponibile | Disponibile |
Supporto per file CSV o TSV in Cloud Object Storage | Non applicabile per SaaS | Disponibile |
Credenziali nei vault per connessioni in Cloud Object Storage | Non applicabile per SaaS | Disponibile |
Autocaching delle query | Non disponibile | Disponibile a partire dalla versione 5.0.3 |
Ulteriori informazioni
- Servizi per Cloud Pak for Data as a Service
- Servizi per IBM Software Hub 5.1
- Opzioni dell'ambiente di distribuzione cloud per https://www.ibm.com/docs/SSNFH6_5.1.x 5.1
Argomento principale: Cloud Pak for Data as a Service