Differenze di funzioni tra le distribuzioni Cloud Pak for Data
Cloud Pak for Data as a Service e Cloud Pak for Data hanno alcune differenze nelle funzionalità e nell'implementazione. Cloud Pak for Data as a Service è una serie di servizi IBM Cloud . Cloud Pak for Data 5.0 viene offerto come software che devi installare e gestire. I servizi disponibili su entrambe le distribuzioni hanno anche differenze nelle funzioni su Cloud Pak for Data as a Service rispetto a Cloud Pak for Data 5.0, 4.8e 4.7.
- Differenze di piattaforma
- Funzioni comuni nei servizi
- Watson Studio
- Watson Machine Learning
- watsonx.governance
- IBM Knowledge Catalog
- DataStage
- Watson OpenScale
- Watson Query
Differenze piattaforma
Cloud Pak for Data as a Service e il Software Cloud Pak for Data condividono una base di codice comune, tuttavia differiscono nei seguenti modi principali:
Funzioni | Come un servizio | Software |
---|---|---|
Software, hardware e installazione | Cloud Pak for Data as a Service è completamente gestito da IBM su IBM Cloud. Gli aggiornamenti software sono automatici. Il ridimensionamento delle risorse di elaborazione e dell'archiviazione è automatico. Ti iscrivi ahttps://dataplatform.cloud.ibm.com . | L'utente fornisce e gestisce l'hardware. Installare, gestire e aggiornare il software. Vedere Requisiti software . |
Archiviazione | Si fornisce un'istanza del servizio IBM Cloud Object Storage per fornire l'archiviazione. Vedere IBM Cloud Object Storage. | Fornisci l'archiviazione persistente su un cluster Red Hat OpenShift . Vedere Requisiti di archiviazione . |
Risorse di calcolo per carichi di lavoro in esecuzione | Gli utenti scelgono il runtime appropriato per i loro lavori. L'utilizzo del calcolo viene fatturato in base al tasso dell'ambiente di runtime e alla durata del job. Vedi Monitora l'utilizzo delle risorse dell'account. | Configuri il numero di nodi Red Hat OpenShift con il numero appropriato di vCPUs. Vedere Requisiti hardware E Monitoraggio della piattaforma . |
Costo | Si acquista ogni servizio di cui si ha bisogno al livello di piano appropriato. Molti servizi fatturano il consumo di risorse di elaborazione. Consulta la pagina di ogni servizio nellaIBM Cloud Catalogare o nel catalogo dei servizi suCloud Pak for Data as a Service , selezionando Servizi > Catalogo servizi dal menu di navigazione. | Si acquista una licenza software in base ai servizi necessari. Ad esempio, la licenza di Cloud Pak for Data Enterprise Edition include la titolarità a servizi come Watson Studio o IBM Knowledge Catalog. VedereCloud Pak for Data . |
Sicurezza, conformità e isolamento | La sicurezza dei dati, la sicurezza della rete, la conformità degli standard di sicurezza e l'isolamento di Cloud Pak for Data as a Service sono gestiti da IBM Cloud. È possibile impostare ulteriori opzioni di sicurezza e crittografia. Vedi Sicurezza di Cloud Pak for Data as a Service. | Red Hat OpenShift Container Platform fornisce le funzioni di protezione di base. Cloud Pak for Data viene valutato per le varie normative sulla privacy e sulla conformità e fornisce funzioni che è possibile utilizzare in preparazione per varie valutazioni sulla privacy e sulla conformità. L'utente è responsabile di ulteriori funzioni di sicurezza, crittografia e isolamento della rete. Vedere Considerazioni sulla sicurezza . |
Servizi disponibili | La maggior parte dei servizi fabric di dati sono disponibili in entrambi gli ambienti di distribuzione. Consultare Servizi per Cloud Pak for Data as a Service. |
Include molti altri servizi. Vedi Servizi per Cloud Pak for Data 5.0. |
Gestione utenti | Si aggiungono utenti e gruppi di utenti e si gestiscono i ruoli e le autorizzazioni degli account con IBM Cloud Identity and Access Management. Vedi Aggiungi utenti all'account. È possibile impostare la federazione SAML anche su IBM Cloud. Vedere i documenti IBM Cloud: Come funziona IBM Cloud IAM. |
È possibile aggiungere utenti e creare gruppi di utenti dal menu Amministrazione . È possibile utilizzare Identity and Access Management Service o utilizzare il provider SAML SSO o LDAP esistente per la gestione di identità e password. È possibile creare gruppi di utenti dinamici basati su attributi. Vedere Gestione utenti . |
Funzionalità principale comune tra i servizi
La seguente funzionalità principale fornita con la piattaforma è effettivamente la stessa per i servizi su Cloud Pak for Data as a Service, software Cloud Pak for Data , versioni 5.0, 4.8e 4.7:
- Ricerca globale di asset e risorse utente nella piattaforma
- Il Platform assets catalog per la condivisione delle connessioni nella piattaforma
- Gestione degli utenti basata sui ruoli all'interno degli spazi di lavoro collaborativi della piattaforma
- Infrastruttura comune per asset e spazi di lavoro
- Un catalogo dei servizi per l'aggiunta di servizi
- Visualizzare l'utilizzo del calcolo dal menu Amministrazione
La seguente tabella descrive le differenze nelle funzionalità principali tra i servizi tra Cloud Pak for Data as a Service e Cloud Pak for Data versioni software 5.0, 4.8e 4.7.
Funzione | Come un servizio | Software |
---|---|---|
Gestisci tutti i progetti | Gli utenti con l'autorizzazione Gestione progetti dall'accesso al servizio IAM Manager per il servizio IBM Cloud Pak for Data possono unirsi a qualsiasi progetto con il ruolo Admin e quindi gestire o eliminare il progetto. | Gli utenti con l'autorizzazione Gestisci progetti possono unirsi a qualsiasi progetto con il ruolo Admin e quindi gestire o eliminare il progetto. |
Connessioni alle origini dati remote | La maggior parte delle origini dati supportate sono comuni a entrambi gli ambienti di distribuzione. Consultare Connessioni supportate. |
Vedere Origini dati supportate . |
Credenziali di connessione personali o condivise | Le connessioni nei progetti e nei cataloghi possono richiedere credenziali personali o consentire credenziali condivise. Le credenziali condivise possono essere disabilitate a livello di account. | Le connessioni della piattaforma possono richiedere credenziali personali o consentire credenziali condivise. Le credenziali condivise possono essere disabilitate a livello di piattaforma. |
Credenziali di connessione da segreti in un vault | Non disponibile | Disponibile |
Autenticazione Kerberos | Non disponibile | Disponibile per alcuni servizi e collegamenti |
Asset e progetti di esempio dall'app hub di risorse | Disponibile | Non disponibile |
Connettore JDBC personalizzato | Non disponibile | Disponibile a partire da 4.8.0 |
Definizioni di origine dati | Non disponibile | Disponibile a partire da 5.0. Consultare Data protection with data source definitions. |
Watson Studio
Le seguenti funzioni Watson Studio sono effettivamente le stesse in Cloud Pak for Data as a Service e nel software Cloud Pak for Data , versioni 5.0, 4.8e 4.7:
- Collaborazione in progetti e spazi di distribuzione
- Accesso programmatico agli asset del progetto
- Importazione ed esportazione del progetto utilizzando un file ZIP del progetto
- Notebook Jupyter
- Pianificazione lavori
- Data Refinery
- Watson Natural Language Processing per Python
Questa tabella descrive le differenze di funzione tra il servizio Watson Studio negli ambienti di distribuzione del software e as - a - service, le differenze tra piani di offerte e se sono richiesti ulteriori servizi. Per ulteriori informazioni sulle differenze di funzione tra i piani dell'offerta su Cloud Pak for Data as a Service, vedi Piani dell'offertaWatson Studio.
Funzione | Come un servizio | Software |
---|---|---|
Crea progetto | Crea: Un progetto vuoto Un progetto da un esempio nell'hub risorse Un progetto dal file |
Crea: Un progetto vuoto Un progetto dal file Un progetto con integrazione Git |
Integrazione Git | Pubblicare i notebook su GitHub Pubblicare i notebook come gist |
Integra un progetto con gli asset di sincronizzazione Git nel repository in un progetto e utilizza tali asset in un altro progetto |
Terminale di progetto per operazioni Git avanzate | Non disponibile | Disponibile nei progetti con integrazione Git predefinita |
Organizzare gli asset in progetti con cartelle | Non disponibile | Disponibile a partire dalla versione 4.8.0 |
JupyterLab | Non disponibile | Disponibile nei progetti con integrazione Git |
Integrazione di Visual Studio Code | Non disponibile | Disponibile nei progetti con integrazione Git |
RStudio | Impossibile eseguire l'integrazione con Git | Può essere integrato con Git. Richiede un servizio RStudio Server Runtimes . |
Script Python | Non disponibile | Utilizzare gli script Python in JupyterLab. Richiede un servizio runtime di Watson Studio . |
Generare il codice per caricare i dati in un notebook utilizzando il Flight service | Non disponibile | Disponibile |
Gestisci ciclo di vita notebook | Non disponibile | Utilizzare CPDCTL per la gestione del ciclo di vita del notebook |
Risorse del pacchetto di codice (serie di file dipendenti in una struttura di cartelle) | Non disponibile | Utilizzare CPDCTL per creare asset di pacchetti di codice in uno spazio di distribuzione |
Promuovi notebook a spazi | Non disponibile | Disponibile manualmente dalla pagina Asset del progetto o in modo programmatico utilizzando CPDCTL |
Python con GPU | Supporto disponibile solo per un singolo tipo GPU | Supporto disponibile per più tipi di GPU Nvidia. Richiede un servizio runtime di Watson Studio . |
Crea e utilizza immagini personalizzate | Non disponibile | Crea immagini personalizzate per ambienti Python (con e senza GPU), R, JupyterLab (con e senza GPU), RStudio e SPSS . Richiede un runtime Watson Studio e altri servizi applicabili. |
Repository Anaconda | Non disponibile | Utilizzare per creare ambienti personalizzati e immagini personalizzate |
Integrazione Hadoop | Non disponibile | Crea ed esegui il training dei modelli ed esegui i flussi Data Refinery su un cluster Hadoop . Richiede il servizio Execution Engine for Apache Hadoop . |
Decision Optimization | Disponibile | Richiede il servizio Decision Optimization . |
SPSS Modeler | Disponibile | Richiede il servizio SPSS Modeler . |
Pipeline di orchestrazione | Disponibile | Richiede il servizio Orchestration Pipelines. |
Watson Machine Learning
Le seguenti funzioni di Watson Machine Learning sono effettivamente le stesse sul software Cloud Pak for Data as a Service e Cloud Pak for Data , versioni 5.0, 4.8e 4.7:
- Collaborazione in progetti e spazi di distribuzione
- Implementazione di modelli
- Distribuisci funzioni
- API REST Watson Machine Learning
- Client Watson Machine Learning Python
- Crea distribuzioni online
- Ridimensiona e aggiorna le distribuzioni
- Definire e utilizzare componenti personalizzati
- Utilizzare l'apprendimento federato per formare un modello comune con origini dati separate e sicure
- Monitorare le distribuzioni tra gli spazi
- Moduli aggiornati per la verifica della distribuzione in linea
- Utilizza pipeline nidificate
- Assegnazione dati AutoAI
- Valutazione della correttezza AutoAI
- Funzioni di supporto delle serie temporali AutoAI
Questa tabella descrive le differenze nelle caratteristiche tra il servizio Watson Machine Learning negli ambienti di distribuzione del software e as - a - service, le differenze tra i piani dell'offerta e se sono richiesti ulteriori servizi. Per i dettagli sulle differenze di funzionalità tra i piani dell'offerta su Cloud Pak for Data as a Service, consulta Piani dell'offertaWatson Machine Learning.
Funzione | Come un servizio | Software |
---|---|---|
Input di addestramento AutoAI | origini dati supportate correnti | Origini dati supportate modificate per release |
Configurazione di calcolo dell'esperimento AutoAI | Diverse dimensioni disponibili | Diverse dimensioni disponibili |
AutoAI limiti sulla dimensione dei dati e numero di obiettivi di previsione |
Imposta limiti | I limiti differiscono per configurazione di elaborazione |
Apprendimento incrementale AutoAI | Non disponibile | Disponibile |
Distribuisci utilizzando i framework più diffusi e specifiche software |
Controllare le ultime versioni supportate | Le versioni supportate differiscono per release |
Connetti a database per distribuzioni batch | Controllare supporto per tipo di distribuzione | Verificare il supporto per tipo di distribuzione e per versione |
Distribuisci e calcola il punteggio degli script Python | Disponibile tramite il client Python | Crea script nel client JupyterLab o Python , quindi distribuisci |
Distribuisci e calcola il punteggio in batch degli script R | Non disponibile | Disponibile |
Distribuisci app Shiny | Non disponibile | Crea e distribuisci app Shiny Distribuisci dal pacchetto di codice |
Valutare la correttezza o la deviazione dei lavori | Richiede il servizio watsonx.governance | Richiede il servizio Watson OpenScale o watsonx.governance |
Valutare le distribuzioni online in uno spazio per la correttezza, la deviazione o l'esplicabilità |
Non disponibile | Disponibile a partire da 4.7 Richiede il servizio Watson OpenScale o watsonx.governance |
Valuta i template di prompt distribuiti in uno spazio | Disponibile | |
Valutare i modelli di prompt scollegati in uno spazio | Non disponibile | Disponibile a partire da 5.0 |
Creazione spazio di controllo | Nessuna limitazione per ruolo | Utilizzare le autorizzazioni per controllare chi può visualizzare e creare spazi |
Importa da progetto GIT nello spazio | Non disponibile | Disponibile |
Pacchetto di codice creato automaticamente durante l'importazione di dal progetto Git nello spazio |
Non disponibile | Disponibile |
Aggiorna app RShiny dal pacchetto di codice | Non disponibile | Disponibile |
Tenere traccia dei dettagli del modello in un inventario del modello | Registra modelli per visualizzare i factsheet con i dettagli del ciclo di vita. Richiede il servizio IBM Knowledge Catalog . | Disponibile Richiede il servizio AI Factsheets o watsonx.governance . |
Crea e utilizza immagini personalizzate | Non disponibile | Creare immagini personalizzate per Python o SPSS |
Notifica ai collaboratori gli eventi Pipeline | Non disponibile | Utilizzare Invia posta per notificare i collaboratori |
Esperimenti di deep learning | Non disponibile | Richiede il servizio Watson Machine Learning Accelerator |
Esegui il provisioning e gestisci le istanze di servizio IBM Cloud | Aggiungere le istanze per Watson Machine Learning o Watson OpenScale |
I servizi vengono forniti sul cluster dall'amministratore |
watsonx.governance
Funzione | Come un servizio | Software |
---|---|---|
Valutare i modelli di machine learning | Vero | Vero |
Valutare i modelli di prompt | Richiedewatsonx Solo Dallas |
Vero |
Integrazione con la console di governance | Integrazione manuale RichiedeIBMOpenPages |
Vero |
Integrazione con AWS (Amazon SageMaker) | Integrazione manuale RichiedeIBMOpenPages |
Vero |
Archivia i casi d'uso dell'IA inIBM Knowledge Catalog | Cloud Pak for Data as a Service soltanto | Non disponibile |
Archivia i casi d'uso dell'intelligenza artificiale nel catalogo di accesso alla piattaforma | watsonx | Vero |
IBM Knowledge Catalog
Le seguenti funzionalità sono effettivamente le stesse per IBM Knowledge Catalog on Cloud Pak for Data as a Service e sul software Cloud Pak for Data, versioni 5.0, 4.8 e 4.7:
- Collaborazione in progetti e cataloghi
- Ricerca e raccomandazioni basate sull'intelligenza artificiale nei cataloghi
- Valutazione e revisione degli asset nei cataloghi
- Strumento Data Refinery nei progetti
- Categorie con ruoli collaboratore
- Classificazioni predefinite e personalizzate
- Classi di dati predefinite e personalizzate
- Regole di governance
- Politiche
- Regole di protezione dei dati
- Creazione di profili manuale di singoli asset di dati relazionali in un progetto o in un catalogo
- Creazione di profili automatica degli asset di dati relazionali aggiunti a un catalogo gestito
- Tipi di asset personalizzati, proprietà personalizzate per gli asset e relazioni personalizzate tra gli asset nei cataloghi
- Monitora attività del flusso di lavoro
- Consegna di dataset mascherati in progetti con flussi di mascheramento
Questa tabella descrive le differenze nelle funzioni tra il servizio IBM Knowledge Catalog negli ambienti di distribuzione del software e as - a - service, le differenze tra i piani di offerta e se sono richiesti ulteriori servizi. Per ulteriori informazioni sulle differenze tra le funzioni tra i piani dell'offerta su Cloud Pak for Data as a Service, consulta IBM Knowledge Catalog piani dell'offerta.
A partire dalla versione Cloud Pak for Data, è possibile installare il cartridge IBM Knowledge Catalog Premium o il cartridge IBM Knowledge Catalog Standard al posto del servizio IBM Knowledge Catalog. IBM Knowledge Catalog Premium offre le stesse funzionalità del servizio IBM Knowledge Catalog più le funzionalità di intelligenza artificiale generativa. IBM Knowledge Catalog Standard offre un sottoinsieme delle funzionalità di IBM Knowledge Catalog più le funzionalità di IA generativa.
Funzione | Come un servizio | Software |
---|---|---|
Strumento Metadata import in progetti - rilevamento | Importare gli asset di dati in progetti o cataloghi. Supporto per un sottoinsieme di connessioni di progetto e catalogo. Vedi Origini dati supportate per la cura e la qualità dei dati. | Importare diversi tipi di asset: importare gli asset di dati in progetti o cataloghi. La maggior parte delle connessioni supportate sono le stesse in entrambi gli ambienti di distribuzione. Importare report di business intelligence, asset con i relativi script di trasformazione associati, lavori ETL o modelli di dati nei cataloghi. Richiede l'installazione di MANTA Automated Data Lineage senza chiave di licenza. Supporto per un sottoinsieme di connessioni di catalogo fonti di dati supportate per la cura e la qualità dei dati. |
Strumento Metadata import nei progetti - derivazione | Non disponibile. | Importa derivazione di asset di dati nei cataloghi. Acquisire ed accedere alla derivazione dei lavori ETL in MANTA Automated Data Lineage (a partire dalla 4.7) Richiede l'installazione di MANTA Automated Data Lineage con una chiave di licenza. Supporto per un sottoinsieme di connessioni del catalogo. Vedere Fonti di dati supportate per la cura e la qualità dei dati. |
Strumenti UI legacy | Non disponibile. Utilizzare gli strumenti nei progetti. | Non disponibile a partire da 4.7. Utilizzare gli strumenti nei progetti. |
Strumento di arricchimento metadati nei progetti | Eseguire la creazione di profili, l'assegnazione dei termini, l'analisi della qualità e l'analisi delle chiavi o delle relazioni su grandi serie di asset di dati. | Disponibile, |
Arricchimento migliorato grazie all'IA generativa | Disponibile, | Non disponibile. A partire da 5.0, installare IBM Knowledge Catalog Premium o IBM Knowledge Catalog Standard. |
Punteggi di qualità dei dati | I punteggi di qualità dei dati sono mostrati in: Informazioni sulla qualità dei dati per gli asset in progetti e cataloghi |
I punteggi della qualità dei dati vengono mostrati in: Informazioni sulla qualità dei dati per gli asset in progetti e cataloghi Risultati dell'arricchimento dei metadati Profili degli asset in progetti e cataloghi. Non disponibile in 4.7 e versioni successive. Risultati della scansione rapida con la UI legacy. Non disponibile in 4.7 e versioni successive. Progetti di qualità dei dati con la UI legacy. Non disponibile in 4.7 e versioni successive. |
Informazioni dettagliate sulla qualità dei dati | Pagina Qualità dei dati in progetti e cataloghi e come parte dei risultati di arricchimento dei metadati | Disponibile a partire da 4.7. |
Regole di qualità dei dati nei progetti | Disponibile Richiede il servizio DataStage . |
Disponibile. Richiede il servizio DataStage . |
Regole SLA di qualità dei dati | Non disponibile. | Monitorare la qualità dei dati e segnalare le violazioni. I report di conformità SLA vengono visualizzati nella pagina Qualità dei dati di un asset di dati nei progetti. Disponibile a partire da 4.7.3. |
Flussi di lavoro di risoluzione per problemi di qualità dei dati | Non disponibile. | Disponibile a partire da 4.7.3. |
Aggiungere più asset a un catalogo con un file | Non disponibile. | Disponibile a partire da 4.7.3. |
Attività degli asset | Richiede un piano a pagamento. Disponibile in progetti e cataloghi. |
Disponibile in progetti e cataloghi. |
Derivazione business | Non disponibile | Disponibile, |
Derivazione dei dati tecnici | Non disponibile | Disponibile Richiede che sia installata una versione con licenza di MANTA Automated Data Lineage for IBM Cloud Pak for Data . Generato dall'esecuzione dello strumento di importazione metadati. È possibile accedervi dai cataloghi. |
Derivazione dati | Richiede l'abilitazione. | Non disponibile |
Termini di business | Limiti per alcuni piani. | Disponibile, |
Termini aziendali predefiniti | I termini aziendali predefiniti e la categoria Knowledge Accelerator Sample Personal Data che li include sono disponibili solo se si crea un'istanza del servizio IBM Knowledge Catalog con un piano Lite o Standard dopo il 7 ottobre 2022. | Non disponibile. |
Dataset di riferimento | Limiti per piano. | Disponibile, |
Relazioni personalizzate per gli artefatti | Richiede un piano a pagamento. | Disponibile |
Knowledge Accelerators | Richiede un piano Enterprise da Resource hub. |
Fornito con la piattaforma. |
Configurazioni personalizzate dei flussi di lavoro per gli artefatti e le richieste di governance | Disponibile per gli artefatti di governance. | Disponibile, |
Ruoli di categoria personalizzati | Limiti per piano. | Disponibile, |
Regole di protezione dei dati di esportazione e importazione | Per esportare le regole di protezione dei dati da qualsiasi sistema e importarle nello stesso sistema o in un sistema diverso, è possibile utilizzare le API. Per i dettagli, vedere Migrazione delle regole di protezione dei dati. | Per esportare le regole di protezione dei dati da qualsiasi sistema e importarle nello stesso sistema o in un sistema diverso, è possibile utilizzare le API o i comandi cpd-cli. Per i dettagli, vedere Migrazione delle regole di protezione dei dati. |
Report amministrativi | Richiede un piano a pagamento. | Disponibile, |
Migrare i dati da InfoSphere Information Server | Non disponibile. | Disponibile a partire dalla 4.8. |
Esplora relazione | Non disponibile. | Disponibile a partire da 5.0. Requires installing the optional knowledge graph component with Cloud Pak for Data or IBM Knowledge Catalog Premium Cartridge. |
DataStage
La tabella seguente descrive le differenze tra le funzioni di DataStage on Cloud Pak for Data as a Service e quelle di DataStage on Cloud Pak for Data, versioni 5.0, 4.8 e 4.7.
Funzione | Come un servizio | Software |
---|---|---|
Gestione istanza PX | Puoi eseguire il provisioning delle istanze da un insieme di dimensione predefinite. | È possibile eseguire il provisioning delle istanze in modo più flessibile utilizzando l'amministrazione dell'istanza Cloud Pak for Data . |
Compilazione job |
|
|
Runtime del job | È possibile inoltrare tutti i lavori desiderati, in base alla coda. |
|
Gestione degli asset | Per i file di tipo .xls, .xlsx, .xml e .json, sono supportate solo strutture semplici. Gli schemi multilivello / nidificati non possono essere analizzati. | È disponibile il supporto completo dei file di tipo .csv, .txt, .xls, .xlsx, .xml e .json. |
Archiviazione |
|
|
Stage Java Integration | Disponibile conDataStage-aaS Ovunque | Disponibile |
Componente libreria Java | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connessione JDBC generica | Disponibile conDataStage-aaS Ovunque | Disponibile |
Excel | Disponibile conDataStage-aaS Ovunque | Disponibile |
AVI | Disponibile conDataStage-aaS Ovunque | Disponibile |
Stage External Source | Disponibile conDataStage-aaS Ovunque | Disponibile |
Stage External Target | Disponibile conDataStage-aaS Ovunque | Disponibile |
Stage gerarchico |
|
Disponibile |
SMP | S, M, L sono nodi singoli, configurazione SMP. Utilizzare un motore di runtime remoto per impostare una configurazione alternativa. | I carichi di lavoro paralleli vengono gestiti mediante partizioni logiche, configurate con l'opzione APT_CONFIG_FILE. |
Connessione SAP Bulk Extract | Non disponibile | Disponibile |
Connessione SAP Delta Extract | Non disponibile | Disponibile |
Fase in wrapping | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connessione SAP HANA | Non disponibile | Disponibile |
Origine dati di testo nella connessione ODBC | Non disponibile | Disponibile |
Fase di creazione | Disponibile conDataStage-aaS Ovunque | Disponibile |
Invia report utilizzando le sottoroutine prima / dopo il lavoro | Disponibile conDataStage-aaS Ovunque | Disponibile |
Fase personalizzata | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connessione Apache HBase | Disponibile conDataStage-aaS Ovunque | Disponibile |
L'autenticazione Kerberos per le connessioni Apache Hive | Non disponibile | Disponibile |
Funzioni definite dall'utente | Disponibile conDataStage-aaS Ovunque | Disponibile |
APT_CONFIG_FILE creati dall'utente | Disponibile conDataStage-aaS Ovunque | Disponibile |
Proprietà prima / dopo il lavoro | Disponibile conDataStage-aaS Ovunque | Disponibile |
Connettore servizio dati | Non disponibile | Disponibile |
Sequenza di database Db2 nello stage Lentamente Changing Dimension, stage Surrogate Key Generator e stage Transformer | Disponibile conDataStage-aaS Ovunque | Disponibile |
Utilizzare la connessione Apache Hive come destinazione. (Disponibile quando nel connettore è selezionato Utilizza proprietà DataStage .) | Disponibile conDataStage-aaS Ovunque | Disponibile |
Parametrizza proprietà con connessioni locali | Non disponibile | Disponibile |
Stage Operational Decision Manager | Disponibile conDataStage-aaS Ovunque | Disponibile |
Spazi di distribuzione | Non disponibile | Disponibile a partire da 4.7.0 |
watsonx.governance
Le seguenti funzioni watsonx.governance sono effettivamente le stesse in Cloud Pak for Data as a Service e nel software Cloud Pak for Data , versioni 5.0, 4.8e 4.7:
- Valutare le distribuzioni per la correttezza
- Valutare la qualità delle distribuzioni
- Monitorare le distribuzioni per la deviazione
- Visualizzare e confrontare i risultati del modello in un pannello di controllo Insights
- Aggiungi distribuzioni dal provider di machine learning di tua scelta
- Imposta avvisi da attivare quando le valutazioni scendono al di sotto di una soglia specificata
- Valutare le distribuzioni in un'interfaccia utente o in un notebook
- Valutazioni e metriche personalizzate
- Visualizza i dettagli sulle valutazioni nei factsheet del modello
Questa tabella descrive le differenze nelle funzioni tra il servizio Watson OpenScale negli ambienti di distribuzione del software e as - a - service, le differenze tra i piani dell'offerta e se sono richiesti ulteriori servizi.
Funzione | Come un servizio | Software |
---|---|---|
Carica dati di test con pre - punteggio | Non disponibile | Disponibile |
IBM SPSS Collaboration and Deployment Services | Non disponibile | Disponibile |
Elaborazione batch | Non disponibile | Disponibile |
Supporta il controllo accessi per gruppi di utenti | Non disponibile | Disponibile |
Database gratuito e piani Postgres | Disponibile | Postgres disponibile a partire da 4.8 |
Imposta più istanze | Non disponibile | Disponibile |
Integrazione con OpenPages | Disponibile con integrazione manuale | Disponibile |
Valutazione degli asset del modello di fondazione | Non disponibile | Disponibile |
Watson Query
In Cloud Pak for Data as a Service, la funzionalità di virtualizzazione dei dati viene fornita dal servizio Watson Query . La seguente funzionalità di virtualizzazione dei dati è effettivamente la stessa su Cloud Pak for Data as a Service e Cloud Pak for Data 5.0, 4.8e 4.7.
- Connessione alle origini dati supportate
- Virtualizzare i dati
- Gestione dei dati virtuali mediante politiche e regole di protezione dei dati
- Monitoraggio ed esplorazione del servizio
- Utilizzo dell'interfaccia SQL
- Memorizzazione nella cache
- Mascheramento colonna
- Esplorare la vista e ricaricare le tabelle
- Campionamento dei dati nella raccolta delle statistiche
- Arricchimento dei metadati
La seguente funzionalità Data virtualization sembra essere diversa nell'interfaccia utente ma fornisce la stessa funzionalità di base:
- Pubblicazione di dati virtuali nei catalogo
- Gestione dell'accesso agli oggetti virtuali
- Gestione di utenti e ruoli
- Ridimensionamento del servizio
- Raccolta di statistiche nel client Web in Watson Query
Questa tabella descrive le differenze di funzionalità tra Watson Query on Cloud Pak for Data as a Service e Data Virtualization (ex Watson Query) on Cloud Pak for Data.
Funzione | Come un servizio | Software |
---|---|---|
Nome servizio | Watson Query | In Cloud Pak for Data 5.0, il servizio è ora denominato Data Virtualization. |
Utilizzare Cloud Pak for Data Data Source Definitions (DSD) per applicare le regole di protezione dei dati IBM Knowledge Catalog | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Dati di query in origini dati API REST | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Tabelle di query dai cataloghi Presto e Databricks precedenti con supporto per più cataloghi | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Ridimensiona automaticamente le istanze del servizio | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Maschera caratteri multibyte per la privacy avanzata dei dati sensibili | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Visualizzare le norme di protezione dei dati applicate a un utente | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Sicurezza avanzata per i risultati di creazione profili nelle viste Data Virtualization | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Le connessioni Data Virtualization nei cataloghi ora fanno riferimento alla connessione della piattaforma | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Le connessioni Data Virtualization nei cataloghi ora fanno riferimento alla connessione della piattaforma | Non applicabile per SaaS | Disponibile a partire da 5.0 |
Sicurezza migliorata per il ruolo Admin: il ruolo Admin non dispone dell'accesso predefinito a tutti i dati. | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Le regole di protezione dati di IBM Knowledge Catalog sono sempre abilitate per i dati Watson Query | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Proteggere gli oggetti non governati: con le regole di protezione dei dati di IBM Knowledge Catalog in Watson Query, gli oggetti virtualizzati non pubblicati in un catalogo gestito seguono l'impostazione della convenzione di accesso ai dati predefinita dalle impostazioni della regola. | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Query dei dati Presto : è possibile creare una connessione a Presto per accedere e interrogare i dati in Presto. | Non applicabile per SaaS | Disponibile a partire da 4.8 |
Registrazione di controllo per monitorare l'attività utente e l'accesso ai dati | Disponibile | Disponibile a partire da 4.7 |
Integrazione con IBM Knowledge Catalog | Obbligatorio | Facoltativo |
Autorizzazione basata sui gruppi e accesso a livello di oggetto per i gruppi | Non disponibile | Disponibile |
Supporto per connettori remoti | Non applicabile per SaaS | Disponibile |
Supporto per origini dati basate su file system, tranne in Cloud Object Storage | Non applicabile per SaaS | Disponibile |
Connessione alle origini dati che richiedono un driver JDBC caricato, ad esempio, SAP HANA, Generico JDBC | Non applicabile per SaaS | Disponibile |
Raccolta delle statistiche nell'interfaccia utente | Non disponibile | Disponibile |
Raccolta automatica delle statistiche durante la virtualizzazione degli oggetti | Non disponibile | Disponibile |
Gestione degli accessi per più gruppi | Non disponibile | Disponibile |
Supporto per file CSV o TSV in Cloud Object Storage | Non applicabile per SaaS | Disponibile |
Credenziali nei vault per connessioni in Cloud Object Storage | Non applicabile per SaaS | Disponibile |
Ulteriori informazioni
- Servizi per Cloud Pak for Data as a Service
- Servizi per Cloud Pak for Data 5.0
- Opzioni dell'ambiente di distribuzione cloud per Cloud Pak for Data 5.0
Argomento principale: Cloud Pak for Data as a Service