Novità
Ricontrolla ogni settimana per scoprire nuove funzioni e aggiornamenti per Cloud Pak for Data as a Service e servizi come Watson Studio, Watson Machine Learning, DataStagee IBM Knowledge Catalog.
Settimana che termina il 26 aprile 2024
Modifica del nome per la connessione IBM Watson Query
26 apr 2024
La connessione "IBM Watson Query" è stata ridenominata in "IBM Data Virtualization". Le impostazioni precedenti per la connessione rimangono le stesse. È stato modificato solo il nome della connessione.
Modifica del nome per il connettore DataStage IBM Watson Query
26 apr 2024
Il nome del connettore DataStage "IBM Watson Query" è stato modificato in "IBM Data Virtualization". Questa modifica coincide con la modifica del nome della connessione. Le impostazioni precedenti per la connessione, il connettore e i lavori associati rimangono le stesse. Sono stati modificati solo il collegamento e il connettore.
Settimana che termina il 19 aprile 2024
Vista elenco progetti avanzata nei cataloghi
18 apr 2024
Ora, quando si aggiungono asset da un catalogo a un progetto, è possibile visualizzare più di 100 progetti nella pagina di elenco dei progetti e aggiungere fino a 50 asset alla volta al progetto. Per ulteriori informazioni, vedere Aggiunta di asset dal catalogo.
Valutazione delle distribuzioni di machine learning negli spazi
18 apr 2024
Configura le valutazioni watsonx.governance nei tuoi spazi di distribuzione per ottenere informazioni dettagliate sulle prestazioni del tuo modello di machine learning. Ad esempio, valutare una distribuzione per la distorsione o monitorare una distribuzione per la deviazione. Quando configuri le valutazioni, puoi analizzare i risultati della valutazione e modellare i record della transazione direttamente negli spazi.
Per ulteriori informazioni, vedi Valutazione delle distribuzioni negli spazi.
19 aprile 2024
Settimana che termina il 12 aprile 2024
Protocollo di applicazione delle regole di protezione dei dati rivisto in Cloud Pak for Data
12 apr 2024
Una versione riveduta del protocollo di applicazione della regola di protezione dei dati è ora disponibile in Cloud Pak for Data. Quando si è all'interno di un catalogo gestito e si fa clic su Add to project
, vengono visualizzate informazioni sul nuovo protocollo di applicazione della regola di protezione dati. È necessario riconoscerlo per continuare.
Cognos Dashboards Il servizio integrato è obsoleto
11 apr 2024
Non è più possibile eseguire il provisioning di un'istanza del servizio integrato Cognos Dashboards . Tuttavia, tutti i dashboard esistenti creati con il servizio integrato Cognos Dashboards continueranno a funzionare fino al 20 giugno 2024. È possibile utilizzare Cognos Analytics on Cloud On - Demand come sostituzione di Cognos Dashboards Embedded. Per ulteriori informazioni, vedi Piani dei prezzi diIBM Cognos Analytics.
Settimana che termina il 5 aprile 2024
Utilizzare le tabelle pivot per visualizzare i dati aggregati negli esperimenti di Decision Optimization
5 aprile 2024
È ora possibile utilizzare le tabelle pivot per visualizzare sia i dati di input che di output aggregati nella vista Visualizzazione negli esperimenti Decision Optimization . Per ulteriori informazioni, consultare Widget di visualizzazione negli esperimenti di Decision Optimization.
Accedere all'elenco delle proprietà dell'API di connessione dall'interfaccia utente
05 apr 2024
In precedenza, l'unico metodo per visualizzare le proprietà di connessione era quello di aprire una nuova pagina Web all'indirizzo https://dataplatform.cloud.ibm.com/connections/docs. Ora è possibile accedere alle stesse informazioni da Dati> Connessioni piattaforma. Espandere Risorse di connessionee selezionare Proprietà di connessione.
È possibile utilizzare tali proprietà per creare connessioni con le connessioni nell'API di dati Watson . Ad esempio, se si crea una connessione in un notebook in modo programmatico, è possibile utilizzare queste informazioni per identificare le proprietà necessarie.
Settimana che termina il 22 marzo 2024
Crea viste dinamiche di dati connessi
21 marzo 2024
Un nuovo tipo di asset di dati connesso fornisce accesso filtrato ai dati dalle origini dati che supportano le query SQL in modo che sia possibile accedere solo a dati pertinenti. In un progetto, fornire una query SQL per creare una vista di colonne o righe specifiche da una o più tabelle. È possibile utilizzare questi asset di dati nell'arricchimento dei metadati e nell'analisi della qualità dei dati come qualsiasi altro asset di dati connesso.
Per ulteriori informazioni, consultare Aggiunta di una vista dinamica di dati connessi a un progetto.
Utilizzare i formati tabella Delta Lake o Apache Iceberg nei connettori Amazon S3 e Apache HDFS
22 marzo 2024
I connettori Amazon S3 e Apache HDFS ora includono le proprietà per i formati di tabella Delta Lake e Apache Iceberg. Questi formati di tabella sono parte integrante dei laghi di dati, che forniscono un repository centralizzato per la gestione di grandi volumi di dati. I data lakes servono come base per la raccolta e l'analisi di dati strutturati, semistrutturati e non strutturati nel suo formato originale per l'archiviazione a lungo termine e per fornire informazioni dettagliate e previsioni.
La proprietà del formato tabella è inclusa nelle proprietà di interazione per gli strumenti supportati. Ad esempio, nel connettore Proprietà dello stage in DataStage.
Settimana conclusosi il 23 febbraio 2024
Accedi ai dati da DataStax Enterprise
23 febbraio 2024
Ora è possibile gestire i dati da DataStax Enterprise.
Settimana che termina il 16 febbraio 2024
Codici sensibili al maiuscolo / minuscolo nei dataset di riferimento in IBM Knowledge Catalog
16 febbraio 2024
I valori dei dati di riferimento sono composti da almeno due colonne: codice e valore. Per tutti i nuovi dataset di riferimento, la colonna di codice è ora sensibile al maiuscolo / minuscolo. Quando si aggiungono valori a un nuovo dataset di riferimento, il codice viene salvato esattamente come viene immesso. Tenere presente che tutti i dataset di riferimento creati prima dell'introduzione di questa modifica non sono sensibili al maiuscolo / minuscolo e tutti i nuovi valori aggiunti verranno salvati in maiuscolo. Questi dataset di riferimento sono contrassegnati con una tag Non sensibile al maiuscolo / minuscolo nell'interfaccia utente. Per i dettagli, consultare Codice sensibile al maiuscolo / minuscolo.
Opzioni di ricerca, filtro e ordinamento migliorate per i dataset di riferimento in IBM Knowledge Catalog
16 febbraio 2024
Quando si visualizza un elenco di valori dei dati di riferimento, è possibile utilizzare i seguenti metodi per individuare più rapidamente i valori richiesti:
- Utilizzare una barra di ricerca per immettere una query per un codice, un valore o un valore di colonna personalizzato.
- Utilizzare una delle 6 opzioni di filtro avanzate.
- Utilizzare la funzione di ordinamento.
Le opzioni di ricerca, filtro e ordinamento possono essere combinate. Per i dettagli, consultare Visualizzazione dei dataset di riferimento.
Settimana che termina il 09 febbraio 2024
Nuovo ambiente Spark 3.4 per l'esecuzione dei lavori del flusso Data Refinery
09 febbraio 2024
Quando si seleziona un ambiente per un lavoro di flusso Data Refinery , è ora possibile selezionare Spark predefinito 3.4 & R 4.2, che include miglioramenti da Spark.
L'ambiente Default Spark 3.3 & R 4.2 è obsoleto e verrà rimosso in un futuro aggiornamento.
Aggiornare i lavori del flusso Data Refinery per utilizzare il nuovo ambiente Default Spark 3.4 & R 4.2 . Per i dettagli, consultare Opzioni di risorse di calcolo per Data Refinery nei progetti.
Altra documentazione Decision Optimization orientata alle attività
09 febbraio 2024
Ora è possibile trovare più facilmente le informazioni corrette per la creazione e la configurazione degli esperimenti di Decision Optimization . Vedere EsperimentiDecision Optimization e relative sottosezioni.
Funzione della vista di paginazione per pubblicare gli asset in un catalogo
08 febbraio 2024
Quando si pubblicano gli asset del progetto in un catalogo, è ora possibile visualizzare 20 cataloghi e asset in ciascuna pagina con la vista di paginazione. In precedenza, era possibile visualizzare gli asset in un elenco. Vedere Pubblicazione di asset in un catalogo.
I tipi di analisi avanzata nell'arricchimento dei metadati sono disponibili nella regione di Francoforte
09 febbraio 2024
La chiave primaria avanzata e l'analisi della relazione e la creazione di profili avanzati sono ora disponibili anche nella regione di Francoforte, oltre alla regione di Dallas.
La connessione IBM Cloud Data Engine è obsoleta
08 febbraio 2024
La connessione IBM Cloud Data Engine è obsoleta e verrà interrotta in una release futura. Consultare Deprecation of Data Engine per le date e i dettagli importanti.
Settimana che termina il 02 febbraio 2024
Salva le ricerche per le risorse del catalogo
02 febbraio 2024
Ogni utente può ora salvare fino a 25 ricerche all'interno di ciascuno dei suoi cataloghi. L'utente che salva una ricerca in un catalogo è l'unico utente che può visualizzare, eseguire, modificare e rimuovere la ricerca. Per ulteriori informazioni, consultare Salvataggio delle ricerche per gli asset del catalogo.
Galleria rinominata in hub di risorse
02 febbraio 2024
La galleria viene rinominata in hub di risorse. L'hub di risorse contiene progetti di esempio, dataset e notebook. Vedere hub di risorse.
La connessione IBM Cloud Databases for DataStax è stata interrotta
02 febbraio 2024
La connessione IBM Cloud Databases for DataStax è stata rimossa da Cloud Pak for Data as a Service.
La connessione Dremio richiede aggiornamenti
02 febbraio 2024
In precedenza, la connessione Dremio utilizzava un driver JDBC . Ora la connessione utilizza un driver basato su Arrow Flight.
Importante: aggiornare le proprietà di connessione. Diverse modifiche si applicano a una connessione per un'istanza Dremio Software (in loco) o un'istanza Dremio Cloud.
Dremio Software: aggiornare il numero di porta.
Il numero di porta predefinito utilizzato da Flight è 32010
. È possibile confermare il numero di porta nel file dremio.conf . Per informazioni, vedi Configurazione tramite dremio.conf .
Inoltre, Dremio non supporta più le connessioni con IBM Cloud Satellite.
Dremio Cloud: aggiorna il metodo di autenticazione e il nome host.
- Accedere a Dremio e generare un token di accesso personale. Per istruzioni, vedi Personal Access Tokens.
- in Cloud Pak for Data as a Service nel modulo Crea connessione: Dremio , modificare il tipo di autenticazione in Personal Access Token e aggiungere le informazioni sul token. L'autenticazione Nome utente e password non può più essere utilizzata per connettersi a un'istanza cloud Dremio .
- Selezionare La porta è abilitata SSL.
Se si utilizza il nome host predefinito per un'istanza cloud Dremio , è necessario modificarlo:
- Modificare
sql.dremio.cloud
indata.dremio.cloud
- Modificare
sql.eu.dremio.cloud
indata.eu.dremio.cloud
Tipi di analisi aggiuntivi nell'arricchimento dei metadati (IBM Knowledge Catalog)
31 gennaio 2024
L'arricchimento dei metadati ora fornisce queste opzioni aggiuntive di analisi:
Analisi della chiave primaria per rilevare le chiavi primarie nei dati che identificano in modo univoco ogni record in un asset di dati.
L'analisi superficiale viene inclusa automaticamente quando selezioni l'opzione di arricchimento Profile data . L'analisi avanzata può essere eseguita sugli asset selezionati dai risultati dell'arricchimento.
Analisi di relazione per identificare le relazioni tra asset di dati o per trovare dati sovrapposti e ridondanti nelle colonne.
L'analisi di relazione chiave superficiale viene eseguita quando si seleziona la nuova opzione di arricchimento Imposta relazioni . L'analisi avanzata può essere eseguita sugli asset selezionati dai risultati dell'arricchimento.
Creazione di profili avanzata per ottenere risultati più esatti per determinate metriche, come la distribuzione della frequenza e l'univocità dei valori all'interno di una colonna.
La creazione profili avanzata può essere eseguita su asset selezionati dai risultati dell'arricchimento.
La chiave primaria avanzata e l'analisi della relazione e la creazione di profili avanzata richiedono il servizio DataStage in aggiunta al servizio IBM Knowledge Catalog e sono disponibili solo nella regione Dallas.
Per ulteriori informazioni, vedi Creazione di un asset di arricchimento dei metadati, Identificazione delle chiavi primarie, Identificazione delle relazionie Profili di dati avanzati.
Settimana che termina il 26 gennaio 2024
AutoAI supporta i dati ordinati per tutti gli esperimenti
25 gennaio 2024
Ora è possibile specificare i dati ordinati per tutti gli esperimenti AutoAI anziché solo per gli esperimenti di serie temporali. Specificare se i dati di addestramento sono ordinati in modo sequenziale, in base a un indice di riga. Quando i dati di input sono sequenziali, la prestazione del modello viene valutata sui record più recenti invece che su un campionamento casuale e i dati di holdout utilizzano gli ultimi n record dell'insieme invece di n record casuali. I dati sequenziali sono richiesti per gli esperimenti di serie temporali ma sono facoltativi per gli esperimenti di classificazione e regressione.
Imposta su tema scuro
25 gennaio 2024
Ora è possibile impostare l'interfaccia utente Cloud Pak for Data as a Service sul tema scuro. Fai clic sull'avatar e seleziona Profilo e impostazioni per aprire il tuo profilo account. Quindi, impostare l'interruttore del tema Dark su on. Il tema scuro non è supportato nei notebook RStudio e Jupyter. Per informazioni sulla gestione del profilo, consultare Gestione delle proprie impostazioni.
Settimana che termina il 19 gennaio 2024
Visualizzare le informazioni sul tipo nativo nel riquadro dei dettagli per le colonne di asset
19 gennaio 2024
Ora, è possibile visualizzare sia i tipi di dati standardizzati che quelli nativi direttamente nel riquadro dei dettagli della colonna. Per visualizzare le informazioni sul tipo nativo, fare clic su un nome colonna asset dalla pagina Panoramica di un asset.
Nuova opzione per la precedenza dell'azione della regola (IBM Knowledge Catalog)
18 gennaio 2024
La precedenza dell'azione della regola consente di specificare il modo in cui le regole vengono applicate quando ci sono più regole con azioni differenti su un dataset. È possibile utilizzare la nuova opzione Applicazione gerarchica per configurare una valutazione a due livelli delle regole di protezione dati.
- Il primo livello valuta le regole per un'azione
Allow
oDeny
senza considerare alcuna azione di mascheramento. La decisione di questo primo livello deve essere quella di consentire l'accesso al secondo livello. - Il secondo livello valuta le regole per un'azione
Transform
.
Puoi impostare questa opzione dall'interfaccia utente o dall' APIaccess_decision_precedence
.
Per ulteriori informazioni, vedi Gestione delle impostazioni delle regole.
Memorizzare i risultati dell'analisi della qualità dei dati (IBM Knowledge Catalog)
18 gennaio 2024
Ora hai la possibilità di scrivere l'output dei controlli di qualità dei dati predefiniti eseguiti come parte dell'arricchimento dei metadati in un database. Ad esempio, si potrebbe voler archiviare questi dati in modo da poter utilizzare le tabelle per tenere traccia dei problemi di qualità e come input per i processi di risoluzione. Per ulteriori informazioni, vedi Creazione di un arricchimento dei metadati.
Connettersi a una nuova origine dati in DataStage: Tableau
18 gennaio 2024
Ora è possibile includere dati da una origine dati Tableau nei flussi DataStage .
Per l'elenco completo dei connettori DataStage , consultare Origini dati supportate in DataStage.
Settimana conclusosi il 12 gennaio 2024
Supporto per IBM Runtime 22.2 obsoleto in Watson Machine Learning
11 gennaio 2024
IBM Runtime 22.2 è obsoleto e verrà rimosso l'11 aprile 2024. A partire dal 7 marzo 2024, non puoi creare notebook o ambienti personalizzati utilizzando i runtime 22.2 . Inoltre, non è possibile preparare nuovi modelli con specifiche software basate sul runtime 22.2 . Aggiornare gli asset e le distribuzioni per utilizzare IBM Runtime 23.1 prima del 7 marzo 2024.
- Per ulteriori informazioni sulla migrazione di un asset a un framework supportato e a una specifica software, consultare Gestione di framework o specifiche software obsoleti.
- Per ulteriori informazioni sull'ambiente del notebook, consultare Opzioni di calcolo delle risorse per l'editor del notebook nei progetti.
- Per ulteriori informazioni sulla modifica dell'ambiente, consultare Modifica dell'ambiente di un notebook.
Settimana che termina il 15 dicembre 2023
Visualizzare le informazioni sull'origine dati nel riquadro dei dettagli per cataloghi
15 dicembre 2023
Se si fa clic su un asset dalla griglia di elementi correlati, è possibile visualizzare le informazioni sull'origine dati direttamente nel pannello dei dettagli dell'asset.
Crea chiavi API utente per lavori e altre operazioni
15 dicembre 2023
Alcune operazioni di runtime in Cloud Pak for Data as a Service, come lavori e formazione del modello, richiedono una chiave API come credenziale per un'autorizzazione sicura. Con le chiavi API dell'utente, puoi ora generare e ruotare la chiave API direttamente in Cloud Pak for Data as a Service come necessario per garantire che le tue operazioni vengano eseguite senza problemi. Le chiavi API sono gestite in IBM Cloud, ma puoi comodamente crearle e ruotarle in Cloud Pak for Data as a Service.
La chiave API utente è specifica dell'account e viene creata da Profilo e impostazioni nel tuo profilo account.
Per ulteriori informazioni, vedi Gestione della chiave API utente.
Nuova scadenza e disconnessione della sessione di login a causa di inattività
15 dicembre 2023
Sei ora scollegato da IBM Cloud a causa della scadenza della sessione. La sessione può scadere a causa della scadenza della sessione di accesso (24 ore per impostazione predefinita) o dell'inattività (2 ore per impostazione predefinita). Puoi modificare le durate predefinite nelle impostazioni di accesso (IAM) in IBM Cloud. Per ulteriori informazioni, consultare Impostazione della scadenza della sessione di login.
Accedere all'elenco delle proprietà API di connessione
15 dicembre 2023
È ora possibile visualizzare l'elenco completo dei connettori con le relative proprietà individuali all'indirizzo https://dataplatform.cloud.ibm.com/connections/docs.
È possibile utilizzare tali proprietà per creare connessioni con le connessioni nell'API di dati Watson . Ad esempio, se si crea una connessione in un notebook in modo programmatico, è possibile utilizzare queste informazioni per identificare le proprietà necessarie.
Organizzare gli asset del progetto in cartelle
14 dicembre 2023
È ora possibile creare cartelle nei propri progetti per organizzare gli asset. Un amministratore del progetto deve abilitare le cartelle e amministratori ed editor possono crearle e gestirle. Le cartelle sono in versione beta e non sono ancora supportate per l'utilizzo in ambienti di produzione. Per ulteriori informazioni, consultare Organizzazione di asset con cartelle (beta).
Il connettore di IBM Cloud Databases for DataStax è obsoleto
15 dicembre 2023
Il connettore IBM Cloud Databases for DataStax è obsoleto e verrà interrotto in una release futura.
Settimana che termina il 08 dicembre 2023
Nuove proprietà client nelle connessioni Db2 per la gestione del workload
08 dicembre 2023
È ora possibile specificare le proprietà nei campi seguenti per scopi di controllo: Nome applicazione, Informazioni sull'account client, Nome host cliente Utente client. Questi campi sono facoltativi e sono disponibili per le seguenti connessioni:
Connettersi a una nuova origine dati in DataStage: Looker
08 dicembre 2023
È ora possibile includere i dati da un'origine dati Looker nei flussi DataStage . (È possibile utilizzare questa connessione solo per i dati di origine).
Per l'elenco completo dei connettori DataStage , consultare Origini dati supportate in DataStage.
Funzioni nuove e potenziate in Data Virtualization
08 dicembre 2023
Le seguenti funzioni nuove e avanzate sono disponibili in Data Virtualization:
Utilizzare le regole di protezione dei dati di IBM Knowledge Catalog per filtrare le righe nelle tabelle virtualizzate
È possibile che si disponga di un'origine dati con tabelle combinate con dati di enti pubblici, aziende e clienti al dettaglio. Ad esempio, una tabella di fatturazione potrebbe avere dei dati per tutti i clienti, dove alcune delle righe sono per i clienti delle amministrazioni pubbliche e altre per i clienti non governativi. Il tipo di client non è indicato nella tabella di fatturazione. Ora, è possibile filtrare l'elenco di record client utilizzando una delle seguenti tecniche.
È possibile utilizzare una tabella separata per identificare i clienti che sono clienti governativi. Gli ID da questa tabella possono essere utilizzati per filtrare le righe dalla tabella di fatturazione. Quando si filtrano le righe, la tabella con maschera non conterrà le righe con i dati dei client governativi.
È possibile utilizzare una tabella di identificativi cliente bloccati come tabella di riferimento. Tutte le righe nella tabella di fatturazione che hanno righe con l'identificativo cliente incluso nella serie di clienti bloccati vengono filtrate dalla serie risultante.
Data Virtualization supporta le colonne di mascheramento nei dati virtualizzati basati su regole di protezione dei dati definite in IBM Knowledge Catalog. Ora è possibile creare regole di protezione dei dati per includere o escludere le righe nei dati virtualizzati per evitare l'esposizione di dati sensibili.
Per ulteriori informazioni, consultare Gestione dei dati virtuali con le regole di protezione dei dati in Data Virtualization.
Utilizza il data masking avanzato sui dati virtualizzati
È ora possibile utilizzare le opzioni di mascheramento dati avanzate in Data Virtualization per evitare di esporre dati sensibili.
Per ulteriori informazioni sul comportamento di mascheramento aggiornato, consultare Masking virtual data in Data Virtualization.
Miglioramento delle prestazioni delle query e dell'applicazione delle regole di protezione dei dati
Data Virtualization ora memorizza e memorizza nella cache le regole di protezione dei dati da IBM Knowledge Catalog in una cache PEP (policy enforcement point) per evitare di valutare le regole ogni volta che viene eseguita la query di un oggetto. Questa cache migliora le prestazioni delle query precedentemente eseguite riducendo il numero di chiamate a IBM Knowledge Catalog per richiamare le regole. Tuttavia, potresti notare un ritardo fino a 10 secondi prima che le regole di protezione dei dati appena aggiunte o aggiornate vengano applicate alle query. È possibile utilizzare il client Web per configurare impostazioni della cache PEP, come la dimensione della cache e la durata della cache.
Per ulteriori informazioni, consultare Abilitazione dell'applicazione delle regole di protezione dei dati in Data Virtualization.
Formatta e salva piani di accesso query formattati per l'ottimizzazione delle prestazioni
È ora possibile formattare e salvare piani di accesso formattati per l'ottimizzazione delle prestazioni in Data Virtualization. Quando si eseguono query SQL in Data Virtualization, è possibile utilizzare il client Web per formattare il modo in cui vengono visualizzate le informazioni EXPLAIN quando si generano i piani di accesso query. È quindi possibile eseguire il comando db2exfmt dal client web per generare e scaricare facilmente l'output EXPLAIN nei file di testo.
Utilizzare i caratteri jolly per filtrare le origini dati
Quando si crea una tabella virtualizzata, è possibile utilizzare i seguenti caratteri jolly per personalizzare i filtri per trovare le origini dati necessarie:
- % (percent): per rappresentare zero o più caratteri
- _ (sottolineatura): per rappresentare un singolo carattere
Per ulteriori informazioni, consultare Filtro dei dati in Data Virtualization.
Gli utenti di Data Virtualization possono pubblicare i propri oggetti virtuali
Gli utenti con il ruolo Utente in Data Virtualization possono ora pubblicare gli oggetti virtuali che hanno creato nei cataloghi gestiti.
Per ulteriori informazioni, vedi Pubblicazione di dati virtuali in un catalogo con Data Virtualization.
Gestire chi può accedere ed eseguire operazioni su singole origini dati
Con le restrizioni di accesso all'origine dati, è possibile gestire esplicitamente l'accesso a singole connessioni all'origine dati che utilizzano le credenziali condivise. È possibile assegnare utenti e ruoli come collaboratori per una connessione origine dati. Solo i collaboratori possono accedere alla connessione all'origine dati. Assegnare privilegi specifici ai collaboratori per gestire le azioni che possono eseguire sulle origini dati. Ciò consente di separare i privilegi dai ruoli, in modo che alcuni utenti a cui è assegnato un ruolo come Gestore possano accedere e intraprendere azioni su connessioni di origini dati differenti rispetto ad altri utenti Manager.
Per ulteriori informazioni, consultare Limitazioni di accesso alla connessione origine dati in Data Virtualization.
Query dei dati nei data lake Generici S3 e Microsoft Azure Data Lake Storage Gen2
È ora possibile connettersi alle origini dati Generic S3 e Microsoft Azure Data Lake Storage Gen2 . Per ulteriori informazioni, consultare Supported data sources in Data Virtualization.
Scegliere la modalità query per assegnare una priorità alle prestazioni o alla congruenza
È ora possibile scegliere se eseguire le query in modalità Max Pushdown o in modalità Max Consistency.
- La modalità max pushdown ignora la differenza semantica tra Data Virtualization e l'origine dati per le singole query di origine. Pertanto, più singole query di origine potrebbero essere completamente inviate all'origine dati, migliorando le prestazioni delle query. I risultati della query sono congruenti con la semantica dell'origine dati per le query completamente spostate in basso in questa modalità. La modalità di pushdown massima non influisce sulle query di più origini.
- La modalità Congruenza massima segue la semantica Data Virtualization per valutare se le operazioni possono essere inviate all'origine dati. Se l'operazione eseguita sull'origine dati genera lo stesso risultato di Data Virtualization, l'operazione può essere spostata verso il basso. Le query in questa modalità potrebbero essere completamente spostate verso il basso se l'origine dati remota ha la stessa semantica di Data Virtualization.
Trova e virtualizza rapidamente le tabelle con la scheda Esplora
È ora possibile trovare rapidamente le tabelle che si desidera virtualizzare. Nella pagina Virtualizza, è possibile utilizzare la scheda Esplora per sfogliare database, schemi e tabelle disponibili in un'origine dati collegata. La scheda Elenco visualizza tutte le tabelle disponibili in tutte le origini dati connesse. Nella pagina Origini dati, è possibile filtrare le origini dati per caricare rapidamente l'elenco ridotto di tabelle disponibili nella scheda Elenco.
Per ulteriori informazioni, consultare Creazione di oggetti virtuali in Data Virtualization.
Migliorare la raccolta delle statistiche per le tabelle virtualizzate utilizzando il campionamento dei dati
Il campionamento dati migliora la raccolta delle statistiche riducendo le risorse necessarie per raccogliere le statistiche. Quando si raccolgono statistiche selezionando il metodo di raccolta di query remote nel client Web, viene utilizzata una frequenza di campionamento predefinita del 20%. Per ottimizzare la raccolta delle statistiche, selezionare Abilita campionamento tabella e scegliere una frequenza di campionamento compresa tra 1% e 99%.
Se si raccolgono le statistiche utilizzando DVSYS.COLLECT_STATISTICS , è possibile utilizzare l'opzione TABLESAMPLE con il tipo di raccolta delle statistiche della query remota per campionare i dati quando si raccolgono le statistiche. Per suggerimenti, vedere Note di utilizzo.
È anche possibile utilizzare DVSYS.COLLECT_STATISTICS per raccogliere le statistiche per le tabelle virtualizzate su file flat.
Per ulteriori informazioni, consultare la procedura memorizzata COLLECT_STATISTICS in Data Virtualization.
Utilizzare le credenziali della piattaforma per accedere alle connessioni Data Virtualization
Quando si utilizza una connessione della piattaforma per accedere a Data Virtualization, vengono richieste le credenziali. È possibile, facoltativamente, selezionare Utilizza credenziali di login della piattaforma, invece di immettere le credenziali personali per la connessione. La connessione utilizza il JWT (JSON Web Token) della sessione corrente.
Miglioramenti per le origini dati nell'archiviazione oggetti
- È ora possibile creare le connessioni e virtualizzare i file per le origini dati Generic S3 nell'archivio oggetti:
- È ora possibile creare tabelle virtualizzate da file CSV o TSV compressi esternamente che sono archiviati nell'archivio oggetti. Per ulteriori informazioni, consultare Creazione di una tabella virtuale dai file nell'archivio oggetti.
- È ora possibile virtualizzare i file flat nell'archivio oggetti cloud che contengono intestazioni di colonna.
Per ulteriori informazioni, vedi Creazione di una tabella virtualizzata dai file nell'archivio oggetti cloud in Data Virtualization.
Miglioramenti del push down del predicato e supporto per il push down del predicato su più origini dati
Il push down del predicato è un'ottimizzazione che riduce i tempi di query e l'utilizzo della memoria. Questa release include i seguenti miglioramenti al push down del predicato:
- Le query che includono clausole COUNT (DISTINCT) o GROUP BY possono ora essere spostate verso il basso con le regole di confronto degli spazi finali per le origini dati Teradata, Netezza®, Microsoft SQL Server, Db2® for z/OS®e Db2 Database.
- Le query che includono un'operazione di confronto di stringhe come un predicato GROUP BY o WHERE rispetto ai dati CHAR o VARCHAR per l'origine dati Teradata per gestire la sensibilità al maiuscolo / minuscolo.
- Le istruzioni SQL con i predicati LIKE sono ora inserite in basso per: Db2®, SAP HANA, Oracle, PostgreSQL, Apache Hive, MySQL, Microsoft SQL Server, Snowflake, Netezza® Performance Servere Teradata.
- Le istruzioni SQL con le clausole Fetch vengono ora spostate verso il basso per: Db2, Db2 for z/OS, Apache Derby, Oracle, Amazon Redshift, Google BigQuerye origini dati Salesforce.com .
- Le istruzioni SQL con un filtro di confronto delle stringhe vengono ora spostate verso il basso per: Db2, Microsoft SQL Server, Teradata, Netezza Performance Servere origini dati Apache Derby .
- Le istruzioni SQL con funzioni OLAP vengono ora spostate verso il basso per le origini dati Db2 e Netezza Performance Server .
- Le origini dati Greenplum ora supportano il push down dei predicati.
- L'origine dati MySQL (My SQL Community Edition e My SQL Enterprise Edition) ora supporta il push down dei predicati.
- L'origine dati Cloudera Impala ora supporta il push down dei predicati.
- L'origine dati Data Virtualization Manager for z/OS® ora supporta il push down dei predicati.
Per ulteriori informazioni, consultare Supported data sources in Data Virtualization.
Una connessione Data Virtualization è ora disponibile nelle connessioni della piattaforma per impostazione predefinita
È possibile aggiungere una connessione Data Virtualization dalle connessioni della piattaforma a cataloghi e progetti senza popolare manualmente i dettagli della connessione.
Gestire l'accesso per più utenti e ruoli se si è un Gestore
Come Data Virtualization Manager, è ora possibile concedere e revocare l'accesso per più utenti e ruoli contemporaneamente.
Per ulteriori informazioni, consultare Gestione dell'accesso agli oggetti virtuali in Data Virtualization.
I gestori Data Virtualization possono ora rendere visibili gli oggetti virtuali a tutti gli utenti
I gestori possono ora scegliere di fornire agli utenti una vista più completa del contenuto rendendo visibili gli oggetti virtuali esistenti dalla pagina Dati virtualizzati. L'accesso ai dati all'interno di tali oggetti continua a rispettare le autorizzazioni Data Virtualization e le regole di protezione dei dati. Per abilitare questa funzione, i gestori devono disabilitare l'impostazione Limita visibilità dalle impostazioni Servizio.
Per ulteriori informazioni, consultare Gestione della visibilità degli oggetti virtuali in Data Virtualization.
Nuove API di memorizzazione nella cache
Le voci della cache possono essere gestite tramite le API REST che il servizio di memorizzazione nella cache espone. Queste API possono essere richiamate da qualsiasi applicazione. È possibile utilizzare le nuove API di memorizzazione nella cache per effettuare le attività riportate di seguito:
- Crea una cache
- Elencare una cache specifica
- Elimina una cache
- Abilita una cache
- Disabilitare una cache
- Aggiorna una cache
- Modifica una cache
Le seguenti API di memorizzazione nella cache sono obsolete:
- Elenca cache
- Elenca una cache
- Recupera la memoria cache
Per ulteriori informazioni, vedi Cache nella documentazione API Data Virtualization 2.0.0 .
Nuova API di pubblicazione
È possibile pubblicare i dati virutalizzati nei cataloghi utilizzando la seguente API:
La seguente API è obsoleta:
Settimana che termina il 1 dicembre 2023
Nuovi piani per Watson OpenScale come parte di watsonx.governance
1 dicembre 2023
Watson OpenScale è ora parte di watsonx.governance. Il provisioning watsonx.governance dal catalogo IBM Cloud installa Watson OpenScale. Su Cloud Pak for Data as a Service, Watson OpenScale continua a fornire servizi per la valutazione dei modelli di machine learning predittivi. Su watsonx, il provisioning di watsonx.governance estende le funzionalità di governance di Watson OpenScale per valutare gli asset del modello di base e gli asset di machine learning. È possibile definire i casi di utilizzo AI per risolvere i problemi di business, quindi tenere traccia dei dati degli asset nei factsheet per supportare gli obiettivi di conformità e governance. I piani e le funzioni Watsonx.governance sono disponibili solo nella regione di Dallas. I piani legacy Watson OpenScale sono disponibili nella regione di Francoforte.
- Per visualizzare i dettagli del piano, vedi i piani watsonx.governance .
- Per iniziare, vedi Provisioning e avvio di watsonx.governance.
IBM Watson Knowledge Catalog è ora IBM Knowledge Catalog
1 dicembre 2023
IBM Watson Knowledge Catalog viene ridenominato IBM Knowledge Catalog. Solo il nome è cambiato, i piani di offerta del servizio e le funzionalità del prodotto rimangono gli stessi.
Nuove origini dati per importazione metadati in IBM Knowledge Catalog
1 dicembre 2023
È possibile importare metadati in IBM Knowledge Catalog dalle seguenti origini dati:
- IBM Match 360
- SingleStoreDB
Per maggiori informazioni, consultare Origini dati supportate per l'importazione dei metadati, l'arricchimento dei metadati e le regole di qualità dei dati.
Settimana conclusosi il 17 novembre 2023
Nuova proprietà personalizzata di tipo utente e gruppo utenti
17 novembre 2023
È ora possibile creare una proprietà personalizzata di tipo utente e gruppo di utenti e assegnarvi utenti o gruppi di utenti specifici. Per ulteriori informazioni, consultare Creazione delle proprietà personalizzate.
Più origini su entrambe le estremità di un tipo di relazione personalizzata
17 novembre 2023
È possibile estendere la propria serie di tipi di relazione personalizzati utilizzando più tipi sull'estremità di origine e destinazione. Utilizzare molti tipi di risorsa utente, asset e colonna per una definizione di relazione più dettagliata. Per ulteriori informazioni, consultare Creazione di relazioni personalizzate.
Nuove autorizzazioni per la qualità dei dati in IBM Knowledge Catalog
17 novembre 2023
È ora possibile assegnare le seguenti autorizzazioni ai propri utenti per avere un maggiore controllo su come viene stabilita la qualità dei dati in IBM Knowledge Catalog:
- Gestire gli asset di qualità dei dati
- Esegui regole di qualità dati
- Drill down ai dettagli del problema
Per impostazione predefinita, le nuove autorizzazioni sono incluse nei seguenti ruoli:
- Amministratore
- CloudPak Data Quality Analyst, che è un ruolo nuovo
Aggiornare le assegnazioni dei ruoli e tutti i ruoli personalizzati che si potrebbero avere per gli utenti che devono gestire le definizioni e le regole di qualità dei dati e per eseguire le regole di qualità dei dati.
Per ulteriori informazioni, vedi Ruoli e autorizzazioni utente per IBM Knowledge Catalog e Watson Studio.
Regole di protezione dei dati di esportazione e di importazione
17 novembre 2023
È ora possibile utilizzare API per esportare e importare regole di protezione dei dati in più istanze di Cloud Pak for Data as a Service. I collegamenti alle risorse utente del glossario, ai cataloghi, agli asset e agli utenti vengono mantenuti quando si esportano le regole di protezione dati.
Per ulteriori informazioni, consultare Migrating data protection rules.
Esegui flussi DataStage in modalità di esecuzione ELT (Extract, Load, and Transform) (Beta)
13 novembre 2023
Il processo ELT è diverso dal processo ETL (Extract, Transform and Load) tradizionale in quanto esegue la parte di trasformazione del processo nel database di destinazione, che può essere più efficiente e conveniente. Questa funzionalità è attualmente offerta in beta e non è supportato per la produzione.
Rimozione di alcuni tipi di relazione predefiniti (13 dicembre 2023)
13 novembre 2023
Il 13 dicembre 2023, verranno rimossi i tipi di relazione predefiniti per le relazioni asset - asset e asset - risorsa utente che non vengono utilizzati di frequente.
Saranno interessati i seguenti tipi di relazione:
Defines - Is defined by
verrà sostituito daContains - Is contained in
Is owner of - Is owned by
verrà sostituito daContains - Is contained in
Has for parent entity - Is relationship child of
verrà sostituito daIs parent of - Is child of
Is supertype of - Is subtype of
verrà sostituito daIs parent of - Is child of
Di seguito sono riportate le operazioni da eseguire:
- Se non si utilizzano questi tipi di relazione, non è richiesta alcuna azione.
- Se si utilizzano questi tipi di relazione e si accettano i tipi di relazione di sostituzione, non è richiesta alcuna azione.
- Se si stanno utilizzando questi tipi di relazione e si desidera assegnare diversi tipi di relazione, rimuovere la relazione corrente e creare nuove relazioni utilizzando altri tipi di relazione personalizzatio predefiniti.
Se hai domande o dubbi relativi alla sostituzione di questi tipi di relazione, puoi aprire un ticket di supporto.
Settimana che termina il 10 novembre 2023
Rimozione della chiave di risorsa dal pannello dei dettagli per le colonne
10 novembre 2023
La chiave di risorsa è stata visualizzata nel pannello dei dettagli a livello di colonna anche se le informazioni non erano applicabili per le colonne. La chiave risorsa viene ora eliminata dal pannello dei dettagli a livello di colonna. Le informazioni sono ancora richieste a livello di asset. Ad esempio, la chiave di risorsa dell'asset potrebbe essere utilizzata nel file CSV di importazione dell'associazione di derivazione.
Distribuisci i motori di runtime remoto DataStage localmente con DataStage-aaS Anywhere
9 novembre 2023
Puoi ora distribuire i motori di runtime remoti DataStage per eseguire i lavori di integrazione dei dati in loco o su qualsiasi data center o cloud.
Il motore di runtime DataStage è un'offerta inserita nel contenitore distribuita in ambienti locali per migliorare le prestazioni e la sicurezza. Progetta le pipeline ETL e ELT in DataStage ed esegui le attività di integrazione dati localmente sul tuo motore. Gli amministratori possono avviare uno o più motori di runtime remoti. Per la sicurezza, lo stile di esecuzione non può essere ripristinato al runtime senza server IBM Cloud una volta che DSaaS Anywhere è abilitato per un progetto, ma il runtime senza server IBM Cloud rimane disponibile per altri progetti.
Per ulteriori informazioni, consultare AmbientiDataStage.
Annuncio del supporto per i framework Python 3.10 e R4.2 e le specifiche software sul runtime 23.1
9 novembre 2023
Puoi ora utilizzare IBM Runtime 23.1, che include i framework di data science più recenti basati su Python 3.10 e R 4.2, per eseguire i notebook Watson Studio Jupyter e gli script R, addestrare i modelli ed eseguire le distribuzioni Watson Machine Learning . Aggiorna gli asset e le distribuzioni per utilizzare le specifiche software e i framework IBM Runtime 23.1 .
- Per informazioni sulla release IBM Runtime 23.1 e sugli ambienti inclusi per Python 3.10 e R 4.2, vedere Modifica degli ambienti notebook.
- Per i dettagli sui framework di distribuzione, vedi Gestione di framework e specifiche software.
Utilizzare Apache Spark 3.4 per eseguire notebook e script
Spark 3.4 con Python 3.10 e R 4.2 è ora supportato come runtime per notebook e script RStudio nei progetti. Per i dettagli sugli ambienti notebook disponibili, consultare Opzioni di calcolo delle risorse per l'editor di notebook nei progetti e Opzioni di calcolo delle risorse per RStudio nei progetti.
Settimana che termina il 27 ottobre 2023
Accedere ai dati da file flat complessi in DataStage
27 ottobre 2023
Ora è possibile utilizzare il connettore Complex Flat nei flussi DataStage .
Per l'elenco completo dei connettori DataStage , consultare Origini dati supportate in DataStage.
Salvataggio della query di ricerca quando si utilizza la barra di ricerca globale
27 ottobre 2023
È ora possibile salvare i criteri di ricerca per un utilizzo successivo. Le ricerche salvate vengono elencate nell'elenco a discesa quando si digita nella barra di ricerca. È anche possibile modificare o eliminare la ricerca salvata. Consultare Salvataggio della ricerca.
Connetti a più origini dati in DataStage
27 ottobre 2023
È ora possibile includere i dati da queste origini dati nei flussi DataStage :
- Apache Derby
- IBM Cloud Data Engine
- IBM Cloud Databases for DataStax
- IBM watsonx.data
Per l'elenco completo dei connettori DataStage , consultare Origini dati supportate in DataStage.
Utilizzare un connettore Satellite Connector per connettersi a un database in loco
26 ottobre 2023
Utilizzare il nuovo connettore Satellite per connettersi a un database non accessibile tramite Internet (ad esempio, dietro un firewall). Satellite Connector utilizza una comunicazione leggera basata su Dockerche crea comunicazioni sicure e controllabili dall'ambiente in loco a IBM Cloud. Per istruzioni, vedi Connessione ai dati dietro un firewall.
Secure Gateway è obsoleto
26 ottobre 2023
IBM Cloud ha annunciato l'obsolescenza di Secure Gateway. Per informazioni, consultare Panoramica e sequenza temporale.
Se attualmente si dispone di connessioni configurate con Secure Gateway, pianificare l'utilizzo di un metodo di comunicazione alternativo. In Cloud Pak for Data as a Service, è possibile utilizzare il connettore Satellite come sostituto di Secure Gateway. Consultare Connessione ai dati dietro un firewall.
Utilizzare la raccolta NLS in DataStage
27 ottobre 2023
È ora possibile confrontare i dati con il supporto lingua nazionale nei flussi DataStage .
Settimana che termina il 20 ottobre 2023
Accedi ai dati lakehouse con la connessione IBM watsonx.data
20 ottobre 2023
Puoi utilizzare la connessione IBM watsonx.data per connettersi a un database in un'istanza watsonx.data distribuita su Cloud Pak for Data o IBM Cloud. IBM watsonx.data è un data lakehouse aperto, ibrido e governato, ottimizzato da un motore di query per tutti i carichi di lavoro di dati e AI.
Per informazioni, vedi IBM watsonx.data connection.
Settimana che termina il 13 ottobre 2023
Nomi di proprietà di enumerazione personalizzati tradotti nella lingua preferita (IBM Knowledge Catalog)
13 ottobre 2023
I proprietari di proprietà personalizzate possono ora consentire la traduzione dei nomi delle proprietà del tipo di enumerazione personalizzato nella propria lingua preferita.
Il proprietario della proprietà del tipo di enumerazione personalizzato per un asset o una colonna deve definire la definizione della proprietà prima di poter scegliere di visualizzare i nomi delle proprietà di enumerazione personalizzate nella lingua del browser. Per ulteriori informazioni, consultare Creazione delle proprietà personalizzate.
Soluzioni intermedie in Decision Optimization
12 ottobre 2023
È ora possibile scegliere di vedere un campione di soluzioni intermedie mentre è in esecuzione un esperimento di Decision Optimization . Ciò può essere utile per il debug o per vedere come il risolutore sta procedendo. Per i grandi modelli che impiegano più tempo a risolvere, con soluzioni intermedie è ora possibile identificare rapidamente e facilmente eventuali problemi potenziali con la soluzione, senza dover attendere il completamento della soluzione. È possibile configurare il parametro di distribuzione della soluzione intermedia nella configurazione di esecuzione e selezionare una frequenza per queste soluzioni. Per ulteriori informazioni, consultare Soluzioni intermedie e Parametri di configurazione di esecuzione.
Finestra di dialogo Nuovo modello salvato Decision Optimization
Quando si salva un modello per la distribuzione dall'interfaccia utente di Decision Optimization , è ora possibile esaminare lo schema di input e output e selezionare più facilmente le tabelle che si desidera includere. È inoltre possibile aggiungere, modificare o eliminare i parametri di configurazione di esecuzione, esaminare l'ambiente e i file di modelli utilizzati. Tutti questi elementi vengono visualizzati nella stessa finestra di dialogo Salva come modello per distribuzione . Per ulteriori informazioni, vedi Distribuzione di un modello Decision Optimization utilizzando l'interfaccia utente.
Obsolescenza della creazione profili di dati non strutturati (IBM Knowledge Catalog)
10 ottobre 2023
Ad oggi, non è più possibile creare il profilo degli asset di dati che contengono dati non strutturati.
Visualizzare le metriche di runtime per i job DataStage
9 ottobre 2023
Ora è possibile visualizzare le metriche di runtime per i job di DataStage nell'area di disegno e nella pagina dei dettagli dell'esecuzione del job. Per ulteriori informazioni, vedi Creazione e gestione di job DataStage.
Aggiunta di chiavi e attributi in massa ai nuovi stage
9 ottobre 2023
È ora possibile aggiungere in massa chiavi e attributi ai seguenti stage nei flussi DataStage : Sort, Merge, Join, Remove duplicate, Difference, Change capture, Change apply, Combine records, Funnel, Compare, Lookup file set, Write range map e Bloom filter.
Settimana che termina il 6 ottobre 2023
Controllare il posizionamento di una nuova colonna nell'operazione Concatena (Data Refinery)
6 ottobre 2023
Ora sono disponibili due opzioni per specificare la posizione della nuova colonna che risulta dall'operazione Concatena : come la colonna più a destra nel dataset o accanto alla colonna originale.
In precedenza, la nuova colonna era posizionata all'inizio del dataset.
Modificare l'operazione Concatena in uno dei flussi Data Refinery esistenti per specificare la nuova posizione della colonna. In caso contrario, il flusso potrebbe avere esito negativo.
Per informazioni sulle operazioni Data Refinery , vedere Operazioni GUI in Data Refinery.
Settimana che termina il 29 settembre 2023
Utilizzare le nuove funzioni nel builder dell'espressione per lo stage Modify in DataStage
25 settembre 2023
È possibile utilizzare le funzioni di conversione nel builder dell'espressione nello stage Modify nei flussi DataStage .
Settimana che termina il 22 settembre 2023
Modelli Java Decision Optimization
20 settembre 2023
Decision Optimization I modelli Java possono ora essere distribuiti in Watson Machine Learning. Utilizzando l'API del nodo di lavoro Java, è possibile creare modelli di ottimizzazione con API Java OPL, CPLEX e CP Optimizer. Puoi ora creare facilmente i tuoi modelli localmente, impacchettarli e distribuirli su Watson Machine Learning utilizzando il contenitore tipo fornito nell' operatore Java GitHubpubblico. Per ulteriori informazioni, consultare Distribuzione di modelli Java per Decision Optimization.
Settimana che termina l'8 settembre 2023
Promemoria: la creazione di profili Watson Knowledge Catalog di dati non strutturati verrà interrotta
8 settembre 2023
La profilazione di asset di dati non strutturati non sarà più supportata a partire dal 10 ottobre 2023.
Settimana che termina il 1 ° settembre 2023
Deprecazione dei commenti nei notebook
31 agosto 2023
A partire da oggi non è possibile aggiungere commenti a un notebook dalla barra delle azioni del notebook. Tutti i commenti esistenti sono stati rimossi.
Utilizzare la nuova variabile di ambiente in DataStage
28 agosto 2023
Ora puoi aggiungere la variabile di ambiente APT_SHOW_METRICS ai parametri del flusso dei tuoi flussi DataStage .
Settimana che termina il 25 agosto 2023
Trova rapidamente cataloghi con ordinamento di nome e data
24 agosto 2023
È ora possibile trovare i cataloghi ordinando l'elenco di cataloghi nella pagina Visualizza tutti i cataloghi in base al nome o alla data di creazione. Fare clic sull'intestazione Nome per ordinare alfabeticamente i cataloghi per nome. Fare clic sull'intestazione Data di creazione per ordinare i cataloghi in base alle date ascendenti o discendenti.
Panoramica sulla qualità dei dati in IBM Knowledge Catalog
22 agosto 2023
Le informazioni sulla qualità dei dati hanno una casa nuova. Per ciascun asset di dati in un catalogo o in un progetto, una pagina Qualità dati viene popolata con informazioni di qualità provenienti da controlli di qualità dei dati predefiniti e regole di qualità dei dati. È possibile visualizzare le dimensioni di qualità dei dati applicabili e i risultati dei singoli controlli di qualità. È possibile eseguire il drill - down nei risultati per ogni controllo o anche nei risultati per ogni colonna.
Per ulteriori informazioni, consultare Qualità dei dati.
Informazioni simili sono disponibili dai risultati dell'arricchimento dei metadati.
Tutta l'analisi della qualità dei dati viene ora eseguita nel contesto dell'arricchimento dei metadati o delle regole di qualità dei dati. Quando si esegue la creazione profili dalla pagina Profilo in un progetto o in un catalogo, la qualità dei dati non viene più analizzata e non viene generato alcun punteggio di qualità dei dati.
Ulteriori miglioramenti della cache disponibili per Watson Pipelines
21 agosto 2023
Sono disponibili ulteriori opzioni per personalizzare le impostazioni del flusso della pipeline. Ora puoi esercitare un maggiore controllo su quando la cache viene utilizzata per le esecuzioni della pipeline. Per i dettagli, consultare Gestione delle impostazioni predefinite.
Settimana che termina il 18 agosto 2023
Aggiornamenti del nome piano per il servizio Watson Machine Learning
18 agosto 2023
A partire da subito, i nomi dei piani vengono aggiornati per il servizio IBM Watson Machine Learning , come segue:
Il piano v2 Standard è ora il piano Essentials . Il piano è progettato per fornire alla tua azienda le risorse necessarie per iniziare a lavorare con i modelli di base e gli asset di machine learning.
Il piano Professional v2 è ora il piano Standard . Questo piano fornisce risorse progettate per supportare la maggior parte delle aziende attraverso la creazione di asset per un utilizzo produttivo.
Le modifiche ai nomi dei piani non modificano i termini di servizio. Vale a dire, se sei registrato per utilizzare il piano Standard v2 , ora sarà denominato Essentials, ma tutti i dettagli del piano rimarranno invariati. Allo stesso modo, se sei registrato per utilizzare il piano Professional v2 , non ci sono modifiche oltre alla modifica del nome del piano in Standard.
Per i dettagli su ciò che è incluso con ogni piano, consulta PianiWatson Machine Learning. Per informazioni sui prezzi, trova il tuo piano nella pagina del piano Watson Machine Learning nel catalogo IBM Cloud .
Connetti a più origini dati in DataStage
18 agosto 2023
È ora possibile includere i dati da queste origini dati nei flussi DataStage :
- Cloudera Impala
- Presto
Per l'elenco completo dei connettori DataStage , consultare Origini dati supportate in DataStage.
Connetti ai dati Google BigQuery con ODBC (DataStage)
18 agosto 2023
La connessione ODBC include ora l'origine dati Google BigQuery .
Per un elenco completo delle origini dati disponibili per la connessione ODBC in DataStage, consultare ConnessioneODBC.
Settimana che termina il 11 agosto 2023
Utilizzare le nuove funzioni nello stage DataStage Transformer
8 agosto 2023
- È ora possibile utilizzare le funzioni di data masking, crittografia e regex nello stage Transformer come parte dei flussi DataStage .
- È ora possibile trascinare e rilasciare le colonne nella scheda Output dello stage Transformer.
- È ora possibile modificare in massa le colonne nello stage Transformer dalla scheda Input.
Deprecazione dei commenti nei notebook
7 agosto 2023
Il 31 agosto 2023, non sarà più possibile aggiungere commenti a un notebook dalla barra delle azioni del notebook. Tutti i commenti esistenti che sono stati aggiunti in questo modo verranno rimossi.
Settimana che termina il 4 agosto 2023
Modello di analisi del testo personalizzato (SPSS Modeler)
4 agosto 2023
Per SPSS Modeler, è ora possibile caricare un modello di analisi del testo personalizzato in un progetto. Ciò fornisce una maggiore flessibilità per acquisire ed estrarre i concetti chiave in un modo univoco per il proprio contesto.
Settimana che termina il 28 luglio 2023
Funzionalità avanzate per la valutazione dei modelli con Watson OpenScale
25 luglio 2023
Utilizzare queste nuove funzioni per monitorare e valutare le distribuzioni del modello e interpretare i risultati.
Configurare le distribuzioni con una nuova impostazione guidata
È disponibile una nuova procedura guidata di configurazione per aggiungere le distribuzioni al dashboard Watson OpenScale Insights e fornire i dettagli del modello. Per ulteriori informazioni, vedi Aggiunta di distribuzioni per le valutazioni.
Configura la nuova valutazione della deviazione per fornire ulteriori informazioni
È possibile configurare una nuova versione della valutazione della deviazione in Watson OpenScale per generare la seguente nuova metrica:
- Deviazione output
- Deviazione funzione
- Deviazione qualità modello
Per ulteriori informazioni, vedi Configurazione delle valutazioni della deviazione v2.
Comprendere le prestazioni del modello con le valutazioni di integrità del modello
Watson OpenScale ora fornisce nuove valutazioni di integrità del modello per impostazione predefinita per aiutarti a comprendere quanto efficientemente il tuo modello elabora le tue transazioni. Per ulteriori informazioni, consultare Metriche di valutazione del monitor di integrità del modello.
Aggiunta di modelli di previsione a più obiettivi in Watson OpenScale
Quando aggiungi le tue distribuzioni in Watson OpenScale, puoi ora specificare più colonne di previsione per fornire i dettagli sull'output dei modelli per configurare le valutazioni della qualità. Per ulteriori informazioni, vedi Fornitura dei dettagli del modello.
Esegui valutazioni di correttezza con dati non strutturati
È ora possibile abilitare le valutazioni di correttezza sui tipi di dati non strutturati per identificare la distorsione. Per ulteriori informazioni, consultare Configurazione delle valutazioni di correttezza.
Settimana che termina il 14 luglio 2023
Gestisci relazioni di colonne di asset in un catalogo
14 luglio 2023
Gli amministratori possono ora creare e gestire relazioni di colonne di asset in un catalogo. Le relazioni di colonna possono essere create tra colonne e asset, colonne e risorse utente o tra colonne.
Per aggiungere una relazione di colonna, fare clic su una riga di colonna nella pagina Panoramica di un asset. Nel riquadro laterale, fare clic sul menu di overflow Elementi correlati . Selezionare uno dei tipi di relazioni dal menu a discesa per aggiungere una relazione.
Per ulteriori informazioni sulla creazione di relazioni, vedere Relazioni di asset in un catalogo.
Obsolescenza del supporto di creazione profili per i dati non strutturati in IBM Knowledge Catalog
12 luglio 2023
La creazione di profili di asset di dati che contengono dati non strutturati, come documenti Microsoft Word, PDF, HTML e testo semplice, è obsoleta. Il supporto sarà interrotto il 10 ottobre 2023. Fino ad allora, gli asset di dati non strutturati dei tipi supportati continueranno ad essere profilati automaticamente quando vengono aggiunti a un progetto o a un catalogo. A partire dall ' 11 ottobre 2023, gli asset di dati non strutturati appena aggiunti non saranno più profilati. I profili esistenti saranno disponibili mentre i rispettivi asset di dati sono attivi nel progetto o nel catalogo.
Microsoft Azure SQL Database supporta l'autenticazione Azure Active Directory (Azure AD)
14 luglio 2023
Ora è possibile selezionare Active Directory per la connessione Microsoft Azure SQL Database . L'autenticazione Active Directory è un'alternativa all'autenticazione SQL Server . Grazie a questo miglioramento, gli amministratori possono gestire centralmente le autorizzazioni utente per Azure. Per ulteriori informazioni, vedere Microsoft Azure SQL Database connection.
Settimana che termina il 7 luglio 2023
Passa a IBM watsonx.ai
7 luglio 2023
Se hai i servizi Watson Studio e Watson Machine Learning , ora hai accesso a IBM watsonx.ai. Puoi passare da Cloud Pak for Data as a Service a watsonx e lavorare con i modelli di base nello strumento Prompt Lab o nei notebook.
Consultare Passaggio tra piattaforme.
Aggiornamenti ai piani Watson Machine Learning
7 luglio 2023
Tutti i piani di Watson Machine Learning ora includono l'inferenza del modello di base. L'inferenza del modello Foundation è disponibile solo su watsonx.ai. È possibile passare a watsonx.ai e utilizzare il nuovo strumento Prompt Lab o accedere a modelli di base con un notebook. Utilizza la stessa istanza del servizio Watson Machine Learning su watsonx.ai di Cloud Pak for Data as a Service.
Se disponi del piano Watson Machine Learning Lite, puoi utilizzare fino a 25.000 token per l'inferenza del modello di fondazione al mese.
Se disponi del piano Watson Machine Learning v2 Standard o v2 Professional, il tuo account verrà addebitato quando gli utenti del tuo account eseguono l'inferenza del modello di base nel Prompt Lab o nei notebook.
Per i dettagli su come viene tracciata e fatturata l'inferenza del modello di base, vedi il pianoWatson Machine Learning. Per il prezzo dell'inferenza del modello di base, trova il tuo piano nella pagina del pianoWatson Machine Learning nel catalogo IBM Cloud .
Funzionalità Natural Language Processing migliorate in Runtime 23.1
7 luglio 2023
Il runtime 23.1 contiene la libreria Watson Natural Language Processing 4.1 e una nuova serie di modelli preaddestrati. La libreria NLP contiene i seguenti miglioramenti e aggiornamenti:
- Molti modelli inclusi sono ora basati su trasformatori. Questi modelli sono stati addestrati su LLM (Slate large language model), creato da IBM. I modelli sono disponibili in due versioni:
- Ottimizzato per ambienti solo CPU
- Per ambienti con GPU o CPU
- Molti modelli inclusi per le diverse attività NLP sono ora basati sul flusso di lavoro invece che sul blocco, quindi puoi applicare i modelli direttamente sul testo di input senza preoccuparti delle fasi di pre - elaborazione.
NLP include un modello di base Slate che puoi utilizzare per ottimizzare le tue attività NLP. Puoi utilizzare il modello Slate o qualsiasi modello basato su transformer da Hugging Face come base per creare i propri modelli con Watson NLP.
Tutti i modelli forniti da IBM sono ora addestrati esclusivamente su dati non distorti con filtri all'avanguardia per odio, pregiudizi e volgarità.
Queste funzioni sono attualmente disponibili nei seguenti ambienti:
- NLP Runtime 23.1 su Python 3.10
- GPU V100 Runtime 23.1 su Python 3.10
- GPU 2xV100 Runtime 23.1 su Python 3.10
È possibile utilizzare questi ambienti per l'elaborazione NLP, ma non per lo sviluppo di modelli generali. Le librerie di data science utilizzate in questi ambienti non sono ancora supportate da Watson Machine Learning.
Per ulteriori informazioni, vedi Watson Natural Language Processing.
Settimana che termina il 30 giugno 2023
Contenuto Data Privacy migliorato in Knowledge Accelerators (IBM Knowledge Catalog)
28 giugno 2023
Knowledge Accelerator for Cross Industry ora ha contenuto Data Privacy che comprende una serie di termini di business classificati e classi di dati per accelerare il rilevamento e la governance delle informazioni personali. Inoltre, sono disponibili regole e politiche sulla privacy dei dati di esempio per descrivere le attività relative al trattamento delle informazioni personali.
I termini di business e le classi di dati hanno classificazioni per guidare l'identificazione delle informazioni personali (PI) e delle informazioni personali sensibili (SPI). È possibile utilizzare l'arricchimento dei metadati in IBM Knowledge Catalog per assegnare termini di business agli asset di dati importati per identificare gli asset che contengono dati personali.
Reporting ora disponibile per gli asset personalizzati (IBM Knowledge Catalog)
28 giugno 2023
È ora possibile creare query, report e dashboard in base a proprietà definite in modo personalizzato per qualsiasi asset in un progetto o in un catalogo. È possibile definire nuove proprietà personalizzate per gli asset per estendere qualsiasi tipo di asset fornito o personalizzato e quindi creare report basati su queste relazioni. Ad esempio, è possibile creare un report sulle regole di qualità dei dati e sulle relazioni delle risorse utente per estrapolare la precisione dei propri dati. Per ulteriori informazioni, consultare Impostazione della creazione di report.
Miglioramenti nella creazione di report per regole di qualità dei dati (IBM Knowledge Catalog)
28 giugno 2023
È ora possibile monitorare regole di qualità dei dati nei modi seguenti:
- Ricevere e gestire report sui problemi di qualità dei dati per ciascun asset di dati in un catalogo o in un progetto.
- Monitorare la qualità dei dati in corso per gli asset di dati in progetti e cataloghi utilizzando i report per i punteggi di qualità dei dati e i punteggi delle dimensioni di qualità dei dati. Il punteggio di qualità dei dati si basa su una media ponderata dei punteggi delle dimensioni di qualità dei dati. I punteggi delle dimensioni della qualità dei dati si basano sui risultati dei relativi controlli della qualità dei dati.
- Per le regole di qualità dei dati che includono più definizioni di regole, vedere le statistiche di controllo della qualità dei dati (risultati) per definizione di regole nello schema di reporting BI.
Per ulteriori informazioni, consultare Modello dati.
Settimana che termina il 23 giugno 2023
Gestisci i modelli in modo più efficiente con i miglioramenti per AI Factsheets
23 giugno 2023
AI Factsheets ora offre più modi per tenere traccia delle soluzioni per problemi di business, gestire una gamma più ampia di asset, acquisire ulteriori informazioni con allegati di factsheet e generare report migliorati.
Tenere traccia delle diverse soluzioni dei casi di utilizzo dei modelli con gli approcci
Quando si tengono traccia dei modelli in un caso di utilizzo, è ora possibile creare uno o più approcci per tenere traccia di metodi e versioni di modelli differenti per risolvere un problema di business. Ad esempio, è possibile creare due approcci differenti in un caso di utilizzo per confrontare il modo in cui i diversi algoritmi influiscono sulle prestazioni del modello in modo da trovare la soluzione migliore. Per i dettagli, vedi Gestione delle versioni del modello in un caso di utilizzo.
Opzioni avanzate per gestire i modelli esterni
Puoi ora utilizzare i AI Factsheets per gestire una gamma più ampia di modelli esterni, inclusi i modelli sviluppati, distribuiti e monitorati su una piattaforma diversa da Cloud Pak for Data as a Service. Oltre ai metadati più completi tracciati per i modelli esterni, il client Python e i comandi API forniscono ulteriori funzioni per spostare i modelli e le distribuzioni in ambienti differenti per tracciare in modo più accurato il ciclo di vita per questi asset. Per i dettagli, consultare Aggiunta di un modello esterno all'inventario del modello.
Esercitare un maggiore controllo sugli allegati
Gli amministratori dell'inventario del modello possono creare gruppi di allegati e creare definizioni di allegati in modo che gli utenti possano visualizzare gli allegati in modo più organizzato e caricare gli allegati in un formato approvato. Per i dettagli, consultare Aggiunta e gestione di allegati per i factsheet.
Aggiungi branding ai tuoi report AI Factsheets .
Personalizzare i modelli di report utilizzati per creare report da fogli di factsheet aggiungendo informazioni sul marchio e un logo. Per ulteriori informazioni, consultare la sezione Creazione di report per i fogli di calcolo e i casi di utilizzo dei modelli. Per i dettagli, consultare Generazione di report per i fogli di calcolo e i casi di utilizzo dei modelli.
Annuncio del supporto per il runtime Python 3.10 Spark 3.3 per notebook (Watson Studio)
23 giugno 2023
Python 3.10 Spark 3.3 è ora supportato come runtime per i notebook. Python 3.9 Spark 3.3 è obsoleto e verrà interrotto il 20 luglio 2023. A partire dal 6 luglio 2023, ti verrà impedito di creare i notebook con un ambiente Python 3.9 Spark 3.3 , ma i notebook esistenti continueranno ad essere eseguiti fino al 30 luglio 2023. Modificare l'ambiente notebook per utilizzare Python 3.10 Spark 3.3 prima che l'ambiente obsoleto venga rimosso. Per i dettagli sugli ambienti notebook, consultare Opzioni di calcolo delle risorse per l'editor del notebook nei progetti.
Settimana che termina il 16 giugno 2023
In arrivo: disponibilità generale della previsione delle anomalie delle serie temporali negli esperimenti AutoAI
15 giugno 2023
Creare un esperimento di previsione delle anomalie delle serie temporali per addestrare un modello in grado di rilevare anomalie o risultati imprevisti, quando il modello prevede i risultati in base a nuovi dati. Questa funzione di AutoAI è attualmente offerta in versione beta e non è supportata per la produzione. Una volta che la funzione è generalmente disponibile e completamente supportata, l'addestramento per gli esperimenti di previsione delle anomalie delle serie temporali consumerà CUH (Capacity Unit Ore) come parte del tuo piano Watson Machine Learning . Per ulteriori dettagli, consultare:
Personalizza i parametri del motore per gli esperimenti Decision Optimization (Watson Studio)
15 giugno 2023
È ora possibile aggiungere un file di impostazioni motore nell'esperimento Decision Optimization . Con questo file, è possibile visualizzare e personalizzare i parametri del motore utilizzati per risolvere il modello in un nuovo editor visivo. È inoltre possibile importare un file di impostazioni motore e ricercare le impostazioni esistenti.
Settimana che termina il 2 giugno 2023
Gestire gli eventi del ciclo di vita AI con lo strumento cpdctl
2 giugno 2023
È ora possibile gestire e automatizzare gli asset ospitati in Cloud Pak for Data as a Service utilizzando lo strumento CLI (Command Line Interface) Cloud Pak for Data (cpdctl). Utilizza la configurazione automatica da IBM Cloud per connetterti facilmente ai comandi API cpdctl. Per i dettagli e un esempio, consultare le seguenti risorse:
- Documentazione IBM Cloud Pak for Data Command Line Interface .
- Esportazione di asset di spazio per un esempio di utilizzo di cpdctl per la gestione di asset.
- IBM cpdctl CLI on IBM Cloud post del blog per dettagli sulla connessione a cpdctl da Cloud Pak for Data as a Service.
Trova facilmente i tuoi cataloghi con la ricerca
1 giugno 2023
Con la pagina Cataloghi aggiornata, è ora possibile cercare un catalogo per nome e visualizzare più cataloghi nella pagina per una scansione più semplice.
Settimana che termina il 19 maggio 2023
Promemoria: fine del supporto per Runtime 22.1 su Python 3.9 e R 3.6
15 maggio 2023
IBM Runtime 22.1 su Python 3.9 e R 3.6 verranno rimossi il 15 giugno 2023. Non puoi più creare nuovi notebook o creare ambienti personalizzati utilizzando i runtime 22.1 o R 3.6o addestrare nuovi modelli con le specifiche software Python 3.9 . Aggiorna i tuoi asset e le tue distribuzioni per utilizzare IBM Runtime 22.2 su Python 3.10 o R 4.2 prima del 15 giugno 2023.
- Per i dettagli sulla migrazione di un asset a un framework supportato e alle specifiche software, consultare Gestione di framework e specifiche software.
- Per i dettagli sugli ambienti notebook, consultare Opzioni di calcolo delle risorse per l'editor del notebook nei progetti.
- Per informazioni sulla modifica degli ambienti, consultare Modifica dell'ambiente di un notebook.
- Per i dettagli sulle librerie e sui package per le versioni R, consultare le Note sulla release CRAN.
Introduzione della ricerca chiave - valore per gli utenti avanzati
18 maggio 2023
Utilizzando le coppie key:value
nella barra di ricerca, è ora possibile ricercare all'interno delle proprietà dell'asset e della risorsa utente, come la descrizione, i tag, le proprietà personalizzate, i nomi delle colonne e molti altri. Vedere Ricerca di proprietà.
Modifica del nome per la connessione IBM Cloud Compose for MySQL
18 maggio 2023
La connessione IBM Cloud Compose for MySQL è stata ridenominata IBM Cloud Databases for MySQL. Le impostazioni precedenti per la connessione rimangono le stesse. È stato modificato solo il nome della connessione.
Connessioni interrotte
18 maggio 2023
Le seguenti connessioni sono state interrotte e rimosse da Cloud Pak for Data as a Service:
- IBM Db2 Event Store
- IBM Db2 Hosted
La ridenominazione degli asset di dati rinomina anche gli allegati file nei progetti
19 maggio 2023
Quando si modifica il nome degli asset di dati con gli allegati file caricati nel progetto, anche gli allegati file vengono ridenominati. Tuttavia, la modifica del nome degli asset di dati importati dai cataloghi non rinomina alcun allegato. È necessario aggiornare tutti i riferimenti all'asset di dati negli asset basati sul codice, come i notebook, al nuovo nome dell'asset di dati, altrimenti l'asset basato sul codice non verrà eseguito. Visualizzare ulteriori informazioni su Gestione degli asset nei progetti.
Settimana che termina il 12 maggio 2023
Nuove funzionalità UI per la creazione di asset personalizzati e la gestione di proprietà personalizzate per le colonne
11 maggio 2023
I collaboratori del catalogo con il ruolo Amministratore o Editor possono ora completare le seguenti attività dal client web:
- Creare asset personalizzati dal catalogo. Per aggiungere un asset personalizzato, selezionare Asset personalizzato dal menu a discesa Aggiungi a catalogo.
- Gestire le proprietà personalizzate per le colonne degli asset di dati. Per gestire le proprietà personalizzate, selezionare una colonna nella Panoramica di un asset e modificare le proprietà nel riquadro laterale.
Per ulteriori informazioni sulle proprietà personalizzate per gli asset di dati, consultare Personalizza tipi di asset, proprietà e relazioni.
Settimana che termina il 5 maggio 2023
Aggiungere il codice generato dal riquadro Frammenti di codice
4 maggio 2023
È stata aggiunta una nuova icona di frammenti di codice alla barra degli strumenti del notebook. Facendo clic sull'icona, si apre il riquadro dei frammenti di codice da cui è possibile leggere i dati da un file o da un collegamento che è stato aggiunto al progetto. La logica della funzione "Inserisci nel codice" esistente per la creazione del codice che carica i dati in una cella del notebook è stata spostata in Leggi dati. Il precedente riquadro Trova e carica dati ora può essere utilizzato solo per caricare dati in un progetto. Consultare Caricamento e accesso dei dati in un notebook.
Settimana che termina il 28 aprile 2023
Watson Pipelines ora generalmente disponibile per l'automazione delle attività del ciclo di vita AI
27 aprile 2023
Watson Pipelines fornisce un'interfaccia grafica per coordinare un flusso end-to-end di asset dalla creazione alla distribuzione. Assemblare e configurare una pipeline che automatizza le attività relative alla cura dei dati, quindi l'addestramento, la distribuzione e l'aggiornamento dei modelli di machine learning. Eseguire un lavoro della pipeline in tempo reale o in base a una pianificazione. Per i dettagli sulla creazione delle pipeline, vedi Watson Pipelines.
Una novità di questo aggiornamento è la possibilità di creare un componente pipeline personalizzato per l'esecuzione di uno script che scrivi utilizzando una funzione Python . È possibile utilizzare i componenti personalizzati per condividere script riutilizzabili tra le pipeline. I componenti personalizzati vengono creati come asset di progetto e quindi utilizzati nelle pipeline create in tale progetto. Per i dettagli, consultare Creazione di un componente personalizzato.
Watson Pipelines viene offerto come funzione di Watson Studio. Tuttavia, è necessario disporre di piani di servizio per gli asset e i processi utilizzati in una pipeline. Ad esempio, per eseguire un flusso DataStage in una pipeline, devi disporre di una istanza del servizio Data Stage. Watson Pipelines utilizza le risorse in base agli asset e ai processi utilizzati nella pipeline. Se la tua pipeline addebita un modello AutoAI , il tuo account viene addebitato per le unità di capacità Watson Machine Learning all'ora (CUH) utilizzate per l'addestramento del modello. Allo stesso modo, se una pipeline contiene un flusso DataStage , l'esecuzione di tale flusso all'interno di Watson Pipelines viene addebitata al piano DataStage . L'esecuzione dei componenti della pipeline e degli script bash consuma le risorse CUH Watson Studio . Per i dettagli sul provisioning delle istanze e dei piani del servizio, consultare Servizi e integrazioni.
Accedi a più dati con la nuova connessione Presto
27 aprile 2023
È ora possibile utilizzare i dati dalle origini dati Presto . Per informazioni, vedere Presto connection.
Settimana che termina il 21 aprile 2023
Approfondisci i dettagli dei risultati di creazione profili (IBM Knowledge Catalog)
20 aprile 2023
È ora possibile accedere alle informazioni di creazione profili dettagliate dall'interno di un arricchimento di metadati o dalla scheda Profilo di un asset in un progetto o in un catalogo. Per ciascuna colonna, visualizzare le informazioni statistiche sui dati della colonna, le informazioni sulle classi di dati, i formati e i tipi di dati e la distribuzione di frequenza dei valori nella colonna. Per le informazioni statistiche, è possibile scegliere tra diversi tipi di visualizzazioni. Per popolare queste visualizzazioni per un profilo esistente, aggiornare il profilo.
Per i dettagli, vedere Dettagli profilo a livello di colonna.
Settimana che termina il 14 aprile 2023
Versioni Python e CPLEX predefinite aggiornate (Decision Optimization)
13 apr 2023
Gli utenti di Python per Decision Optimization sono ora 3.10 e la versione predefinita di CPLEX è 22.1. Queste versioni vengono utilizzate per impostazione predefinita quando si crea un nuovo esperimento. Python 3.9 è obsoleto e verrà presto rimosso. Per aggiornare l'ambiente, consultare Configurazione degli ambienti. Per aggiornare i modelli distribuiti esistenti, vedi Distribuzione del modello.
Miglioramenti alle regole di qualità dei dati (IBM Knowledge Catalog)
13 apr 2023
Ora è anche possibile eseguire le regole di qualità dei dati sugli asset di dati da queste origini dati:
- Amazon S3 (solo file CSV)
- Apache Cassandra
- SAP ASE
Quando si configura una regola di qualità dei dati con bind gestiti esternamente, è ora possibile selezionare del contenuto aggiuntivo per i link di output nel flusso DataStage associato. Per ulteriori informazioni, consultare Creazione di regole dalle definizioni di qualità dei dati.
Settimana che termina il 7 aprile 2023
Nuovo: esperimento di rilevamento delle anomalie delle serie temporali (Beta)
7 aprile 2023
Utilizzare AutoAI per addestrare un modello di previsione delle anomalie delle serie temporali in grado di rilevare anomalie o risultati imprevisti, quando il modello prevede i risultati in base a nuovi dati. Le pipeline candidate del modello generate dall'esperimento vengono classificate in base al livello di prestazioni misurato dalla metrica di ottimizzazione. Salvare un modello come notebook per esaminare il codice o salvare e distribuire un modello per rilevare potenziali anomalie nei nuovi dati. Per i dettagli, vedi Creazione di un modello di previsione delle anomalie delle serie temporali (Beta). Questa funzione è offerta come beta e non è ancora supportata per l'utilizzo in ambienti di produzione.
Filtra l'attività dell'asset in un progetto
6 aprile 2023
Nel riquadro Asset della scheda Panoramica di un progetto, è possibile filtrare gli asset selezionando Per utente o Per tutto utilizzando l'elenco a discesa. Per utente elenca gli asset modificati dall'utente, ordinati in base al più recente nella parte superiore. Per tutti elenca gli asset modificati da altri e anche dall'utente, ordinati per il più recente nella parte superiore.
Aggiornamento a Spark con R 4.2 in Watson Studio
3 aprile 2023
Gli ambienti Spark R 3.6 per Watson Studio vengono aggiornati a R 4.2. Tutti gli ambienti Spark R 3.6 sono ora obsoleti e verranno rimossi il 15 giugno 2023. A partire dall ' 11 maggio 2023, non è più possibile creare nuovi notebook o nuovi flussi Data Refinery con Spark R 3.6. Inoltre, non sarà possibile creare nuovi ambienti personalizzati Spark R 3.6 . In quel momento, potrebbe essere necessario aggiornare alcune versioni di package e script per i notebook. È necessario aggiornare gli asset e le distribuzioni per utilizzare Spark con R 4.2 prima del 15 giugno 2023.
Consultare Modifica dell'ambiente per un notebook. Per i dettagli sulle librerie e sui package per le versioni R, consultare le Note sulla release CRAN.
Nuovo ambiente Spark con R 4.2 per l'esecuzione dei lavori del flusso Data Refinery
3 aprile 2023
È ora possibile selezionare Spark predefinito 3.3 & R 4.2 quando si seleziona un ambiente per un lavoro del flusso Data Refinery . Il nuovo ambiente utilizza le stesse CUH (Capacity Unit Ore) degli altri ambienti predefiniti.
L'ambiente Spark predefinito 3.2 & R 3.6 è obsoleto e verrà interrotto in un futuro aggiornamento. Modificare i lavori del flusso Data Refinery per utilizzare il nuovo ambiente Default Spark 3.3 & R 3.6 .
Per informazioni sugli ambienti per Data Refinery, consultare Opzioni di risorse di calcolo per Data Refinery nei progetti.
La modifica dell'ambiente influisce su due operazioni della GUI. Se si dispone di flussi Data Refinery esistenti che includono queste operazioni GUI, è necessario aggiornare il flusso Data Refinery .
- Suddividi
- Suddividi in token
Per aggiornare un flusso, aprirlo, salvarlo. Per i dettagli, consultare Gestione dei flussi Data Refinery.
Settimana che termina il 31 marzo 2023
Crea asset personalizzati da un catalogo
31 marzo 2023
Gli amministratori e gli editori possono ora creare risorse personalizzate all'interno dell'interfaccia utente del catalogo. Per aggiungere un nuovo asset personalizzato, selezionare Asset personalizzato dal menu a discesa Aggiungi al catalogo . Per ulteriori informazioni sugli asset personalizzati, vedi Tipi di asset personalizzati, proprietà e relazioni in Aggiunta di asset a un catalogo (Watson Knowledge Catalog).
Miglioramenti e miglioramenti in Data Virtualization
29 marzo 2023
Data Virtualization è stato aggiornato per fornire le seguenti funzioni:
- Con la virtualizzazione asincrona, è possibile visualizzare i dettagli dello stato di un lavoro di virtualizzazione in qualsiasi momento nella pagina Dati virtualizzati . Se le tabelle virtualizzate sono grandi e il lavoro impiega più tempo, è possibile lavorare su altre attività, come la virtualizzazione di più tabelle, mentre il lavoro termina.
- Con la pubblicazione e le assegnazioni asincrone nella pagina Dati virtualizzati , è possibile lavorare su altre attività mentre i lavori di pubblicazione e assegnazione terminano.
- È possibile utilizzare i lavori nel client Web per raccogliere statistiche sulle tabelle virtualizzate. Per ulteriori informazioni, consultare Raccolta di statistiche nel client Web in Data Virtualization.
- È possibile visualizzare la cronologia di pubblicazione o assegnazione di un oggetto nella pagina Dati virutualizzati . Fare clic su una riga dell'oggetto dall'elenco per visualizzarne la cronologia di pubblicazione e assegnazione nel pannello di destra della pagina Dati virutualizzati .
Settimana che termina il 24 marzo 2023
Federated Learning funziona su computer Mac con chip serie M
23 marzo 2023
Eseguire gli esperimenti di Federated Learning sui computer M1 Mac e M2 Mac nell'ultimo runtime. Per i requisiti, vedere Configurazione del sistema.
Settimana che termina il 17 marzo 2023
Definire le chiavi composite nei dataset di riferimento (IBM Knowledge Catalog)
17 marzo 2023
È ora possibile specificare più colonne per creare una chiave composita per i dataset di riferimento. Senza una chiave composita, i valori dei dati di riferimento in una serie sono identificati da una stringa univoca nella colonna di codice. Una chiave composita è una combinazione della colonna di codice e fino a 5 colonne personalizzate in un dataset di riferimento. Una chiave composta viene utilizzata per identificare in modo univoco ciascun valore di dati di riferimento. Con una chiave composta, i valori nella colonna di codice non devono più essere univoci. L'unicità è garantita solo quando i valori di tutte le colonne specificate sono combinati. Per i dettagli, consultare Impostazione dei dataset di riferimento.
Settimana che termina il 10 marzo 2023
Creare query, report o dashboard in base a relazioni personalizzate (IBM Knowledge Catalog)
9 marzo 2023
Quando si creano relazioni personalizzate tra gli asset e le risorse utente di governance, è possibile sincronizzare tali risorse con il data mart di report IBM Knowledge Catalog , in modo da poter creare report. Ad esempio, è possibile utilizzare le relazioni personalizzate per:
- Ottenere analisi della qualità a vari livelli di granularità (per dominio, per metadati, per utente, per team)
- Certificare la qualità dei dati
- Conta il numero di asset che hanno una proprietà di riservatezza specifica
Per informazioni su come creare relazioni personalizzate, consultare Proprietà e relazioni personalizzate per le risorse di governance e gli asset di catalogo (IBM Knowledge Catalog).
Per informazioni su come creare report, consultare Impostazione dei report per IBM Knowledge Catalog.
Runtime 22.1 su Python 3.9 obsoleto per Watson Studio e Watson Machine Learning
9 marzo 2023
IBM Runtime 22.1 su Python 3.9 è ora obsoleto e verrà rimosso il 15 giugno 2023. A partire dall ' 11 maggio 2023, non è più possibile creare nuovi notebook o creare ambienti personalizzati utilizzando i runtime 22.1 . Non sarai inoltre in grado di addestrare nuovi modelli con le specifiche software Python 3.9 . Aggiorna i tuoi asset e le tue distribuzioni per utilizzare IBM Runtime 22.2 su Python 3.10 prima del 15 Giugno 2023:
- Per i dettagli sulla migrazione di un asset a un framework supportato e alle specifiche software, consultare Gestione di framework e specifiche software.
- Per i dettagli sugli ambienti notebook, consultare Opzioni di calcolo delle risorse per l'editor del notebook nei progetti.
- Per informazioni sulla modifica degli ambienti, consultare Modifica dell'ambiente di un notebook.
Eseguire le regole di qualità dei dati su origini dati aggiuntive (IBM Knowledge Catalog)
9 marzo 2023
Ora è possibile eseguire le regole di qualità dei dati sugli asset di dati da queste origini dati:
- IBM Data Virtualization
- Microsoft Azure Data Lake Storage
- Snowflake
Nuova opzione per il binding delle variabili nelle regole di qualità dei dati (IBM Knowledge Catalog)
9 marzo 2023
Ora è anche possibile utilizzare i parametri del job per collegare le variabili di regola alle colonne di dati e gestire tali parametri centralmente in un progetto. Pertanto, non è necessario aggiornare le regole quando, ad esempio, si desidera modificare il bind in una colonna diversa. Consultare Creazione di regole dalle definizioni di qualità dei dati.
Settimana che termina il 3 marzo 2023
Miglioramenti per AI Factsheets (Watson Machine Learning)
3 marzo 2023
È ora possibile allegare file e immagini a un factsheet. Per i dettagli, consultare Personalizzazione dei dettagli per un foglio informativo. I fogli di calcolo visualizzano anche metriche Watson OpenScale aggiuntive dall'esplicabilità e dai monitor personalizzati. Per i dettagli, consultare Visualizzazione dei fogli di lavoro.
Creare, archiviare e condividere le funzioni di machine learning (Beta) (Watson Studio)
2 marzo 2023
È ora possibile accelerare lo sviluppo dei modelli di machine learning creando e condividendo le funzionalità. Aggiungere un gruppo di funzioni a un asset di dati in un progetto per identificare le funzioni di tale dataset. È possibile condividere le funzioni con l'organizzazione pubblicando l'asset di dati in un catalogo che funge da negozio di funzioni. Consultare Gestione dei gruppi di funzioni.
Settimana che termina il 24 febbraio 2023
Gestisci relazioni personalizzate (IBM Knowledge Catalog)
24 febbraio 2023
Ora è possibile gestire le relazioni personalizzate tra gli asset del catalogo e le risorse di governance nella pagina Panoramica di un asset.
Per informazioni su come creare relazioni personalizzate, consultare Proprietà e relazioni personalizzate per le risorse di governance e gli asset di catalogo (IBM Knowledge Catalog).
Settimana che termina il 17 febbraio 2023
Data Refinery L'operazione di calcolo funziona sulle colonne Data
17 febbraio 2023
È ora possibile utilizzare l'operazione Calcola sulle colonne del tipo di dati Data per aggiungere o sottrarre i valori del giorno o del mese.
Per informazioni sulle operazioni GUI, consultare Operazioni GUI in Data Refinery.
Nuova libreria per accedere agli asset del progetto in Watson Studio
17 febbraio 2023
La libreria ibm-watson-studio-lib
contiene una serie di funzioni che consentono di interagire con i progetti e gli asset di progetti Watson Studio . La libreria può essere utilizzata nei notebook creati nell'editor di notebook ed è disponibile per Python e R. È il successore della libreria project_lib
. Per i dettagli, vedi Utilizzo di ibm - watson - studio - lib.
"Spark predefinito 3.2 & R 3.6 " ambiente interrotto (Data Refinery)
17 febbraio 2023
L'ambiente Default Spark 3.2 & R 3.6 non sarà più disponibile a partire dal 17 febbraio 2023.
Se si dispone di lavori di flusso Data Refinery impostati con l'ambiente Default Spark 3.2 & R 3.6 o un ambiente personalizzato che utilizza Spark 3.0, i lavori non riusciranno. Modificare l'ambiente in Default Spark 3.3 & R 3.6 o Default Data Refinery XS o in un ambiente personalizzato che non utilizza Spark 3.0.
Per informazioni sugli ambienti per Data Refinery, consultare Opzioni di risorse di calcolo per Data Refinery nei progetti.
Nuove funzioni per le regole di qualità dei dati (IBM Knowledge Catalog)
16 febbraio 2023
Queste nuove funzionalità sono disponibili:
- Utilizzare più di una definizione di qualità dei dati in una singola regola di qualità dei dati. Inoltre, è possibile includere una singola definizione più di una volta per applicare la stessa definizione a colonne differenti. Per i dettagli, consultare Creazione di regole dalle definizioni di qualità dei dati.
- Scarica l'output della regola come file CSV. Se una tabella di output è definita per la regola, è ora possibile scaricare l'output della regola come file CSV dalla cronologia di esecuzione della regola, ad esempio, per l'utilizzo in un programma di fogli di calcolo.
- Eseguire regole sui dati dalle origini dati Amazon Redshift e Greenplum . Vedi Origini dati supportate per le regole di importazione, arricchimento e qualità dei metadati.
- Esportare e importare gli asset di qualità dei dati. Quando si esporta un progetto sul computer desktop, è ora possibile includere gli asset di qualità dei dati. Consultare Esportazione di un progetto.
Settimana che termina il 10 febbraio 2023
Importare gli asset da un progetto o uno spazio in uno spazio esistente (Watson Machine Learning)
9 febbraio 2023
È ora possibile importare uno spazio di distribuzione o un progetto (in formato .zip) in uno spazio di distribuzione esistente. Aggiungere gli asset o aggiornare gli asset esistenti in un spazio. Ad esempio, è possibile sostituire un modello con una versione più recente. Per i dettagli, consultare Importazione di spazi e progetti in spazi esistenti.
Utilizzo di più macro in DataStage
10 febbraio 2023
È possibile aggiungere la macro DSJobController alle proprietà dello stage o nelle funzioni del trasformatore.
La macro agisce come funzione DataStage e genera i dati senza la necessità di argomenti, semplificando l'impostazione di flussi e job DataStage .
Per ulteriori informazioni, consultare Macro.
Settimana che termina il 3 febbraio 2023
Utilizzo di più macro in DataStage
6 febbraio 2023
È possibile aggiungere le seguenti macro alle proprietà dello stage o nelle funzioni del trasformatore:
- DSProjectId
- ID DSJobRun
- DSJobId
Le macro agiscono come funzioni DataStage e come dati di output senza la necessità di argomenti, semplificando l'impostazione di flussi e job DataStage .
Per ulteriori informazioni, consultare Macro.
Settimana che termina il 20 gennaio 2023
Modifica delle colonne di input negli stage DataStage
20 gennaio 2023
È ora possibile modificare le colonne tramite la scheda di input di uno stage in DataStage. Le modifiche vengono propagate alla fase precedente nel flusso.
Nuove opzioni per importazione di metadati (IBM Knowledge Catalog)
19 gennaio 2023
Per garantire che il catalogo o il progetto di destinazione dell'importazione dei metadati non contenga dati obsoleti, è ora possibile configurare l'importazione per ripulire gli asset di dati che non possono essere reimportati. Selezionare questa opzione per eliminare gli asset che non sono più disponibili nell'origine dati, che sono stati rimossi dall'ambito di importazione o entrambi dalla destinazione di importazione quando l'importazione dei metadati viene rieseguita. Consultare Importazione di metadati.
Esportare i dati dagli esperimenti di Decision Optimization al progetto
18 gennaio 2023
È ora possibile esportare le tabelle nel progetto dalla vista Prepara dati o Esplora soluzione nell'esperimento Decision Optimization . Ciò consente di riutilizzare i dati in altri modelli o servizi. È inoltre possibile esportare i dati utilizzando il client Decision Optimization Python.
Consultare Esportazione dei dati dagli esperimenti di Decision Optimization
.
Settimana che termina il 13 gennaio 2023
Casi di utilizzo di Data Fabric aggiornati
12 gennaio 2023
I casi di utilizzo di Data Fabric vengono aggiornati per riflettere meglio il modo in cui si utilizzano i nostri prodotti:
- Integrazione dei dati: questo caso d'uso ora include le pipeline.
- Data governance: questo caso d'uso ora include Match 360.
- Governance AI: questo caso d'uso ora si concentra sul monitoraggio, sulla manutenzione, sull'automazione e sulla gestione dei modelli AI in produzione.
- Data Science e MLOps: questo nuovo caso d'uso spiega come rendere operativa l'analisi dei dati e la creazione di modelli.
Vedere casi di utilizzo di Data fabric.
Personalizza il web browser per supportare il tuo brand
12 gennaio 2023
Come amministratore, è possibile aggiungere nomi di prodotti personalizzati, logo e altri grafici per personalizzare il marchio del browser web per Cloud Pak for Data as a Service.
Consultare Personalizzazione del marchio del browser Web.
Settimana che termina il 6 gennaio 2023
Connetti a più origini dati in DataStage
6 gennaio 2023
È ora possibile includere i dati da queste origini dati nei flussi DataStage :
- Dremio
- SingleStoreDB
Per un elenco completo dei connettori DataStage , consultare ConnettoriDataStage.