Revenez chaque semaine pour découvrir les nouvelles fonctionnalités et les mises à jour de Cloud Pak for Data as a Service et des services tels que watsonx.ai Studio (anciennement Watson Studio, watsonx.ai Runtime (anciennement Watson Machine Learning), DataStage, et IBM Knowledge Catalog
Semaine se terminant le 20 décembre 2024
Déployer des modèles convertis au format ONNX
20 décembre 2024
Vous pouvez désormais déployer des modèles d'apprentissage automatique et d'IA générative convertis au format ONNX et utiliser le point final pour l'inférence. Ces modèles peuvent également être adaptés aux axes dynamiques. Pour plus d'informations, voir Déployer des modèles convertis au format ONNX.
Déployer des flux SPSS Modeler multi-sources
20 décembre 2024
Vous pouvez désormais créer des déploiements pour les flux de SPSS Modeler qui utilisent plusieurs flux d'entrée pour fournir des données au modèle. Pour plus d'informations, voir Déployer des flux SPSS Modeler multi-sources.
Semaine se terminant le 13 décembre 2024
Nouvelles sources de données pour l'importation de métadonnées de lignée
12 décembre 2024
Vous pouvez désormais importer des métadonnées de lignage à partir des sources de données suivantes. Une fois les données importées, vous pouvez les visualiser sur un graphique de lignée. Pour plus d'informations, voir Sources de données prises en charge pour la curation et la qualité des données.
Contrôle de la qualité des données et workflows de remédiation IBM Knowledge Catalog
12 décembre 2024
Pour concentrer les efforts d'amélioration de la qualité sur les données les plus importantes pour votre organisation, vous identifiez les éléments de données critiques, définissez les attentes en matière de qualité et veillez à remédier aux problèmes de qualité des données.
Vous pouvez désormais élaborer des règles de qualité des données pour les accords de niveau de service (SLA) :
- Contrôler la qualité des données critiques par rapport à des critères de qualité spécifiques dans le cadre de l'enrichissement des métadonnées.
- Déclencher des flux de travail de remédiation si la qualité ne répond pas aux attentes. Vous pouvez utiliser le flux de travail de remédiation par défaut ou créer des flux de travail personnalisés.
Vous pouvez consulter des informations sur la conformité ou les violations des règles SLA et l'état des tâches de remédiation sur la page Qualité des données d'une ressource de données surveillée.
Pour plus d'informations, voir :
Supprimer les noms et descriptions suggérés des résultats de l'enrichissement des métadonnées IBM Knowledge Catalog
12 décembre 2024
Dans les résultats de l'enrichissement des métadonnées, vous pouvez désormais supprimer en bloc les noms d'affichage ou les descriptions suggérés lorsque l'enrichissement est exécuté avec l'option Étendre les métadonnées. Voir Modifications en bloc des résultats de l'enrichissement des métadonnées.
Utiliser les définitions des sources de données pour gérer et protéger les données auxquelles on accède à partir de connexions
12 décembre 2024
Les définitions de sources de données sont un nouveau type de ressources que vous définissez en fonction des points d'extrémité d'une connexion ou d'une ressource de données connectée. Lorsque vous créez une définition de source de données, vous pouvez contrôler l'endroit où vos données sont stockées dans plusieurs projets, catalogues ou sources de données multi-nœuds. Vous pouvez également appliquer la bonne solution de protection (moteur d'application) en fonction de la définition de la source de données. Pour plus d'informations, voir Protection des données avec les définitions de sources de données.
Ces nouvelles fonctionnalités de définition des sources de données sont désormais disponibles dans toutes les régions.
Définition d'une source de données avec une solution de protectionIBM Knowledge Catalog
09 décembre 2024
Une solution de protection est une méthode d'application des règles de protection des données, soit dans des catalogues régis, soit par une solution d'application en profondeur.
Pour configurer la plate-forme avec une solution d'application approfondie, vous pouvez créer une définition de source de données pour définir le type de source de données. Le type de source de données détermine les types de connexions auxquels la définition de la source de données peut être associée et les options de solution de protection disponibles. Pour plus de détails, voir Solutions de protection pour la définition des sources de données.
Ces nouvelles fonctionnalités de définition des sources de données sont désormais disponibles dans toutes les régions.
Dépréciation des fonctionnalités pour le flux de masquage
11 décembre 2024
Les fonctionnalités suivantes sont obsolètes et sont désormais supprimées :
- L'option de réversibilité est désormais supprimée pour l'obscurcissement des données, ce qui permet d'inverser ultérieurement le masquage pour récupérer les valeurs d'origine.
- Le chiffrement réversible n'est plus disponible pour créer des copies de données en créant des flux de masquage et la symbolisation par hachage à sens unique pour une conformité flexible.
- Décrypter des données masquées réversibles n'est plus disponible.
Mise à jour des didacticiels de SPSS Modeler
11 décembre 2024
Obtenez une expérience pratique avec SPSS Modeler en essayant les 15 tutoriels SPSS Modeler mis à jour.
IBM Knowledge Catalog est disponible dans la région de Sydney
09 décembre 2024
IBM Knowledge Catalog est désormais également disponible dans le centre de données de Sydney. Vous pouvez sélectionner Sydney comme région préférée lors de votre inscription.
Pour plus d'informations sur les caractéristiques des produits disponibles dans la région de Sydney, voir Disponibilité régionale des services et des caractéristiques.
IBM DataStage est disponible dans la région de Sydney
09 décembre 2024
DataStage est maintenant disponible dans le centre de données de Sydney. Vous pouvez sélectionner Sydney comme région préférée lors de l'inscription.
Pour plus d'informations sur les caractéristiques des produits disponibles dans la région de Sydney, voir Disponibilité régionale des services et des caractéristiques.
IBM watsonx.governance est disponible dans la région de Sydney
9 décembre 2024
IBM watsonx.governance est désormais disponible dans le centre de données de Sydney. Vous pouvez sélectionner Sydney comme région préférée lors de l'inscription.
Pour plus d'informations sur les caractéristiques des produits disponibles dans la région de Sydney, voir Disponibilité régionale des services et des caractéristiques.
Semaine se terminant le 6 décembre 2024
Nouvelles sources de données pour l'importation de métadonnées de lignée
06 décembre 2024
Vous pouvez désormais importer des métadonnées de lignage à partir des sources de données suivantes. Une fois les données importées, vous pouvez les visualiser sur un graphique de lignée. Pour plus d'informations, voir Sources de données prises en charge pour la curation et la qualité des données.
Déclassement du plan IBM Cloud Object Storage LiteIBM Knowledge Catalog
05 décembre 2024
Les plans Cloud Object Storage Lite à durée illimitée que vous avez provisionnés avant le 1er juillet 2024 sont obsolètes et pourraient être supprimés après le 15 décembre 2024. Pour conserver vos données et autres actifs, vous devez mettre à niveau votre service de Cloud Object Storage vers un plan standard avant le 15 décembre 2024. Si vous ne mettez pas à niveau votre plan de Cloud Object Storage vers Standard, vos espaces de travail pourraient devenir inaccessibles après le 15 décembre 2024, et vos données pourraient être définitivement supprimées. Pour plus d'informations, voir Lite plan (obsolète).
Les fichiers Microsoft Excel sont obsolètes pour les modèles OPL dans Decision Optimization
05 décembre 2024
Les fichiers Microsoft Excel (.xls et .xlsx) ne sont plus utilisés pour l'entrée et la sortie directes dans les modèles OPL de Decision Optimization. Pour se connecter à des fichiers Excel, utilisez plutôt un connecteur de données. Le connecteur de données transforme votre fichier Excel en fichier .csv. Pour plus d'informations, voir Données référencées.
Amélioration de la planification des tâches d'enrichissement des métadonnéesIBM Knowledge Catalog)
05 décembre 2024
Vous pouvez désormais configurer des fenêtres d'exécution pour vos travaux d'enrichissement des métadonnées afin d'équilibrer les charges de travail. Les travaux ne s'exécutent alors que dans les délais configurés. Pour plus d'informations, voir Gestion de la planification des travaux d'enrichissement.
Segmenter les données en fonction de la valeur des colonnes pour se concentrer sur les informations dont on a besoinIBM Knowledge Catalog
05 décembre 2024
Vous pouvez désormais diviser les ressources de données en plus petites ressources de données basées sur des valeurs de colonnes sélectionnées pour vous aider à accéder uniquement aux données qui vous intéressent. Pour plus d'informations, voir Création de ressources de données en segmentant les données des colonnes.
Nouveaux carnets d'exemples pour le déploiement de modèles convertis au format ONNX
03 décembre 2024
Vous pouvez désormais déployer des modèles d'apprentissage automatique et d'IA générative convertis au format ONNX et utiliser le point final pour l'inférence. Ces modèles peuvent également être adaptés aux axes dynamiques. Voir les exemples de carnets suivants :
- Convertir un réseau neuronal ONNX d'axes fixes en axes dynamiques
- Utiliser le modèle ONNX converti à partir de PyTorch
- Utiliser un modèle ONNX converti à partir de TensorFlow pour reconnaître des chiffres écrits à la main
Pour plus d'informations, voir les échantillons et les exemples de clients Python dewatsonx.ai Runtime.
Semaine se terminant le 29 novembre 2024
Amélioration de la documentation sur les options d'écriture pour Data Refinery
28 novembre 2024
Les options d'écriture et de tableau pour l'exportation des flux de données dépendent de votre connexion. Ces options sont maintenant expliquées afin que vous soyez mieux guidé dans le choix de vos options de table cible. Pour plus d'informations, voir Options de connexion cible pour Data Refinery.
Semaine du 25 novembre 2024
Changement de nom du service Watson Query
25 novembre 2024
Le service Watson Query a été renommé Data Virtualization ization Data Virtualizion.
Semaine se terminant le 22 novembre 2024
Changement de nom pour les services Watson Studio et Watson Machine Learning
21 novembre 2024
Les services suivants ont été renommés :
- Watson Machine Learning s'appelle désormais watsonx.ai Runtime.
- Watson Studio s'appelle désormais watsonx.ai Studio.
Certaines vidéos, certains carnets de notes et certains exemples de code peuvent continuer à faire référence à ces services sous leur ancien nom.
Cloud Pak for Data as a Service est disponible dans la région de Sydney
21 novembre 2024
Cloud Pak for Data as a Service est maintenant disponible dans le centre de données de Sydney avec les services watsonx.ai Runtime et watsonx.ai Studio. Lorsque vous vous inscrivez, vous pouvez sélectionner Sydney comme région préférée.
Tous les services ne sont pas encore disponibles dans la région de Sydney. Pour plus d'informations sur les caractéristiques des produits disponibles dans la région de Sydney, voir Disponibilité régionale des services et des caractéristiques.
Surveillance améliorée des travaux d'enrichissement des métadonnéesIBM Knowledge Catalog)
21 novembre 2024
Sur le nouveau tableau de bord des mesures d'exécution, vous pouvez suivre la progression des différentes tâches d'enrichissement pour un travail d'enrichissement des métadonnées actif. En outre, vous pouvez explorer les informations relatives aux exécutions de travaux terminés afin de déterminer si des problèmes sont survenus et où ils se sont produits. Pour plus d'informations, voir Suivi des exécutions de travaux d'enrichissement.
Promouvoir les flux de SPSS Modeler dans les espaces de déploiement
19 novembre 2024
Vous pouvez désormais promouvoir directement les flux SPSS Modeler des projets vers les espaces de déploiement sans avoir à exporter le projet et à l'importer ensuite dans l'espace de déploiement. Pour plus d'informations, voir Promouvoir les flux et les modèles SPSS Modeler.
Semaine se terminant le 15 novembre 2024
Les informations d'identification des tâches sont désormais requises pour déployer des ressources et exécuter des tâches à partir d'un espace de déploiement
11 novembre 2024
Pour améliorer la sécurité des tâches de déploiement en cours d'exécution, vous devez saisir vos informations d'identification pour déployer les ressources suivantes à partir d'un espace de déploiement :
- Modèles d'invite
- Services d’IA
- Modèles
- Fonctions Python
- Scripts
En outre, vous devez saisir vos informations d'identification pour créer les déploiements suivants à partir de votre espace de déploiement :
- En ligne
- Lot
Vous devez également utiliser vos identifiants de tâches pour créer et gérer des tâches de déploiement à partir de votre espace de déploiement.
Pour savoir comment configurer les informations d'identification de votre tâche et générer une clé API, voir Ajouter des informations d'identification de la tâche.
Mode éditeur pour les propriétés personnaliséesIBM Knowledge Catalog
14 novembre 2024
Lors de l'affichage des artefacts de gouvernance, vous pouvez désormais activer le mode éditeur pour les propriétés personnalisées. Lorsque l'option Modifier les valeurs est désactivée dans la section Détails, vous ne pouvez voir que les propriétés personnalisées pour lesquelles des valeurs ont été définies pour l'artefact. Activez le mode éditeur et vous pourrez voir toutes les propriétés personnalisées disponibles et modifier leurs valeurs. Pour plus d'informations, voir Propriétés, relations et types d'actifs personnalisés.
Semaine se terminant le 8 novembre 2024
Se connecter à de nouvelles sources de données avec SPSS Modeler
7 novembre 2024
Vous pouvez désormais connecter SPSS Modeler à Databricks et à Microsoft Azure Synapse Analytics, et SPSS Modeler dispose d'un accès en lecture et en écriture aux deux sources de données. Pour plus d'informations, voir Connexion àMicrosoft Azure Databricks et Connexion àMicrosoft Azure Synapse Analytics.
Semaine se terminant le 1er novembre 2024
Déclassement d'IBM Runtime 23.1
28 octobre 2024
IBM Runtime 23.1 est obsolète. À partir du 21 novembre 2024, vous ne pourrez plus créer de nouveaux carnets ou environnements personnalisés en utilisant les runtimes 23.1 Vous ne pouvez pas non plus créer de nouveaux déploiements avec des spécifications logicielles basées sur le runtime 23.1 Pour garantir une expérience transparente et tirer parti des dernières fonctionnalités et améliorations, passez à IBM Runtime 24.1
- Pour plus d'informations sur la modification des environnements, voir Modification des environnements des ordinateurs portables.
- Pour plus d'informations sur les structures de déploiement, voir Gestion des cadres et des spécifications logicielles.
Semaine se terminant le 25 octobre 2024
Comparer les tableaux dans les expériences d'Decision Optimization pour voir les différences entre les scénarios
23 octobre 2024
Vous pouvez désormais comparer les tableaux d'une expérience d'Decision Optimization dans la vue Préparer les données ou Explorer la solution. Cette comparaison peut être utile pour voir les différences de valeur des données entre les scénarios affichés l'un à côté de l'autre.
Pour plus d'informations, voir Comparer les tables de scénarios.
Semaine se terminant le 18 octobre 2024
La délimitation des ressources du compte est activée par défaut
17 octobre 2024
Le paramètre " Resource scope
de votre compte est désormais défini par défaut sur " ON
Toutefois, si vous avez précédemment défini la valeur du paramètre d'étendue des ressources sur " ON
ou " OFF
, le paramètre actuel n'est pas modifié.
Lorsque la délimitation des ressources est activée, vous ne pouvez pas accéder aux projets qui ne font pas partie de votre compte IBM Cloud actuellement sélectionné. Si vous appartenez à plusieurs comptes IBM Cloud, il se peut que vous ne voyiez pas tous vos projets listés ensemble. Par exemple, il se peut que vous ne voyiez pas tous vos projets sur la page Tous les projets. Vous devez changer de compte pour voir les projets dans les autres comptes.
Semaine se terminant le 11 octobre 2024
Analysez les données textuelles japonaises dans SPSS Modeler avec Text Analytics
9 octobre 2024
Vous pouvez désormais utiliser les nœuds d'analyse de texte dans SPSS Modeler, tels que le nœud d'analyse des liens de texte et le nœud d'exploration de texte, pour analyser les données textuelles écrites en japonais.
Semaine se terminant le 4 octobre 2024
Présentation d'IBM Manta Data Lineage: un nouveau service qui fournit un data lineage pour vos données
04 octobre 2024
IBM Manta Data Lineage est un service de lignage de données qui augmente la transparence du pipeline de données afin que vous puissiez déterminer l'exactitude des données dans l'ensemble des modèles et systèmes d'entreprise. Pour plus d'informations sur le lignage des données, voir Lignage des données.
Ce service nécessite le service IBM Knowledge Catalog et l'activation du lignage des données sur votre compte IBM Cloud. Voir, Enable data lineage. Il n'est disponible que dans la région de Dallas.
Vous pouvez accéder à vos lignages importés dans le nouvel espace de travail Lignage de données ou visualiser le lignage d'un actif spécifique dans la page Catalogues ou Projets.
Vous pouvez importer des métadonnées de lignage à partir des sources suivantes :
- Connexion Microsoft Azure SQL Database
- Connexion Microsoft SQL Server
- Connexion àMicrosoft Power BI (Azure)
- Connexion Snowflake
- InfoSphere DataStage
- IBM DataStage for Cloud Pak for Data
Pour plus d'informations sur l'importation de métadonnées, voir Importation de métadonnées.
Amélioration de l'onglet " Draft" pour les artefacts de gouvernanceIBM Knowledge Catalog
3 octobre 2024
Pour chaque type d'artefact, vous pouvez désormais visualiser tous les brouillons disponibles dans l'onglet Brouillon. Pour l'afficher, sélectionnez le type d'artefact dans le menu principal et cliquez sur Brouillon. L'onglet n'est visible que si vous disposez des autorisations nécessaires et si des brouillons sont disponibles. Lorsque vous affichez tous vos brouillons dans l'onglet, vous pouvez sélectionner plusieurs brouillons et utiliser le menu d'actions groupées pour les modifier ou les traiter en une seule fois. Notez que la page Tous les brouillons n'est plus disponible à partir du menu principal. Pour plus d'informations, voir Gestion des artefacts de gouvernance.
Actions en bloc sur les ressources du catalogueIBM Knowledge Catalog
3 octobre 2024
Vous pouvez désormais modifier et supprimer les classifications et les propriétés personnalisées de plusieurs actifs d'un catalogue en même temps.
Mise à jour automatique des propriétés communes des donnéesIBM Knowledge Catalog
3 octobre 2024
Grâce à l'identification globale des actifs, vous pouvez vous assurer que les propriétés communes des actifs de données ayant la même clé de ressource et référençant la même ressource physique restent les mêmes, même s'ils se trouvent dans des projets ou des catalogues différents. Vous pouvez ainsi gérer ces données de manière appropriée et cohérente. Pour plus d'informations, voir l'identification des biens de Globla.
Affecter des groupes d'utilisateurs en tant que membres d'actifsIBM Knowledge Catalog
3 octobre 2024
Vous pouvez maintenant assigner des groupes d'utilisateurs comme membres de l'actif. Auparavant, vous ne pouviez ajouter que des utilisateurs de catalogues individuels en tant que membres d'actifs.
Téléchargement et mise à jour des actifs en masseIBM Knowledge Catalog
3 octobre 2024
Pour télécharger et mettre à jour plusieurs biens en masse, vous pouvez désormais importer et exporter des fichiers CSV contenant soit les détails des métadonnées des biens, soit les détails des relations entre les biens, soit les deux. Pour plus d'informations, voir Ajouter et mettre à jour des actifs et des métadonnées d'actifs à partir de fichiers CSV vers des catalogues).
Disponibilité du plan watsonx.governance dans la région de Francfort et suppression du plan OpenScale legacy
3 octobre 2024
L'ancien plan watsonx.governance pour provisionner Watson OpenScale dans la région de Francfort est obsolète. IBM Watson OpenScale ne sera plus disponible pour un nouvel abonnement ou pour provisionner de nouvelles instances. Pour les capacités OpenScale, souscrivez au plan Essentials de watsonx.governance, qui est désormais disponible à Francfort et à Dallas.
- Pour afficher les détails d'un plan, voir les plans watsonx.governance .
- Pour commencer, voir Mise à disposition et lancement de watsonx.governance.
Remarques :
- Les instances de plan existantes continueront à fonctionner et seront prises en charge jusqu'à la date de fin de prise en charge, qui reste à déterminer.
- Les clients existants sur IBM Watson OpenScale peuvent continuer à ouvrir des tickets de support en utilisant IBM Watson OpenScale.
Mise à jour des environnements et des spécifications logicielles
3 octobre 2024
Les bibliothèques Tensorflow et Keras incluses dans IBM Runtime 23.1 sont désormais mises à jour vers leurs nouvelles versions. Cela peut avoir un impact sur la façon dont le code est exécuté dans vos carnets. Pour plus de détails, voir Paquets de bibliothèques inclus dans les exécutions 'watsonx.ai Studio (anciennement 'Watson Studo).
Le Runtime 23.1 sera abandonné au profit du Runtime 24.1 d'IBM dans le courant de l'année. Pour éviter des perturbations répétées, nous vous recommandons de passer dès maintenant à IBM Runtime 24.1 et d'utiliser les spécifications logicielles correspondantes pour les déploiements.
- Pour plus d'informations sur la modification des environnements, voir Modification des environnements des ordinateurs portables.
- Pour plus d'informations sur les structures de déploiement, voir Gestion des cadres et des spécifications logicielles.
Utiliser les définitions des sources de données pour gérer et protéger les données auxquelles on accède à partir de connexions
04 octobre 2024
Les définitions de sources de données sont un nouveau type de ressources que vous définissez en fonction des points d'extrémité d'une connexion ou d'une ressource de données connectée. Lorsque vous créez une définition de source de données, vous pouvez contrôler l'endroit où vos données sont stockées dans plusieurs projets, catalogues ou sources de données multi-nœuds. Vous pouvez également appliquer la bonne solution de protection (moteur d'application) en fonction de la définition de la source de données. Pour plus d'informations, voir Protection des données avec les définitions de sources de données.
Ces nouvelles caractéristiques de définition des sources de données ne sont disponibles que dans la région de Dallas.
Définition d'une source de données avec une solution de protectionIBM Knowledge Catalog
04 octobre 2024
Une solution de protection est une méthode d'application des règles de protection des données, soit dans des catalogues régis, soit par une solution d'application en profondeur.
Pour configurer la plate-forme avec une solution d'application approfondie, vous pouvez créer une définition de source de données pour définir le type de source de données. Le type de source de données détermine les types de connexions auxquels la définition de la source de données peut être associée et les options de solution de protection disponibles. Pour plus de détails, voir Solutions de protection pour la définition des sources de données.
Ces nouvelles caractéristiques de définition des sources de données ne sont disponibles que dans la région de Dallas.
Examiner et gérer les affectations de classes et de périodes de données dans une feuille de calculIBM Knowledge Catalog
04 octobre 2024
Si vous préférez travailler dans un tableur familier lorsque vous examinez et mettez à jour les résultats de l'enrichissement des métadonnées, vous pouvez désormais installer le module complémentaire Review metadata pour Microsoft Excel. Utilisez le modèle de feuille de calcul fourni avec le produit en combinaison avec le module complémentaire :
- Pour télécharger les données enrichies d'un projet spécifique et l'enrichissement des métadonnées.
- Examiner et mettre à jour les classes de données et les termes suggérés et attribués pour ces actifs de données.
- Pour télécharger les données mises à jour dans le projet.
Pour plus d'informations, voir Révision et mise à jour des résultats d'enrichissement dans un programme externe.
Semaine se terminant le 27 septembre 2024
Suppression de la durée d'exécution de Spark 3.3
23 septembre 2024
La prise en charge du runtime Spark 3.3 dans IBM Analytics Engine sera supprimée d'ici le 29 octobre 2024 et la version par défaut sera remplacée par le runtime Spark 3.4. Pour garantir une expérience transparente et tirer parti des dernières fonctionnalités et améliorations, passez à Spark 3.4.
À partir du 29 octobre 2024, vous ne pourrez plus créer ou exécuter des notebooks ou des environnements personnalisés en utilisant des runtimes Spark 3.3. De plus, vous ne pouvez pas créer ou exécuter des déploiements avec des spécifications logicielles basées sur le runtime Spark 3.3.
- Pour mettre à jour votre instance vers Spark 3.4, voir Remplacer le Runtime par défaut de l'instance.
- Pour plus de détails sur les environnements disponibles pour les ordinateurs portables, voir Changer l'environnement d'un ordinateur portable.
- Pour plus d'informations sur les structures de déploiement, voir Gestion des cadres et des spécifications logicielles.
Semaine se terminant le 20 septembre 2024
Règles de qualité des données du groupeIBM Knowledge Catalog
20 septembre 2024
Vous pouvez désormais regrouper certains types de règles de qualité des données dans un seul flux DataStage et les exécuter ensemble. Pour plus d'informations, voir Règles de regroupement.
Semaine se terminant le 13 septembre 2024
Créer des jobs batch pour les flux SPSS Modeler dans les espaces de déploiement
10 septembre 2024
Vous pouvez désormais créer des travaux par lots pour les flux SPSS Modeler dans les espaces de déploiement. Les flux vous permettent de décider des nœuds terminaux à exécuter chaque fois que vous créez un travail par lots à partir d'un flux. Lorsque vous planifiez des travaux par lots pour des flux, le travail par lots utilise les sources de données et les cibles de sortie que vous avez spécifiées dans votre flux. Le mappage de ces sources de données et de ces sorties est automatique si les sources de données et les cibles se trouvent également dans votre espace de déploiement. Pour plus d'informations sur la création de travaux par lots à partir de flux, voir Création de travaux de déploiement pour les flux SPSS Modeler.
Pour plus d'informations sur les flux et les modèles dans les espaces de déploiement, voir Déploiement des flux et des modèles SPSS Modeler.
Semaine se terminant le 30 août 2024
Modifier la forme du nœud du pipeline
30 août 2024
Vous pouvez désormais modifier l'apparence des nœuds de pipeline afin de les transformer d'un style de carte uniforme en des formes plus compactes qui reflètent le type de nœud. Pour plus d'informations, voir Paramètres des pipelines.
Créer des jeux de paramètres globaux
30 août 2024
Vous pouvez désormais ajouter des paramètres PROJDEF aux jeux de paramètres de votre pipeline. Les paramètres peuvent être référencés à la fois dans les flux DataStage et Orchestration Pipelines au même niveau de projet. Pour plus d'informations, voir Configuration des objets globaux pour Orchestration Pipelines.
Semaine se terminant le 23 août 2024
Ajouter des groupes d'utilisateurs comme collaborateurs dans les projets et les espaces
22 août 2024
Vous pouvez désormais ajouter des groupes d'utilisateurs en tant que collaborateurs dans les projets et les espaces si votre compte IBM Cloud contient des groupes d'accès IAM. Votre IBM Cloud peut créer des groupes d'accès, qui sont ensuite disponibles en tant que groupes d'utilisateurs dans les projets. Lors de la création d'un projet, vous devez laisser l'option Restreindre qui peut être collaborateur activée pour ajouter des groupes d'utilisateurs en tant que collaborateurs. Pour plus d'informations, voir Travail avec les groupes d'accès IAM.
Fin de support pour la fonction de prédiction d'anomalie pour les expériences de séries temporelles AutoAI
19 août 2024
La fonction de prédiction des anomalies (outliers) dans les prédictions des modèles de séries temporelles de AutoAI, actuellement en version bêta, est obsolète et sera supprimée le 23 septembre 2024. Les expériences de séries temporelles standard AutoAI sont toujours entièrement prises en charge. Pour plus de détails, voir Construction d'une expérience de série temporelle.
Attribuer des classifications dans l'enrichissement des métadonnéesIBM Knowledge Catalog)
22 août 2024
Vous pouvez désormais attribuer des classifications aux ressources de données et aux colonnes dans l'enrichissement des métadonnées, soit automatiquement sur la base de l'attribution de termes ou de classes de données, soit manuellement dans les résultats de l'enrichissement. Voir Conception de l'enrichissement des métadonnées : Attribuer des termes et des classifications.
Semaine se terminant le 16 août 2024
Archiver et désarchiver des projets et des espaces
16 août 2024
Les projets et les espaces sont désormais archivés après 90 jours d'inactivité afin de préserver les ressources. Pour travailler à nouveau avec ces projets ou espaces, désarchivez-les en les ouvrant directement sur la page du projet ou de l'espace. En fonction de la taille du projet ou de l'espace, le désarchivage peut prendre plus ou moins de temps.
Configurer le retrait des actifs
16 août 2024
Désormais, lorsque vous créez un nouveau catalogue, vous pouvez également décider de la manière dont vous souhaitez configurer la suppression des actifs. Vous pouvez choisir de purger les actifs automatiquement, soit immédiatement après la suppression, soit 30 jours après la suppression. Pour les catalogues créés précédemment, vous pouvez modifier les paramètres de suppression des actifs sur la page Paramètres du catalogue.
Pour plus d'informations, voir :
Les informations d'identification des tâches sont désormais requises pour exécuter des travaux dans un espace de déploiement
15 août 2024
Pour améliorer la sécurité de l'exécution des tâches de déploiement, vous devez saisir vos informations d'identification pour exécuter une tâche dans un espace de déploiement. Pour plus d'informations, voir Créer des emplois dans des espaces de déploiement.
Pour savoir comment configurer les informations d'identification de votre tâche et générer une clé API, voir Ajouter des informations d'identification de la tâche.
Semaine se terminant le 26 juillet 2024
Mise en pause de l'enrichissement des métadonnéesIBM Knowledge Catalog)
25 juillet 2024
Vous pouvez désormais suspendre et reprendre les exécutions des tâches d'enrichissement des métadonnées. Pour plus de détails, voir Suspendre et reprendre les exécutions de tâches d'enrichissement.
Annonce du soutien à Python 3.11 et R4.3 frameworks et spécifications logicielles sur le runtime 24.1
25 juillet 2024
Vous pouvez désormais utiliser IBM Runtime 24.1, qui inclut les derniers cadres de science des données basés sur Python 3.11 et R 4.3, pour exécuter des carnets Jupyter et des scripts R, et former des modèles. À partir du 29 juillet, vous pourrez également effectuer des déploiements. Mettez à jour vos ressources et vos déploiements pour utiliser les frameworks et les spécifications logicielles IBM Runtime 24.1
- Pour des informations sur le IBM Durée 24.1 version et les environnements inclus pour Python 3.10 et R 4.2, voir Environnements de bloc-notes.
- Pour plus d'informations sur les structures de déploiement, voir Gestion des cadres et des spécifications logicielles.
Version améliorée de Jupyter Notebook l'éditeur est maintenant disponible
25 juillet 2024
Si vous exécutez votre ordinateur portable dans des environnements basés sur Runtime 24.1, vous pouvez utiliser ces améliorations pour travailler avec votre code :
- Déboguer automatiquement votre code
- Générez automatiquement une table des matières pour votre bloc-notes
- Basculer les numéros de ligne à côté de votre code
- Réduisez le contenu des cellules et utilisez la vue côte à côte pour le code et la sortie, pour une productivité améliorée
Pour plus d'informations, voir Jupyter notebook editor.
Modèles d'intégration de transformateur de processeur de langage naturel pris en charge avec Runtime 24.1
25 juillet 2024
Dans le nouveau Runtime 24.1 environnement, vous pouvez désormais utiliser des modèles d'intégration de transformateur de traitement du langage naturel (NLP) pour créer des intégrations de texte qui capturent le sens d'une phrase ou d'un passage afin de faciliter les tâches de génération augmentée par récupération. Pour plus d'informations, voir Intégrations.
De nouveaux modèles PNL spécialisés sont disponibles dans Runtime 24.1
25 juillet 2024
Les nouveaux modèles PNL spécialisés suivants sont désormais inclus dans le Runtime 24.1 environnement:
- Un modèle capable de détecter et d'identifier le contenu haineux, abusif ou grossier (HAP) dans le contenu textuel. Pour plus d'informations, voir Détection des PAD.
- Trois modèles pré-entraînés capables d'aborder des sujets liés à la finance, à la cybersécurité et à la biomédecine. Pour plus d'informations, voir Classer du texte avec un modèle de classification personnalisé.
Extrayez des informations détaillées à partir de grandes collections de textes à l'aide de la synthèse des points clés
25 juillet 2024
Vous pouvez désormais utiliser la synthèse de points clés dans les carnets de notes pour extraire des informations détaillées et exploitables à partir de vastes collections de textes représentant les opinions des personnes (telles que des évaluations de produits, des réponses à des enquêtes ou des commentaires sur les médias sociaux). Le résultat est livré de manière organisée, hiérarchique et facile à traiter. Pour plus d'informations, voir Résumé des points clés
Mise à jour de la version de RStudio
25 juillet 2024
Afin d'offrir une expérience utilisateur cohérente dans les nuages privés et publics, l'IDE RStudio pour le Cloud Pak for Data as a Service sera mis à jour vers RStudio Server 2024.04.1 et R 4.3.1 le 29 juillet 2024. La nouvelle version de RStudio apporte un certain nombre d'améliorations et de correctifs de sécurité. Voir les notes de mise à jour de RStudio Server 2024.04.1 pour plus d'informations. Bien qu'aucun problème de compatibilité majeur ne soit prévu, les utilisateurs doivent être conscients des changements de version de certains packages décrits dans le tableau ci-dessous.
Lorsque vous lancez l'IDE RStudio à partir d'un projet après la mise à jour, réinitialisez l'espace de travail RStudio pour vous assurer que le chemin de la bibliothèque pour les paquets R 4.3.1 est pris en compte par le serveur RStudio.
Semaine se terminant le 12 juillet 2024
Suivi des décisions d’application des règles de protection des données
9 juillet 2024
Vous pouvez désormais suivre les décisions d'application en tant qu'événements d'audit lorsque le Envoyer les évaluations des stratégies aux journaux d'audit est cochée dans la liste Gestion des paramètres de règles page.
Semaine se terminant le 5 juillet 2024
Connecteurs regroupés par type de source de données
05 juillet 2024
Lorsque vous créez une connexion, les connecteurs sont désormais regroupés par type de source de données afin de faciliter leur recherche et leur sélection. Par exemple, le type de source de données MongoDB inclut les connecteurs IBM Cloud Databases for MongoDB et MongoDB.
De plus, un nouveau Récents La catégorie affiche les six derniers connecteurs que vous avez utilisés pour créer une connexion.
Pour les instructions, voir Ajout de connexions aux sources de données dans un projet ou Ajout de connexions à des sources de données dans un catalogue .
Modifications groupées des propriétés des artefacts de gouvernance
05 juillet 2024
Vous pouvez désormais modifier la catégorie principale ou secondaire de plusieurs artefacts de gouvernance à la fois. Des modifications groupées sont également disponibles lors de la mise à jour des relations. Pour plus d'informations, voir Gestion des artefacts de gouvernance.
Définition d'un seuil d'affectation pour les résultats des analyses de relationsIBM Knowledge Catalog
05 juillet 2024
Vous définissez désormais également un seuil pour lequel les résultats d’une analyse de relation doivent être attribués automatiquement. Vous pouvez définir une valeur par défaut pour le projet, mais écraser le paramètre pour chaque exécution d'analyse. Pour plus de détails, voir Identifier les relations .
Modifications àCloud Object Storage Forfaits allégés
01 juillet 2024
À compter du 1er juillet 2024, leCloud Object Storage Plan Lite qui est automatiquement provisionné lorsque vous vous inscrivez pour un essai de 30 jours deCloud Pak for Data as a Service expire après la fin de l’essai. Vous pouvez mettre à niveau votreCloud Object Storage Lite au forfait Standard avec l'option Free Tier à tout moment pendant la période d'essai de 30 jours.
ExistantCloud Object Storage les instances de service avec des forfaits Lite que vous avez provisionnés avant le 1er juillet 2024 seront conservées jusqu'au 15 décembre 2024. Vous devez mettre à niveau votreCloud Object Storage service à un forfait Standard avant le 15 décembre 2024.
Semaine se terminant le 21 juin 2024
Ajout d'actifs de catalogue à des projets
20 juin 2024
Ajout d'un droit d'utilisateur Ajouter des actifs de catalogue à des projets. Désormais, pour ajouter des actifs à des projets, vous devez disposer du rôle Ajouter des actifs de catalogue à des projets, du rôle Administrateur, Editeur ou Afficheur dans le catalogue et être le propriétaire ou l'éditeur de l'actif. Les utilisateurs qui ne disposent pas d'un rôle existant avec le droit Gérer les catalogues ou Accéder aux catalogues doivent disposer explicitement du droit Ajouter des actifs de catalogue aux projets.
Suppression du Cognos Dashboard différée
20 juin 2024
Tous les tableaux de bord existants que vous avez créés avec le service Cognos Dashboards Embedded continueront de fonctionner jusqu'au 30 septembre 2024. Vous ne pouvez plus mettre à disposition une instance du service Cognos Dashboards Embedded. Vous pouvez utiliser Cognos Analytics on Cloud On-Demand pour remplacer Cognos Dashboards Embedded. Pour plus d'informations, voir IBM Cognos Analytics -Plans de tarification.
Les données d'identification de tâche seront requises pour les demandes de travail de déploiement
19 juin 2024
Pour améliorer la sécurité de l'exécution des travaux de déploiement, l'utilisateur qui demande le travail doit fournir des données d'identification de tâche sous la forme d'une clé d'API. L'exigence sera appliquée à compter du 15 août 2024. Voir Ajout de données d'identification de tâche pour plus de détails sur la génération de la clé d'API.
Enrichissement de données amélioré dans IBM Knowledge Catalog
20 juin 2024
Outre les fonctions existantes, l'enrichissement des métadonnées fournit désormais des options pour l'enrichissement des données sémantiques et étendues à l'intelligence artificielle:
- Recommander des noms descriptifs pour les tables et les colonnes en fonction des métadonnées collectées et d'un glossaire prédéfini.
- Suggérez et affectez des descriptions sémantiques pour le contenu des tables et des colonnes en fonction des colonnes environnantes et du contexte des tables.
- Terminez l'affectation de termes sémantiques pour les tables et les colonnes.
Pour plus de détails, voir Conception d'enrichissements de métadonnées.
Ces nouvelles fonctions d'enrichissement des métadonnées basées sur l'intelligence artificielle de génération sont disponibles uniquement dans la région de Dallas.
Modification du client IBM Federated Learning Python
20 juin 2024
La bibliothèque client Python de Federated Learning a été fusionnée avec la bibliothèque watsonx.ai . Vos exemples de code doivent être mis à jour avec le client Python le plus récent. Voir Connexion à l'agrégateur.
Connectez-vous à une nouvelle source de données dansDataStage:IBMPlanning Analytics
14 juin 2024
Vous pouvez désormais inclure des données provenant d'une source de données IBM Planning Analytics dans vos flux DataStage .
Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.
Semaine se terminant le 7 juin 2024
Modifications en bloc pour les artefacts de gouvernance
7 juin 2024
Vous pouvez désormais apporter des modifications à plusieurs artefacts de gouvernance à la fois lorsque vous souhaitez éditer des étiquettes ou des intendants. Pour plus d'informations, voir Gestion des artefacts de gouvernance.
Modification de la catégorie parent pour des artefacts individuels
7 juin 2024
Lorsque vous affichez les détails de l'artefact, vous pouvez désormais modifier la catégorie parent en sélectionnant Déplacer vers dans le menu d'action à trois points.
Les règles de protection des données ne sont plus appliquées dans les projets
7 juin 2024
Les règles de protection des données ne sont désormais appliquées que dans les catalogues gouvernés ou par une solution d'application approfondie. Une solution d'application approfondie est une solution de protection permettant d'appliquer des règles sur les données qui se trouvent en dehors de Cloud Pak for Data lorsque la source de données est intégrée à l'un de ces services:
- IBM Data Virtualization
- IBM watsonx.data
Les actifs ajoutés aux projets à partir d'un catalogue gouverné ne sont plus soumis à des restrictions d'aperçu, de téléchargement ou de profilage par les règles de protection des données, sauf si vous avez configuré une solution d'application approfondie.
Il vous sera rappelé les protocoles révisés d'application des règles de protection des données lorsque vous:
- Création d'une règle de protection des données.
- Copie d'un actif d'un catalogue gouverné dans un projet
Pour plus de détails, voir Accepter le protocole révisé pour l'application des règles de protection des données.
Gestion des paramètres des rapports
6 juin 2024
Les propriétaires ou les administrateurs de compte IBM Cloud peuvent désormais gérer les paramètres des rapports sur la page Compte . Pour plus d'informations, voir Gestion des paramètres de compte.
Semaine se terminant le 31 mai 2024
IBM Watson Pipelines est désormais IBM Orchestration Pipelines
30 mai 2024
Le nouveau nom de service reflète les capacités d'orchestration de parties du cycle de vie de l'intelligence artificielle en flux reproductibles.
Etiquetez les projets pour les extraire facilement
31 mai 2024
Vous pouvez désormais affecter des étiquettes à des projets afin de faciliter leur regroupement ou leur extraction. Affectez des balises lorsque vous créez un nouveau projet ou à partir de la liste de tous les projets. Filtrez la liste des projets par étiquette pour extraire un ensemble de projets associé. Pour plus d'informations, voir Création d'un projet.
Se connecter à une nouvelle source de données : Milvus
31 mai 2024
Utilisez la connexion Milvus pour stocker et confirmer l'exactitude de vos identifiants et détails de connexion pour accéder à un magasin de vecteurs Milvus. Pour plus d'informations, voir la connexion Milvus.
Semaine se terminant le 24 mai 2024
Utilisateur et rôle de l'actif
24 mai 2024
Mise à jour des rôles d'appartenance d'actif pour les catalogues. Désormais, les utilisateurs peuvent détenir le rôle de propriétaire d'actif, d'éditeur d'actif ou d'afficheur d'actif. Le rôle d'éditeur d'actif a remplacé le rôle de membre d'actif. Maintenant, pour effectuer des actions liées à un actif, vous devez être un propriétaire d'actif ou un éditeur d'actif.
En outre, les actifs peuvent avoir plusieurs propriétaires maintenant.
Vous pouvez modifier les rôles utilisateur d'un actif dans la page de contrôle Accès d'un actif en sélectionnant un rôle dans le menu déroulant Rôle .
Actions en bloc sur les actifs de catalogue
24 mai 2024
Vous pouvez désormais modifier et supprimer les termes commerciaux, les propriétaires ou les étiquettes pour un maximum de 20 actifs de catalogue à la fois.
Semaine se terminant le 10 mai 2024
Nouveaux filtres pour les résultats d'enrichissementIBM Knowledge Catalog)
10 mai 2024
Vous pouvez maintenant appliquer des filtres supplémentaires à vos résultats d'enrichissement:
- Affecté, suggéré ou aucun terme métier
- Affecté, suggéré ou aucune classe de données
Modifications de nom pour les connexions et les connecteurs DataStage
10 mai 2024
Les connexions et connecteurs DataStage suivants portent de nouveaux noms:
- "Apache Cassandra (optimisé)" est maintenant "Apache Cassandra pourDataStage" .
- "IBMDb2 (optimisé") est maintenant "IBMDb2 pourDataStage" .
- "IBMNetezza Performance Server (optimisé)" est maintenant "IBMNetezza Performance Server pourDataStage" .
- "Oracle (optimisé)" est maintenant "Oracle Database pourDataStage" .
- "Salesforce.com (optimisé)" est maintenant "Salesforce API pourDataStage" .
- "Teradata (optimisé)" est maintenant "Teradata base de données pourDataStage" .
Vos paramètres précédents pour les connexions, les connecteurs et les travaux associés restent les mêmes. Seuls les noms de connexion et de connecteur ont été modifiés.
Semaine se terminant le 26 avril 2024
Changement de nom pour la connexion IBM Watson Query
26 avril 2024
La connexion "IBM Watson Query" a été renommée en "IBM Data Virtualization". Vos paramètres précédents pour la connexion sont conservés. Seul le nom de la connexion a été modifié.
Changement de nom pour le connecteur DataStage IBM Watson Query
26 avril 2024
Le nom de connecteur DataStage "IBM Watson Query" a été remplacé par "IBM Data Virtualization". Ce changement coïncide avec le changement de nom de connexion. Vos paramètres précédents pour la connexion, le connecteur et les travaux associés restent les mêmes. Seuls le nom de la connexion et du connecteur ont été modifiés.
Masquagewatsonx.data dansIBM Knowledge Catalog
26 avril 2024
Vous pouvez protéger les données sensibles danswatsonx.data en utilisant les capacités de masquage deIBM Knowledge Catalog . Pour plus d'informations, voir Masquagewatsonx.data actifs enIBM Knowledge Catalog .
Semaine se terminant le 19 avril 2024
Vue de liste de projets améliorée dans les catalogues
18 avril 2024
A présent, lorsque vous ajoutez des actifs d'un catalogue à un projet, vous pouvez afficher plus de 100 projets dans votre page de liste de projets et ajouter jusqu'à 50 actifs à la fois à votre projet. Pour plus d'informations, voir Ajout d'actifs à partir du catalogue.
Evaluer les déploiements d'apprentissage automatique dans les espaces
18 avril 2024
Configurez les évaluations watsonx.governance dans vos espaces de déploiement pour obtenir des informations sur les performances de votre modèle d'apprentissage automatique. Par exemple, évaluez un déploiement pour le biais ou surveillez un déploiement pour la dérive. Lorsque vous configurez des évaluations, vous pouvez analyser les résultats d'évaluation et modéliser les enregistrements de transaction directement dans vos espaces.
Pour plus d'informations, voir Evaluation des déploiements dans les espaces.
19 avril 2024
Semaine se terminant le 12 avril 2024
Révision du protocole d'application des règles de protection des données dans Cloud Pak for Data
12 avril 2024
Une version révisée du protocole d'application des règles de protection des données est désormais en place dans Cloud Pak for Data. Lorsque vous vous trouvez dans un catalogue gouverné et que vous cliquez sur Add to project
, des informations sur le nouveau protocole d'application des règles de protection des données s'affichent. Vous devez le reconnaître pour continuer.
Cognos Dashboards Le service Embedded est obsolète
11 avril 2024
Vous ne pouvez plus mettre à disposition une instance du service Cognos Dashboards Embedded. Toutefois, tous les tableaux de bord existants que vous avez créés avec le service Cognos Dashboards Embedded continueront de fonctionner jusqu'au 20 juin 2024. Vous pouvez utiliser Cognos Analytics on Cloud On-Demand pour remplacer Cognos Dashboards Embedded. Pour plus d'informations, voir IBM Cognos Analytics -Plans de tarification.
Semaine se terminant le 5 avril 2024
Utiliser des tableaux croisés dynamiques pour afficher les données agrégées dans les expérimentations Decision Optimization
5 avril 2024
Vous pouvez désormais utiliser des tableaux croisés dynamiques pour afficher à la fois les données d'entrée et de sortie agrégées dans la vue Visualisation des expérimentations Decision Optimization . Pour plus d'informations, voir Widgets de visualisation dans les expérimentations Decision Optimization.
Accès à la liste des propriétés d'API de connexion à partir de l'interface utilisateur
5 avril 2024
Auparavant, le seul moyen d'afficher les propriétés de la connexion était d'ouvrir une nouvelle page web à l'https://dataplatform.cloud.ibm.com/connections/docs. Vous pouvez désormais accéder aux mêmes informations à partir de Données > Connectivité. Développez Ressources de connexionet sélectionnez Propriétés de connexion.
Vous pouvez utiliser ces propriétés pour créer des connexions avec les connexions dans l'API Watson Data. Par exemple, si vous créez une connexion dans un bloc-notes à l'aide d'un programme, vous pouvez utiliser ces informations pour identifier les propriétés dont vous avez besoin.
Semaine se terminant le 22 mars 2024
Créer des vues dynamiques des données connectéesIBM Knowledge Catalog
21 mars 2024
Un nouveau type d'actif de données connecté fournit un accès filtré aux données des sources de données qui prennent en charge les requêtes SQL afin que vous puissiez accéder uniquement aux données pertinentes. Dans un projet, fournissez une requête SQL pour créer une vue de colonnes ou de lignes spécifiques à partir d'une ou de plusieurs tables. Vous pouvez utiliser ces actifs de données dans l'enrichissement des métadonnées et l'analyse de la qualité des données comme n'importe quel autre actif de données connecté.
Pour plus d'informations, voir Ajout d'une vue dynamique des données connectées à un projet.
Utilisez les formats de table Delta Lake ou Apache Iceberg dans Amazon S3 et les connecteurs Apache HDFS
22 mars 2024
Les connecteurs Amazon S3 et Apache HDFS incluent désormais des propriétés pour les formats de table Delta Lake et Apache Iceberg. Ces formats de table font partie intégrante des lacs de données, qui fournissent un référentiel centralisé pour la gestion de grands volumes de données. Les lacs de données servent de base à la collecte et à l'analyse de données structurées, semi-structurées et non structurées dans leur format d'origine pour le stockage à long terme et pour générer des connaissances et des prévisions.
La propriété de format de tableau est incluse dans les propriétés d'interaction pour les outils pris en charge. Par exemple, dans le connecteur Propriétés d'étape dans DataStage.
Semaine se terminant le 23 février 2024
Accès aux données à partir de DataStax Enterprise
23 février 2024
Vous pouvez désormais utiliser les données d' DataStax Enterprise.
Semaine se terminant le 16 février 2024
Codes sensibles à la casse dans les jeux de données de référence dans IBM Knowledge Catalog
16 février 2024
Les valeurs de données de référence se composent d'au moins deux colonnes: code et valeur. Pour tous les nouveaux jeux de données de référence, la colonne de code est désormais sensible à la casse. Lorsque vous ajoutez des valeurs à un nouveau jeu de données de référence, le code est sauvegardé exactement comme vous l'avez saisi. Notez que tous les jeux de données de référence qui ont été créés avant l'introduction de cette modification restent insensibles à la casse et que les nouvelles valeurs qui y ont été ajoutées seront sauvegardées en majuscules. Ces jeux de données de référence sont marqués avec une balise insensible à la casse dans l'interface utilisateur. Pour plus de détails, voir Code sensible à la casse.
Amélioration des options de recherche, de filtrage et de tri pour les jeux de données de référence dans IBM Knowledge Catalog
16 février 2024
Lorsque vous affichez une liste de valeurs de données de référence, vous pouvez utiliser les méthodes suivantes pour trouver plus rapidement les valeurs requises:
- Utilisez une barre de recherche pour entrer une requête pour un code, une valeur ou une valeur de colonne personnalisée.
- Utilisez l'une des 6 options de filtre avancées.
- Utilisez la fonction de tri.
Les options de recherche, de filtrage et de tri peuvent être combinées. Pour plus de détails, voir Affichage des jeux de données de référence.
Semaine se terminant le 09 février 2024
Nouvel environnement Spark 3.4 pour l'exécution de travaux de flux Data Refinery
09 fév 2024
Lorsque vous sélectionnez un environnement pour un travail de flux Data Refinery , vous pouvez maintenant sélectionner Default Spark 3.4 & R 4.2, qui inclut des améliorations de Spark.
L'environnement Default Spark 3.3 & R 4.2 est obsolète et sera supprimé lors d'une mise à jour ultérieure.
Mettez à jour vos travaux de flux Data Refinery pour utiliser le nouvel environnement Default Spark 3.4 & R 4.2 . Pour plus de détails, voir Options de ressource de calcul pour Data Refinery dans les projets.
Documentation Decision Optimization plus centrée sur les tâches
09 fév 2024
Vous pouvez désormais trouver plus facilement les informations appropriées pour créer et configurer des expérimentations Decision Optimization . Voir ExpériencesDecision Optimization et ses sous-sections.
Fonction de vue de pagination pour la publication d'actifs dans un catalogue
08 fév 2024
Lorsque vous publiez des actifs de projet dans un catalogue, vous pouvez désormais afficher 20 catalogues et actifs sur chaque page avec la vue de pagination. Auparavant, vous pouvez afficher vos actifs dans une liste. Voir Publication d'actifs dans un catalogue.
Des types d'analyse avancés dans l'enrichissement des métadonnées sont disponibles dans la région de FrancfortIBM Knowledge Catalog
09 fév 2024
La clé primaire avancée et l'analyse des relations et le profilage avancé sont désormais également disponibles dans la région de Francfort, en plus de la région de Dallas.
IBM Cloud Data Engine la connexion est obsolète
08 fév 2024
La connexion IBM Cloud Data Engine est obsolète et sera supprimée dans une prochaine version. Pour connaître les dates importantes et les détails, consultez la rubrique " Déclassement du moteur de données".
Semaine se terminant le 02 février 2024
Sauvegardez vos recherches d'actifs de catalogue
02 fév 2024
Chaque utilisateur peut désormais enregistrer jusqu'à 25 recherches dans chacun de ses catalogues. L'utilisateur qui sauvegarde une recherche dans un catalogue est le seul utilisateur qui peut afficher, exécuter, éditer et supprimer la recherche. Pour plus d'informations, voir Sauvegarde des recherches d'actifs de catalogue.
Galerie renommée en concentrateur de ressources
02 fév 2024
La galerie est renommée en concentrateur de ressources. Le concentrateur de ressources contient des exemples de projets, de fichiers et de blocs-notes. Voir concentrateur de ressources.
IBM Cloud Databases for DataStax connexion interrompue
02 fév 2024
La connexion IBM Cloud Databases for DataStax a été supprimée de Cloud Pak for Data as a Service.
La connexion Dremio requiert des mises à jour
02 fév 2024
Auparavant, la connexion Dremio utilisait un pilote JDBC . Maintenant, la connexion utilise un pilote basé sur Arrow Flight.
Important: mettez à jour les propriétés de connexion. Différentes modifications s'appliquent à une connexion pour une instance Dremio Software (sur site) ou une instance Dremio Cloud.
Logiciel Dremio : mettez à jour le numéro de port.
Le nouveau numéro de port par défaut utilisé par Flight est 32010
. Vous pouvez confirmer le numéro de port dans le fichier dremio.conf . Voir Configuration via dremio.conf pour plus d'informations.
En outre, Dremio ne prend plus en charge les connexions avec IBM Cloud Satellite.
Dremio Cloud: mettez à jour la méthode d'authentification et le nom d'hôte.
- Connectez-vous à Dremio et générez un jeton d'accès personnel. Pour plus d'informations, voir les jetons d'accès personnels.
- Dans Cloud Pak for Data as a Service dans le formulaire Create connection: Dremio , remplacez le type d'authentification par Personal Access Token et ajoutez les informations relatives au jeton. (L'authentification Nom d'utilisateur et mot de passe ne peut plus être utilisée pour se connecter à une instance cloud Dremio .)
- Sélectionnez Le port est activé pour SSL.
Si vous utilisez le nom d'hôte par défaut pour une instance Dremio Cloud, vous devez le modifier:
- Remplacez
sql.dremio.cloud
pardata.dremio.cloud
- Remplacez
sql.eu.dremio.cloud
pardata.eu.dremio.cloud
Types d'analyse supplémentaires dans l'enrichissement de métadonnées (IBM Knowledge Catalog)
31 janvier 2024
L'enrichissement des métadonnées fournit désormais les options d'analyse supplémentaires suivantes:
Analyse de clé primaire pour détecter les clés primaires dans vos données qui identifient de manière unique chaque enregistrement dans un actif de données.
L'analyse superficielle est automatiquement incluse lorsque vous sélectionnez l'option d'enrichissement Données de profil . L'analyse avancée peut être exécutée sur des actifs sélectionnés à partir des résultats d'enrichissement.
Analyse des relations pour identifier les relations entre les actifs de données ou pour trouver des données redondantes et redondantes dans les colonnes.
L'analyse des relations de clé superficielle est exécutée lorsque vous sélectionnez la nouvelle option d'enrichissement Définir les relations . L'analyse avancée peut être exécutée sur des actifs sélectionnés à partir des résultats d'enrichissement.
Profilage avancé pour obtenir des résultats plus précis pour certains indicateurs, tels que la distribution de fréquence et l'unicité des valeurs dans une colonne.
Le profilage avancé peut être exécuté sur des actifs sélectionnés à partir des résultats d'enrichissement.
L'analyse avancée des clés primaires et des relations et le profilage avancé nécessitent le service DataStage en plus du service IBM Knowledge Catalog et ne sont disponibles que dans la région de Dallas.
Pour plus d'informations, voir Création d'un actif d'enrichissement de métadonnées, Identification des clés primaires, Identification des relationset Profils de données avancés.
Semaine se terminant le 26 janvier 2024
AutoAI prend en charge les données ordonnées pour toutes les expérimentations
25 janvier 2024
Vous pouvez désormais spécifier des données ordonnées pour toutes les expérimentations AutoAI plutôt que des expérimentations de séries temporelles. Indiquez si vos données d'apprentissage sont classées de manière séquentielle, en fonction d'un index de ligne. Lorsque les données d'entrée sont séquentielles, les performances du modèle sont évaluées sur les enregistrements les plus récents au lieu d'un échantillonnage aléatoire, et les données restantes utilisent les n derniers enregistrements de l'ensemble au lieu de n enregistrements aléatoires. Des données séquentielles sont requises pour les expériences de séries temporelles, mais facultatives pour les expériences de classification et de régression.
Définir sur le thème foncé
25 janvier 2024
Vous pouvez désormais définir votre interface utilisateur Cloud Pak for Data as a Service sur le thème foncé. Cliquez sur votre avatar et sélectionnez Profil et paramètres pour ouvrir votre profil de compte. Ensuite, définissez le bouton de thème foncé sur on. Le thème sombre n'est pas pris en charge dans RStudio et les carnets Jupyter. Pour plus d'informations sur la gestion de votre profil, voir Gestion de vos paramètres.
Semaine se terminant le 19 janvier 2024
Afficher les informations de type natif dans le panneau des détails des colonnes d'actif
19 janvier 2024
Vous pouvez maintenant afficher les types de données standardisés et natifs directement dans le panneau des détails de la colonne. Pour afficher les informations de type natif, cliquez sur le nom d'une colonne d'actif dans la page Présentation d'un actif.
Nouvelle option pour la priorité des actions de règle (IBM Knowledge Catalog)
18 janvier 2024
La priorité des actions de règle vous permet de spécifier comment les règles sont appliquées lorsqu'il existe plusieurs règles avec des actions différentes sur un ensemble de données. Vous pouvez utiliser la nouvelle option Application hiérarchique pour configurer une évaluation à deux couches des règles de protection des données.
- La première couche évalue les règles pour une action
Allow
ouDeny
sans prendre en compte les actions de masquage. La décision de cette première couche doit être de permettre l'accès à la deuxième couche. - La deuxième couche évalue les règles d'une action
Transform
.
Vous pouvez définir cette option à partir de l'interface utilisateur ou de l' APIaccess_decision_precedence
.
Pour plus d'informations, voir Gestion des paramètres de règle.
Stockez les résultats de l'analyse de la qualité des données (IBM Knowledge Catalog)
18 janvier 2024
Vous avez maintenant la possibilité d'écrire la sortie des contrôles de qualité de données prédéfinis qui sont exécutés dans le cadre de l'enrichissement des métadonnées dans une base de données. Par exemple, vous pouvez stocker ces données afin de pouvoir utiliser les tables pour le suivi des problèmes de qualité et en tant qu'entrée pour les processus de résolution. Pour plus d'informations, voir Création d'un enrichissement de métadonnées.
Connectez-vous à une nouvelle source de données dansDataStage:Tableau
18 janvier 2024
Vous pouvez désormais inclure des données provenant d'une source de données Tableau dans vos flux DataStage .
Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.
Semaine se terminant le 12 janvier 2024
La prise en charge du Runtime IBM 22.2 est obsolète dans le Runtime watsonx.ai (anciennement Watson Machine Learning)
11 janvier 2024
IBM Runtime 22.2 est obsolète et sera supprimé le 11 avril 2024. A partir du 7 mars 2024, vous ne pouvez pas créer de blocs-notes ou d'environnements personnalisés à l'aide des environnements d'exécution 22.2 . En outre, vous ne pouvez pas entraîner de nouveaux modèles avec des spécifications logicielles basées sur l'environnement d'exécution 22.2 . Mettez à jour vos actifs et vos déploiements pour utiliser IBM Runtime 23.1 avant le 7 mars 2024.
- Pour en savoir plus sur la migration d'un actif vers une infrastructure et une spécification logicielle prises en charge, voir Gestion des spécifications ou des infrastructures logicielles obsolètes.
- Pour en savoir plus sur l'environnement de bloc-notes, voir Options de ressource de calcul pour l'éditeur de bloc-notes dans les projets.
- Pour en savoir plus sur la modification de votre environnement, voir Modification de l'environnement d'un bloc-notes.
Semaine se terminant le 15 décembre 2023
Afficher les informations sur la source de données dans le panneau des détails des catalogues
15 décembre 2023
Si vous cliquez sur un actif dans la grille des éléments associés, vous pouvez afficher les informations de la source de données directement dans le panneau des détails de l'actif.
Créer des clés d'API utilisateur pour des travaux et d'autres opérations
15 décembre 2023
Certaines opérations d'exécution dans Cloud Pak for Data as a Service, telles que les travaux et l'entraînement de modèle, nécessitent une clé d'API comme données d'identification pour l'autorisation sécurisée. Avec les clés d'API utilisateur, vous pouvez désormais générer et faire pivoter une clé d'API directement dans Cloud Pak for Data as a Service , si nécessaire, afin de garantir le bon déroulement de vos opérations. Les clés d'API sont gérées dans IBM Cloud, mais vous pouvez facilement les créer et les faire pivoter dans Cloud Pak for Data as a Service.
La clé d'API utilisateur est spécifique au compte et est créée à partir de Profil et paramètres sous votre profil de compte.
Pour plus d'informations, voir Gestion de la clé d'API utilisateur.
Expiration et déconnexion de la nouvelle session de connexion en raison d'une inactivité
15 décembre 2023
Vous êtes maintenant déconnecté d' IBM Cloud en raison de l'expiration de la session. Votre session peut expirer en raison de l'expiration de la session de connexion (24 heures par défaut) ou de l'inactivité (2 heures par défaut). Vous pouvez modifier les durées par défaut dans les paramètres d'accès (IAM) dans IBM Cloud. Pour plus d'informations, voir Définition de l'expiration de la session de connexion.
Accéder à la liste des propriétés d'API de connexion
15 décembre 2023
Vous pouvez désormais consulter la liste complète des connecteurs et de leurs propriétés individuelles à l'adresse https://dataplatform.cloud.ibm.com/connections/docs.
Vous pouvez utiliser ces propriétés pour créer des connexions avec les connexions dans l'API Watson Data. Par exemple, si vous créez une connexion dans un bloc-notes à l'aide d'un programme, vous pouvez utiliser ces informations pour identifier les propriétés dont vous avez besoin.
Organiser les actifs de projet dans des dossiers
14 décembre 2023
Vous pouvez maintenant créer des dossiers dans vos projets pour organiser les actifs. Un administrateur du projet doit activer les dossiers, et les administrateurs et les éditeurs peuvent les créer et les gérer. Les dossiers sont en version bêta et ne sont pas encore pris en charge pour une utilisation dans les environnements de production. Pour plus d'informations, voir Organisation des actifs avec des dossiers (bêta).
IBM Cloud Databases for DataStax connecteur est obsolète
15 décembre 2023
Le connecteur IBM Cloud Databases for DataStax est obsolète et sera supprimé dans une prochaine version.
Semaine se terminant le 08 décembre 2023
Nouvelles propriétés client dans les connexions Db2 pour la gestion de charge de travail
08 décembre 2023
Vous pouvez désormais spécifier des propriétés dans les zones suivantes à des fins de surveillance: Nom de l'application, Informations comptables du client, Nom d'hôte du clientet Utilisateur du client. Ces zones sont facultatives et sont disponibles pour les connexions suivantes:
Se connecter à une nouvelle source de données dans DataStage: Google Looker
08 décembre 2023
Vous pouvez désormais inclure des données provenant d'une source de données Google Looker dans vos flux DataStage. (Vous pouvez utiliser cette connexion uniquement pour les données source.)
Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.
Fonctionnalités nouvelles et améliorées de la Data Virtualization
08 décembre 2023
Les fonctionnalités nouvelles et améliorées suivantes sont disponibles dans la Data Virtualization:
Utilisez les règles de protection des données d' IBM Knowledge Catalog pour filtrer les lignes dans les tables virtualisées
Il se peut que vous ayez une source de données comportant des tables avec des données de clients de l'administration, de l'entreprise et de la distribution combinées. Par exemple, une table de facturation peut contenir des données pour tous les clients, où certaines des lignes sont destinées à des clients gouvernementaux et d'autres à des clients non gouvernementaux. Le type du client n'est pas indiqué dans la table de facturation. Vous pouvez maintenant filtrer la liste des enregistrements client à l'aide de l'une des techniques suivantes.
Vous pouvez utiliser un tableau distinct pour identifier les clients qui sont des clients gouvernementaux. Les ID de cette table peuvent être utilisés pour filtrer les lignes de la table de facturation. Lorsque vous filtrez des lignes, la table masquée ne contient pas les lignes contenant les données des clients du gouvernement.
Vous pouvez utiliser une table d'identificateurs de client bloqués comme table de référence. Toutes les lignes de la table de facturation qui comportent des lignes avec l'identificateur de client inclus dans l'ensemble de clients bloqués sont exclues de l'ensemble de résultats.
Data Virtualization prend en charge le masquage des colonnes dans les données virtualisées en fonction des règles de protection des données définies dans IBM Knowledge Catalog. Désormais, vous pouvez créer des règles de protection des données pour inclure ou exclure des lignes dans vos données virtualisées afin d'éviter d'exposer des données sensibles.
Pour plus d'informations, reportez-vous à la section Gouverner les données virtuelles à l'aide de règles de protection des données dans la section Data Virtualization.
Utiliser le masquage de données avancé sur les données virtualisées
Vous pouvez désormais utiliser les options avancées de masquage des données dans la Data Virtualization pour éviter d'exposer des données sensibles.
Pour plus d'informations sur le nouveau comportement de masquage, voir Masquage des données virtuelles dans la Data Virtualization.
Amélioration des performances des requêtes et application des règles de protection des données
Data Virtualization stocke et met en cache les règles de protection des données d'IBM Knowledge Catalog dans un cache PEP (Policy enforcement point) afin d'éviter d'évaluer les règles à chaque fois qu'un objet est interrogé. Ce cache améliore les performances des requêtes précédemment exécutées en réduisant le nombre d'appels à IBM Knowledge Catalog pour extraire les règles. Toutefois, vous pouvez constater un délai pouvant aller jusqu'à 10 secondes avant que des règles de protection des données nouvellement ajoutées ou mises à jour ne soient appliquées aux requêtes. Vous pouvez utiliser le client Web pour configurer les paramètres de cache PEP, tels que la taille du cache et la durée de vie du cache.
Pour plus d'informations, voir Activation de l'application des règles de protection des données dans la Data Virtualization.
Formater et sauvegarder les plans d'accès aux requêtes formatées pour l'optimisation des performances
Vous pouvez désormais formater et enregistrer des plans d'accès formatés pour l'optimisation des performances dans la Data Virtualization. Lorsque vous exécutez des requêtes SQL dans Data Virtualization, vous pouvez utiliser le client Web pour formater la manière dont les informations EXPLAIN apparaissent lorsque vous générez des plans d'accès aux requêtes. Vous pouvez ensuite exécuter la commande db2exfmt à partir du client Web pour générer et télécharger facilement la sortie EXPLAIN dans des fichiers texte.
Utilisez des caractères génériques pour filtrer vos sources de données
A présent, lorsque vous créez une table virtualisée, vous pouvez utiliser les caractères génériques suivants pour personnaliser les filtres afin de trouver les sources de données dont vous avez besoin:
- % (percent): pour représenter zéro ou plusieurs caractères
- _ (trait de soulignement): pour représenter un caractère unique
Pour plus d'informations, voir Filtrer les données dans la Data Virtualization.
Les utilisateurs de Data Virtualization peuvent publier leurs propres objets virtuels
Les utilisateurs ayant le rôle d'utilisateur dans la Data Virtualization peuvent désormais publier les objets virtuels qu'ils ont créés dans les catalogues gouvernés.
Pour plus d'informations, voir Publication de données virtuelles dans un catalogue avec la Data Virtualization.
Gérer les utilisateurs pouvant accéder à des sources de données individuelles et effectuer des opérations sur ces dernières
Avec les restrictions d'accès à la source de données, vous pouvez gérer explicitement l'accès à des connexions de source de données individuelles qui utilisent des droits d'accès partagés. Vous pouvez affecter des utilisateurs et des rôles en tant que collaborateurs pour une connexion de source de données. Seuls ces collaborateurs peuvent accéder à la connexion de source de données. Vous affectez des privilèges spécifiques aux collaborateurs pour gérer les actions qu'ils peuvent effectuer sur les sources de données. Cela vous permet de séparer les privilèges des rôles, de sorte que certains utilisateurs auxquels un rôle tel que Gestionnaire est affecté puissent accéder à des connexions de sources de données différentes et effectuer des actions sur ces connexions.
Pour plus d'informations, voir Restrictions d'accès à la connexion à la source de données dans la Data Virtualization.
Données de requête dans les lacs de données S3 génériques et Microsoft Azure Data Lake Storage Gen2
Vous pouvez désormais vous connecter à des sources de données S3 génériques et Microsoft Azure Data Lake Storage Gen2 . Pour plus d'informations, voir Sources de données prises en charge dans la Data Virtualization.
Choisissez votre mode de requête pour prioriser les performances ou la cohérence
Vous pouvez désormais choisir entre l'exécution de requêtes en mode Max Pushdown ou en mode Max Consistency.
- Le mode Max Pushdown ignore la différence sémantique entre la Data Virtualization et la source de données pour les requêtes à source unique. Par conséquent, d'autres requêtes à source unique peuvent être entièrement envoyées à la source de données, ce qui améliore les performances des requêtes. Les résultats de requête sont cohérents avec la sémantique de source de données pour les requêtes entièrement insérées dans ce mode. Le mode de transfert de l'exécution sur la base de données n'a pas d'impact sur les requêtes à sources multiples.
- Le mode Max Consistency suit la sémantique de Data Virtualization pour évaluer si les opérations peuvent être poussées vers la source de données. Si l'opération exécutée sur la source de données génère le même résultat que la Data Virtualization, l'opération peut être repoussée vers le bas. Dans ce mode, les requêtes peuvent être entièrement repoussées vers le bas si la source de données distante a la même sémantique que la Data Virtualization.
Recherchez et virtualisez rapidement des tables à l'aide de l'onglet Explorer
Vous pouvez maintenant trouver rapidement les tables que vous souhaitez virtualiser. Sur la page Virtualiser, vous pouvez utiliser l'onglet Explorer pour parcourir les bases de données, les schémas et les tables disponibles dans une source de données connectée. L'onglet Liste affiche toutes les tables disponibles dans toutes vos sources de données connectées. Sur la page Sources de données, vous pouvez filtrer vos sources de données pour charger rapidement la liste réduite des tables disponibles dans l'onglet Liste.
Pour plus d'informations, voir Création d'objets virtuels dans Data Virtualization.
Amélioration de la collecte de statistiques pour les tables virtualisées à l'aide de l'échantillonnage de données
L'échantillonnage de données améliore la collecte de statistiques en réduisant les ressources dont vous avez besoin pour collecter des statistiques. Lorsque vous collectez des statistiques en sélectionnant la méthode de collecte de requêtes distantes dans le client Web, un taux d'échantillonnage par défaut de 20% est utilisé. Pour optimiser la collecte de statistiques, sélectionnez Activer l'échantillonnage de table et choisissez un taux d'échantillonnage compris entre 1% et 99%.
Si vous collectez des statistiques à l'aide de DVSYS.COLLECT_STATISTICS , vous pouvez utiliser l'option TABLESAMPLE avec le type de collecte de statistiques de requête distante pour échantillonner des données lorsque vous collectez des statistiques. Pour obtenir des conseils, consultez les remarques sur l'utilisation.
Vous pouvez également utiliser DVSYS.COLLECT_STATISTICS permet de collecter des statistiques pour les tables virtualisées sur des fichiers à plat.
Pour plus d'informations, voir la procédure stockée COLLECT_STATISTICS dans Data Virtualization.
Utilisez vos identifiants de plate-forme pour accéder aux connexions de Data Virtualization
Lorsque vous utilisez une connexion de plate-forme pour accéder à la Data Virtualization, vous êtes invité à fournir vos informations d'identification. Vous pouvez éventuellement sélectionner Utiliser mes données d'identification de connexion à la plateforme, plutôt que d'entrer vos données d'identification personnelles pour la connexion. La connexion utilise votre jeton Web JSON (JWT) de session en cours.
Améliorations apportées aux sources de données dans le stockage d'objets
- Vous pouvez désormais créer des connexions et virtualiser des fichiers pour les sources de données S3 génériques dans le stockage d'objets:
- Vous pouvez désormais créer des tables virtualisées à partir de fichiers CSV ou TSV compressés en externe qui sont stockés dans le stockage d'objets. Pour plus d'informations, voir Création d'une table virtuelle à partir de fichiers dans le stockage d'objets.
- Vous pouvez désormais virtualiser des fichiers à plat dans le stockage d'objets cloud qui contiennent des en-têtes de colonne.
Pour plus d'informations, voir Création d'une table virtualisée à partir de fichiers dans le stockage d'objets dans le nuage dans Data Virtualization.
Améliorations de la fonction de transfert de l'exécution sur les prédicats et prise en charge de la fonction de transfert de l'exécution sur d'autres sources de données
Le prédicat pushdown est une optimisation qui réduit les temps de requête et l'utilisation de la mémoire. Cette édition inclut les améliorations suivantes apportées à la fonction de transfert de l'exécution sur la base de données des prédicats:
- Les requêtes qui incluent des clauses COUNT (DISTINCT) ou GROUP BY peuvent désormais être insérées avec des règles de comparaison des blancs de fin pour Teradata, Netezza®, Microsoft SQL Server, Db2® for z/OS®et les sources de données de base de données Db2 .
- Requêtes qui incluent une opération de comparaison de chaînes telle qu'un prédicat GROUP BY ou WHERE sur des données CHAR ou VARCHAR pour la source de données Teradata afin de gérer la sensibilité à la casse.
- Les instructions SQL avec des prédicats LIKE sont désormais supprimées pour :Db2® ,SAP HANA ,Oracle ,PostgreSQL,Apache Hive ,MySQL,Microsoft SQL Server , Flocon de neige,Netezza® Performance Server , etTeradata .
- Les instructions SQL comportant des clauses Fetch sont désormais insérées pour les sources de données Db2, Db2 for z/OS, Apache Derby, Oracle, Amazon Redshift, Google BigQueryet Salesforce.com .
- Les instructions SQL avec un filtre de comparaison de chaînes sont désormais insérées pour les sources de données Db2, Microsoft SQL Server, Teradata, Netezza Performance Serveret Apache Derby .
- Les instructions SQL avec des fonctions OLAP sont désormais insérées pour les sources de données Db2 et Netezza Performance Server .
- Les sources de données Greenplum prennent désormais en charge la propagation des prédicats.
- La source de données MySQL (My SQL Community Edition et My SQL Enterprise Edition) prend désormais en charge la propagation des prédicats.
- La source de données Cloudera Impala prend désormais en charge la propagation des prédicats.
- La source de données Data Virtualization Manager for z/OS® prend désormais en charge les prédicats de type "push down".
Pour plus d'informations, voir Sources de données prises en charge dans la Data Virtualization.
Une connexion de Data Virtualization est désormais disponible par défaut dans les connexions de la plate-forme
Vous pouvez ajouter une connexion de Data Virtualization à partir des connexions de la plate-forme aux catalogues et aux projets sans avoir à remplir manuellement les détails de la connexion.
Gérer l'accès pour plusieurs utilisateurs et rôles si vous êtes un responsable
En tant que Data Virtualization Manager, vous pouvez désormais accorder et révoquer l'accès à plusieurs utilisateurs et rôles en même temps.
Pour plus d'informations, voir Gestion de l'accès aux objets virtuels dans la Data Virtualization.
Les responsables de la Data Virtualization peuvent désormais rendre les objets virtuels visibles à tous les utilisateurs
Les gestionnaires peuvent désormais choisir d'offrir aux utilisateurs une vue plus complète du contenu en rendant les objets virtuels existants visibles à partir de la page Données virtualisées. L'accès aux données au sein de ces objets continue de respecter les autorisations de Data Virtualization et les règles de protection des données. Pour activer cette fonction, les gestionnaires doivent désactiver le paramètre Restreindre la visibilité des paramètres de service.
Pour plus d'informations, voir Gestion de la visibilité des objets virtuels dans la Data Virtualization.
Nouvelles API de mise en cache
Les entrées de cache peuvent être gérées via des API REST exposées par le service de mise en cache. Ces API peuvent être appelées par n'importe quelle application. Vous pouvez utiliser de nouvelles API de mise en cache pour effectuer les tâches suivantes:
- Créer un cache
- Répertorier un cache spécifique
- Supprimer un cache
- Activer un cache
- Désactiver un cache
- Actualiser un cache
- Editer un cache
Les API de mise en cache suivantes sont obsolètes:
- Répertorier les caches
- Répertorier un cache
- Extraire la mémoire cache
Pour plus d'informations, voir Caches dans la documentation de l'API de Data Virtualization 2.0.0
Nouvelle API de publication
Vous pouvez publier des données virutalized dans des catalogues à l'aide de l'API suivante:
L'API suivante est obsolète:
Semaine se terminant le 1er décembre 2023
Nouveaux plans pour Watson OpenScale dans le cadre de watsonx.governance
1 déc 2023
Watson OpenScale fait désormais partie de watsonx.governance. La mise à disposition de watsonx.governance à partir du catalogue IBM Cloud installe Watson OpenScale. Sur Cloud Pak for Data as a Service, Watson OpenScale continue de fournir des services d'évaluation des modèles d'apprentissage automatique prédictif. Sur watsonx, la mise à disposition de watsonx.governance étend les capacités de gouvernance de Watson OpenScale pour évaluer les actifs de modèle de base ainsi que les actifs d'apprentissage automatique. Vous pouvez définir des cas d'utilisation de l'intelligence artificielle pour résoudre des problèmes métier, puis suivre les données d'actifs dans des fiches d'information pour prendre en charge les objectifs de conformité et de gouvernance. Les plans et fonctions Watsonx.governance ne sont disponibles que dans la région de Dallas. Les plans existants Watson OpenScale sont disponibles dans la région de Francfort.
- Pour afficher les détails d'un plan, voir les plans watsonx.governance .
- Pour commencer, voir Mise à disposition et lancement de watsonx.governance.
IBM Watson Knowledge Catalog est désormais IBM Knowledge Catalog
1 déc 2023
IBM Watson Knowledge Catalog est renommé en IBM Knowledge Catalog. Seul le nom a changé, les plans d'offre de services et les fonctions du produit restent les mêmes.
Nouvelles sources de données pour l'importation de métadonnées dans IBM Knowledge Catalog
1 déc 2023
Vous pouvez importer des métadonnées dans IBM Knowledge Catalog à partir des sources de données suivantes:
- IBM Match 360
- SingleStoreDB
Pour plus d'informations, voir Sources de données prises en charge pour l'importation de métadonnées, l'enrichissement de métadonnées et les règles de qualité de données.
Semaine se terminant le 17 novembre 2023
Nouvelle propriété personnalisée de type utilisateur et groupe d'utilisateurs
17 novembre 2023
Vous pouvez désormais créer une propriété personnalisée de type utilisateur et groupe d'utilisateurs et lui affecter des utilisateurs ou des groupes d'utilisateurs spécifiques. Pour plus d'informations, voir Création de propriétés personnalisées.
Plusieurs sources à l'une ou l'autre extrémité d'un type de relation personnalisé
17 novembre 2023
Vous pouvez étendre votre ensemble de types de relation personnalisés en utilisant plusieurs types sur les extrémités source et cible. Utilisez de nombreux types d'artefact, d'actif et de colonne pour une définition de relation plus détaillée. Pour plus d'informations, voir Création de relations personnalisées.
Nouveaux droits pour la qualité des données dans IBM Knowledge Catalog
17 novembre 2023
Vous pouvez désormais affecter les droits suivants à vos utilisateurs afin de mieux contrôler la manière dont la qualité des données est établie dans IBM Knowledge Catalog:
- Gestion des actifs de qualité de données
- Exécuter des règles de qualité de données
- Exploration en aval des détails des problèmes
Par défaut, les nouveaux droits sont inclus dans les rôles suivants:
- Administrateur
- CloudPak Data Quality Analyst, qui est un nouveau rôle
Mettez à jour les affectations de rôle et les rôles personnalisés dont vous pouvez disposer pour les utilisateurs qui doivent gérer des définitions et des règles de qualité de données et exécuter des règles de qualité de données.
Pour plus d'informations, voir Rôles et autorisations des utilisateurs pour IBM Knowledge Catalog et watsonx.ai Studio.
Règles de protection des données à l'exportation et à l'importation
17 novembre 2023
Vous pouvez désormais utiliser des API pour exporter et importer des règles de protection des données dans plusieurs instances de Cloud Pak for Data as a Service. Les liens vers les artefacts de glossaire, les catalogues, les actifs et les utilisateurs sont gérés lorsque vous exportez les règles de protection des données.
Pour plus d'informations, voir Migration des règles de protection des données.
Exécuter les flux DataStage en mode d'exécution Extraction, chargement et transformation (ELT) (bêta)
13 novembre 2023
Le processus ELT est différent du processus ETL (extraction, transformation et chargement) traditionnel dans la mesure où il exécute la partie transformation du processus dans la base de données cible, qui peut être plus efficace et plus rentable. Cette fonction est actuellement disponible en version bêta et n'est pas prise en charge pour la production.
Suppression de certains types de relation prédéfinis (13 décembre 2023)
13 novembre 2023
Le 13 décembre 2023, les types de relation prédéfinis pour les relations actif-actif et actif-artefact qui sont rarement utilisées seront supprimés.
Les types de relation suivants seront affectés:
Defines - Is defined by
sera remplacé parContains - Is contained in
Is owner of - Is owned by
sera remplacé parContains - Is contained in
Has for parent entity - Is relationship child of
sera remplacé parIs parent of - Is child of
Is supertype of - Is subtype of
sera remplacé parIs parent of - Is child of
Voici ce que vous devez faire maintenant:
- Si vous n'utilisez pas ces types de relation, aucune action n'est requise.
- Si vous utilisez ces types de relation et que vous êtes d'accord avec les types de relation de remplacement, aucune action n'est requise.
- Si vous utilisez ces types de relation et souhaitez affecter des types de relation différents, supprimez la relation en cours et créez de nouvelles relations à l'aide d'autres types de relation prédéfinis ou personnalisés.
Si vous avez des questions ou des préoccupations concernant le remplacement de ces types de relation, vous pouvez ouvrir un ticket de demande de service.
Semaine se terminant le 10 novembre 2023
Suppression de la clé de ressource du panneau des détails des colonnes
10 novembre 2023
La clé de ressource a été affichée dans le panneau des détails à un niveau de colonne, bien que les informations ne s'appliquent pas aux colonnes. La clé de ressource est désormais supprimée du panneau des détails au niveau de la colonne. Les informations sont toujours requises au niveau de l'actif. Par exemple, la clé de ressource d'actif peut être utilisée dans le fichier CSV de mappage de lignage d'importation.
DéployerDataStage moteurs d'exécution distants localement avecDataStage-aaS N'importe où
9 novembre 2023
Vous pouvez désormais déployer des moteurs d'exécution distants DataStage pour exécuter des travaux d'intégration de données sur site ou dans n'importe quel centre de données ou cloud.
Le moteur d'exécution DataStage est une offre conteneurisée qui est déployée dans des environnements locaux pour améliorer les performances et la sécurité. Concevez des pipelines ETL et ELT dans DataStage et exécutez des tâches d'intégration de données localement sur votre moteur. Les administrateurs peuvent lancer un ou plusieurs moteurs d'exécution distants. Pour des raisons de sécurité, le style d'exécution ne peut pas être rétabli dans l'environnement d'exécution sans serveur IBM Cloud une fois que DSaaS Anywhere est activé pour un projet, mais l'environnement d'exécution sans serveur IBM Cloud reste disponible pour d'autres projets.
Pour plus d'informations, voir EnvironnementsDataStage.
Annonce de la prise en charge des infrastructures et des spécifications logicielles Python 3.10 et R4.2 sur l'environnement d'exécution 23.1
9 novembre 2023
Vous pouvez désormais utiliser IBM Runtime 23.1, qui inclut les derniers frameworks de science des données basés sur Python 3.10 et R 4.2, pour exécuter des blocs-notes Jupyter et des scripts R, former des modèles et exécuter des déploiements. Mettez à jour vos ressources et vos déploiements pour utiliser les frameworks et les spécifications logicielles IBM Runtime 23.1
- Pour plus d'informations sur l'édition IBM Runtime 23.1 et les environnements inclus pour Python 3.10 et R 4.2, voir Modification des environnements de bloc-notes.
- Pour plus d'informations sur les structures de déploiement, voir Gestion des cadres et des spécifications logicielles.
Utilisez Apache Spark 3.4 pour exécuter des blocs-notes et des scripts
Spark 3.4 avec Python 3.10 et R 4.2 est maintenant supporté comme runtime pour les notebooks et les scripts RStudio dans les projets. Pour plus de détails sur les environnements de bloc-notes disponibles, voir Calculer les options de ressources pour l'éditeur de bloc-notes dans les projets et Calculer les options de ressources pour RStudio dans les projets.
Semaine se terminant le 27 octobre 2023
Accès aux données à partir de fichiers à plat complexes dans DataStage
27 octobre 2023
Vous pouvez désormais utiliser le connecteur Complex Flat File dans vos flux DataStage .
Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.
Enregistrement de votre requête de recherche lors de l'utilisation de la barre de recherche globale
27 octobre 2023
Vous pouvez maintenant sauvegarder vos critères de recherche pour une utilisation ultérieure. Vos recherches sauvegardées sont répertoriées dans la liste déroulante lorsque vous entrez des données dans la barre de recherche. Vous pouvez également éditer ou supprimer la recherche sauvegardée. Voir Sauvegarde de votre recherche.
Connexion à d'autres sources de données dans DataStage
27 octobre 2023
Vous pouvez désormais inclure des données provenant de ces sources de données dans vos flux DataStage :
- Apache Derby
- IBM Cloud Data Engine
- IBM Cloud Databases for DataStax
- IBM watsonx.data Presto
Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.
Utilisez un connecteur Satellite pour vous connecter à une base de données sur site
26 octobre 2023
Utilisez le nouveau connecteur Satellite pour vous connecter à une base de données qui n'est pas accessible via Internet (par exemple, derrière un pare-feu). Le connecteur Satellite utilise une communication Dockerlégère qui crée des communications sécurisées et auditables depuis votre environnement sur site vers IBM Cloud. Pour obtenir des instructions, voir Connexion à des données derrière un pare-feu.
Secure Gateway est obsolète
26 octobre 2023
IBM Cloud a annoncé la dépréciation de Secure Gateway. Pour plus d'informations, voir la vue d'ensemble et le calendrier.
Si vous disposez actuellement de connexions configurées avec Secure Gateway, prévoyez d'utiliser une autre méthode de communication. Dans Cloud Pak for Data as a Service, vous pouvez utiliser le connecteur Satellite pour remplacer Secure Gateway. Voir Connexion à des données derrière un pare-feu.
Utiliser le classement NLS dans DataStage
27 octobre 2023
Vous pouvez désormais rassembler des données avec le support de langue nationale dans vos flux DataStage .
Semaine se terminant le 20 octobre 2023
Accédez aux données Lakehouse avec la nouvelle connexion IBM watsonx.data Presto
20 octobre 2023
Vous pouvez utiliser la connexion IBM watsonx.data Presto pour vous connecter à une base de données dans une instance watsonx.data déployée sur Cloud Pak for Data ou IBM Cloud. IBM watsonx.data est un data lakehouse ouvert, hybride et gouverné, optimisé par un moteur de requêtes pour toutes les charges de travail liées aux données et à l'IA.
Pour plus d'informations, voir IBM watsonx.data Presto connexion.
Semaine se terminant le 13 octobre 2023
Noms de propriété d'énumération personnalisés traduits dans votre langue préférée (IBM Knowledge Catalog)
13 octobre 2023
Les propriétaires de propriétés personnalisées peuvent désormais autoriser la traduction des noms de propriété de type énumération personnalisés dans la langue de votre choix.
Le propriétaire de la propriété de type énumération personnalisée pour un actif ou une colonne doit définir la définition de la propriété pour que vous puissiez choisir d'afficher les noms de propriété d'énumération personnalisée dans la langue de votre navigateur. Pour plus d'informations, voir Création de propriétés personnalisées.
Solutions intermédiaires dans Decision Optimization
12 octobre 2023
Vous pouvez maintenant choisir d'afficher un échantillon de solutions intermédiaires alors qu'une expérimentation Decision Optimization est en cours d'exécution. Cela peut être utile pour le débogage ou pour voir la progression du solveur. Pour les grands modèles qui prennent plus de temps à résoudre, avec des solutions intermédiaires, vous pouvez maintenant identifier rapidement et facilement les problèmes potentiels avec la résolution, sans avoir à attendre la fin de la résolution. Vous pouvez configurer le paramètre de livraison de solutions intermédiaires dans la configuration de l'exécution et sélectionner une fréquence pour ces solutions. Pour plus d'informations, voir Solutions intermédiaires et Paramètres de configuration d'exécution.
Nouvelle boîte de dialogue du modèle enregistré Decision Optimization
Lorsque vous sauvegardez un modèle pour le déploiement à partir de l'interface utilisateur Decision Optimization , vous pouvez désormais examiner le schéma d'entrée et de sortie et sélectionner plus facilement les tables que vous souhaitez inclure. Vous pouvez également ajouter, modifier ou supprimer des paramètres de configuration d'exécution, examiner l'environnement et les fichiers de modèle utilisés. Tous ces éléments sont affichés dans la même boîte de dialogue Sauvegarder en tant que modèle pour le déploiement . Pour plus d'informations, voir Déploiement d'un modèle Decision Optimization à l'aide de l'interface utilisateur.
Dépréciation du profilage des données non structurées (IBM Knowledge Catalog)
10 octobre 2023
A ce jour, les actifs de données qui contiennent des données non structurées ne peuvent plus être profilés.
Afficher les métriques d'exécution pour vos travaux DataStage
9 octobre 2023
Vous pouvez désormais afficher les métriques d'exécution de vos travaux DataStage sur la grille et sur la page des détails d'exécution de travail. Pour plus d'informations, voir Création et gestion de travaux DataStage.
Ajout en bloc de clés et d'attributs à de nouvelles étapes
9 octobre 2023
Vous pouvez désormais ajouter en bloc des clés et des attributs aux étapes suivantes dans vos flux DataStage : tri, fusion, jointure, suppression des doublons, différence, capture de changement, application de changement, combinaison d'enregistrements, entonnoir, comparaison, ensemble de fichiers de recherche, mappe de plage d'écriture et filtre de Bloom.
Semaine se terminant le 6 octobre 2023
Contrôle le placement d'une nouvelle colonne dans l'opération de concaténation (Data Refinery)
6 octobre 2023
Vous disposez maintenant de deux options pour spécifier la position de la nouvelle colonne qui résulte de l'opération Concaténer : en tant que colonne la plus à droite dans le jeu de données ou en regard de la colonne d'origine.
Auparavant, la nouvelle colonne était placée au début du jeu de données.
Editez l'opération Concaténer dans l'un de vos flux Data Refinery existants pour spécifier la nouvelle position de colonne. Sinon, le flux risque d'échouer.
Pour plus d'informations sur les opérations Data Refinery , voir Opérations de l'interface graphique dans Data Refinery.
Semaine se terminant le 29 septembre 2023
Utiliser de nouvelles fonctions dans le générateur d'expressions pour l'étape Modify dans DataStage
25 septembre 2023
Vous pouvez utiliser des fonctions de conversion dans le générateur d'expressions de l'étape Modify de vos flux DataStage .
Semaine se terminant le 22 septembre 2023
Modèles Java Decision Optimization
20 septembre 2023
Les modèles Java d'Decision Optimization peuvent désormais être déployés dans watsonx.ai Runtime (anciennement Watson Machine Learning. En utilisant l'API d'agent Java, vous pouvez créer des modèles d'optimisation avec les API Java OPL, CPLEX et CP Optimizer. You can now easily create your models locally, package them and deploy them on watsonx.ai Runtime by using the boilerplate that is provided in the public Travailleur Java " GitHub. Pour plus d'informations, voir Déploiement de modèles Java pour l'Decision Optimization
Semaine se terminant le 8 septembre 2023
Rappel: le profilage Watson Knowledge Catalog des données non structurées sera abandonné
8 septembre 2023
Le profilage des actifs de données non structurées ne sera plus pris en charge à partir du 10 octobre 2023.
Semaine se terminant le 1er septembre 2023
Obsolescence des commentaires dans les blocs-notes
31 août 2023
A ce jour, il n'est pas possible d'ajouter des commentaires à un bloc-notes à partir de la barre d'actions du bloc-notes. Tous les commentaires existants ont été supprimés.
Utiliser une nouvelle variable d'environnement dans DataStage
28 août 2023
Vous pouvez maintenant ajouter la variable d'environnement APT_SHOW_METRICS aux paramètres de flux de vos flux DataStage .
Semaine se terminant le 25 août 2023
Recherche rapide de catalogues avec tri des noms et des dates
24 août 2023
Vous pouvez désormais rechercher des catalogues en triant la liste des catalogues sur la page Afficher tous les catalogues par nom ou date de création. Cliquez sur l'en-tête Nom pour trier les catalogues par ordre alphabétique des noms. Cliquez sur l'en-tête Date de création pour trier les catalogues par dates croissantes ou décroissantes.
La qualité des données en un coup d'oeil dans IBM Knowledge Catalog
22 août 2023
Les informations sur la qualité des données ont une nouvelle maison. Pour chaque actif de données d'un catalogue ou d'un projet, une page Qualité de données est remplie avec des informations de qualité provenant de vérifications de qualité de données prédéfinies et de règles de qualité de données. Vous pouvez voir les dimensions de qualité de données applicables et les résultats des contrôles de qualité individuels. Vous pouvez explorer en aval les résultats de chaque vérification ou même les résultats de chaque colonne.
Pour plus d'informations, voir Qualité des données.
Des informations similaires sont disponibles à partir des résultats de l'enrichissement des métadonnées.
Toutes les analyses de la qualité des données sont désormais exécutées dans le contexte de l'enrichissement des métadonnées ou des règles de qualité des données. Lorsque vous exécutez le profilage à partir de la page Profil d'un projet ou d'un catalogue, la qualité des données n'est plus analysée et aucun score de qualité des données n'est généré.
Améliorations de cache supplémentaires disponibles pour Watson Pipelines
21 août 2023
D'autres options sont disponibles pour personnaliser vos paramètres de flux de pipeline. Vous pouvez désormais exercer un contrôle plus important sur le moment où le cache est utilisé pour les exécutions de pipeline. Pour plus de détails, voir Gestion des paramètres par défaut.
Semaine se terminant le 18 août 2023
Planifier les mises à jour de noms pour le service watsonx.ai Runtime (anciennement Watson Machine Learning)
18 août 2023
Dès à présent, les noms des plans sont mis à jour pour le service IBM watsonx.ai Runtime, comme suit :
Le plan v2 Standard est désormais le plan Essentials . Le plan est conçu pour fournir à votre organisation les ressources nécessaires pour commencer à utiliser des modèles de base et des actifs d'apprentissage automatique.
Le plan v2 Professional est désormais le plan Standard . Ce plan fournit des ressources conçues pour aider la plupart des organisations via la création d'actifs à une utilisation productive.
Les modifications apportées aux noms de plan ne modifient pas vos conditions de service. Autrement dit, si vous êtes enregistré pour utiliser le plan v2 Standard, il sera désormais nommé Essentials, mais tous les détails du plan resteront les mêmes. De même, si vous êtes enregistré pour utiliser le plan Professionnel v2 , il n'y a pas d'autres changements que le changement de nom du plan en Standard.
Pour plus de détails sur ce qui est inclus dans chaque plan, voir les plans d'exécutionwatsonx.ai Pour obtenir des informations sur les tarifs, trouvez votre plan sur la page du planwatsonx.ai Runtime dans le catalogue IBM Cloud
Connexion à d'autres sources de données dans DataStage
18 août 2023
Vous pouvez désormais inclure des données provenant de ces sources de données dans vos flux DataStage :
- Cloudera Impala
- Presto
Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.
Connexion aux données Google BigQuery avec ODBC (DataStage)
18 août 2023
La connexion ODBC inclut désormais la source de données Google BigQuery .
Pour la liste complète des sources de données disponibles pour leODBC connexion dansDataStage, voirODBC connexion .
Semaine se terminant le 11 août 2023
Utilisation de nouvelles fonctions dans l'étape DataStage Transformer
8 août 2023
- Vous pouvez désormais utiliser des fonctions de masquage de données, de chiffrement et d'expression régulière dans l'étape Transformer dans le cadre de vos flux DataStage .
- Vous pouvez maintenant faire glisser et déposer des colonnes dans l'onglet Sortie de l'étape Transformer.
- Vous pouvez désormais éditer en bloc des colonnes dans l'étape Transformer à partir de l'onglet Entrée.
Obsolescence des commentaires dans les blocs-notes
7 août 2023
Le 31 août 2023, vous ne pourrez plus ajouter de commentaires à un bloc-notes à partir de la barre d'actions du bloc-notes. Tous les commentaires existants qui ont été ajoutés de cette manière seront supprimés.
Semaine se terminant le 4 août 2023
Modèle d'analyse de texte personnalisé (SPSS Modeler)
4 août 2023
Pour SPSS Modeler, vous pouvez désormais télécharger un modèle d'analyse de texte personnalisé dans un projet. Vous bénéficiez ainsi d'une plus grande souplesse pour capturer et extraire les concepts clés d'une manière unique à votre contexte.
Semaine se terminant le 28 juillet 2023
Amélioration des capacités d'évaluation des modèles avec Watson OpenScale
25 juillet 2023
Utilisez ces nouvelles fonctions pour surveiller et évaluer les déploiements de modèle et interpréter les résultats.
Configurer les déploiements avec une nouvelle configuration guidée
Un nouvel assistant de configuration est disponible pour vous aider à ajouter des déploiements au tableau de bord Watson OpenScale Insights et à fournir des détails sur le modèle. Pour plus d'informations, voir Ajout de déploiements pour les évaluations.
Configurer une nouvelle évaluation de la dérive pour fournir plus d'informations
Vous pouvez configurer une nouvelle version de l'évaluation de la dérive dans Watson OpenScale pour générer les nouvelles métriques suivantes:
- Dérive de sortie
- Dérive des caractéristiques
- Dérive de la qualité du modèle
Pour plus d'informations, voir Configuration des évaluations v2 de dérive.
Comprendre les performances des modèles à l'aide d'évaluations de la santé des modèles
Watson OpenScale fournit désormais de nouvelles évaluations de santé de modèle par défaut pour vous aider à comprendre l'efficacité avec laquelle votre modèle traite vos transactions. Pour plus d'informations, voir Métriques d'évaluation du moniteur de santé de modèle.
Ajout de modèles de prévision multicible dans Watson OpenScale
Lorsque vous ajoutez vos déploiements dans Watson OpenScale, vous pouvez désormais spécifier plusieurs colonnes de prévision pour fournir des détails sur la sortie de vos modèles afin de configurer des évaluations de qualité. Pour plus d'informations, voir Indication des détails du modèle.
Exécuter des évaluations d'équité avec des données non structurées
Vous pouvez désormais activer les évaluations d'équité sur les types de données non structurées pour identifier le biais. Pour plus d'informations, voir Configuration des évaluations d'équité.
Semaine se terminant le 14 juillet 2023
Gérer les relations de colonne d'actif dans un catalogue
14 juillet 2023
Les administrateurs peuvent désormais créer et gérer des relations de colonne d'actif dans un catalogue. Des relations de colonne peuvent être créées entre des colonnes et des actifs, des colonnes et des artefacts, ou entre des colonnes.
Pour ajouter une relation de colonne, cliquez sur une ligne de colonne dans la page Présentation d'un actif. Dans le panneau latéral, cliquez sur le menu déroulant dynamique Articles liés . Sélectionnez l'un des types de relation dans la liste déroulante pour ajouter une relation.
Pour en savoir plus sur la création de relations, voir Relations d'actifs dans un catalogue.
Dépréciation de la prise en charge du profilage pour les données non structurées dans IBM Knowledge Catalog
12 juillet 2023
Le profilage des actifs de données qui contiennent des données non structurées, telles que des documents Microsoft Word, PDF, HTML et texte en clair, est obsolète. La prise en charge sera arrêtée le 10 octobre 2023. Jusque-là, les actifs de données non structurées des types pris en charge continueront à être profilés automatiquement lorsqu'ils seront ajoutés à un projet ou à un catalogue. A partir du 11 octobre 2023, les actifs de données non structurées nouvellement ajoutés ne seront plus profilés. Les profils existants seront disponibles pendant que les actifs de données respectifs résident dans le projet ou le catalogue.
La connexion Microsoft Azure SQL Database prend en charge l'authentification Azure Active Directory (Azure AD)
14 juillet 2023
Vous pouvez désormais sélectionner Active Directory pour la connexion Microsoft Azure SQL Database . L'authentification Active Directory est une alternative à l'authentification SQL Server . Grâce à cette amélioration, les administrateurs peuvent gérer de manière centralisée les droits utilisateur sur Azure. Pour plus d'informations, voir Connexion àMicrosoft Azure SQL Database.
Semaine se terminant le 7 juillet 2023
Passez à IBM watsonx.ai
7 juillet 2023
Si vous disposez des services watsonx watsonx.ai Studio (anciennement Watson Studio) et watsonx.ai Runtime (anciennement Watson Machine Learning), vous avez désormais accès à IBM watsonx.ai Vous pouvez passer de Cloud Pak for Data as a Service à watsonx et travailler avec des modèles de fondation dans l'outil Prompt Lab ou dans des carnets de notes.
Mises à jour des plans d'exécution de watsonx.ai (anciennement Watson Machine Learning)
7 juillet 2023
Tous les plans d'exécution de watsonx.ai incluent désormais l'inférence du modèle de fondation. L'inférence de modèle de base est disponible uniquement sur watsonx.ai. Vous pouvez passer à watsonx.ai et utiliser le nouvel outil Prompt Lab ou accéder aux modèles de fondation à l'aide d'un ordinateur portable. Vous utilisez la même instance de service watsonx.ai Runtime sur watsonx.ai que celle que vous utilisez sur Cloud Pak for Data as a Service
Si vous avez le plan watsonx.ai Runtime Lite, vous pouvez utiliser jusqu'à 25 000 jetons par mois pour l'inférence du modèle de fondation.
Si vous avez le plan watsonx.ai Runtime v2 Standard ou v2 Professional, votre compte sera facturé lorsque les utilisateurs de votre compte effectueront l'inférence du modèle de fondation dans le Prompt Lab ou dans les carnets de notes.
Pour plus de détails sur la façon dont l'inférence du modèle de fondation est suivie et facturée, voir le plan d'exécutionwatsonx.ai Pour connaître la tarification de l'inférence du modèle de fondation, trouvez votre plan sur la page du planwatsonx.ai Runtime dans le catalogue IBM Cloud
Amélioration des fonctions de traitement automatique du langage naturel dans l'environnement d'exécution 23.1
7 juillet 2023
L'environnement d'exécution 23.1 contient la Watson Natural Language Processing 4.1 et un nouvel ensemble de modèles pré-entraînés. La bibliothèque NLP contient les améliorations et mises à jour suivantes:
- De nombreux modèles inclus sont désormais basés sur des transformateurs. Ces modèles ont été entraînés sur le modèle LLM (Slate Large Language Model), qui a été créé par IBM. Les modèles sont disponibles en deux versions:
- Optimisé pour les environnements d'UC uniquement
- Pour les environnements avec des GPU ou des UC
- De nombreux modèles inclus pour différentes tâches NLP sont désormais basés sur le flux de travaux au lieu de basés sur les blocs, de sorte que vous pouvez appliquer les modèles directement sur le texte d'entrée sans vous soucier des étapes de prétraitement.
NLP inclut un modèle Slate Foundation que vous pouvez utiliser pour affiner vos tâches NLP. Vous pouvez utiliser le modèle Slate ou tout modèle basé sur un transformateur de Hugging Face comme base pour créer vos propres modèles avec Watson NLP.
Tous les modèles fournis par IBM sont désormais exclusivement formés sur des données non biaisées avec un filtrage de pointe pour la haine, les biais et les grossièretés.
Ces fonctions sont actuellement disponibles dans les environnements suivants:
- NLP Runtime 23.1 sur Python 3.10
- GPU V100 Runtime 23.1 sur Python 3.10
- GPU 2xV100 Runtime 23.1 sur Python 3.10
Vous pouvez utiliser ces environnements pour le traitement NLP, mais pas pour le développement de modèle général. Les bibliothèques de science des données utilisées dans ces environnements ne sont pas encore prises en charge par watsonx.ai Runtime (anciennement Watson Machine Learning).
Pour plus d'informations, voir Watson Natural Language Processing.
Semaine se terminant le 30 juin 2023
Amélioration du contenu Data Privacy dans Knowledge Accelerators (IBM Knowledge Catalog)
28 juin 2023
Knowledge Accelerator for Cross Industry dispose désormais d'un contenu Data Privacy qui inclut un ensemble de termes métier et de classes de données classifiés afin d'accélérer la reconnaissance et la gouvernance des informations personnelles. En outre, des exemples de règles et de politiques de confidentialité des données sont disponibles pour décrire les activités liées au traitement des informations personnelles.
Les termes métier et les classes de données ont des classifications pour guider l'identification des informations personnelles (PI) et des informations personnelles sensibles (SPI). Vous pouvez utiliser l'enrichissement de métadonnées dans IBM Knowledge Catalog pour affecter les termes métier à des actifs de données importés afin d'identifier les actifs qui contiennent des données personnelles.
Génération de rapports disponibles pour les actifs personnalisés (IBM Knowledge Catalog)
28 juin 2023
Vous pouvez désormais créer des requêtes, des rapports et des tableaux de bord basés sur des propriétés personnalisées pour n'importe quel actif d'un projet ou d'un catalogue. Vous pouvez définir de nouvelles propriétés personnalisées pour les actifs afin d'étendre les types d'actifs fournis ou personnalisés, puis créer des rapports basés sur ces relations. Par exemple, vous pouvez créer un rapport sur vos règles de qualité de données et vos relations d'artefact pour extrapoler la précision de vos données. Pour plus d'informations, voir Configuration de la génération de rapports.
Amélioration de la génération de rapports pour les règles de qualité des données (IBM Knowledge Catalog)
28 juin 2023
Vous pouvez désormais surveiller les règles de qualité de données comme suit:
- Recevez et gérez des rapports sur les problèmes de qualité de données pour chaque actif de données d'un catalogue ou d'un projet.
- Surveillez la qualité continue des données pour les actifs de données dans les projets et les catalogues en utilisant la génération de rapports pour les scores de qualité de données et les scores de dimensions de qualité de données. Le score de qualité des données est basé sur une moyenne pondérée à partir des scores de dimension de qualité des données. Les scores des dimensions de qualité des données sont basés sur les résultats des contrôles de qualité des données pertinents.
- Pour les règles de qualité de données qui incluent plusieurs définitions de règle, consultez les statistiques de contrôle de qualité de données (résultats) par définition de règle dans le schéma de génération de rapports BI.
Pour plus d'informations, voir Modèle de données.
Semaine se terminant le 23 juin 2023
Gouvernance plus efficace des modèles grâce à des améliorations apportées aux AI Factsheets
23 juin 2023
Les AI Factsheets offrent désormais d'autres moyens de suivre les solutions aux problèmes métier, de gouverner un plus large éventail d'actifs, de capturer plus d'informations avec des pièces jointes de fiches d'information et de générer des rapports améliorés.
Suivez les différentes solutions de cas d'utilisation de modèle avec des approches
Lorsque vous suivez des modèles dans un cas d'utilisation, vous pouvez désormais créer une ou plusieurs approches pour suivre différentes méthodes et versions de modèle pour résoudre un problème métier. Par exemple, vous pouvez créer deux approches différentes dans un cas d'utilisation pour comparer la façon dont différents algorithmes affectent les performances du modèle afin de trouver la meilleure solution. Pour plus de détails, voir Gestion des versions de modèle dans un cas d'utilisation.
Options améliorées pour la gouvernance des modèles externes
Vous pouvez désormais utiliser des AI Factsheets pour gouverner une gamme plus large de modèles externes, y compris les modèles développés, déployés et surveillés sur une plateforme autre que Cloud Pak for Data as a Service. En plus des métadonnées plus complètes suivies pour les modèles externes, le client Python et les commandes d'API fournissent davantage de fonctions permettant de déplacer des modèles et des déploiements dans différents environnements afin de suivre plus précisément le cycle de vie de ces actifs. Pour plus de détails, voir Ajout d'un modèle externe à l'inventaire de modèles.
Exercer plus de contrôle sur les pièces jointes
Les administrateurs d'inventaire de modèle peuvent créer des groupes de pièces jointes et des définitions de pièces jointes afin que les utilisateurs puissent afficher les pièces jointes de manière plus organisée et les télécharger dans un format approuvé. Pour plus de détails, voir Ajout et gestion de pièces jointes pour des fiches de données.
Ajout d'une image de marque à vos rapports AI Factsheets
Personnalisez les modèles de rapport que vous utilisez pour créer des rapports à partir de feuilles de calcul en ajoutant des informations de marque et un logo. Pour plus d'informations, voir Génération de rapports pour des fiches de renseignements et des cas d'utilisation de modèle. Pour plus de détails, voir Génération de rapports pour des fiches de données et des scénarios d'utilisation de modèle.
Annonce de la prise en charge du runtime Python 3.10 Spark 3.3 pour les notebookswatsonx.ai Studio anciennement Watson Studo)
23 juin 2023
Python 3.10 Spark 3.3 est désormais pris en charge en tant qu'environnement d'exécution pour les blocs-notes. Python 3.9 Spark 3.3 est obsolète et sera abandonné le 20 juillet 2023. A partir du 6 juillet 2023, vous ne pourrez plus créer de blocs-notes avec un environnement Python 3.9 Spark 3.3 , mais les blocs-notes existants continueront de s'exécuter jusqu'au 30 juillet 2023. Modifiez votre environnement de bloc-notes pour utiliser Python 3.10 Spark 3.3 avant de supprimer l'environnement obsolète. Pour plus de détails sur les environnements de bloc-notes, voir Options de ressource de calcul pour l'éditeur de bloc-notes dans les projets.
Semaine se terminant le 16 juin 2023
Prochainement: Disponibilité générale de la prévision des anomalies de séries temporelles dans les expérimentations AutoAI
15 juin 2023
Créez une expérimentation de prévision d'anomalie de série temporelle pour entraîner un modèle qui peut détecter des anomalies, ou des résultats inattendus, lorsque le modèle prévoit des résultats en fonction de nouvelles données. Cette fonction d' AutoAI est actuellement disponible en version bêta et n'est pas prise en charge pour la production. Une fois que la fonctionnalité sera disponible et entièrement prise en charge, l'entraînement pour les expériences de prédiction d'anomalies de séries temporelles consommera des unités d'heures de capacité (CUH) dans le cadre de votre plan d'exécution watsonx.ai
Personnaliser les paramètres du moteur pour les expériences d'Decision Optimizationwatsonx.ai Studio (anciennement Watson Studio)
15 juin 2023
Vous pouvez maintenant ajouter un fichier de paramètres de moteur dans votre expérimentation Decision Optimization . Avec ce fichier, vous pouvez afficher et personnaliser les paramètres de moteur utilisés pour résoudre votre modèle dans un nouvel éditeur visuel. Vous pouvez également importer un fichier de paramètres de moteur et rechercher des paramètres existants.
Semaine se terminant le 2 juin 2023
Gestion des événements de cycle de vie de l'intelligence artificielle à l'aide de l'outil cpdctl
2 juin 2023
Vous pouvez désormais gérer et automatiser vos actifs hébergés sur Cloud Pak for Data as a Service à l'aide de l'outil d'interface de ligne de commande Cloud Pak for Data (cpdctl). Utilisez la configuration automatique à partir d' IBM Cloud pour vous connecter facilement avec les commandes d'API cpdctl. Pour plus de détails et un exemple, consultez les ressources suivantes:
- Documentation de l'interface de ligne de commande d'IBM Cloud Pak for Data.
- Exportation des actifs d'espace pour un exemple d'utilisation de cpdctl pour la gestion des actifs.
- IBM cpdctl CLI on IBM Cloud blog post for details about connecting to cpdctl from Cloud Pak for Data as a Service.
Trouvez facilement vos catalogues à l'aide de la fonction de recherche
1er juin 2023
Avec la page Catalogues mise à jour, vous pouvez désormais rechercher un catalogue par nom et voir d'autres catalogues sur la page pour faciliter l'analyse.
Semaine se terminant le 19 mai 2023
Rappel: Fin de la prise en charge de Runtime 22.1 sur Python 3.9 et R 3.6
15 mai 2023
Les environnements IBM Runtime 22.1 sur Python 3.9 et R 3.6 seront supprimés le 15 juin 2023. Vous ne pouvez plus créer de nouveaux blocs-notes ni créer d'environnements personnalisés à l'aide des environnements d'exécution 22.1 ou de R 3.6, ni entraîner de nouveaux modèles avec les spécifications logicielles Python 3.9 . Mettez à jour vos actifs et vos déploiements pour utiliser IBM Runtime 22.2 sur Python 3.10 ou R 4.2 avant le 15 juin 2023.
- Pour plus de détails sur la migration d'un actif vers une spécification de logiciel et d'infrastructure prise en charge, voir Gestion des cadres et des spécifications logicielles.
- Pour plus de détails sur les environnements de bloc-notes, voir Options de ressource de calcul pour l'éditeur de bloc-notes dans les projets.
- Pour plus d'informations sur la modification de vos environnements, voir Modification de l'environnement d'un bloc-notes.
- Pour plus de détails sur les bibliothèques et les packages des versions R, voir les notes sur l'édition de CRAN.
Introduction à la recherche par clé-valeur pour les utilisateurs avancés
18 mai 2023
A l'aide des paires key:value
de la barre de recherche, vous pouvez désormais effectuer des recherches dans les propriétés d'actif et d'artefact, telles que la description, les balises, les propriétés personnalisées, les noms de colonne, etc. Voir Recherche de propriétés.
Changement de nom pour la connexion IBM Cloud Compose for MySQL
18 mai 2023
La connexion IBM Cloud Compose for MySQL a été renommée IBM Cloud Databases for MySQL. Vos paramètres précédents pour la connexion sont conservés. Seul le nom de la connexion a été modifié.
Connexions abandonnées
18 mai 2023
Les connexions suivantes sont abandonnées et ont été supprimées de Cloud Pak for Data as a Service:
- IBM Db2 Event Store
- IBM Db2 Hosted
Le changement de nom des actifs de données renomme également les fichiers joints dans les projets
19 mai 2023
Lorsque vous modifiez le nom des actifs de données avec des fichiers joints que vous avez téléchargés dans le projet, les fichiers joints sont également renommés. Toutefois, la modification du nom des actifs de données importés à partir de catalogues ne renomme aucune pièce jointe. Vous devez mettre à jour toutes les références à l'actif de données dans les actifs basés sur le code, tels que les blocs-notes, vers le nouveau nom d'actif de données, sinon l'actif basé sur le code ne s'exécutera pas. Voir plus d'informations sur la gestion des actifs dans les projets.
Semaine se terminant le 12 mai 2023
Nouvelles fonctions d'interface utilisateur pour la création d'actifs personnalisés et la gestion des propriétés personnalisées pour les colonnes
11 mai 2023
Les collaborateurs de catalogue dotés du rôle d'administrateur ou d'éditeur peuvent désormais effectuer les tâches suivantes à partir du client Web:
- Créez des actifs personnalisés à partir du catalogue. Pour ajouter un actif personnalisé, sélectionnez Actif personnalisé dans le menu déroulant Ajouter au catalogue.
- Gérez les propriétés personnalisées des colonnes d'actif de données. Pour gérer les propriétés personnalisées, sélectionnez une colonne dans la vue d'ensemble d'un actif et éditez les propriétés dans le panneau latéral.
Pour en savoir plus sur les propriétés personnalisées des actifs de données, voir Types d'actif, propriétés et relations personnalisés.
Semaine se terminant le 5 mai 2023
Ajout de code généré à partir du panneau Fragments de code
4 mai 2023
Une nouvelle icône de fragments de code a été ajoutée à la barre d'outils du bloc-notes. En cliquant sur l'icône, vous ouvrez la sous-fenêtre Fragments de code à partir de laquelle vous pouvez lire les données d'un fichier ou d'une connexion qui a été ajouté au projet. La logique de fonction "Insérer dans le code" existante pour générer du code qui charge des données dans une cellule de bloc-notes a été déplacée sous Données de lecture. L'ancien panneau de recherche et de chargement de données ne peut désormais être utilisé que pour télécharger des données dans un projet. Voir Chargement et consultation de données dans un bloc-notes.
Semaine se terminant le 28 avril 2023
Les pipelines d'orchestration sont désormais disponibles en version GA pour l'automatisation des activités de cycle de vie de l'intelligence artificielle
27 avril 2023
Orchestration Pipelines fournit une interface graphique permettant d'orchestrer un flux d'actifs de bout en bout depuis la création jusqu'au déploiement. Assemblez et configurez un pipeline qui automatise les tâches relatives à la conservation des données, puis à l'entraînement, au déploiement et à la mise à jour des modèles d'apprentissage automatique. Exécuter un travail de pipeline en temps réel ou selon un planning. Pour plus de détails sur la création de pipelines, voir Pipelines d'orchestration.
La nouveauté de cette mise à jour est la possibilité de créer un composant de pipeline personnalisé pour exécuter un script que vous écrivez à l'aide d'une fonction Python . Vous pouvez utiliser des composants personnalisés pour partager des scripts réutilisables entre des pipelines. Vous créez des composants personnalisés en tant qu'actifs de projet, puis vous les utilisez dans des pipelines que vous créez dans ce projet. Pour plus de détails, voir Création d'un composant personnalisé.
Orchestration Pipelines est une fonctionnalité de watsonx.ai Studio (anciennement Watson Studio. Toutefois, vous devez disposer de plans de service pour les actifs et les processus utilisés dans un pipeline. Par exemple, pour exécuter un flux DataStage dans un pipeline, vous devez disposer d'une instance de service Data Stage. Les pipelines d'orchestration consomment des ressources en fonction des actifs et des processus utilisés dans le pipeline. Si votre pipeline entraîne un modèle AutoAI, votre compte est facturé pour les unités de capacité par heure (CUH) de watsonx.ai Runtime (anciennement Watson Machine Learning) utilisées pour l'entraînement du modèle. De même, si un pipeline contient un flux DataStage, l'exécution de ce flux dans Orchestration Pipelines est imputée à votre plan DataStage. L'exécution des composants du pipeline et des scripts bash consomme les ressources CUH de watsonx.ai Studio. Pour plus de détails sur la mise à disposition des instances de service et des plans, voir Services et intégrations.
Accéder à d'autres données avec la nouvelle connexion Presto
27 avril 2023
Vous pouvez désormais utiliser les données des sources de données Presto . Pour plus d'informations, voir ConnexionPresto.
Semaine se terminant le 21 avril 2023
Exploration en aval des détails des résultats de profilage (IBM Knowledge Catalog)
20 avril 2023
Vous pouvez désormais accéder à des informations de profilage détaillées à partir d'un enrichissement de métadonnées ou à partir de l'onglet Profil d'un actif dans un projet ou un catalogue. Pour chaque colonne, affichez les informations statistiques sur les données de la colonne, les informations sur les classes de données, les types de données et les formats, ainsi que la distribution de fréquence des valeurs dans la colonne. Pour les informations statistiques, vous pouvez également choisir entre plusieurs types de visualisation. Pour remplir ces vues pour un profil existant, mettez à jour le profil.
Pour plus de détails, voir Column-level profile details.
Semaine se terminant le 14 avril 2023
Versions par défaut de Python et de CPLEX mises à jour (Decision Optimization)
13 avril 2023
Les utilisateurs par défaut de Python for Decision Optimization sont désormais 3.10 et la version par défaut de CPLEX est 22.1. Ces versions sont utilisées par défaut lorsque vous créez une nouvelle expérimentation. Python 3.9 est obsolète et sera bientôt supprimé. Pour mettre à jour votre environnement, voir Configuration des environnements. Pour mettre à jour des modèles déployés existants, voir Déploiement de modèle.
Améliorations apportées aux règles de qualité des données (IBM Knowledge Catalog)
13 avril 2023
Vous pouvez également exécuter des règles de qualité de données sur des actifs de données à partir de ces sources de données:
- Amazon S3 (fichiers CSV uniquement)
- Apache Cassandra
- SAP ASE
Lorsque vous configurez une règle de qualité de données avec des liaisons gérées en externe, vous pouvez désormais sélectionner du contenu supplémentaire pour les liens de sortie dans le flux DataStage associé. Pour plus d'informations, voir Création de règles à partir de définitions de qualité de données.
Semaine se terminant le 7 avril 2023
Nouveau: Expérimentation de détection des anomalies de séries temporelles (bêta)
7 avril 2023
Utilisez l'AutoAI pour former un modèle de prédiction d'anomalies de séries temporelles qui peut détecter des anomalies, ou des résultats inattendus, lorsque le modèle prédit des résultats basés sur de nouvelles données. Les pipelines de candidats de modèle générés par l'expérimentation sont classés en fonction de leur performance mesurée par la métrique d'optimisation. Sauvegardez un modèle en tant que bloc-notes pour réviser le code ou sauvegardez et déployez un modèle pour détecter les anomalies potentielles dans les nouvelles données.
Filtrer votre activité d'actif dans un projet
6 avril 2023
Dans la sous-fenêtre Actifs de l'onglet Présentation d'un projet, vous pouvez filtrer les actifs en sélectionnant Par vous ou Par tous dans la liste déroulante. Par vous répertorie les actifs que vous avez édités, classés par plus récent en haut. Par tous répertorie les actifs édités par d'autres personnes, ainsi que par vous-même, classés en fonction des actifs les plus récents en haut.
Mise à jour vers Spark avec R 4.2 dans watsonx.ai Studio (anciennement Watson Studo)
3 avril 2023
Les environnements Spark R 3.6 pour watsonx.ai Studio sont mis à jour vers R 4.2 Tous les environnements Spark R 3.6 sont désormais obsolètes et seront supprimés le 15 juin 2023. A partir du 11 mai 2023, vous ne pouvez plus créer de nouveaux blocs-notes ou de nouveaux flux Data Refinery avec Spark R 3.6. De plus, vous ne pourrez pas créer de nouveaux environnements personnalisés Spark R 3.6 . A ce moment-là, vous devrez peut-être mettre à jour certaines versions de package et des scripts pour vos blocs-notes. Vous devez mettre à jour vos actifs et vos déploiements pour utiliser Spark avec R 4.2 avant le 15 juin 2023.
Voir Modification de l'environnement d'un bloc-notes. Pour plus de détails sur les bibliothèques et les packages des versions R, voir les notes sur l'édition de CRAN.
Nouvel environnement Spark with R 4.2 pour l'exécution de travaux de flux Data Refinery
3 avril 2023
Vous pouvez désormais sélectionner Default Spark 3.3 & R 4.2 lorsque vous sélectionnez un environnement pour un travail de flux Data Refinery . Le nouvel environnement utilise les mêmes unités de capacité-heures (CUH) que les autres environnements par défaut (Default).
L'environnement Default Spark 3.2 & R 3.6 est obsolète et sera abandonné lors d'une mise à jour ultérieure. Modifiez vos travaux de flux Data Refinery pour utiliser le nouvel environnement Default Spark 3.3 & R 3.6 .
Pour plus d'informations sur les environnements pour Data Refinery, voir Options de ressource de calcul pour Data Refinery dans les projets.
La modification de l'environnement affecte deux opérations de l'interface graphique. Si vous disposez de flux Data Refinery existants qui incluent ces opérations d'interface graphique, vous devez mettre à jour le flux Data Refinery .
- Fractionner
- Segmenter
Pour mettre à jour un flux, ouvrez-le, sauvegardez-le. Pour plus de détails, voir Gestion des flux Data Refinery.
Semaine se terminant le 31 mars 2023
Créer des actifs personnalisés à partir d'un catalogue
31 mars 2023
Les administrateurs et les éditeurs peuvent désormais créer des actifs personnalisés dans l'interface utilisateur du catalogue. Pour ajouter un nouvel actif personnalisé, sélectionnez Actif personnalisé dans le menu déroulant Ajouter au catalogue . Pour en savoir plus sur les actifs personnalisés, voir Types d'actifs personnalisés, propriétés et relations dans Ajout d'actifs à un catalogue (Watson Knowledge Catalog).
Améliorations de la Data Virtualization
29 mars 2023
La Data Virtualization a été mise à jour pour fournir les capacités suivantes :
- Avec la virtualisation asynchrone, vous pouvez afficher les détails de statut d'un travail de virtualisation à tout moment sur la page Données virtualisées . Si les tables virtualisées sont volumineuses et que le travail prend plus de temps, vous pouvez travailler sur d'autres tâches, telles que la virtualisation d'un plus grand nombre de tables, alors que le travail se termine.
- Avec la publication et les affectations asynchrones sur la page Données virtualisées , vous pouvez travailler sur d'autres tâches pendant que les travaux de publication et d'affectation se terminent.
- Vous pouvez utiliser les travaux du client Web pour collecter des statistiques sur les tables virtualisées. Pour plus d'informations, voir Collecte de statistiques dans le client Web dans la section Data Virtualization.
- Vous pouvez afficher l'historique de publication ou d'affectation d'un objet sur la page Données Virutualized . Cliquez sur une ligne d'objet dans la liste pour afficher son historique de publication et d'affectation dans le panneau de droite de la page Données virutualisées .
Semaine se terminant le 24 mars 2023
L'apprentissage fédéré s'exécute sur des ordinateurs Mac avec des puces M-series
23 mars 2023
Exécutez vos expérimentations d'apprentissage fédéré sur les ordinateurs M1 Mac et M2 Mac dans l'environnement d'exécution le plus récent. Pour connaître la configuration requise, voir Configuration de votre système.
Semaine se terminant le 17 mars 2023
Définition de clés composites dans des ensembles de données de référence (IBM Knowledge Catalog)
17 mars 2023
Vous pouvez désormais spécifier plusieurs colonnes pour créer une clé composite pour vos jeux de données de référence. Sans clé composite, les valeurs de données de référence d'un ensemble sont identifiées par une chaîne unique dans la colonne de code. Une clé composite est une combinaison de la colonne de code et jusqu'à 5 colonnes personnalisées dans un jeu de données de référence. Une clé composite est utilisée pour identifier de manière unique chaque valeur de données de référence. Avec une clé composite, les valeurs de la colonne de code n'ont plus besoin d'être uniques. L'unicité est garantie uniquement lorsque les valeurs de toutes les colonnes spécifiées sont combinées. Pour plus de détails, voir Conception de jeux de données de référence.
Semaine se terminant le 10 mars 2023
Créer des requêtes, des rapports ou des tableaux de bord basés sur des relations personnalisées (IBM Knowledge Catalog)
9 mars 2023
Lorsque vous créez des relations personnalisées entre des actifs et des artefacts de gouvernance, vous pouvez les synchroniser avec le magasin de données de génération de rapports IBM Knowledge Catalog afin de pouvoir créer des rapports. Par exemple, vous pouvez utiliser les relations personnalisées pour:
- Obtenir des analyses de qualité à différents niveaux de granularité (par domaine, par métadonnées, par utilisateur, par équipe)
- Certifiez la qualité de vos données
- Compter le nombre d'actifs ayant une propriété de confidentialité spécifique
Pour savoir comment créer des relations personnalisées, voir Propriétés et relations personnalisées pour les artefacts de gouvernance et les actifs de catalogue (IBM Knowledge Catalog).
Pour savoir comment créer des rapports, voir Configuration de la génération de rapports pour IBM Knowledge Catalog.
Runtime 22.1 sur Python 3.9 deprecation pour watsonx.ai Studio (anciennement Watson Studio) et watsonx.ai Runtime (anciennement Watson Machine Learning)
9 mars 2023
IBM Runtime 22.1 sur Python 3.9 est désormais obsolète et sera supprimée le 15 juin 2023. A partir du 11 mai 2023, vous ne pouvez plus créer de nouveaux blocs-notes ni créer d'environnements personnalisés à l'aide des environnements d'exécution 22.1 . Vous ne pourrez pas non plus entraîner de nouveaux modèles avec les spécifications logicielles Python 3.9 . Mettez à jour vos actifs et vos déploiements pour utiliser IBM Runtime 22.2 sur Python 3.10 avant le 15 juin 2023:
- Pour plus de détails sur la migration d'un actif vers une spécification de logiciel et d'infrastructure prise en charge, voir Gestion des cadres et des spécifications logicielles.
- Pour plus de détails sur les environnements de bloc-notes, voir Options de ressource de calcul pour l'éditeur de bloc-notes dans les projets.
- Pour plus d'informations sur la modification de vos environnements, voir Modification de l'environnement d'un bloc-notes.
Exécution de règles de qualité de données sur des sources de données supplémentaires (IBM Knowledge Catalog)
9 mars 2023
Vous pouvez désormais exécuter des règles de qualité de données sur des actifs de données à partir de ces sources de données:
- IBM Data Virtualization
- Microsoft Azure Data Lake Storage
- Snowflake
Nouvelle option pour la liaison de variables dans les règles de qualité des données (IBM Knowledge Catalog)
9 mars 2023
Vous pouvez également utiliser des paramètres de travail pour lier des variables de règle à des colonnes de données et gérer ces paramètres de manière centralisée dans un projet. Par conséquent, vous n'avez pas besoin de mettre à jour les règles lorsque, par exemple, vous souhaitez modifier la liaison sur une colonne différente. Voir Création de règles à partir de définitions de qualité de données.
Semaine se terminant le 3 mars 2023
Améliorations pour les AI Factsheetswatsonx.ai Runtime, anciennement Watson Machine Learning)
3 mars 2023
Vous pouvez désormais joindre des fichiers et des images à une feuille d'information. Pour plus de détails, voir Personnalisation des détails d'une fiche technique. Les fiches d'information affichent également des métriques Watson OpenScale supplémentaires provenant de l'explicabilité et des moniteurs personnalisés. Pour plus de détails, voir Affichage des fiches de données.
Créer, stocker et partager des fonctions d'apprentissage automatique (Beta)watsonx.ai Studio anciennement Watson Studo)
2 mars 2023
Vous pouvez maintenant accélérer le développement de modèles d'apprentissage automatique en créant et en partageant des fonctions. Vous ajoutez un groupe de fonctions à un actif de données dans un projet pour identifier les fonctions de cet ensemble de données. Vous pouvez partager les fonctions avec votre organisation en publiant l'actif de données dans un catalogue qui fait office de magasin de fonctions. Voir Gestion des groupes de fonctions.
Semaine se terminant le 24 février 2023
Gérer les relations personnalisées (IBM Knowledge Catalog)
24 février 2023
Vous pouvez désormais gérer les relations personnalisées entre les actifs de catalogue et les artefacts de gouvernance dans la page Présentation d'un actif.
Pour savoir comment créer des relations personnalisées, voir Propriétés et relations personnalisées pour les artefacts de gouvernance et les actifs de catalogue (IBM Knowledge Catalog).
Semaine se terminant le 17 février 2023
Data Refinery L'opération de calcul fonctionne sur les colonnes de date
17 février 2023
Vous pouvez désormais utiliser l'opération Calculer sur les colonnes de type de données Date pour ajouter ou soustraire des valeurs de jour ou de mois.
Pour plus d'informations sur les opérations de l'interface graphique, voir Opérations de l'interface graphique dans Data Refinery.
Nouvelle bibliothèque pour accéder aux actifs du projet dans watsonx.ai Studio (anciennement Watson Studo)
17 février 2023
La bibliothèque " ibm-watson-studio-lib
contient un ensemble de fonctions qui vous aident à interagir avec les projets de watsonx.ai Studio et les actifs des projets. La bibliothèque peut être utilisée dans des blocs-notes créés dans l'éditeur de bloc-notes et est disponible pour Python et R. Il s'agit du successeur de la bibliothèque project_lib
. Pour plus d'informations, voir Utilisation d'ibm-watson-studio-lib.
"Default Spark 3.2 & R 3.6 " environnement abandonné (Data Refinery)
17 février 2023
L'environnement Default Spark 3.2 & R 3.6 ne sera plus disponible à compter du 17 février 2023.
Si des travaux de flux Data Refinery sont configurés avec l'environnement Default Spark 3.2 & R 3.6 ou un environnement personnalisé qui utilise Spark 3.0, les travaux échoueront. Remplacez l'environnement par Default Spark 3.3 & R 3.6 ou Default Data Refinery XS ou un environnement personnalisé qui n'utilise pas Spark 3.0.
Pour plus d'informations sur les environnements pour Data Refinery, voir Options de ressource de calcul pour Data Refinery dans les projets.
Nouvelles fonctions des règles de qualité des données (IBM Knowledge Catalog)
16 février 2023
Ces nouvelles fonctions sont disponibles:
- Utilisez plusieurs définitions de qualité de données dans une même règle de qualité de données. En outre, vous pouvez inclure une définition individuelle plusieurs fois pour appliquer la même définition à des colonnes différentes. Pour plus de détails, voir Création de règles à partir de définitions de qualité de données.
- Télécharger la sortie de règle sous forme de fichier CSV. Si une table de sortie est définie pour la règle, vous pouvez également télécharger la sortie de la règle sous forme de fichier CSV à partir de l'historique d'exécution de la règle, par exemple, pour l'utiliser dans un tableur.
- Exécutez des règles sur les données des sources de données Amazon Redshift et Greenplum . Voir Sources de données prises en charge pour l'importation de métadonnées, l'enrichissement de métadonnées et les règles de qualité de données.
- Exportez et importez des actifs de qualité de données. Lorsque vous exportez des actifs de projet vers le bureau, vous pouvez désormais inclure des actifs de qualité de données. Voir Exportation d'un projet.
Semaine se terminant le 10 février 2023
Importer des actifs d'un projet ou d'un espace dans un espace existantwatsonx.ai Runtime, anciennement Watson Machine Learning)
9 février 2023
Vous pouvez désormais importer un espace de déploiement ou un projet (au format .zip) dans un espace de déploiement existant. Ajoutez des actifs ou mettez à jour des actifs existants dans un espace. Par exemple, vous pouvez remplacer un modèle par une version plus récente. Pour plus de détails, voir Importation d'espaces et de projets dans des espaces existants.
Utiliser d'autres macros dans DataStage
10 février 2023
Vous pouvez ajouter la macro DSJobController aux propriétés d'étape ou aux fonctions du transformateur.
La macro agit en tant que fonction DataStage et génère des données sans avoir besoin d'arguments, ce qui simplifie la configuration des travaux et des flux DataStage .
Pour plus d'informations, voir Macros.
Semaine se terminant le 3 février 2023
Utiliser d'autres macros dans DataStage
6 février 2023
Vous pouvez ajouter les macros suivantes aux propriétés d'étape ou dans les fonctions du transformateur:
- DSProjectId
- DSJobRunId
- DSJobId
Les macros agissent en tant que fonctions DataStage et génèrent des données sans avoir besoin d'arguments, ce qui simplifie la configuration des travaux et des flux DataStage .
Pour plus d'informations, voir Macros.
Semaine se terminant le 20 janvier 2023
Editer les colonnes d'entrée dans les étapes DataStage
20 janvier 2023
Vous pouvez maintenant éditer des colonnes via l'onglet d'entrée d'une étape dans DataStage. Vos modifications sont propagées à l'étape précédente du flux.
Nouvelles options pour l'importation de métadonnées (IBM Knowledge Catalog)
19 janvier 2023
Pour vous assurer que le projet cible ou le catalogue de votre importation de métadonnées ne contient pas de données périmées, vous pouvez maintenant configurer l'importation pour nettoyer les actifs de données qui ne peuvent pas être réimportés. Sélectionnez cette option pour supprimer les actifs qui ne sont plus disponibles dans la source de données et / ou qui ont été supprimés de la portée d'importation lors de la réexécution de l'importation de métadonnées. Voir Importation de métadonnées.
Exportez les données des expérimentations Decision Optimization vers votre projet
18 janvier 2023
Vous pouvez désormais exporter des tables dans votre projet à partir de la vue Préparer les données ou Explorer la solution dans votre expérimentation Decision Optimization . Cela vous permet de réutiliser vos données dans d'autres modèles ou services. Vous pouvez également exporter des données à l'aide du client PythonDecision Optimization.
Voir Exportation des données des expériences d' Decision Optimization.
Semaine se terminant le 13 janvier 2023
Cas d'utilisation de matrice de données mis à jour
12 janvier 2023
Les cas d'utilisation de la matrice de données sont mis à jour pour mieux refléter la façon dont vous utilisez nos produits:
- Intégration des données: ce cas d'utilisation inclut désormais les pipelines.
- Gouvernance des données: ce cas d'utilisation inclut désormais Match 360.
- Gouvernance de l'IA: ce cas d'utilisation se concentre désormais sur la surveillance, la maintenance, l'automatisation et la gouvernance des modèles d'IA en production.
- Data Science and MLOps: ce nouveau scénario d'utilisation explique comment opérationnaliser l'analyse de données et la création de modèles.
Personnalisez le navigateur Web pour prendre en charge votre marque
12 janvier 2023
En tant qu'administrateur, vous pouvez ajouter des noms de produit personnalisés, des logos et d'autres graphiques afin de personnaliser l'image de marque du navigateur Web pour Cloud Pak for Data as a Service.
Voir Personnalisation de l'image de marque du navigateur Web.
Semaine se terminant le 6 janvier 2023
Connexion à d'autres sources de données dans DataStage
6 janvier 2023
Vous pouvez désormais inclure des données provenant de ces sources de données dans vos flux DataStage :
- Dremio
- SingleStoreDB
Pour la liste complète des connecteurs DataStage, voir Connecteurs DataStage.