0 / 0
Retourner à la version anglaise de la documentation
Nouveautés

Nouveautés

Revenez chaque semaine pour découvrir les nouvelles fonctions et mises à jour de Cloud Pak for Data as a Service et des services tels que Watson Studio, Watson Machine Learning, DataStageet IBM Knowledge Catalog.

Astuce: Parfois, vous devez effectuer une action spécifique après une mise à jour. Pour voir toutes les actions requises, recherchez dans cette page "Action requise".

Semaine se terminant le 10 mai 2024

Nouveaux filtres pour les résultats d'enrichissement

10 mai 2024

Vous pouvez maintenant appliquer des filtres supplémentaires à vos résultats d'enrichissement:

  • Affecté, suggéré ou aucun terme métier
  • Affecté, suggéré ou aucune classe de données

Modifications de nom pour les connexions et les connecteurs DataStage

10 mai 2024

Les connexions et connecteurs DataStage suivants portent de nouveaux noms:

  • "Apache Cassandra (optimisé)" est désormais "Apache Cassandra for DataStage".
  • "IBM Db2 (optimisé") est désormais "IBM Db2 for DataStage".
  • "IBM Netezza Performance Server (optimisé)" est désormais "IBM Netezza Performance Server for DataStage".
  • "Oracle (optimisé)" est désormais "Oracle Database for DataStage".
  • "Salesforce.com (optimisé)" est désormais "Salesforce API for DataStage".
  • "Teradata (optimisé)" est désormais la base de donnéesTeradata pour DataStage".

Vos paramètres précédents pour les connexions, les connecteurs et les travaux associés restent les mêmes. Seuls les noms de connexion et de connecteur ont été modifiés.

Semaine se terminant le 26 avril 2024

Changement de nom pour la connexion IBM Watson Query

26 avril 2024

La connexion "IBM Watson Query" a été renommée en "IBM Data Virtualization". Vos paramètres précédents pour la connexion sont conservés. Seul le nom de la connexion a été modifié.

Changement de nom pour le connecteur DataStage IBM Watson Query

26 avril 2024

Le nom de connecteur DataStage "IBM Watson Query" a été remplacé par "IBM Data Virtualization". Ce changement coïncide avec le changement de nom de connexion. Vos paramètres précédents pour la connexion, le connecteur et les travaux associés restent les mêmes. Seuls le nom de la connexion et du connecteur ont été modifiés.

Semaine se terminant le 19 avril 2024

Vue de liste de projets améliorée dans les catalogues

18 avril 2024

A présent, lorsque vous ajoutez des actifs d'un catalogue à un projet, vous pouvez afficher plus de 100 projets dans votre page de liste de projets et ajouter jusqu'à 50 actifs à la fois à votre projet. Pour plus d'informations, voir Ajout d'actifs à partir du catalogue.

Evaluer les déploiements d'apprentissage automatique dans les espaces

18 avril 2024

Configurez les évaluations watsonx.governance dans vos espaces de déploiement pour obtenir des informations sur les performances de votre modèle d'apprentissage automatique. Par exemple, évaluez un déploiement pour le biais ou surveillez un déploiement pour la dérive. Lorsque vous configurez des évaluations, vous pouvez analyser les résultats d'évaluation et modéliser les enregistrements de transaction directement dans vos espaces.

Pour plus d'informations, voir Evaluation des déploiements dans les espaces.

19 avril 2024

Fiches d'information disponibles à partir des cas d'utilisation de l'IA dans le menu de navigation principal

Les fiches d'information qui suivent les détails du cycle de vie des modèles d'apprentissage automatique sont désormais stockées dans des cas d'utilisation de l'IA plutôt que dans des cas d'utilisation de modèle. Les cas d'utilisation de l'intelligence artificielle et les modèles externes sont affichés dans le menu de navigation principal pour faciliter l'accès.

Cas d'utilisation de l'IA dans le menu de navigation principal

Semaine se terminant le 12 avril 2024

Révision du protocole d'application des règles de protection des données dans Cloud Pak for Data

12 avril 2024

Une version révisée du protocole d'application des règles de protection des données est désormais en place dans Cloud Pak for Data. Lorsque vous vous trouvez dans un catalogue gouverné et que vous cliquez sur Add to project, des informations sur le nouveau protocole d'application des règles de protection des données s'affichent. Vous devez le reconnaître pour continuer.

Cognos Dashboards Le service Embedded est obsolète

11 avril 2024

Vous ne pouvez plus mettre à disposition une instance du service Cognos Dashboards Embedded. Toutefois, tous les tableaux de bord existants que vous avez créés avec le service Cognos Dashboards Embedded continueront de fonctionner jusqu'au 20 juin 2024. Vous pouvez utiliser Cognos Analytics on Cloud On-Demand pour remplacer Cognos Dashboards Embedded. Pour plus d'informations, voir IBM Cognos Analytics -Plans de tarification.

Semaine se terminant le 5 avril 2024

Utiliser des tableaux croisés dynamiques pour afficher les données agrégées dans les expérimentations Decision Optimization

5 avril 2024

Vous pouvez désormais utiliser des tableaux croisés dynamiques pour afficher à la fois les données d'entrée et de sortie agrégées dans la vue Visualisation des expérimentations Decision Optimization . Pour plus d'informations, voir Widgets de visualisation dans les expérimentations Decision Optimization.

Accès à la liste des propriétés d'API de connexion à partir de l'interface utilisateur

5 avril 2024

Auparavant, le seul moyen d'afficher les propriétés de connexion consistait à ouvrir une nouvelle page Web à l'adresse https://dataplatform.cloud.ibm.com/connections/docs. Vous pouvez maintenant accéder aux mêmes informations à partir de Données > Connexions de plateforme. Développez Ressources de connexionet sélectionnez Propriétés de connexion.

Propriétés de connexion

Vous pouvez utiliser ces propriétés pour créer des connexions avec les connexions dans l'API Watson Data. Par exemple, si vous créez une connexion dans un bloc-notes à l'aide d'un programme, vous pouvez utiliser ces informations pour identifier les propriétés dont vous avez besoin.

Semaine se terminant le 22 mars 2024

Créer des vues dynamiques des données connectées

21 mars 2024

Un nouveau type d'actif de données connecté fournit un accès filtré aux données des sources de données qui prennent en charge les requêtes SQL afin que vous puissiez accéder uniquement aux données pertinentes. Dans un projet, fournissez une requête SQL pour créer une vue de colonnes ou de lignes spécifiques à partir d'une ou de plusieurs tables. Vous pouvez utiliser ces actifs de données dans l'enrichissement des métadonnées et l'analyse de la qualité des données comme n'importe quel autre actif de données connecté.

Pour plus d'informations, voir Ajout d'une vue dynamique des données connectées à un projet.

Utilisez les formats de table Delta Lake ou Apache Iceberg dans Amazon S3 et les connecteurs Apache HDFS

22 mars 2024

Les connecteurs Amazon S3 et Apache HDFS incluent désormais des propriétés pour les formats de table Delta Lake et Apache Iceberg. Ces formats de table font partie intégrante des lacs de données, qui fournissent un référentiel centralisé pour la gestion de grands volumes de données. Les lacs de données servent de base à la collecte et à l'analyse de données structurées, semi-structurées et non structurées dans leur format d'origine pour le stockage à long terme et pour générer des connaissances et des prévisions.

La propriété de format de tableau est incluse dans les propriétés d'interaction pour les outils pris en charge. Par exemple, dans le connecteur Propriétés d'étape dans DataStage.

Semaine se terminant le 23 février 2024

Accès aux données à partir de DataStax Enterprise

23 février 2024

Vous pouvez désormais utiliser les données d' DataStax Enterprise.

Semaine se terminant le 16 février 2024

Codes sensibles à la casse dans les jeux de données de référence dans IBM Knowledge Catalog

16 février 2024

Les valeurs de données de référence se composent d'au moins deux colonnes: code et valeur. Pour tous les nouveaux jeux de données de référence, la colonne de code est désormais sensible à la casse. Lorsque vous ajoutez des valeurs à un nouveau jeu de données de référence, le code est sauvegardé exactement comme vous l'avez saisi. Notez que tous les jeux de données de référence qui ont été créés avant l'introduction de cette modification restent insensibles à la casse et que les nouvelles valeurs qui y ont été ajoutées seront sauvegardées en majuscules. Ces jeux de données de référence sont marqués avec une balise insensible à la casse dans l'interface utilisateur. Pour plus de détails, voir Code sensible à la casse.

Amélioration des options de recherche, de filtrage et de tri pour les jeux de données de référence dans IBM Knowledge Catalog

16 février 2024

Lorsque vous affichez une liste de valeurs de données de référence, vous pouvez utiliser les méthodes suivantes pour trouver plus rapidement les valeurs requises:

  • Utilisez une barre de recherche pour entrer une requête pour un code, une valeur ou une valeur de colonne personnalisée.
  • Utilisez l'une des 6 options de filtre avancées.
  • Utilisez la fonction de tri.

Les options de recherche, de filtrage et de tri peuvent être combinées. Pour plus de détails, voir Affichage des jeux de données de référence.

Semaine se terminant le 09 février 2024

Nouvel environnement Spark 3.4 pour l'exécution de travaux de flux Data Refinery

09 fév 2024

Lorsque vous sélectionnez un environnement pour un travail de flux Data Refinery , vous pouvez maintenant sélectionner Default Spark 3.4 & R 4.2, qui inclut des améliorations de Spark.

Environnements Spark Data Refinery

L'environnement Default Spark 3.3 & R 4.2 est obsolète et sera supprimé lors d'une mise à jour ultérieure.

Mettez à jour vos travaux de flux Data Refinery pour utiliser le nouvel environnement Default Spark 3.4 & R 4.2 . Pour plus de détails, voir Options de ressource de calcul pour Data Refinery dans les projets.

Documentation Decision Optimization plus centrée sur les tâches

09 fév 2024

Vous pouvez désormais trouver plus facilement les informations appropriées pour créer et configurer des expérimentations Decision Optimization . Voir ExpériencesDecision Optimization et ses sous-sections.

Fonction de vue de pagination pour la publication d'actifs dans un catalogue

08 fév 2024

Lorsque vous publiez des actifs de projet dans un catalogue, vous pouvez désormais afficher 20 catalogues et actifs sur chaque page avec la vue de pagination. Auparavant, vous pouvez afficher vos actifs dans une liste. Voir Publication d'actifs dans un catalogue.

Les types d'analyse avancée dans l'enrichissement des métadonnées sont disponibles dans la région de Francfort

09 fév 2024

La clé primaire avancée et l'analyse des relations et le profilage avancé sont désormais également disponibles dans la région de Francfort, en plus de la région de Dallas.

La connexion à IBM Cloud Data Engine est obsolète

08 fév 2024

La connexion IBM Cloud Data Engine est obsolète et sera abandonnée dans une édition ultérieure. Pour connaître les dates et les détails importants, voir Dépréciation du moteur de données .

Semaine se terminant le 02 février 2024

Sauvegardez vos recherches d'actifs de catalogue

02 fév 2024

Chaque utilisateur peut désormais enregistrer jusqu'à 25 recherches dans chacun de ses catalogues. L'utilisateur qui sauvegarde une recherche dans un catalogue est le seul utilisateur qui peut afficher, exécuter, éditer et supprimer la recherche. Pour plus d'informations, voir Sauvegarde des recherches d'actifs de catalogue.

La connexion à IBM Cloud Databases for DataStax n'est plus disponible

02 fév 2024

La connexion IBM Cloud Databases for DataStax a été retirée de Cloud Pak for Data as a Service.

La connexion Dremio requiert des mises à jour

02 fév 2024

Auparavant, la connexion Dremio utilisait un pilote JDBC . Maintenant, la connexion utilise un pilote basé sur Arrow Flight.

Important: mettez à jour les propriétés de connexion. Différentes modifications s'appliquent à une connexion pour une instance Dremio Software (sur site) ou une instance Dremio Cloud.

Logiciel Dremio : mettez à jour le numéro de port.

Le nouveau numéro de port par défaut utilisé par Flight est 32010. Vous pouvez confirmer le numéro de port dans le fichier dremio.conf . Pour plus d'informations, voir Configuration via dremio.conf .

De plus, Dremio ne prend plus en charge les connexions avec IBM Cloud Satellite.

Dremio Cloud: mettez à jour la méthode d'authentification et le nom d'hôte.

  1. Connectez-vous à Dremio et générez un jeton d'accès personnel. Pour obtenir des instructions, voir Personal Access Tokens.
  2. Dans Cloud Pak for Data as a Service dans le formulaire Create connection: Dremio , remplacez le type d'authentification par Personal Access Token et ajoutez les informations relatives au jeton. (L'authentification Nom d'utilisateur et mot de passe ne peut plus être utilisée pour se connecter à une instance cloud Dremio .)
  3. Sélectionnez Le port est activé pour SSL.

Si vous utilisez le nom d'hôte par défaut pour une instance Dremio Cloud, vous devez le modifier:

  • Remplacez sql.dremio.cloud par data.dremio.cloud
  • Remplacez sql.eu.dremio.cloud par data.eu.dremio.cloud

Types d'analyse supplémentaires dans l'enrichissement de métadonnées (IBM Knowledge Catalog)

31 janvier 2024

L'enrichissement des métadonnées fournit désormais les options d'analyse supplémentaires suivantes:

  • Analyse de clé primaire pour détecter les clés primaires dans vos données qui identifient de manière unique chaque enregistrement dans un actif de données.

    L'analyse superficielle est automatiquement incluse lorsque vous sélectionnez l'option d'enrichissement Données de profil . L'analyse avancée peut être exécutée sur des actifs sélectionnés à partir des résultats d'enrichissement.

  • Analyse des relations pour identifier les relations entre les actifs de données ou pour trouver des données redondantes et redondantes dans les colonnes.

    L'analyse des relations de clé superficielle est exécutée lorsque vous sélectionnez la nouvelle option d'enrichissement Définir les relations . L'analyse avancée peut être exécutée sur des actifs sélectionnés à partir des résultats d'enrichissement.

  • Profilage avancé pour obtenir des résultats plus précis pour certains indicateurs, tels que la distribution de fréquence et l'unicité des valeurs dans une colonne.

    Le profilage avancé peut être exécuté sur des actifs sélectionnés à partir des résultats d'enrichissement.

L'analyse avancée des clés primaires et des relations et le profilage avancé nécessitent le service DataStage en plus du service IBM Knowledge Catalog et sont disponibles uniquement dans la région de Dallas.

Pour plus d'informations, voir Création d'un actif d'enrichissement de métadonnées, Identification des clés primaires, Identification des relationset Profils de données avancés.

Semaine se terminant le 26 janvier 2024

AutoAI prend en charge les données ordonnées pour toutes les expérimentations

25 janvier 2024

Vous pouvez désormais spécifier des données ordonnées pour toutes les expérimentations AutoAI plutôt que des expérimentations de séries temporelles. Indiquez si vos données d'apprentissage sont classées de manière séquentielle, en fonction d'un index de ligne. Lorsque les données d'entrée sont séquentielles, les performances du modèle sont évaluées sur les enregistrements les plus récents au lieu d'un échantillonnage aléatoire, et les données restantes utilisent les n derniers enregistrements de l'ensemble au lieu de n enregistrements aléatoires. Des données séquentielles sont requises pour les expériences de séries temporelles, mais facultatives pour les expériences de classification et de régression.

Définir sur le thème foncé

25 janvier 2024

Vous pouvez désormais définir votre interface utilisateur Cloud Pak for Data as a Service sur le thème foncé. Cliquez sur votre avatar et sélectionnez Profil et paramètres pour ouvrir votre profil de compte. Ensuite, définissez le bouton de thème foncé sur on. Le thème foncé n'est pas pris en charge dans les blocs-notes RStudio et Jupyter. Pour plus d'informations sur la gestion de votre profil, voir Gestion de vos paramètres.

Semaine se terminant le 19 janvier 2024

Afficher les informations de type natif dans le panneau des détails des colonnes d'actif

19 janvier 2024

Vous pouvez maintenant afficher les types de données standardisés et natifs directement dans le panneau des détails de la colonne. Pour afficher les informations de type natif, cliquez sur le nom d'une colonne d'actif dans la page Présentation d'un actif.

Nouvelle option pour la priorité des actions de règle (IBM Knowledge Catalog)

18 janvier 2024

La priorité des actions de règle vous permet de spécifier comment les règles sont appliquées lorsqu'il existe plusieurs règles avec des actions différentes sur un ensemble de données. Vous pouvez utiliser la nouvelle option Application hiérarchique pour configurer une évaluation à deux couches des règles de protection des données.

  • La première couche évalue les règles pour une action Allow ou Deny sans prendre en compte les actions de masquage. La décision de cette première couche doit être de permettre l'accès à la deuxième couche.
  • La deuxième couche évalue les règles d'une action Transform .

Vous pouvez définir cette option à partir de l'interface utilisateur ou de l' APIaccess_decision_precedence.

Pour plus d'informations, voir Gestion des paramètres de règle.

Stockez les résultats de l'analyse de la qualité des données (IBM Knowledge Catalog)

18 janvier 2024

Vous avez maintenant la possibilité d'écrire la sortie des contrôles de qualité de données prédéfinis qui sont exécutés dans le cadre de l'enrichissement des métadonnées dans une base de données. Par exemple, vous pouvez stocker ces données afin de pouvoir utiliser les tables pour le suivi des problèmes de qualité et en tant qu'entrée pour les processus de résolution. Pour plus d'informations, voir Création d'un enrichissement de métadonnées.

Connectez-vous à une nouvelle source de données dans DataStage: Tableau

18 janvier 2024

Vous pouvez désormais inclure des données provenant d'une source de données Tableau dans vos flux DataStage .

Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.

Semaine se terminant le 12 janvier 2024

Prise en charge d' IBM Runtime 22.2 obsolète dans Watson Machine Learning

11 janvier 2024

IBM Runtime 22.2 est obsolète et sera supprimé le 11 avril 2024. A partir du 7 mars 2024, vous ne pouvez pas créer de blocs-notes ou d'environnements personnalisés à l'aide des environnements d'exécution 22.2 . En outre, vous ne pouvez pas entraîner de nouveaux modèles avec des spécifications logicielles basées sur l'environnement d'exécution 22.2 . Mettez à jour vos actifs et vos déploiements pour utiliser IBM Runtime 23.1 avant le 7 mars 2024.

Semaine se terminant le 15 décembre 2023

Afficher les informations sur la source de données dans le panneau des détails des catalogues

15 décembre 2023

Si vous cliquez sur un actif dans la grille des éléments associés, vous pouvez afficher les informations de la source de données directement dans le panneau des détails de l'actif.

Créer des clés d'API utilisateur pour des travaux et d'autres opérations

15 décembre 2023

Certaines opérations d'exécution dans Cloud Pak for Data as a Service, telles que les travaux et l'entraînement de modèle, nécessitent une clé d'API comme données d'identification pour l'autorisation sécurisée. Avec les clés d'API utilisateur, vous pouvez désormais générer et faire pivoter une clé d'API directement dans Cloud Pak for Data as a Service , si nécessaire, afin de garantir le bon déroulement de vos opérations. Les clés d'API sont gérées dans IBM Cloud, mais vous pouvez facilement les créer et les faire pivoter dans Cloud Pak for Data as a Service.

La clé d'API utilisateur est spécifique au compte et est créée à partir de Profil et paramètres sous votre profil de compte.

Pour plus d'informations, voir Gestion de la clé d'API utilisateur.

Expiration et déconnexion de la nouvelle session de connexion en raison d'une inactivité

15 décembre 2023

Vous êtes maintenant déconnecté d' IBM Cloud en raison de l'expiration de la session. Votre session peut expirer en raison de l'expiration de la session de connexion (24 heures par défaut) ou de l'inactivité (2 heures par défaut). Vous pouvez modifier les durées par défaut dans les paramètres d'accès (IAM) dans IBM Cloud. Pour plus d'informations, voir Définition de l'expiration de la session de connexion.

Accéder à la liste des propriétés d'API de connexion

15 décembre 2023

Vous pouvez maintenant afficher la liste complète des connecteurs avec leurs propriétés individuelles à l'adresse suivante: https://dataplatform.cloud.ibm.com/connections/docs.

Vous pouvez utiliser ces propriétés pour créer des connexions avec les connexions dans l'API Watson Data. Par exemple, si vous créez une connexion dans un bloc-notes à l'aide d'un programme, vous pouvez utiliser ces informations pour identifier les propriétés dont vous avez besoin.

Organiser les actifs de projet dans des dossiers

14 décembre 2023

Vous pouvez maintenant créer des dossiers dans vos projets pour organiser les actifs. Un administrateur du projet doit activer les dossiers, et les administrateurs et les éditeurs peuvent les créer et les gérer. Les dossiers sont en version bêta et ne sont pas encore pris en charge pour une utilisation dans les environnements de production. Pour plus d'informations, voir Organisation des actifs avec des dossiers (bêta).

L'onglet Actifs avec les dossiers

Le connecteur IBM Cloud Databases for DataStax est obsolète

15 décembre 2023

Le connecteur IBM Cloud Databases for DataStax est obsolète et sera abandonné dans une édition ultérieure.

Semaine se terminant le 08 décembre 2023

Nouvelles propriétés client dans les connexions Db2 pour la gestion de charge de travail

08 décembre 2023

Vous pouvez désormais spécifier des propriétés dans les zones suivantes à des fins de surveillance: Nom de l'application, Informations comptables du client, Nom d'hôte du clientet Utilisateur du client. Ces zones sont facultatives et sont disponibles pour les connexions suivantes:

Connectez-vous à une nouvelle source de données dans DataStage: Looker

08 décembre 2023

Vous pouvez désormais inclure des données provenant d'une source de données Looker dans vos flux DataStage . (Vous pouvez utiliser cette connexion uniquement pour les données source.)

Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.

Fonctions nouvelles et améliorées dans Data Virtualization

08 décembre 2023

Les fonctions nouvelles et améliorées suivantes sont disponibles dans Data Virtualization:

Utilisez les règles de protection des données IBM Knowledge Catalog pour filtrer les lignes dans des tables virtualisées

Il se peut que vous ayez une source de données comportant des tables avec des données de clients de l'administration, de l'entreprise et de la distribution combinées. Par exemple, une table de facturation peut contenir des données pour tous les clients, où certaines des lignes sont destinées à des clients gouvernementaux et d'autres à des clients non gouvernementaux. Le type du client n'est pas indiqué dans la table de facturation. Vous pouvez maintenant filtrer la liste des enregistrements client à l'aide de l'une des techniques suivantes.

Vous pouvez utiliser un tableau distinct pour identifier les clients qui sont des clients gouvernementaux. Les ID de cette table peuvent être utilisés pour filtrer les lignes de la table de facturation. Lorsque vous filtrez des lignes, la table masquée ne contient pas les lignes contenant les données des clients du gouvernement.

Vous pouvez utiliser une table d'identificateurs de client bloqués comme table de référence. Toutes les lignes de la table de facturation qui comportent des lignes avec l'identificateur de client inclus dans l'ensemble de clients bloqués sont exclues de l'ensemble de résultats.

La Data Virtualization prend en charge le masquage des colonnes dans les données virtualisées en fonction des règles de protection des données définies dans IBM Knowledge Catalog. Désormais, vous pouvez créer des règles de protection des données pour inclure ou exclure des lignes dans vos données virtualisées afin d'éviter d'exposer des données sensibles.

Pour plus d'informations, voir Gouvernance des données virtuelles avec des règles de protection des données dans Data Virtualization.

Utiliser le masquage de données avancé sur les données virtualisées

Vous pouvez désormais utiliser les options de masquage de données avancées dans Data Virtualization pour éviter d'exposer des données sensibles.

Pour plus d'informations sur le comportement de masquage mis à jour, voir Masquage des données virtuelles dans Data Virtualization.

Amélioration des performances des requêtes et application des règles de protection des données

Data Virtualization stocke et met en cache les règles de protection des données d' IBM Knowledge Catalog dans un cache de point d'application des règles (PEP) afin d'éviter d'évaluer les règles chaque fois qu'un objet est interrogé. Ce cache améliore les performances des requêtes précédemment exécutées en réduisant le nombre d'appels à IBM Knowledge Catalog pour extraire les règles. Toutefois, vous pouvez constater un délai pouvant aller jusqu'à 10 secondes avant que des règles de protection des données nouvellement ajoutées ou mises à jour ne soient appliquées aux requêtes. Vous pouvez utiliser le client Web pour configurer les paramètres de cache PEP, tels que la taille du cache et la durée de vie du cache.

Pour plus d'informations, voir Activation de l'application des règles de protection des données dans Data Virtualization.

Formater et sauvegarder les plans d'accès aux requêtes formatées pour l'optimisation des performances

Vous pouvez désormais formater et sauvegarder des plans d'accès formatés pour optimiser les performances dans Data Virtualization. Lorsque vous exécutez des requêtes SQL dans Data Virtualization, vous pouvez utiliser le client Web pour formater l'affichage des informations EXPLAIN lorsque vous générez des plans d'accès aux requêtes. Vous pouvez ensuite exécuter la commande db2exfmt à partir du client Web pour générer et télécharger facilement la sortie EXPLAIN dans des fichiers texte.

Utilisez des caractères génériques pour filtrer vos sources de données

A présent, lorsque vous créez une table virtualisée, vous pouvez utiliser les caractères génériques suivants pour personnaliser les filtres afin de trouver les sources de données dont vous avez besoin:

  • % (percent): pour représenter zéro ou plusieurs caractères
  • _ (trait de soulignement): pour représenter un caractère unique

Pour plus d'informations, voir Filtrage des données dans Data Virtualization.

Les utilisateurs de Data Virtualization peuvent publier leurs propres objets virtuels

Les utilisateurs ayant le rôle Utilisateur dans Data Virtualization peuvent désormais publier des objets virtuels qu'ils ont créés dans des catalogues gouvernés.

Pour plus d'informations, voir Publication de données virtuelles dans un catalogue avec Data Virtualization.

Gérer les utilisateurs pouvant accéder à des sources de données individuelles et effectuer des opérations sur ces dernières

Avec les restrictions d'accès à la source de données, vous pouvez gérer explicitement l'accès à des connexions de source de données individuelles qui utilisent des droits d'accès partagés. Vous pouvez affecter des utilisateurs et des rôles en tant que collaborateurs pour une connexion de source de données. Seuls ces collaborateurs peuvent accéder à la connexion de source de données. Vous affectez des privilèges spécifiques aux collaborateurs pour gérer les actions qu'ils peuvent effectuer sur les sources de données. Cela vous permet de séparer les privilèges des rôles, de sorte que certains utilisateurs auxquels un rôle tel que Gestionnaire est affecté puissent accéder à des connexions de sources de données différentes et effectuer des actions sur ces connexions.

Pour plus d'informations, voir Restrictions d'accès à la connexion à la source de données dans Data Virtualization.

Données de requête dans les lacs de données S3 génériques et Microsoft Azure Data Lake Storage Gen2

Vous pouvez désormais vous connecter à des sources de données S3 génériques et Microsoft Azure Data Lake Storage Gen2 . Pour plus d'informations, voir Sources de données prises en charge dans Data Virtualization.

Choisissez votre mode de requête pour prioriser les performances ou la cohérence

Vous pouvez désormais choisir entre l'exécution de requêtes en mode Max Pushdown ou en mode Max Consistency.

  • Le mode Max Pushdown ignore la différence sémantique entre Data Virtualization et la source de données pour les requêtes à source unique. Par conséquent, d'autres requêtes à source unique peuvent être entièrement envoyées à la source de données, ce qui améliore les performances des requêtes. Les résultats de requête sont cohérents avec la sémantique de source de données pour les requêtes entièrement insérées dans ce mode. Le mode de transfert de l'exécution sur la base de données n'a pas d'impact sur les requêtes à sources multiples.
  • Le mode de cohérence max suit la sémantique Data Virtualization pour évaluer si les opérations peuvent être envoyées à la source de données. Si l'opération exécutée sur la source de données génère le même résultat que Data Virtualization, l'opération peut être transférée. Les requêtes dans ce mode peuvent être entièrement répercutées si la source de données distante possède la même sémantique que Data Virtualization.

Recherchez et virtualisez rapidement des tables à l'aide de l'onglet Explorer

Vous pouvez maintenant trouver rapidement les tables que vous souhaitez virtualiser. Sur la page Virtualiser, vous pouvez utiliser l'onglet Explorer pour parcourir les bases de données, les schémas et les tables disponibles dans une source de données connectée. L'onglet Liste affiche toutes les tables disponibles dans toutes vos sources de données connectées. Sur la page Sources de données, vous pouvez filtrer vos sources de données pour charger rapidement la liste réduite des tables disponibles dans l'onglet Liste.

Pour plus d'informations, voir Création d'objets virtuels dans Data Virtualization.

Amélioration de la collecte de statistiques pour les tables virtualisées à l'aide de l'échantillonnage de données

L'échantillonnage de données améliore la collecte de statistiques en réduisant les ressources dont vous avez besoin pour collecter des statistiques. Lorsque vous collectez des statistiques en sélectionnant la méthode de collecte de requêtes distantes dans le client Web, un taux d'échantillonnage par défaut de 20% est utilisé. Pour optimiser la collecte de statistiques, sélectionnez Activer l'échantillonnage de table et choisissez un taux d'échantillonnage compris entre 1% et 99%.

Si vous collectez des statistiques à l'aide de DVSYS.COLLECT_STATISTICS , vous pouvez utiliser l'option TABLESAMPLE avec le type de collecte de statistiques de requête distante pour échantillonner des données lorsque vous collectez des statistiques. Pour obtenir des conseils, consultez les remarques sur l'utilisation.

Vous pouvez également utiliser DVSYS.COLLECT_STATISTICS permet de collecter des statistiques pour les tables virtualisées sur des fichiers à plat.

Pour plus d'informations, voir la procédure mémorisée COLLECT_STATISTICS dans Data Virtualization.

Utilisez vos données d'identification de plateforme pour accéder aux connexions Data Virtualization

Lorsque vous utilisez une connexion de plateforme pour accéder à Data Virtualization, vous êtes invité à entrer vos données d'identification. Vous pouvez éventuellement sélectionner Utiliser mes données d'identification de connexion à la plateforme, plutôt que d'entrer vos données d'identification personnelles pour la connexion. La connexion utilise votre jeton Web JSON (JWT) de session en cours.

Améliorations apportées aux sources de données dans le stockage d'objets

  • Vous pouvez désormais créer des connexions et virtualiser des fichiers pour les sources de données S3 génériques dans le stockage d'objets:
  • Vous pouvez désormais créer des tables virtualisées à partir de fichiers CSV ou TSV compressés en externe qui sont stockés dans le stockage d'objets. Pour plus d'informations, voir Création d'une table virtuelle à partir de fichiers dans le stockage d'objets.
  • Vous pouvez désormais virtualiser des fichiers à plat dans le stockage d'objets cloud qui contiennent des en-têtes de colonne.

Pour plus d'informations, voir Création d'une table virtualisée à partir de fichiers dans le stockage d'objets cloud dans Data Virtualization.

Améliorations de la fonction de transfert de l'exécution sur les prédicats et prise en charge de la fonction de transfert de l'exécution sur d'autres sources de données

Le prédicat pushdown est une optimisation qui réduit les temps de requête et l'utilisation de la mémoire. Cette édition inclut les améliorations suivantes apportées à la fonction de transfert de l'exécution sur la base de données des prédicats:

  • Les requêtes qui incluent des clauses COUNT (DISTINCT) ou GROUP BY peuvent désormais être insérées avec des règles de comparaison des blancs de fin pour Teradata, Netezza®, Microsoft SQL Server, Db2® for z/OS®et les sources de données de base de données Db2 .
  • Requêtes qui incluent une opération de comparaison de chaînes telle qu'un prédicat GROUP BY ou WHERE sur des données CHAR ou VARCHAR pour la source de données Teradata afin de gérer la sensibilité à la casse.
  • Les instructions SQL avec des prédicats LIKE sont désormais insérées pour: Db2®, SAP HANA, Oracle, PostgreSQL, Apache Hive, MySQL, Microsoft SQL Server, Snowflake, Netezza® Performance Serveret Teradata.
  • Les instructions SQL comportant des clauses Fetch sont désormais insérées pour les sources de données Db2, Db2 for z/OS, Apache Derby, Oracle, Amazon Redshift, Google BigQueryet Salesforce.com .
  • Les instructions SQL avec un filtre de comparaison de chaînes sont désormais insérées pour les sources de données Db2, Microsoft SQL Server, Teradata, Netezza Performance Serveret Apache Derby .
  • Les instructions SQL avec des fonctions OLAP sont désormais insérées pour les sources de données Db2 et Netezza Performance Server .
  • Les sources de données Greenplum prennent désormais en charge la propagation des prédicats.
  • La source de données MySQL (My SQL Community Edition et My SQL Enterprise Edition) prend désormais en charge la propagation des prédicats.
  • La source de données Cloudera Impala prend désormais en charge la propagation des prédicats.
  • La source de données Data Virtualization Manager for z/OS® prend désormais en charge la propagation des prédicats.

Pour plus d'informations, voir Sources de données prises en charge dans Data Virtualization.

Une connexion Data Virtualization est désormais disponible par défaut dans les connexions de plateforme

Vous pouvez ajouter une connexion Data Virtualization à partir de connexions de plateforme à des catalogues et des projets sans avoir à renseigner manuellement les détails de connexion.

Gérer l'accès pour plusieurs utilisateurs et rôles si vous êtes un responsable

En tant que Data Virtualization Manager, vous pouvez désormais accorder et révoquer l'accès pour plusieurs utilisateurs et rôles en même temps.

Pour plus d'informations, voir Gestion de l'accès aux objets virtuels dans Data Virtualization.

Les gestionnaires Data Virtualization peuvent désormais rendre les objets virtuels visibles par tous les utilisateurs

Les gestionnaires peuvent désormais choisir d'offrir aux utilisateurs une vue plus complète du contenu en rendant les objets virtuels existants visibles à partir de la page Données virtualisées. L'accès aux données dans ces objets continue de respecter les autorisations et les règles de protection des données de Data Virtualization . Pour activer cette fonction, les gestionnaires doivent désactiver le paramètre Restreindre la visibilité des paramètres de service.

Pour plus d'informations, voir Gestion de la visibilité des objets virtuels dans Data Virtualization.

Le rôle d'intendant ne détient plus les droits d'accès à la base de données DATAACCESS

A la place, le rôle d'intendant obtient désormais des droits SELECTIN plus restreints sur tous les schémas définis par l'utilisateur.

Nouvelles API de mise en cache

Les entrées de cache peuvent être gérées via des API REST exposées par le service de mise en cache. Ces API peuvent être appelées par n'importe quelle application. Vous pouvez utiliser de nouvelles API de mise en cache pour effectuer les tâches suivantes:

  • Créer un cache
  • Répertorier un cache spécifique
  • Supprimer un cache
  • Activer un cache
  • Désactiver un cache
  • Actualiser un cache
  • Editer un cache

Les API de mise en cache suivantes sont obsolètes:

  • Répertorier les caches
  • Répertorier un cache
  • Extraire la mémoire cache

Pour plus d'informations, voir Caches dans la documentation de l'API Data Virtualization 2.0.0 .

Nouvelle API de publication

Vous pouvez publier des données virutalized dans des catalogues à l'aide de l'API suivante:

L'API suivante est obsolète:

Semaine se terminant le 1er décembre 2023

Nouveaux plans pour Watson OpenScale dans le cadre de watsonx.governance

1 déc 2023

Watson OpenScale fait désormais partie de watsonx.governance. La mise à disposition de watsonx.governance à partir du catalogue IBM Cloud installe Watson OpenScale. Sur Cloud Pak for Data as a Service, Watson OpenScale continue de fournir des services d'évaluation des modèles d'apprentissage automatique prédictif. Sur watsonx, la mise à disposition de watsonx.governance étend les capacités de gouvernance de Watson OpenScale pour évaluer les actifs de modèle de base ainsi que les actifs d'apprentissage automatique. Vous pouvez définir des cas d'utilisation de l'intelligence artificielle pour résoudre des problèmes métier, puis suivre les données d'actifs dans des fiches d'information pour prendre en charge les objectifs de conformité et de gouvernance. Les plans et fonctions Watsonx.governance ne sont disponibles que dans la région de Dallas. Les plans existants Watson OpenScale sont disponibles dans la région de Francfort.

IBM Watson Knowledge Catalog est désormais IBM Knowledge Catalog

1 déc 2023

IBM Watson Knowledge Catalog est renommé en IBM Knowledge Catalog. Seul le nom a changé, les plans d'offre de services et les fonctions du produit restent les mêmes.

Nouvelles sources de données pour l'importation de métadonnées dans IBM Knowledge Catalog

1 déc 2023

Vous pouvez importer des métadonnées dans IBM Knowledge Catalog à partir des sources de données suivantes:

  • IBM Match 360
  • SingleStoreDB

Pour plus d'informations, voir Sources de données prises en charge pour l'importation de métadonnées, l'enrichissement de métadonnées et les règles de qualité de données.

Semaine se terminant le 17 novembre 2023

Nouvelle propriété personnalisée de type utilisateur et groupe d'utilisateurs

17 novembre 2023

Vous pouvez désormais créer une propriété personnalisée de type utilisateur et groupe d'utilisateurs et lui affecter des utilisateurs ou des groupes d'utilisateurs spécifiques. Pour plus d'informations, voir Création de propriétés personnalisées.

Plusieurs sources à l'une ou l'autre extrémité d'un type de relation personnalisé

17 novembre 2023

Vous pouvez étendre votre ensemble de types de relation personnalisés en utilisant plusieurs types sur les extrémités source et cible. Utilisez de nombreux types d'artefact, d'actif et de colonne pour une définition de relation plus détaillée. Pour plus d'informations, voir Création de relations personnalisées.

Nouveaux droits pour la qualité des données dans IBM Knowledge Catalog

17 novembre 2023

Vous pouvez désormais affecter les droits suivants à vos utilisateurs afin de mieux contrôler la manière dont la qualité des données est établie dans IBM Knowledge Catalog:

  • Gestion des actifs de qualité de données
  • Exécuter des règles de qualité de données
  • Exploration en aval des détails des problèmes

Par défaut, les nouveaux droits sont inclus dans les rôles suivants:

  • Administrateur
  • CloudPak Data Quality Analyst, qui est un nouveau rôle

Mettez à jour les affectations de rôle et les rôles personnalisés dont vous pouvez disposer pour les utilisateurs qui doivent gérer des définitions et des règles de qualité de données et exécuter des règles de qualité de données.

Pour plus d'informations, voir Rôles utilisateur et droits pour IBM Knowledge Catalog et Watson Studio.

Règles de protection des données à l'exportation et à l'importation

17 novembre 2023

Vous pouvez désormais utiliser des API pour exporter et importer des règles de protection des données dans plusieurs instances de Cloud Pak for Data as a Service. Les liens vers les artefacts de glossaire, les catalogues, les actifs et les utilisateurs sont gérés lorsque vous exportez les règles de protection des données.

Pour plus d'informations, voir Migration des règles de protection des données.

Exécuter les flux DataStage en mode d'exécution Extraction, chargement et transformation (ELT) (bêta)

13 novembre 2023

Le processus ELT est différent du processus ETL (extraction, transformation et chargement) traditionnel dans la mesure où il exécute la partie transformation du processus dans la base de données cible, qui peut être plus efficace et plus rentable. Cette fonction est actuellement disponible en version bêta et n'est pas prise en charge pour la production.

Suppression de certains types de relation prédéfinis (13 décembre 2023)

13 novembre 2023

Le 13 décembre 2023, les types de relation prédéfinis pour les relations actif-actif et actif-artefact qui sont rarement utilisées seront supprimés.

Les types de relation suivants seront affectés:

  • Defines - Is defined by sera remplacé par Contains - Is contained in
  • Is owner of - Is owned by sera remplacé par Contains - Is contained in
  • Has for parent entity - Is relationship child of sera remplacé par Is parent of - Is child of
  • Is supertype of - Is subtype of sera remplacé par Is parent of - Is child of

Voici ce que vous devez faire maintenant:

  • Si vous n'utilisez pas ces types de relation, aucune action n'est requise.
  • Si vous utilisez ces types de relation et que vous êtes d'accord avec les types de relation de remplacement, aucune action n'est requise.
  • Si vous utilisez ces types de relation et souhaitez affecter des types de relation différents, supprimez la relation en cours et créez de nouvelles relations à l'aide d'autres types de relation prédéfinis ou personnalisés.

Si vous avez des questions ou des préoccupations concernant le remplacement de ces types de relation, vous pouvez ouvrir un ticket de demande de service.

Semaine se terminant le 10 novembre 2023

Suppression de la clé de ressource du panneau des détails des colonnes

10 novembre 2023

La clé de ressource a été affichée dans le panneau des détails à un niveau de colonne, bien que les informations ne s'appliquent pas aux colonnes. La clé de ressource est désormais supprimée du panneau des détails au niveau de la colonne. Les informations sont toujours requises au niveau de l'actif. Par exemple, la clé de ressource d'actif peut être utilisée dans le fichier CSV de mappage de lignage d'importation.

Déploiement de moteurs d'exécution distants DataStage en local avec DataStage-aaS Anywhere

9 novembre 2023

Vous pouvez désormais déployer des moteurs d'exécution distants DataStage pour exécuter des travaux d'intégration de données sur site ou dans n'importe quel centre de données ou cloud.

Le moteur d'exécution DataStage est une offre conteneurisée qui est déployée dans des environnements locaux pour améliorer les performances et la sécurité. Concevez des pipelines ETL et ELT dans DataStage et exécutez des tâches d'intégration de données localement sur votre moteur. Les administrateurs peuvent lancer un ou plusieurs moteurs d'exécution distants. Pour des raisons de sécurité, le style d'exécution ne peut pas être rétabli dans l'environnement d'exécution sans serveur IBM Cloud une fois que DSaaS Anywhere est activé pour un projet, mais l'environnement d'exécution sans serveur IBM Cloud reste disponible pour d'autres projets.

Pour plus d'informations, voir EnvironnementsDataStage.

Annonce de la prise en charge des infrastructures et des spécifications logicielles Python 3.10 et R4.2 sur l'environnement d'exécution 23.1

9 novembre 2023

Vous pouvez désormais utiliser IBM Runtime 23.1, qui inclut les infrastructures de science des données les plus récentes basées sur Python 3.10 et R 4.2, pour exécuter des blocs-notes et des scripts Watson Studio Jupyter, entraîner des modèles et exécuter des déploiements Watson Machine Learning . Mettez à jour vos actifs et vos déploiements pour utiliser les infrastructures et les spécifications logicielles d' IBM Runtime 23.1 .

Utilisez Apache Spark 3.4 pour exécuter des blocs-notes et des scripts

Spark 3.4 avec Python 3.10 et R 4.2 est désormais pris en charge en tant qu'environnement d'exécution pour les blocs-notes et les scripts RStudio dans les projets. Pour plus de détails sur les environnements de bloc-notes disponibles, voir Options de ressource de calcul pour l'éditeur de bloc-notes dans les projets et Options de ressource de calcul pour RStudio dans les projets.

Semaine se terminant le 27 octobre 2023

Accès aux données à partir de fichiers à plat complexes dans DataStage

27 octobre 2023

Vous pouvez désormais utiliser le connecteur Complex Flat File dans vos flux DataStage .

Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.

Connexion à d'autres sources de données dans DataStage

27 octobre 2023

Vous pouvez désormais inclure des données provenant de ces sources de données dans vos flux DataStage :

  • Apache Derby
  • IBM Cloud Data Engine
  • IBM Cloud Databases for DataStax
  • IBM watsonx.data

Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.

Utilisez un connecteur Satellite pour vous connecter à une base de données sur site

26 octobre 2023

Utilisez le nouveau connecteur Satellite pour vous connecter à une base de données qui n'est pas accessible via Internet (par exemple, derrière un pare-feu). Le connecteur Satellite utilise une communication Dockerlégère qui crée des communications sécurisées et auditables depuis votre environnement sur site vers IBM Cloud. Pour obtenir des instructions, voir Connexion à des données derrière un pare-feu.

Secure Gateway est obsolète

26 octobre 2023

IBM Cloud a annoncé la dépréciation de Secure Gateway. Pour plus d'informations, voir Présentation et calendrier.

Si vous disposez actuellement de connexions configurées avec Secure Gateway, prévoyez d'utiliser une autre méthode de communication. Dans Cloud Pak for Data as a Service, vous pouvez utiliser le connecteur Satellite pour remplacer Secure Gateway. Voir Connexion à des données derrière un pare-feu.

Utiliser le classement NLS dans DataStage

27 octobre 2023

Vous pouvez désormais rassembler des données avec le support de langue nationale dans vos flux DataStage .

Semaine se terminant le 20 octobre 2023

Accédez aux données du lakehouse avec la nouvelle connexion IBM watsonx.data

20 octobre 2023

Vous pouvez utiliser la connexion IBM watsonx.data pour vous connecter à une base de données dans une instance watsonx.data déployée sur Cloud Pak for Data ou IBM Cloud. IBM watsonx.data est un lakehouse de données ouvert, hybride et gouverné qui est optimisé par un moteur de requête pour toutes les charges de travail de données et d'intelligence artificielle.

Pour plus d'informations, voir ConnexionIBM watsonx.data.

Semaine se terminant le 13 octobre 2023

Noms de propriété d'énumération personnalisés traduits dans votre langue préférée (IBM Knowledge Catalog)

13 octobre 2023

Les propriétaires de propriétés personnalisées peuvent désormais autoriser la traduction des noms de propriété de type énumération personnalisés dans la langue de votre choix.

Le propriétaire de la propriété de type énumération personnalisée pour un actif ou une colonne doit définir la définition de la propriété pour que vous puissiez choisir d'afficher les noms de propriété d'énumération personnalisée dans la langue de votre navigateur. Pour plus d'informations, voir Création de propriétés personnalisées.

Solutions intermédiaires dans Decision Optimization

12 octobre 2023

Vous pouvez maintenant choisir d'afficher un échantillon de solutions intermédiaires alors qu'une expérimentation Decision Optimization est en cours d'exécution. Cela peut être utile pour le débogage ou pour voir la progression du solveur. Pour les grands modèles qui prennent plus de temps à résoudre, avec des solutions intermédiaires, vous pouvez maintenant identifier rapidement et facilement les problèmes potentiels avec la résolution, sans avoir à attendre la fin de la résolution. Affichage graphique illustrant les statistiques d'exécution avec des solutions intermédiaires. Vous pouvez configurer le paramètre de distribution de solution intermédiaire dans la configuration d'exécution et sélectionner une fréquence pour ces solutions. Pour plus d'informations, voir Solutions intermédiaires et Paramètres de configuration d'exécution.

Nouvelle boîte de dialogue du modèle enregistré Decision Optimization

Lorsque vous sauvegardez un modèle pour le déploiement à partir de l'interface utilisateur Decision Optimization , vous pouvez désormais examiner le schéma d'entrée et de sortie et sélectionner plus facilement les tables que vous souhaitez inclure. Vous pouvez également ajouter, modifier ou supprimer des paramètres de configuration d'exécution, examiner l'environnement et les fichiers de modèle utilisés. Tous ces éléments sont affichés dans la même boîte de dialogue Sauvegarder en tant que modèle pour le déploiement . Pour plus d'informations, voir Déploiement d'un modèle Decision Optimization à l'aide de l'interface utilisateur.

Dépréciation du profilage des données non structurées (IBM Knowledge Catalog)

10 octobre 2023

A ce jour, les actifs de données qui contiennent des données non structurées ne peuvent plus être profilés.

Afficher les métriques d'exécution pour vos travaux DataStage

9 octobre 2023

Vous pouvez désormais afficher les métriques d'exécution de vos travaux DataStage sur la grille et sur la page des détails d'exécution de travail. Pour plus d'informations, voir Création et gestion de travaux DataStage.

Ajout en bloc de clés et d'attributs à de nouvelles étapes

9 octobre 2023

Vous pouvez désormais ajouter en bloc des clés et des attributs aux étapes suivantes dans vos flux DataStage : tri, fusion, jointure, suppression des doublons, différence, capture de changement, application de changement, combinaison d'enregistrements, entonnoir, comparaison, ensemble de fichiers de recherche, mappe de plage d'écriture et filtre de Bloom.

Semaine se terminant le 6 octobre 2023

Contrôle le placement d'une nouvelle colonne dans l'opération de concaténation (Data Refinery)

6 octobre 2023

Vous disposez maintenant de deux options pour spécifier la position de la nouvelle colonne qui résulte de l'opération Concaténer : en tant que colonne la plus à droite dans le jeu de données ou en regard de la colonne d'origine.

Concaténer la position de la colonne d'opération

Auparavant, la nouvelle colonne était placée au début du jeu de données.

Important :

Editez l'opération Concaténer dans l'un de vos flux Data Refinery existants pour spécifier la nouvelle position de colonne. Sinon, le flux risque d'échouer.

Pour plus d'informations sur les opérations Data Refinery , voir Opérations de l'interface graphique dans Data Refinery.

Semaine se terminant le 29 septembre 2023

Utiliser de nouvelles fonctions dans le générateur d'expressions pour l'étape Modify dans DataStage

25 septembre 2023

Vous pouvez utiliser des fonctions de conversion dans le générateur d'expressions de l'étape Modify de vos flux DataStage .

Semaine se terminant le 22 septembre 2023

Modèles Java Decision Optimization

20 septembre 2023

Les modèles Java Decision Optimization peuvent désormais être déployés dans Watson Machine Learning. En utilisant l'API d'agent Java, vous pouvez créer des modèles d'optimisation avec les API Java OPL, CPLEX et CP Optimizer. Vous pouvez désormais créer facilement vos modèles en local, les conditionner et les déployer sur Watson Machine Learning à l'aide du conteneur boilerplate fourni dans le GitHub d'agent Java GitHub. Pour plus d'informations, voir Déploiement de modèles Java pour Decision Optimization.

Semaine se terminant le 8 septembre 2023

Rappel: le profilage Watson Knowledge Catalog des données non structurées sera abandonné

8 septembre 2023

Le profilage des actifs de données non structurées ne sera plus pris en charge à partir du 10 octobre 2023.

Semaine se terminant le 1er septembre 2023

Obsolescence des commentaires dans les blocs-notes

31 août 2023

A ce jour, il n'est pas possible d'ajouter des commentaires à un bloc-notes à partir de la barre d'actions du bloc-notes. Tous les commentaires existants ont été supprimés.

Icône Commentaires dans la barre d'actions du bloc-notes

Utiliser une nouvelle variable d'environnement dans DataStage

28 août 2023

Vous pouvez maintenant ajouter la variable d'environnement APT_SHOW_METRICS aux paramètres de flux de vos flux DataStage .

Semaine se terminant le 25 août 2023

Recherche rapide de catalogues avec tri des noms et des dates

24 août 2023

Vous pouvez désormais rechercher des catalogues en triant la liste des catalogues sur la page Afficher tous les catalogues par nom ou date de création. Cliquez sur l'en-tête Nom pour trier les catalogues par ordre alphabétique des noms. Cliquez sur l'en-tête Date de création pour trier les catalogues par dates croissantes ou décroissantes.

La qualité des données en un coup d'oeil dans IBM Knowledge Catalog

22 août 2023

Les informations sur la qualité des données ont une nouvelle maison. Pour chaque actif de données d'un catalogue ou d'un projet, une page Qualité de données est remplie avec des informations de qualité provenant de vérifications de qualité de données prédéfinies et de règles de qualité de données. Vous pouvez voir les dimensions de qualité de données applicables et les résultats des contrôles de qualité individuels. Vous pouvez explorer en aval les résultats de chaque vérification ou même les résultats de chaque colonne.

Onglet Qualité de données dans les catalogues et les projets

Pour plus d'informations, voir Qualité des données.

Des informations similaires sont disponibles à partir des résultats de l'enrichissement des métadonnées.

Toutes les analyses de la qualité des données sont désormais exécutées dans le contexte de l'enrichissement des métadonnées ou des règles de qualité des données. Lorsque vous exécutez le profilage à partir de la page Profil d'un projet ou d'un catalogue, la qualité des données n'est plus analysée et aucun score de qualité des données n'est généré.

Améliorations de cache supplémentaires disponibles pour Watson Pipelines

21 août 2023

D'autres options sont disponibles pour personnaliser vos paramètres de flux de pipeline. Vous pouvez désormais exercer un contrôle plus important sur le moment où le cache est utilisé pour les exécutions de pipeline. Pour plus de détails, voir Gestion des paramètres par défaut.

Semaine se terminant le 18 août 2023

Mises à jour des noms de plan pour le service Watson Machine Learning

18 août 2023

A partir de maintenant, les noms de plan sont mis à jour pour le service IBM Watson Machine Learning , comme suit:

  • Le plan v2 Standard est désormais le plan Essentials . Le plan est conçu pour fournir à votre organisation les ressources nécessaires pour commencer à utiliser des modèles de base et des actifs d'apprentissage automatique.

  • Le plan v2 Professional est désormais le plan Standard . Ce plan fournit des ressources conçues pour aider la plupart des organisations via la création d'actifs à une utilisation productive.

Les modifications apportées aux noms de plan ne modifient pas vos conditions de service. Autrement dit, si vous êtes enregistré pour utiliser le plan v2 Standard, il sera désormais nommé Essentials, mais tous les détails du plan resteront les mêmes. De même, si vous êtes enregistré pour utiliser le plan Professionnel v2 , il n'y a pas d'autres changements que le changement de nom du plan en Standard.

Pour plus de détails sur les éléments inclus avec chaque plan, voir PlansWatson Machine Learning. Pour obtenir des informations de tarification, recherchez votre plan sur la page de planWatson Machine Learning dans le catalogue IBM Cloud .

Connexion à d'autres sources de données dans DataStage

18 août 2023

Vous pouvez désormais inclure des données provenant de ces sources de données dans vos flux DataStage :

  • Cloudera Impala
  • Presto

Pour la liste complète des connecteurs DataStage , voir Sources de données prises en charge dans DataStage.

Connexion aux données Google BigQuery avec ODBC (DataStage)

18 août 2023

La connexion ODBC inclut désormais la source de données Google BigQuery .

Pour obtenir la liste complète des sources de données disponibles pour la connexion ODBC dans DataStage, voir ConnexionODBC.

Semaine se terminant le 11 août 2023

Utilisation de nouvelles fonctions dans l'étape DataStage Transformer

8 août 2023

  • Vous pouvez désormais utiliser des fonctions de masquage de données, de chiffrement et d'expression régulière dans l'étape Transformer dans le cadre de vos flux DataStage .
  • Vous pouvez maintenant faire glisser et déposer des colonnes dans l'onglet Sortie de l'étape Transformer.
  • Vous pouvez désormais éditer en bloc des colonnes dans l'étape Transformer à partir de l'onglet Entrée.

Obsolescence des commentaires dans les blocs-notes

7 août 2023

Le 31 août 2023, vous ne pourrez plus ajouter de commentaires à un bloc-notes à partir de la barre d'actions du bloc-notes. Tous les commentaires existants qui ont été ajoutés de cette manière seront supprimés.

Icône Commentaires dans la barre d'actions du bloc-notes

Semaine se terminant le 4 août 2023

Modèle d'analyse de texte personnalisé (SPSS Modeler)

4 août 2023

Pour SPSS Modeler, vous pouvez désormais télécharger un modèle d'analyse de texte personnalisé dans un projet. Vous bénéficiez ainsi d'une plus grande souplesse pour capturer et extraire les concepts clés d'une manière unique à votre contexte.

Semaine se terminant le 28 juillet 2023

Amélioration des capacités d'évaluation des modèles avec Watson OpenScale

25 juillet 2023

Utilisez ces nouvelles fonctions pour surveiller et évaluer les déploiements de modèle et interpréter les résultats.

Configurer les déploiements avec une nouvelle configuration guidée

Un nouvel assistant de configuration est disponible pour vous aider à ajouter des déploiements au tableau de bord Watson OpenScale Insights et à fournir des détails sur le modèle. Pour plus d'informations, voir Ajout de déploiements pour les évaluations.

Configurer une nouvelle évaluation de la dérive pour fournir plus d'informations

Vous pouvez configurer une nouvelle version de l'évaluation de la dérive dans Watson OpenScale pour générer les nouvelles métriques suivantes:

  • Dérive de sortie
  • Dérive des caractéristiques
  • Dérive de la qualité du modèle

Pour plus d'informations, voir Configuration des évaluations v2 de dérive.

Comprendre les performances des modèles à l'aide d'évaluations de la santé des modèles

Watson OpenScale fournit désormais de nouvelles évaluations de santé de modèle par défaut pour vous aider à comprendre l'efficacité avec laquelle votre modèle traite vos transactions. Pour plus d'informations, voir Métriques d'évaluation du moniteur de santé de modèle.

Ajout de modèles de prévision multicible dans Watson OpenScale

Lorsque vous ajoutez vos déploiements dans Watson OpenScale, vous pouvez désormais spécifier plusieurs colonnes de prévision pour fournir des détails sur la sortie de vos modèles afin de configurer des évaluations de qualité. Pour plus d'informations, voir Indication des détails du modèle.

Exécuter des évaluations d'équité avec des données non structurées

Vous pouvez désormais activer les évaluations d'équité sur les types de données non structurées pour identifier le biais. Pour plus d'informations, voir Configuration des évaluations d'équité.

Semaine se terminant le 14 juillet 2023

Gérer les relations de colonne d'actif dans un catalogue

14 juillet 2023

Les administrateurs peuvent désormais créer et gérer des relations de colonne d'actif dans un catalogue. Des relations de colonne peuvent être créées entre des colonnes et des actifs, des colonnes et des artefacts, ou entre des colonnes.

Pour ajouter une relation de colonne, cliquez sur une ligne de colonne dans la page Présentation d'un actif. Dans le panneau latéral, cliquez sur le menu déroulant dynamique Articles liés . Sélectionnez l'un des types de relation dans la liste déroulante pour ajouter une relation.

Pour en savoir plus sur la création de relations, voir Relations d'actifs dans un catalogue.

Dépréciation de la prise en charge du profilage pour les données non structurées dans IBM Knowledge Catalog

12 juillet 2023

Le profilage des actifs de données qui contiennent des données non structurées, telles que des documents Microsoft Word, PDF, HTML et texte en clair, est obsolète. La prise en charge sera arrêtée le 10 octobre 2023. Jusque-là, les actifs de données non structurées des types pris en charge continueront à être profilés automatiquement lorsqu'ils seront ajoutés à un projet ou à un catalogue. A partir du 11 octobre 2023, les actifs de données non structurées nouvellement ajoutés ne seront plus profilés. Les profils existants seront disponibles pendant que les actifs de données respectifs résident dans le projet ou le catalogue.

La connexion Microsoft Azure SQL Database prend en charge l'authentification Azure Active Directory (Azure AD)

14 juillet 2023

Vous pouvez désormais sélectionner Active Directory pour la connexion Microsoft Azure SQL Database . L'authentification Active Directory est une alternative à l'authentification SQL Server . Grâce à cette amélioration, les administrateurs peuvent gérer de manière centralisée les droits utilisateur sur Azure. Pour plus d'informations, voir Connexion àMicrosoft Azure SQL Database.

Semaine se terminant le 7 juillet 2023

Passez à IBM watsonx.ai

7 juillet 2023

Si vous disposez des services Watson Studio et Watson Machine Learning , vous avez désormais accès à IBM watsonx.ai. Vous pouvez passer de Cloud Pak for Data as a Service à watsonx et utiliser des modèles de base dans l'outil Prompt Lab ou dans des blocs-notes.

Voir Passage d'une plateforme à une autre.

Mises à jour des plans Watson Machine Learning

7 juillet 2023

Tous les plans Watson Machine Learning incluent désormais l'inférence de modèle de base. L'inférence de modèle de base est disponible uniquement sur watsonx.ai. Vous pouvez basculer vers watsonx.ai et utiliser le nouvel outil Prompt Lab ou accéder aux modèles de base avec un bloc-notes. Vous utilisez la même instance de service Watson Machine Learning sur watsonx.ai que sur Cloud Pak for Data as a Service.

Si vous disposez du plan Lite Watson Machine Learning , vous pouvez utiliser jusqu'à 25 000 jetons par mois pour l'inférence du modèle de base.

Si vous disposez du plan Watson Machine Learning v2 Standard ou v2 Professional, votre compte sera facturé lorsque les utilisateurs de votre compte effectueront une inférence de modèle de base dans Prompt Lab ou dans des blocs-notes.

Pour plus de détails sur la façon dont l'inférence de modèle de base est suivie et facturée, voir le planWatson Machine Learning. Pour la tarification de l'inférence de modèle de base, recherchez votre plan sur la page de planWatson Machine Learning dans le catalogue IBM Cloud .

Amélioration des fonctions de traitement automatique du langage naturel dans l'environnement d'exécution 23.1

7 juillet 2023

L'environnement d'exécution 23.1 contient la Watson Natural Language Processing 4.1 et un nouvel ensemble de modèles pré-entraînés. La bibliothèque NLP contient les améliorations et mises à jour suivantes:

  • De nombreux modèles inclus sont désormais basés sur des transformateurs. Ces modèles ont été entraînés sur le modèle LLM (Slate Large Language Model), qui a été créé par IBM. Les modèles sont disponibles en deux versions:
    • Optimisé pour les environnements d'UC uniquement
    • Pour les environnements avec des GPU ou des UC
  • De nombreux modèles inclus pour différentes tâches NLP sont désormais basés sur le flux de travaux au lieu de basés sur les blocs, de sorte que vous pouvez appliquer les modèles directement sur le texte d'entrée sans vous soucier des étapes de prétraitement.

NLP inclut un modèle Slate Foundation que vous pouvez utiliser pour affiner vos tâches NLP. Vous pouvez utiliser le modèle Slate ou tout modèle basé sur un transformateur de Hugging Face comme base pour créer vos propres modèles avec Watson NLP.

Tous les modèles fournis par IBM sont désormais exclusivement formés sur des données non biaisées avec un filtrage de pointe pour la haine, les biais et les grossièretés.

Ces fonctions sont actuellement disponibles dans les environnements suivants:

  • NLP Runtime 23.1 sur Python 3.10
  • GPU V100 Runtime 23.1 sur Python 3.10
  • GPU 2xV100 Runtime 23.1 sur Python 3.10

Vous pouvez utiliser ces environnements pour le traitement NLP, mais pas pour le développement de modèle général. Les bibliothèques de sciences des données utilisées dans ces environnements ne sont pas encore prises en charge par Watson Machine Learning.

Pour plus d'informations, voir Watson Natural Language Processing.

Semaine se terminant le 30 juin 2023

Amélioration du contenu Data Privacy dans Knowledge Accelerators (IBM Knowledge Catalog)

28 juin 2023

Knowledge Accelerator for Cross Industry dispose désormais d'un contenu Data Privacy qui inclut un ensemble de termes métier et de classes de données classifiés afin d'accélérer la reconnaissance et la gouvernance des informations personnelles. En outre, des exemples de règles et de politiques de confidentialité des données sont disponibles pour décrire les activités liées au traitement des informations personnelles.

Les termes métier et les classes de données ont des classifications pour guider l'identification des informations personnelles (PI) et des informations personnelles sensibles (SPI). Vous pouvez utiliser l'enrichissement de métadonnées dans IBM Knowledge Catalog pour affecter les termes métier à des actifs de données importés afin d'identifier les actifs qui contiennent des données personnelles.

Voir IBM Knowledge Accelerator for Cross Industry.

Génération de rapports disponibles pour les actifs personnalisés (IBM Knowledge Catalog)

28 juin 2023

Vous pouvez désormais créer des requêtes, des rapports et des tableaux de bord basés sur des propriétés personnalisées pour n'importe quel actif d'un projet ou d'un catalogue. Vous pouvez définir de nouvelles propriétés personnalisées pour les actifs afin d'étendre les types d'actifs fournis ou personnalisés, puis créer des rapports basés sur ces relations. Par exemple, vous pouvez créer un rapport sur vos règles de qualité de données et vos relations d'artefact pour extrapoler la précision de vos données. Pour plus d'informations, voir Configuration de la génération de rapports.

Amélioration de la génération de rapports pour les règles de qualité des données (IBM Knowledge Catalog)

28 juin 2023

Vous pouvez désormais surveiller les règles de qualité de données comme suit:

  • Recevez et gérez des rapports sur les problèmes de qualité de données pour chaque actif de données d'un catalogue ou d'un projet.
  • Surveillez la qualité continue des données pour les actifs de données dans les projets et les catalogues en utilisant la génération de rapports pour les scores de qualité de données et les scores de dimensions de qualité de données. Le score de qualité des données est basé sur une moyenne pondérée à partir des scores de dimension de qualité des données. Les scores des dimensions de qualité des données sont basés sur les résultats des contrôles de qualité des données pertinents.
  • Pour les règles de qualité de données qui incluent plusieurs définitions de règle, consultez les statistiques de contrôle de qualité de données (résultats) par définition de règle dans le schéma de génération de rapports BI.

Pour plus d'informations, voir Modèle de données.

Semaine se terminant le 23 juin 2023

Gouvernance plus efficace des modèles grâce à des améliorations apportées aux AI Factsheets

23 juin 2023

Les AI Factsheets offrent désormais d'autres moyens de suivre les solutions aux problèmes métier, de gouverner un plus large éventail d'actifs, de capturer plus d'informations avec des pièces jointes de fiches d'information et de générer des rapports améliorés.

Suivez les différentes solutions de cas d'utilisation de modèle avec des approches

Lorsque vous suivez des modèles dans un cas d'utilisation, vous pouvez désormais créer une ou plusieurs approches pour suivre différentes méthodes et versions de modèle pour résoudre un problème métier. Par exemple, vous pouvez créer deux approches différentes dans un cas d'utilisation pour comparer la façon dont différents algorithmes affectent les performances du modèle afin de trouver la meilleure solution. Pour plus de détails, voir Gestion des versions de modèle dans un cas d'utilisation.

Options améliorées pour la gouvernance des modèles externes

Vous pouvez désormais utiliser des AI Factsheets pour gouverner une gamme plus large de modèles externes, y compris les modèles développés, déployés et surveillés sur une plateforme autre que Cloud Pak for Data as a Service. En plus des métadonnées plus complètes suivies pour les modèles externes, le client Python et les commandes d'API fournissent davantage de fonctions permettant de déplacer des modèles et des déploiements dans différents environnements afin de suivre plus précisément le cycle de vie de ces actifs. Pour plus de détails, voir Ajout d'un modèle externe à l'inventaire de modèles.

Exercer plus de contrôle sur les pièces jointes

Les administrateurs d'inventaire de modèle peuvent créer des groupes de pièces jointes et des définitions de pièces jointes afin que les utilisateurs puissent afficher les pièces jointes de manière plus organisée et les télécharger dans un format approuvé. Pour plus de détails, voir Ajout et gestion de pièces jointes pour des fiches de données.

Ajout d'une image de marque à vos rapports AI Factsheets

Personnalisez les modèles de rapport que vous utilisez pour créer des rapports à partir de feuilles de calcul en ajoutant des informations de marque et un logo. Pour plus d'informations, voir Génération de rapports pour des fiches de renseignements et des cas d'utilisation de modèle. Pour plus de détails, voir Génération de rapports pour des fiches de données et des scénarios d'utilisation de modèle.

Annonce de la prise en charge de l'environnement d'exécution Python 3.10 Spark 3.3 pour les blocs-notes (Watson Studio)

23 juin 2023

Python 3.10 Spark 3.3 est désormais pris en charge en tant qu'environnement d'exécution pour les blocs-notes. Python 3.9 Spark 3.3 est obsolète et sera abandonné le 20 juillet 2023. A partir du 6 juillet 2023, vous ne pourrez plus créer de blocs-notes avec un environnement Python 3.9 Spark 3.3 , mais les blocs-notes existants continueront de s'exécuter jusqu'au 30 juillet 2023. Modifiez votre environnement de bloc-notes pour utiliser Python 3.10 Spark 3.3 avant de supprimer l'environnement obsolète. Pour plus de détails sur les environnements de bloc-notes, voir Options de ressource de calcul pour l'éditeur de bloc-notes dans les projets.

Semaine se terminant le 16 juin 2023

Prochainement: Disponibilité générale de la prévision des anomalies de séries temporelles dans les expérimentations AutoAI

15 juin 2023

Créez une expérimentation de prévision d'anomalie de série temporelle pour entraîner un modèle qui peut détecter des anomalies, ou des résultats inattendus, lorsque le modèle prévoit des résultats en fonction de nouvelles données. Cette fonction d' AutoAI est actuellement disponible en version bêta et n'est pas prise en charge pour la production. Une fois que la fonction est généralement disponible et entièrement prise en charge, la formation pour les expérimentations de prévision des anomalies de séries temporelles consommera des heures d'unité de capacité (CUH) dans le cadre de votre plan Watson Machine Learning . Pour plus de détails, voir:

Personnalisation des paramètres de moteur pour les expérimentations Decision Optimization (Watson Studio)

15 juin 2023

Vous pouvez maintenant ajouter un fichier de paramètres de moteur dans votre expérimentation Decision Optimization . Avec ce fichier, vous pouvez afficher et personnaliser les paramètres de moteur utilisés pour résoudre votre modèle dans un nouvel éditeur visuel. Vous pouvez également importer un fichier de paramètres de moteur et rechercher des paramètres existants.

Le fichier .ops des paramètres du moteur s'affiche ouvert dans la vue de l'éditeur visuel avec un paramètre personnalisé

Voir Paramètres du moteur de modèlePython.

Semaine se terminant le 2 juin 2023

Gestion des événements de cycle de vie de l'intelligence artificielle à l'aide de l'outil cpdctl

2 juin 2023

Vous pouvez désormais gérer et automatiser vos actifs hébergés sur Cloud Pak for Data as a Service à l'aide de l'outil d'interface de ligne de commande Cloud Pak for Data (cpdctl). Utilisez la configuration automatique à partir d' IBM Cloud pour vous connecter facilement avec les commandes d'API cpdctl. Pour plus de détails et un exemple, consultez les ressources suivantes:

Semaine se terminant le 19 mai 2023

Rappel: Fin de la prise en charge de Runtime 22.1 sur Python 3.9 et R 3.6

15 mai 2023

Les environnements IBM Runtime 22.1 sur Python 3.9 et R 3.6 seront supprimés le 15 juin 2023. Vous ne pouvez plus créer de nouveaux blocs-notes ni créer d'environnements personnalisés à l'aide des environnements d'exécution 22.1 ou de R 3.6, ni entraîner de nouveaux modèles avec les spécifications logicielles Python 3.9 . Mettez à jour vos actifs et vos déploiements pour utiliser IBM Runtime 22.2 sur Python 3.10 ou R 4.2 avant le 15 juin 2023.

Introduction à la recherche par clé-valeur pour les utilisateurs avancés

18 mai 2023

A l'aide des paires key:value de la barre de recherche, vous pouvez désormais effectuer des recherches dans les propriétés d'actif et d'artefact, telles que la description, les balises, les propriétés personnalisées, les noms de colonne, etc. Voir Recherche de propriétés.

Changement de nom pour la connexion IBM Cloud Compose for MySQL

18 mai 2023

La connexion IBM Cloud Compose for MySQL a été renommée en IBM Cloud Databases for MySQL. Vos paramètres précédents pour la connexion sont conservés. Seul le nom de la connexion a été modifié.

Connexions abandonnées

18 mai 2023

Les connexions suivantes sont abandonnées et ont été supprimées de Cloud Pak for Data as a Service:

  • IBM Db2 Event Store
  • IBM Db2 Hosted

Le changement de nom des actifs de données renomme également les fichiers joints dans les projets

19 mai 2023

Lorsque vous modifiez le nom des actifs de données avec des fichiers joints que vous avez téléchargés dans le projet, les fichiers joints sont également renommés. Toutefois, la modification du nom des actifs de données importés à partir de catalogues ne renomme aucune pièce jointe. Vous devez mettre à jour toutes les références à l'actif de données dans les actifs basés sur le code, tels que les blocs-notes, vers le nouveau nom d'actif de données, sinon l'actif basé sur le code ne s'exécutera pas. Voir plus d'informations sur la gestion des actifs dans les projets.

Semaine se terminant le 12 mai 2023

Nouvelles fonctions d'interface utilisateur pour la création d'actifs personnalisés et la gestion des propriétés personnalisées pour les colonnes

11 mai 2023

Les collaborateurs de catalogue dotés du rôle d'administrateur ou d'éditeur peuvent désormais effectuer les tâches suivantes à partir du client Web:

  • Créez des actifs personnalisés à partir du catalogue. Pour ajouter un actif personnalisé, sélectionnez Actif personnalisé dans le menu déroulant Ajouter au catalogue.
  • Gérez les propriétés personnalisées des colonnes d'actif de données. Pour gérer les propriétés personnalisées, sélectionnez une colonne dans la vue d'ensemble d'un actif et éditez les propriétés dans le panneau latéral.

Pour en savoir plus sur les propriétés personnalisées des actifs de données, voir Types d'actif, propriétés et relations personnalisés.

Semaine se terminant le 5 mai 2023

Ajout de code généré à partir du panneau Fragments de code

4 mai 2023

Une nouvelle icône de fragments de code a été ajoutée à la barre d'outils du bloc-notes. En cliquant sur l'icône, vous ouvrez la sous-fenêtre Fragments de code à partir de laquelle vous pouvez lire les données d'un fichier ou d'une connexion qui a été ajouté au projet. La logique de fonction "Insérer dans le code" existante pour générer du code qui charge des données dans une cellule de bloc-notes a été déplacée sous Données de lecture. L'ancien panneau de recherche et de chargement de données ne peut désormais être utilisé que pour télécharger des données dans un projet. Voir Chargement et consultation de données dans un bloc-notes.

Semaine se terminant le 28 avril 2023

Watson Pipelines est désormais disponible en version GA pour l'automatisation des activités de cycle de vie de l'intelligence artificielle

27 avril 2023

Watson Pipelines fournit une interface graphique permettant d'orchestrer un flux d'actifs de bout en bout depuis la création jusqu'au déploiement. Assemblez et configurez un pipeline qui automatise les tâches relatives à la conservation des données, puis à l'entraînement, au déploiement et à la mise à jour des modèles d'apprentissage automatique. Exécuter un travail de pipeline en temps réel ou selon un planning. Pour plus de détails sur la création de pipelines, voir Watson Pipelines.

La nouveauté de cette mise à jour est la possibilité de créer un composant de pipeline personnalisé pour exécuter un script que vous écrivez à l'aide d'une fonction Python . Vous pouvez utiliser des composants personnalisés pour partager des scripts réutilisables entre des pipelines. Vous créez des composants personnalisés en tant qu'actifs de projet, puis vous les utilisez dans des pipelines que vous créez dans ce projet. Pour plus de détails, voir Création d'un composant personnalisé.

Watson Pipelines est proposé en tant que fonction de Watson Studio. Toutefois, vous devez disposer de plans de service pour les actifs et les processus utilisés dans un pipeline. Par exemple, pour exécuter un flux DataStage dans un pipeline, vous devez disposer d'une instance de service Data Stage. Watson Pipelines consomme des ressources en fonction des actifs et des processus utilisés dans le pipeline. Si votre pipeline entraîne un modèle AutoAI , votre compte est facturé pour les unités de capacité Watson Machine Learning par heure (CUH) utilisées pour l'entraînement du modèle. De même, si un pipeline contient un flux DataStage , l'exécution de ce flux dans Watson Pipelines est facturée à votre plan DataStage . L'exécution de composants de pipeline et de scripts bash consomme des ressources Watson Studio CUH. Pour plus de détails sur la mise à disposition des instances de service et des plans, voir Services et intégrations.

Accéder à d'autres données avec la nouvelle connexion Presto

27 avril 2023

Vous pouvez désormais utiliser les données des sources de données Presto . Pour plus d'informations, voir ConnexionPresto.

Semaine se terminant le 21 avril 2023

Exploration en aval des détails des résultats de profilage (IBM Knowledge Catalog)

20 avril 2023

Vous pouvez désormais accéder à des informations de profilage détaillées à partir d'un enrichissement de métadonnées ou à partir de l'onglet Profil d'un actif dans un projet ou un catalogue. Pour chaque colonne, affichez les informations statistiques sur les données de la colonne, les informations sur les classes de données, les types de données et les formats, ainsi que la distribution de fréquence des valeurs dans la colonne. Pour les informations statistiques, vous pouvez également choisir entre plusieurs types de visualisation. Pour remplir ces vues pour un profil existant, mettez à jour le profil.

Informations statistiques pour les données continues

Informations statistiques pour les données nominales

Pour plus de détails, voir Column-level profile details.

Semaine se terminant le 14 avril 2023

Versions par défaut de Python et de CPLEX mises à jour (Decision Optimization)

13 avril 2023

Les utilisateurs par défaut de Python for Decision Optimization sont désormais 3.10 et la version par défaut de CPLEX est 22.1. Ces versions sont utilisées par défaut lorsque vous créez une nouvelle expérimentation. Python 3.9 est obsolète et sera bientôt supprimé. Pour mettre à jour votre environnement, voir Configuration des environnements. Pour mettre à jour des modèles déployés existants, voir Déploiement de modèle.

Améliorations apportées aux règles de qualité des données (IBM Knowledge Catalog)

13 avril 2023

Vous pouvez également exécuter des règles de qualité de données sur des actifs de données à partir de ces sources de données:

  • Amazon S3 (fichiers CSV uniquement)
  • Apache Cassandra
  • SAP ASE

Lorsque vous configurez une règle de qualité de données avec des liaisons gérées en externe, vous pouvez désormais sélectionner du contenu supplémentaire pour les liens de sortie dans le flux DataStage associé. Pour plus d'informations, voir Création de règles à partir de définitions de qualité de données.

Semaine se terminant le 7 avril 2023

Nouveau: Expérimentation de détection des anomalies de séries temporelles (bêta)

7 avril 2023

Utilisez AutoAI pour entraîner un modèle de prévision d'anomalie de série temporelle qui peut détecter des anomalies ou des résultats inattendus lorsque le modèle prévoit des résultats basés sur de nouvelles données. Les pipelines de candidats de modèle générés par l'expérimentation sont classés en fonction de leur performance mesurée par la métrique d'optimisation. Sauvegardez un modèle en tant que bloc-notes pour réviser le code ou sauvegardez et déployez un modèle pour détecter les anomalies potentielles dans les nouvelles données. Pour plus d'informations, voir Création d'un modèle de prévision d'anomalie de série temporelle (bêta). Cette fonction est disponible en version bêta et n'est pas encore prise en charge dans les environnements de production.

Filtrer votre activité d'actif dans un projet

6 avril 2023

Dans la sous-fenêtre Actifs de l'onglet Présentation d'un projet, vous pouvez filtrer les actifs en sélectionnant Par vous ou Par tous dans la liste déroulante. Par vous répertorie les actifs que vous avez édités, classés par plus récent en haut. Par tous répertorie les actifs édités par d'autres personnes, ainsi que par vous-même, classés en fonction des actifs les plus récents en haut.

Mise à niveau vers Spark avec R 4.2 dans Watson Studio

3 avril 2023

Les environnements Spark R 3.6 pour Watson Studio sont mis à niveau vers R 4.2. Tous les environnements Spark R 3.6 sont désormais obsolètes et seront supprimés le 15 juin 2023. A partir du 11 mai 2023, vous ne pouvez plus créer de nouveaux blocs-notes ou de nouveaux flux Data Refinery avec Spark R 3.6. De plus, vous ne pourrez pas créer de nouveaux environnements personnalisés Spark R 3.6 . A ce moment-là, vous devrez peut-être mettre à jour certaines versions de package et des scripts pour vos blocs-notes. Vous devez mettre à jour vos actifs et vos déploiements pour utiliser Spark avec R 4.2 avant le 15 juin 2023.

Voir Modification de l'environnement d'un bloc-notes. Pour plus de détails sur les bibliothèques et les packages des versions R, voir les notes sur l'édition de CRAN.

Nouvel environnement Spark with R 4.2 pour l'exécution de travaux de flux Data Refinery

3 avril 2023

Vous pouvez désormais sélectionner Default Spark 3.3 & R 4.2 lorsque vous sélectionnez un environnement pour un travail de flux Data Refinery . Le nouvel environnement utilise les mêmes unités de capacité-heures (CUH) que les autres environnements par défaut (Default).

Sélection de Spark 3.3 & R 3.6

Important :

L'environnement Default Spark 3.2 & R 3.6 est obsolète et sera abandonné lors d'une mise à jour ultérieure. Modifiez vos travaux de flux Data Refinery pour utiliser le nouvel environnement Default Spark 3.3 & R 3.6 .

Pour plus d'informations sur les environnements pour Data Refinery, voir Options de ressource de calcul pour Data Refinery dans les projets.

La modification de l'environnement affecte deux opérations de l'interface graphique. Si vous disposez de flux Data Refinery existants qui incluent ces opérations d'interface graphique, vous devez mettre à jour le flux Data Refinery .

  • Fractionner
  • Segmenter

Pour mettre à jour un flux, ouvrez-le, sauvegardez-le. Pour plus de détails, voir Gestion des flux Data Refinery.

Semaine se terminant le 31 mars 2023

Créer des actifs personnalisés à partir d'un catalogue

31 mars 2023

Les administrateurs et les éditeurs peuvent désormais créer des actifs personnalisés dans l'interface utilisateur du catalogue. Pour ajouter un nouvel actif personnalisé, sélectionnez Actif personnalisé dans le menu déroulant Ajouter au catalogue . Pour en savoir plus sur les actifs personnalisés, voir Types d'actifs personnalisés, propriétés et relations dans Ajout d'actifs à un catalogue (Watson Knowledge Catalog).

Améliorations et améliorations apportées à la Data Virtualization

29 mars 2023

Data Virtualization a été mis à jour pour fournir les fonctionnalités suivantes:

  • Avec la virtualisation asynchrone, vous pouvez afficher les détails de statut d'un travail de virtualisation à tout moment sur la page Données virtualisées . Si les tables virtualisées sont volumineuses et que le travail prend plus de temps, vous pouvez travailler sur d'autres tâches, telles que la virtualisation d'un plus grand nombre de tables, alors que le travail se termine.
  • Avec la publication et les affectations asynchrones sur la page Données virtualisées , vous pouvez travailler sur d'autres tâches pendant que les travaux de publication et d'affectation se terminent.
  • Vous pouvez utiliser les travaux du client Web pour collecter des statistiques sur les tables virtualisées. Pour plus d'informations, voir Collecte de statistiques dans le client Web dans Data Virtualization.
  • Vous pouvez afficher l'historique de publication ou d'affectation d'un objet sur la page Données Virutualized . Cliquez sur une ligne d'objet dans la liste pour afficher son historique de publication et d'affectation dans le panneau de droite de la page Données virutualisées .

Semaine se terminant le 24 mars 2023

L'apprentissage fédéré s'exécute sur des ordinateurs Mac avec des puces M-series

23 mars 2023

Exécutez vos expérimentations d'apprentissage fédéré sur les ordinateurs M1 Mac et M2 Mac dans l'environnement d'exécution le plus récent. Pour connaître la configuration requise, voir Configuration de votre système.

Semaine se terminant le 17 mars 2023

Définition de clés composites dans des jeux de données de référence (IBM Knowledge Catalog)

17 mars 2023

Vous pouvez désormais spécifier plusieurs colonnes pour créer une clé composite pour vos jeux de données de référence. Sans clé composite, les valeurs de données de référence d'un ensemble sont identifiées par une chaîne unique dans la colonne de code. Une clé composite est une combinaison de la colonne de code et jusqu'à 5 colonnes personnalisées dans un jeu de données de référence. Une clé composite est utilisée pour identifier de manière unique chaque valeur de données de référence. Avec une clé composite, les valeurs de la colonne de code n'ont plus besoin d'être uniques. L'unicité est garantie uniquement lorsque les valeurs de toutes les colonnes spécifiées sont combinées. Pour plus de détails, voir Conception de jeux de données de référence.

Semaine se terminant le 10 mars 2023

Créer des requêtes, des rapports ou des tableaux de bord basés sur des relations personnalisées (IBM Knowledge Catalog)

9 mars 2023

Lorsque vous créez des relations personnalisées entre des actifs et des artefacts de gouvernance, vous pouvez les synchroniser avec le magasin de données de génération de rapports IBM Knowledge Catalog afin de pouvoir créer des rapports. Par exemple, vous pouvez utiliser les relations personnalisées pour:

  • Obtenir des analyses de qualité à différents niveaux de granularité (par domaine, par métadonnées, par utilisateur, par équipe)
  • Certifiez la qualité de vos données
  • Compter le nombre d'actifs ayant une propriété de confidentialité spécifique

Pour savoir comment créer des relations personnalisées, voir Propriétés et relations personnalisées pour les artefacts de gouvernance et les actifs de catalogue (IBM Knowledge Catalog).

Pour savoir comment créer des rapports, voir Configuration de la génération de rapports pour IBM Knowledge Catalog.

Obsolescence de l'environnement d'exécution 22.1 sur Python 3.9 pour Watson Studio et Watson Machine Learning

9 mars 2023

IBM Runtime 22.1 sur Python 3.9 est désormais obsolète et sera supprimée le 15 juin 2023. A partir du 11 mai 2023, vous ne pouvez plus créer de nouveaux blocs-notes ni créer d'environnements personnalisés à l'aide des environnements d'exécution 22.1 . Vous ne pourrez pas non plus entraîner de nouveaux modèles avec les spécifications logicielles Python 3.9 . Mettez à jour vos actifs et vos déploiements pour utiliser IBM Runtime 22.2 sur Python 3.10 avant le 15 juin 2023:

Exécution de règles de qualité de données sur des sources de données supplémentaires (IBM Knowledge Catalog)

9 mars 2023

Vous pouvez désormais exécuter des règles de qualité de données sur des actifs de données à partir de ces sources de données:

  • IBM Data Virtualization
  • Microsoft Azure Data Lake Storage
  • Snowflake

Nouvelle option pour la liaison de variables dans les règles de qualité des données (IBM Knowledge Catalog)

9 mars 2023

Vous pouvez également utiliser des paramètres de travail pour lier des variables de règle à des colonnes de données et gérer ces paramètres de manière centralisée dans un projet. Par conséquent, vous n'avez pas besoin de mettre à jour les règles lorsque, par exemple, vous souhaitez modifier la liaison sur une colonne différente. Voir Création de règles à partir de définitions de qualité de données.

Semaine se terminant le 3 mars 2023

Améliorations apportées à AI Factsheets (Watson Machine Learning)

3 mars 2023

Vous pouvez désormais joindre des fichiers et des images à une feuille d'information. Pour plus de détails, voir Personnalisation des détails d'une fiche technique. Les fiches d'information affichent également des métriques Watson OpenScale supplémentaires provenant de l'explicabilité et des moniteurs personnalisés. Pour plus de détails, voir Affichage des fiches de données.

Créer, stocker et partager des fonctions d'apprentissage automatique (bêta) (Watson Studio)

2 mars 2023

Vous pouvez maintenant accélérer le développement de modèles d'apprentissage automatique en créant et en partageant des fonctions. Vous ajoutez un groupe de fonctions à un actif de données dans un projet pour identifier les fonctions de cet ensemble de données. Vous pouvez partager les fonctions avec votre organisation en publiant l'actif de données dans un catalogue qui fait office de magasin de fonctions. Voir Gestion des groupes de fonctions.

Semaine se terminant le 24 février 2023

Gérer les relations personnalisées (IBM Knowledge Catalog)

24 février 2023

Vous pouvez désormais gérer les relations personnalisées entre les actifs de catalogue et les artefacts de gouvernance dans la page Présentation d'un actif.

Pour savoir comment créer des relations personnalisées, voir Propriétés et relations personnalisées pour les artefacts de gouvernance et les actifs de catalogue (IBM Knowledge Catalog).

Semaine se terminant le 17 février 2023

Data Refinery L'opération de calcul fonctionne sur les colonnes de date

17 février 2023

Vous pouvez désormais utiliser l'opération Calculer sur les colonnes de type de données Date pour ajouter ou soustraire des valeurs de jour ou de mois.

Data Refinery Opération Calculer

Pour plus d'informations sur les opérations de l'interface graphique, voir Opérations de l'interface graphique dans Data Refinery.

Nouvelle bibliothèque permettant d'accéder aux actifs de projet dans Watson Studio

17 février 2023

La bibliothèque ibm-watson-studio-lib contient un ensemble de fonctions qui vous aident à interagir avec des projets et des actifs de projet Watson Studio . La bibliothèque peut être utilisée dans des blocs-notes créés dans l'éditeur de bloc-notes et est disponible pour Python et R. Il s'agit du successeur de la bibliothèque project_lib . Pour plus d'informations, voir Utilisation d'ibm-watson-studio-lib.

"Default Spark 3.2 & R 3.6 " environnement abandonné (Data Refinery)

17 février 2023

L'environnement Default Spark 3.2 & R 3.6 ne sera plus disponible à compter du 17 février 2023.

Si des travaux de flux Data Refinery sont configurés avec l'environnement Default Spark 3.2 & R 3.6 ou un environnement personnalisé qui utilise Spark 3.0, les travaux échoueront. Remplacez l'environnement par Default Spark 3.3 & R 3.6 ou Default Data Refinery XS ou un environnement personnalisé qui n'utilise pas Spark 3.0.

Pour plus d'informations sur les environnements pour Data Refinery, voir Options de ressource de calcul pour Data Refinery dans les projets.

Nouvelles fonctions des règles de qualité des données (IBM Knowledge Catalog)

16 février 2023

Ces nouvelles fonctions sont disponibles:

Semaine se terminant le 10 février 2023

Importer des actifs d'un projet ou d'un espace dans un espace existant (Watson Machine Learning)

9 février 2023

Vous pouvez désormais importer un espace de déploiement ou un projet (au format .zip) dans un espace de déploiement existant. Ajoutez des actifs ou mettez à jour des actifs existants dans un espace. Par exemple, vous pouvez remplacer un modèle par une version plus récente. Pour plus de détails, voir Importation d'espaces et de projets dans des espaces existants.

Utiliser d'autres macros dans DataStage

10 février 2023

Vous pouvez ajouter la macro DSJobController aux propriétés d'étape ou aux fonctions du transformateur.

La macro agit en tant que fonction DataStage et génère des données sans avoir besoin d'arguments, ce qui simplifie la configuration des travaux et des flux DataStage .

Pour plus d'informations, voir Macros.

Semaine se terminant le 3 février 2023

Utiliser d'autres macros dans DataStage

6 février 2023

Vous pouvez ajouter les macros suivantes aux propriétés d'étape ou dans les fonctions du transformateur:

  • DSProjectId
  • ID DSJobRun
  • DSJobId

Les macros agissent en tant que fonctions DataStage et génèrent des données sans avoir besoin d'arguments, ce qui simplifie la configuration des travaux et des flux DataStage .

Pour plus d'informations, voir Macros.

Semaine se terminant le 20 janvier 2023

Editer les colonnes d'entrée dans les étapes DataStage

20 janvier 2023

Vous pouvez maintenant éditer des colonnes via l'onglet d'entrée d'une étape dans DataStage. Vos modifications sont propagées à l'étape précédente du flux.

Nouvelles options pour l'importation de métadonnées (IBM Knowledge Catalog)

19 janvier 2023

Pour vous assurer que le projet cible ou le catalogue de votre importation de métadonnées ne contient pas de données périmées, vous pouvez maintenant configurer l'importation pour nettoyer les actifs de données qui ne peuvent pas être réimportés. Sélectionnez cette option pour supprimer les actifs qui ne sont plus disponibles dans la source de données et / ou qui ont été supprimés de la portée d'importation lors de la réexécution de l'importation de métadonnées. Voir Importation de métadonnées.

Metadata import: nouvelles options avancées

Exportez les données des expérimentations Decision Optimization vers votre projet

18 janvier 2023

Vous pouvez désormais exporter des tables dans votre projet à partir de la vue Préparer les données ou Explorer la solution dans votre expérimentation Decision Optimization . Cela vous permet de réutiliser vos données dans d'autres modèles ou services. Vous pouvez également exporter des données à l'aide du client PythonDecision Optimization.

Voir Exportation de données à partir d'expérimentations Decision Optimization.
Exportation de données vers le projet

Semaine se terminant le 13 janvier 2023

Cas d'utilisation de matrice de données mis à jour

12 janvier 2023

Les cas d'utilisation de la matrice de données sont mis à jour pour mieux refléter la façon dont vous utilisez nos produits:

  • Intégration des données: ce cas d'utilisation inclut désormais les pipelines.
  • Gouvernance des données: ce cas d'utilisation inclut désormais Match 360.
  • Gouvernance de l'IA: ce cas d'utilisation se concentre désormais sur la surveillance, la maintenance, l'automatisation et la gouvernance des modèles d'IA en production.
  • Data Science and MLOps: ce nouveau scénario d'utilisation explique comment opérationnaliser l'analyse de données et la création de modèles.

Voir Cas d'utilisation de matrice de données.

Personnalisez le navigateur Web pour prendre en charge votre marque

12 janvier 2023

En tant qu'administrateur, vous pouvez ajouter des noms de produit personnalisés, des logos et d'autres graphiques afin de personnaliser l'image de marque du navigateur Web pour Cloud Pak for Data as a Service.

Voir Personnalisation de l'image de marque du navigateur Web.

Semaine se terminant le 6 janvier 2023

Connexion à d'autres sources de données dans DataStage

6 janvier 2023

Vous pouvez désormais inclure des données provenant de ces sources de données dans vos flux DataStage :

  • Dremio
  • SingleStoreDB

Pour la liste complète des connecteurs DataStage, voir Connecteurs DataStage.

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus