Accès aux sources de données à l'aide de connecteurs distants dans le cadre de la Data Virtualization

Dernière mise à jour : 21 mars 2025
Accès aux sources de données à l'aide de connecteurs distants dans le cadre de la Data Virtualization
Data Virtualization prend en charge l'utilisation de connecteurs distants pour accéder aux fichiers locaux sur des systèmes distants ou pour accéder à des sources de données distantes.
Accéder à la source de données ou aux services distants
Les connecteurs distants permettent d'accéder à des sources de données ou à d'autres services de données qui ne sont pas directement accessibles à partir du cluster Cloud Pak for Data . De plus, les connecteurs distants facilitent la reconnaissance des sources de données avec l'analyse de ports à distance. Pour plus d'informations, voir Découvrir des sources de données éloignées.
Accéder aux données stockées dans les fichiers
Vous pouvez accéder aux données de fichier, dans des formats tels que CSV, TSV et XLS, sur des systèmes de fichiers distants. De plus, les connecteurs fournissent une exploration à distance et un aperçu des données pour faciliter la configuration de la virtualisation.
Améliorer la performance des requêtes
Les connecteurs distants permettent d'effectuer des agrégations réparties et des filtres de jointure et d'accélérer le traitement des requêtes sur plusieurs pods de travail. Les connecteurs permettent également un plus grand nombre de connexions de source de données et améliorent le parallélisme lors du traitement. À mesure que le nombre de sources connectées augmente, la distribution et le parallélisme du traitement favorisent la performance des requêtes. Ainsi, rapprocher le connecteur de la source de données rapproche ce traitement de la source de données.
Recommandations :
  • Localisez le connecteur distant le plus près possible de la source de données. Lorsqu'il se trouve sur la même machine que la source de données, vous éliminez le temps d'attente du réseau entre la source de données et le connecteur distant. S'il est situé dans le même centre de données, vous disposez d'un réseau haute vitesse stable entre eux. Le temps d'attente augmente à mesure que le connecteur distant s'éloigne de la source de données. Des temps d'attente existent toujours le long du chemin de communication du connecteur, mais le connecteur effectue davantage d'opérations sur les données de résultat à partir de la source de données.
  • Ajustez le nombre de sources de données sur chaque connecteur distant. Le nombre maximal recommandé de sources de données par connecteur distant est de 10 en raison des paramètres de mémoire définis pour chaque connecteur.
  • Assurez-vous que Java 21 d' IBM® est installé sur la source de données où le connecteur distant sera situé.

Comment accéder aux données sur les sources de données éloignées

Utilisez le flux suivant pour comprendre comment accéder aux données sur les sources de données éloignées.

Aperçu du processus de connexion de la Data Virtualization à des sources de données distantes.

Pour l'essayer, voir Amélioration des performances de vos sources de données de virtualisation des données avec des connecteurs distants.

En savoir plus