connexion à Spark SQL

Dernière mise à jour : 17 mars 2025
Connexion à Spark SQL

Spark SQL fournit une interface de programmation pour travailler avec des données structurées en utilisant SQL, des trames de données et des ensembles de données. Spark SQL prend en charge le traitement par lots et en continu pour des performances optimisées.

Le connecteur Spark SQL nécessite des informations spécifiques pour créer une connexion avec lui dans Data Virtualization. Pour plus d'informations, voir Data sources in object storage dans Data Virtualization.

Avant de commencer

Vous aurez besoin des informations de connexion suivantes pour cette connexion :
  • Nom d'hôte
  • Numéro de port
  • Base de données cible
  • Nom d'utilisateur et mot de passe

Procédure

Pour vous connecter à Spark SQL en Data Virtualization, procédez comme suit.

  1. Dans le menu de navigation, cliquez sur Données > Data virtualization La page Sources de données s’affiche.

  2. Cliquez sur Ajouter une connexion > Nouvelle connexion pour afficher la liste des sources de données.

  3. Sélectionnez la connexion à la source de données Spark SQL.

  4. Entrez le nom et la description de la connexion.

  5. Saisissez le nom d'hôte, le numéro de port, la base de données cible et les informations d'identification (nom d'utilisateur et mot de passe) pour la connexion.

  6. Spark SQL dispose de deux options d'authentification pour établir la connexion :
    • Authentifiez-vous en utilisant votre nom d'utilisateur et votre mot de passe.

    • Authentifiez-vous en utilisant Kerberos avec le nom principal du service (SPN), le principal utilisateur et le keytab.

      Remarque :

      Pour utiliser la méthode d'authentification Kerberos , vous devez configurer au préalable l'authentification Kerberos dans Data Virtualization au préalable. Voir Kerberos authentication on Cloud for Data Virtualization pour plus d'informations.

  7. Si la connexion nécessite un certificat SSL personnalisé, saisissez le certificat dans le champ Certificat SSL.

  8. Cliquez sur Créer pour ajouter la connexion à l'environnement de source de données.

Résultats

Vous pouvez désormais utiliser votre base de données Spark SQL comme source de données dans Data Virtualization.