Spark SQLへの接続

最終更新: 2025年3月17日
Spark SQLへの接続

Spark SQL SQL、データフレーム、データセットを使用して構造化データと連携するためのプログラミングインターフェースを提供します。 Spark SQL 最適化されたパフォーマンスを実現するバッチ処理とストリーミング処理をサポートしています。

Spark SQL コネクタに接続するには、 Data Virtualization で特定の情報が必要です。 詳細については、 オブジェクトストレージ内のデータソース Data Virtualization をご覧ください。

始める前に

この接続には、以下の接続情報が必要です
  • ホスト名
  • ポート番号
  • ターゲット・データベース
  • ユーザー名とパスワード

手順

Data VirtualizationSpark SQL に接続するには、以下の手順に従ってください。

  1. ナビゲーションメニューで、 「データ 」> Data virtualizationデータ ソースページが表示されます。

  2. データ ソースの一覧を表示するには、 [接続の追加] > [新しい接続] をクリックします。

  3. Spark SQL データソース接続を選択します。

  4. 接続名と説明を入力します。

  5. 接続先のホスト名、ポート番号、ターゲットデータベース、および認証情報(ユーザー名とパスワード)を入力します。

  6. Spark SQL 接続を設定するための認証方法として、2つのオプションがあります
    • ユーザ名とパスワードの認証情報を使用して認証します。

    • Kerberos をサービスプリンシパル名(SPN)、ユーザープリンシパル、およびkeytabを使用して認証します。

      注:

      Kerberos 認証方式を使用するには、事前に Kerberos 認証を Data Virtualization で設定しておく必要があります。 詳細は Kerberos クラウド上の認証 Data Virtualization をご覧ください。

  7. 接続にカスタム SSL 証明書が必要な場合は、 SSL 証明書フィールドに証明書を入力します。

  8. 作成 をクリックして、データ・ソース環境への接続を追加します。

結果

Spark SQL のデータベースを Data Virtualization のデータソースとして使用できるようになりました。