Spark SQLへの接続
Spark SQL SQL、データフレーム、データセットを使用して構造化データと連携するためのプログラミングインターフェースを提供します。 Spark SQL 最適化されたパフォーマンスを実現するバッチ処理とストリーミング処理をサポートしています。
Spark SQL コネクタに接続するには、 Data Virtualization で特定の情報が必要です。 詳細については、 オブジェクトストレージ内のデータソース Data Virtualization をご覧ください。
始める前に
- ホスト名
- ポート番号
- ターゲット・データベース
- ユーザー名とパスワード
手順
Data Virtualization の Spark SQL に接続するには、以下の手順に従ってください。
ナビゲーションメニューで、 データ ソースページが表示されます。
データ ソースの一覧を表示するには、
をクリックします。Spark SQL データソース接続を選択します。
接続名と説明を入力します。
接続先のホスト名、ポート番号、ターゲットデータベース、および認証情報(ユーザー名とパスワード)を入力します。
- Spark SQL 接続を設定するための認証方法として、2つのオプションがあります
ユーザ名とパスワードの認証情報を使用して認証します。
Kerberos をサービスプリンシパル名(SPN)、ユーザープリンシパル、およびkeytabを使用して認証します。
注:Kerberos 認証方式を使用するには、事前に Kerberos 認証を Data Virtualization で設定しておく必要があります。 詳細は Kerberos クラウド上の認証 Data Virtualization をご覧ください。
接続にカスタム SSL 証明書が必要な場合は、 SSL 証明書フィールドに証明書を入力します。
作成 をクリックして、データ・ソース環境への接続を追加します。