Go back to the English version of the documentation在Data Virtualization中使用远程连接器访问数据源
在Data Virtualization中使用远程连接器访问数据源
Last updated: 2024年11月26日
在Data Virtualization中使用远程连接器和 "IBM® Cloud"Secure Gateway,访问位于受保护网络中的数据源和文件。
- 访问远程数据源或服务
- 远程连接器提供对无法从 Cloud Pak for Data 集群直接访问的数据源或其他数据服务的访问。 此外,远程连接器还有助于通过远程端口扫描来发现数据源。 有关更多信息,请参阅 发现远程数据源。
- 访问文件中存储的数据
- 您可以在远程文件系统上以 CSV , TSV 和 XLS 等格式访问文件数据。 此外,连接器还提供了远程浏览和数据预览,以方便进行虚拟化配置。
- 提高查询性能
- 远程连接器支持分布式聚集和连接过滤器,并在多个工作程序 pod 上加速查询处理。 连接器还支持更多数据源连接,并在处理期间增强并行性。 随着连接的源数量增加,处理的分布和并行性将有利于提升查询性能。 因此,将连接器移至更靠近数据源的位置可以使处理过程离数据源更近。
建议:
- 请将远程连接器尽可能安置在距离数据源更近的位置。 当它与数据源位于相同机器上时,即可消除数据源与远程连接器之间的网络等待时间。 如果它与数据源位于相同数据中心内,即可在两者之间实现稳定的高速网络连接。 等待时间随远程连接器与数据源之间距离的增加而增加。 在连接器通信路径上仍存在等待时间,但连接器可对数据源生成的数据执行更多操作。
- 调整每个远程连接器上的数据源数量。 每个远程连接器的最大建议数据源数为 10 ,因为为每个连接器定义了内存设置。
- 确保在远程连接器所在的数据源上安装了 IBM Java 8。
如何访问远程数据源上的数据
使用以下工作流程来了解如何访问远程数据源上的数据。
要进行试用,请参阅 通过远程连接器提高数据虚拟化数据源的性能。