0 / 0
Go back to the English version of the documentation
在Data Virtualization中使用远程连接器访问数据源
Last updated: 2024年11月26日
在Data Virtualization中使用远程连接器访问数据源
Data Virtualization中使用远程连接器和 "IBM® Cloud"Secure Gateway,访问位于受保护网络中的数据源和文件。
访问远程数据源或服务
远程连接器提供对无法从 Cloud Pak for Data 集群直接访问的数据源或其他数据服务的访问。 此外,远程连接器还有助于通过远程端口扫描来发现数据源。 有关更多信息,请参阅 发现远程数据源
访问文件中存储的数据
您可以在远程文件系统上以 CSV , TSV 和 XLS 等格式访问文件数据。 此外,连接器还提供了远程浏览和数据预览,以方便进行虚拟化配置。
提高查询性能
远程连接器支持分布式聚集和连接过滤器,并在多个工作程序 pod 上加速查询处理。 连接器还支持更多数据源连接,并在处理期间增强并行性。 随着连接的源数量增加,处理的分布和并行性将有利于提升查询性能。 因此,将连接器移至更靠近数据源的位置可以使处理过程离数据源更近。
建议:
  • 请将远程连接器尽可能安置在距离数据源更近的位置。 当它与数据源位于相同机器上时,即可消除数据源与远程连接器之间的网络等待时间。 如果它与数据源位于相同数据中心内,即可在两者之间实现稳定的高速网络连接。 等待时间随远程连接器与数据源之间距离的增加而增加。 在连接器通信路径上仍存在等待时间,但连接器可对数据源生成的数据执行更多操作。
  • 调整每个远程连接器上的数据源数量。 每个远程连接器的最大建议数据源数为 10 ,因为为每个连接器定义了内存设置。
  • 确保在远程连接器所在的数据源上安装了 IBM Java 8。

如何访问远程数据源上的数据

使用以下工作流程来了解如何访问远程数据源上的数据。

将Data Virtualization连接到远程数据源的流程概述。

要进行试用,请参阅 通过远程连接器提高数据虚拟化数据源的性能

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more