Para acceder a sus datos en IBM watsonx.data, cree un recurso de conexión para ello. El activo de conexión incluye información para conectarse a una instancia watsonx.data y al motor de consulta Presto que se ejecuta en esa instancia.
IBM watsonx.data es un conjunto de datos abierto, híbrido y gobernado optimizado por un motor de consulta para todas las cargas de trabajo de datos e IA.
Antes de empezar
Diferencias entre las conexiones watsonx.data Presto y las conexiones Presto
IBM watsonx.data incorpora el motor Presto SQL Query. Tanto la watsonx.data Presto como Presto conexiones pueden crear activos de conexión para interactuar con el Presto SQL Query Engine en IBM watsonx.data.
watsonx.data Presto connection
La conexión ' watsonx.data ' Presto ' admite la lectura desde ' IBM ' watsonx.data utilizando el motor ' Presto ' SQL Query y admite la escritura de tablas en el formato de tabla Iceberg en ' Amazon S3, ' Apache Ozone, ' IBM Ceph y ' IBM Cloud Object Storage buckets en ' IBM ' watsonx.data. La conexión también es necesaria si desea que la integración con IBM Knowledge Catalog aproveche el servicio con watsonx.data.
IBM recomienda utilizar la conexión watsonx.data Presto cuando se conecte desde Cloud Pak for Data a IBM watsonx.data.
Para obtener más información sobre la conexión watsonx.data Presto, consulte el resto del tema.
Presto
La conexión Presto puede crear una conexión de sólo lectura con cualquier motor Presto, incluida la implementación en IBM watsonx.data.
Para obtener más información sobre la conexión Presto, consulte Presto.
Requisito previo
Configure una instancia de watsonx.data.
Puede conectarse a instancias de software o como servicio:
watsonx.data en Cloud Pak for Data: Consulte Instalación de watsonx.data en Cloud Pak for Data.
watsonx.data como servicio en IBM Cloud: Consulte Introducción a watsonx.data en IBM Cloud
watsonx.data independiente: Véase Instalación de watsonx.data autónomo
Cree una conexión con watsonx.data
Los detalles de su conexión varían según el tipo de despliegue elegido. Para crear el activo de conexión, en la sección Detalles de conexión de la página Conectarse a un origen de datos, seleccione el tipo de despliegue:
- IBM watsonx.data Edición para desarrolladores
- IBM watsonx.data en IBM Cloud
- IBM watsonx.data en Red Hat OpenShift
También puede dejar el tipo de despliegue en el valor por defecto, donde verá los detalles de la conexión heredada.
Los datos que debe proporcionar cambiarán en función del tipo de prestación que elija:
IBM watsonx.data Edición para desarrolladores
Puede importar un archivo JSON para rellenar estos campos utilizando Importar valores de conexión. Para obtener el archivo JSON necesario para esta conexión, tendrás que ir a la página de la consola de tu instancia watsonx.data y navegar hasta el campo Connect information y podrás copiar el archivo JSON.
- Nombre de host o dirección IP: Encuentra esta información en la consola en Configuraciones > Información de conexión > Detalles de la instancia.
- Puerto: el número de puerto predeterminado es
443
. Puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia. - ID de instancia: Encuentra este valor en la consola watsonx.data. Hacer clic Detalles de la instancia desde el menú de navegación. También puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia.
IBM watsonx.data en IBM Cloud
Puede importar un archivo JSON para rellenar estos campos utilizando Importar valores de conexión. Para obtener el archivo JSON necesario para esta conexión, tendrás que ir a la página de la consola de tu instancia watsonx.data y navegar hasta el campo Connect information y podrás copiar el archivo JSON.
- Nombre de host o dirección IP: Encuentra esta información en la consola en Configuraciones > Información de conexión > Detalles de la instancia.
- Puerto: el número de puerto predeterminado es
443
. Puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia. - CRN: Nombre del recurso en la nube: Busca este valor en la consola watsonx.data. Hacer clic Detalles de la instancia desde el menú de navegación. También puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia.
IBM watsonx.data en Red Hat OpenShift
Puede importar un archivo JSON para rellenar estos campos utilizando Importar valores de conexión. Para obtener el archivo JSON necesario para esta conexión, tendrás que ir a la página de la consola de tu instancia watsonx.data y navegar hasta el campo Connect information y podrás copiar el archivo JSON.
- Nombre de host o dirección IP: Encuentra esta información en la consola en Configuraciones > Información de conexión > Detalles de la instancia.
- Puerto: el número de puerto predeterminado es
443
. Puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia. - ID de instancia: Encuentra este valor en la consola watsonx.data. Hacer clic Detalles de la instancia desde el menú de navegación. También puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia.
Detalles de la conexión heredada
watsonx.data software
Para crear el activo de conexión, en la sección Detalles de conexión de la página Conectarse a un origen de datos, seleccione Conectarse a watsonx.data en Cloud Pak for Data y proporcione estos detalles:
- Nombre de host o dirección IP: Encuentra esta información en la consola en Configuraciones > Información de conexión > Detalles de la instancia.
- Puerto: el número de puerto predeterminado es
443
. Puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia. - ID de instancia: Encuentra este valor en la consola watsonx.data. Hacer clic Detalles de la instancia desde el menú de navegación. También puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia.
- Nombre de la instancia: Busque el nombre de la instancia en la página de inicio del cliente web Cloud Pak for Data. Haga clic en Servicios > Instancias en el menú de navegación.
watsonx.data como Servicio
Nombre de host o dirección IP: Encuentra esta información en la consola en Configuraciones > Información de conexión > Detalles de la instancia.
Puerto: el número de puerto predeterminado es
443
. Puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia.ID de instancia: Encuentra este valor en la consola watsonx.data. Hacer clic Detalles de la instancia desde el menú de navegación. También puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia.
Nombre de instancia: Encuentre este valor en el watsonx.ai Instancias de servicio página. Hacer clic Administración > Servicios > Instancias de servicio. Por ejemplo,
watsonx.data-aaa
. No utilice el nombre de instancia sugerido que se muestra en el campo.CRN: Nombre del recurso en la nube: Busca este valor en la consola watsonx.data. Hacer clic Detalles de la instancia desde el menú de navegación. También puede encontrar esta información en la consola en Configuraciones > Información de la conexión > Detalles de la instancia.
Credenciales
Sus credenciales varían según el tipo de despliegue elegido:
- IBM watsonx.data Edición para desarrolladores
- IBM watsonx.data en IBM Cloud
- IBM watsonx.data en Red Hat OpenShift
También puede dejar el tipo de despliegue en el valor por defecto, donde verá los detalles de la conexión heredada.
IBM watsonx.data Edición para desarrolladores
- Nombre de usuario y contraseña: El nombre de usuario y la contraseña que se utilizan para iniciar sesión en la consola watsonx.datastandalone.
IBM watsonx.data en IBM Cloud
- clave API: La clave API de la cuenta que tiene acceso a la instancia watsonx.data en IBM Cloud.
La clave API se puede generar en la consola IBM Cloud.
IBM watsonx.data en Red Hat OpenShift
Debe seleccionar un método de autenticación:
- Nombre de usuario y contraseña: El nombre de usuario y la contraseña que se utilizan para acceder a Cloud Pak for Data donde se encuentra la instancia watsonx.data.
- Nombre de usuario y clave API: El nombre de usuario y la clave API que se utilizan para acceder a Cloud Pak for Data donde se encuentra la instancia watsonx.data.
Este método de autenticación se recomienda si Cloud Pak for Data utiliza un servicio de gestión de identidades (IAM), por ejemplo, LDAP o SSO. La clave API se encuentra en el Perfil y configuración del clúster Cloud Pak for Data de destino. Para obtener información sobre las claves API, consulte Generación de claves API para la autenticación.
Detalles de la conexión heredada
watsonx.data software
El nombre de usuario y la contraseña o los nombres de usuario y la clave de API para la instancia watsonx.data. Las mismas credenciales se utilizan también para el motor.
Debe seleccionar el método de autenticación:
- Nombre de usuario y contraseña: El nombre de usuario y la contraseña que se utilizan para acceder a Cloud Pak for Data donde se encuentra la instancia watsonx.data, o el nombre de usuario y la contraseña para watsonx.data independiente.
- Nombre de usuario y clave API: El nombre de usuario y la clave API que se utilizan para acceder a Cloud Pak for Data donde se encuentra la instancia watsonx.data, o el nombre de usuario y la contraseña para watsonx.data independiente. Este método de autenticación se recomienda si Cloud Pak for Data utiliza un servicio de gestión de identidades (IAM), por ejemplo, LDAP o SSO. La clave API se encuentra en el Perfil y configuración del clúster Cloud Pak for Data de destino. Para obtener información sobre las claves API, consulte Generación de claves API para la autenticación.
watsonx.data como Servicio
El nombre de usuario y la contraseña de la instancia watsonx.data. Las mismas credenciales se utilizan también para el motor.
- Nombre de usuario: El nombre de usuario por defecto es
ibmlhapikey_<cloud-account-email-address>
. Por ejemplo,[email protected]
. - Contraseña: La contraseña es la clave API del usuario. Para crear una clave de API, consulte IBM Cloud docs: Creación de una clave de API en la consola.
Certificados
De forma predeterminada, SSL está habilitado está seleccionado. Este valor se recomienda para aumentar la seguridad. Si no utiliza SSL, los datos pueden estar sujetos a vulnerabilidades como la filtración de datos. Aunque la base de datos alojada en watsonx.data también puede tener un certificado SSL, la conexión pasa por el motor.
El certificado SSL debe estar en formato PEM.
La información sobre los certificados SSL varía según el tipo de despliegue elegido:
- IBM watsonx.data Edición para desarrolladores
- IBM watsonx.data en IBM Cloud
- IBM watsonx.data en Red Hat OpenShift
IBM watsonx.data Edición para desarrolladores
El certificado SSL es opcional.
Si SSL está habilitado en una instancia de watsonx.data en Cloud Pak for Data y el certificado es un certificado autofirmado, debe especificar el certificado en el campo Certificado SSL .
Pregunte a su administrador de watsonx.data si SSL está configurado. Puedes encontrar el certificado SSL en la consola watsonx.data en Configuraciones > Información de conexión > Detalles de la instancia.
IBM watsonx.data en IBM Cloud
El certificado SSL es opcional.
IBM watsonx.data en Red Hat OpenShift
El certificado SSL es opcional.
Si SSL está habilitado en una instancia de watsonx.data en Cloud Pak for Data y el certificado es un certificado autofirmado, debe especificar el certificado en el campo Certificado SSL .
Pregunte a su administrador de watsonx.data si SSL está configurado. Puedes encontrar el certificado SSL en la consola watsonx.data en Configuraciones > Información de conexión > Detalles de la instancia.
Detalles de conexión del motor
Introduzca los datos de conexión del motor
Versiones de motor compatibles
Para watsonx.data en Cloud Pak for Data versión 5.0.3 y posteriores:
- Presto (Java)
- Presto (C++)
Para watsonx.data en Cloud Pak for Data versión 5.0.2 y anteriores:
- Presto (Java)
Para watsonx.data como Servicio:
- Presto (Java)
- Presto (C++)
Proporcione estos detalles de conexión del motor. Encuentre esta información en la consola web watsonx.data en Configuraciones > Información de conexión > Detalles de conexión de motores y servicios.
Nombre de host o dirección IP del motor: El nombre de host o la dirección IP es el valor del anfitrión interno campo.
ID del motor: Este valor está en el ID del motor campo.
puerto del motor: El número de puerto es el valor en el anfitrión interno campo después de los dos puntos (
:
). El número de puerto predeterminado es8443
.
Elija el método para crear una conexión basada en el lugar en el que se encuentra en la plataforma
- En un proyecto
- Pulse Activos > Nuevo activo > Conectar a un origen de datos. Consulte Adición de una conexión a un proyecto.
- En un catálogo
- Pulse Añadir al catálogo > Conexión. Consulte Adición de un activo de conexión a un catálogo.
- En el catálogo de activos de la plataforma
- Pulse Nueva conexión. Consulte Adición de conexiones de plataforma.
Paso siguiente: Añadir activos de datos desde la conexión
Dónde puede utilizar esta conexión
Puede utilizar la conexión watsonx.data Presto en los siguientes espacios de trabajo y herramientas:
Proyectos
- Data Refinerywatsonx.ai Studio o IBM Knowledge Catalog)
- DataStage (servicioDataStage ). Consulte Conexión a un origen de datos en DataStage.
- 'Decision Optimization (watsonx.ai Studio y ' watsonx.ai Runtime)
- Metadata import (IBM Knowledge Catalog)
Catálogos
Platform assets catalog
Otros catálogos (IBM Knowledge Catalog)
Escribir datos en watsonx.data
Puede ingerir datos en watsonx.data con DataStage. Debes ingresar uncatalog_name
,schema_name
, ytable_name
propiedades. La propiedad table_name
es obligatoria. Puede pasar el nombre completo, catalog_name.schema_name.table_name
, a la propiedad table_name
.
El conector ' watsonx.data ' Presto crea tablas Iceberg directamente en el almacenamiento definido en ' IBM ' watsonx.data. Actualmente, el conector admite la escritura en los siguientes almacenamientos:
- Amazon S3
- Ozono Apache
- IBM Ceph
- IBM Cloud Object Storage
Consola web de watsonx.data
Más información
- watsonx.data en Cloud Pak for Data
- watsonx.data como servicio en IBM Cloud
- Independiente watsonx.data
Conexiones relacionadas
Tema principal: Conexiones soportadas