Creación de datos sintéticos a partir de datos importados

Última actualización: 14 mar 2025
Creación de datos sintéticos a partir de datos importados

Orígenes de datos soportados para Synthetic Data Generator.

Utilizando Synthetic Data Generator, puede conectarse a los datos sin importar dónde residan, utilizando conectores o archivos de datos.

Importante: Si importa un flujo, es posible que algunos nodos no sean compatibles o no funcionen como se espera.

Tamaño de datos

El entorno de Synthetic Data Generator puede importar hasta ~2.5GB de datos.

Conectores

En la tabla siguiente se listan los orígenes de datos a los que se puede conectar utilizando Synthetic Data Generator.

Conector Sólo lectura Lectura y escritura Notas
Amazon RDS for MySQL La opción Sustituir el conjunto de datos no está soportada para esta conexión.
Amazon RDS for PostgreSQL La opción Sustituir el conjunto de datos no está soportada para esta conexión.
Amazon Redshift
Amazon S3
Apache Cassandra
Apache Impala
Apache Derby
Apache HDFS (anteriormente conocido como "Hortonworks HDFS")
Apache Hive
Cuadro
DataStax Enterprise
Dremio
Dropbox
FTP (transferencia de sistema de archivos remoto)
Google BigQuery
Google Cloud Storage
Greenplum
HTTP
IBM Cloud Object-Storage
IBM Cloud Object-Storage (infraestructura)
IBM Cloud Data Engine
IBM Cloud Databases for MongoDB
IBM Cloud Databases for MySQL
IBM Cloud Databases for PostgreSQL
IBM Cloudant
IBM Cognos-Análisis
IBM Data Virtualization Manager for z/OS
IBM Db2
IBM Db2 Big SQL
IBM Db2 for i
IBM Db2 for z/OS
IBM Db2 on Cloud
IBM Db2 Warehouse
IBM Informix
IBM Netezza Performance Server
IBM Planning Analytics (anteriormente conocido como "IBM TM1") Solo se da soporte a la opción Sustituir el conjunto de datos.
IBM Data Virtualization
IBM watsonx.data Presto
Looker
MariaDB
Microsoft Azure Blob Storage
Microsoft Azure Cosmos DB
Microsoft Azure Databricks
Microsoft Azure Data Lake Storage
Microsoft Azure File Storage
Microsoft Azure SQL Database
Microsoft SQL Server La retrotracción de SQL no está soportada cuando Active Directory está habilitado.
Microsoft Azure Synapse Analytics
MongoDB
MySQL
OData
Oracle
PostgreSQL
Salesforce.com
SAP ASE
SAP IQ
SAP OData
SingleStoreDB
Snowflake
Tableau
Teradata

Archivos de datos

Además de utilizar datos de orígenes de datos remotos o bases de datos integradas, puede utilizar datos de archivos. Puede trabajar con datos de los siguientes tipos de archivos utilizando Synthetic Data Generator.

Importante : Si su archivo.csv contiene cualquier carga maliciosa (fórmulas, por ejemplo) en un campo de entrada, estas podrían ejecutarse.
Conector Sólo lectura Lectura y escritura
AVRO
CSV/delimitado
Excel (XLS, XLSX)
JSON
ORC
Parquet
SAS
SAV
SHP
XML