Translation not up to date
Následující tabulka uvádí zdroje dat, ze kterých můžete importovat metadata, pro která můžete spustit obohacení metadat nebo pravidla kvality dat a do kterých můžete zapsat výstup pravidel kvality dat.
- Nezbytná oprávnění
- Uživatelé musí být autorizováni pro přístup k připojením ke zdrojům dat. Pro import metadat musí mít uživatel, který spouští import, oprávnění SELECT nebo podobné oprávnění k dotyčným databázím.
Pro spuštění obohacení metadat nebo pravidel kvality dat a pro zápis výstupu pravidla musí v projektu existovat odpovídající aktivum připojení. Pokud typy aktiv importované ze specifického připojení neumožňují obohacení nebo spuštění pravidel kvality dat, nelze použít (zkráceno na N/A) se zobrazí ve sloupci Obohacení metadat a v sloupcích souvisejících s pravidly. Pomlčka (-) ve sloupci označuje, že zdroj dat není pro tento účel podporován.
Standardně pravidla kvality dat a základní toky DataStage podporují standardní připojení platformy. Ne všechny konektory podporované v tradičním DataStage a potenciálně použité ve vlastních tocích DataStage jsou podporovány v produktu Watson Knowledge Catalog.
Obecně jsou podporovány následující datové formáty:
- Vše: Tabulky z relačních a nerelačních zdrojů dat
- Metadata import: Jakýkoli formát ze souborových připojení ke zdrojům dat. V případě sešitů aplikace Microsoft Excel je každý list importován jako samostatné datové aktivum. Název datového aktiva se rovná názvu listu aplikace Excel.
- Obohacení metadat: Tabulátor: CSV, TSV, Avro, Parquet, Microsoft Excel (Pro sešity odeslané z lokálního systému souborů je profilován pouze první list v sešitu.)
- Pravidla kvality dat: Tabulková: Avro, CSV, Parquet, ORC
Konektor | Metadata import | Obohacení metadat | Vazby v pravidlech vytvořených z definic kvality dat | Pravidla založená na SQL | Výstupní tabulky |
---|---|---|---|---|---|
Amazon RDS for MySQL | ✓ | ✓ | — | — | — |
Amazon RDS for PostgreSQL | ✓ | ✓ | — | — | — |
Amazon Redshift | ✓ | ✓ | ✓ | ✓ | — |
Amazon S3 | ✓ | ✓ | ✓ 4 | — | — |
Apache Cassandra | ✓ | ✓ | ✓ | ✓ | — |
Apache HDFS | ✓ | ✓ | ✓ | — | — |
Apache Hive | ✓ | ✓ | ✓ | ✓ | ✓ 5 |
Apache Kafka | ✓ | — | — | — | — |
Rámeček | ✓ | ✓ | — | — | — |
Cloudera Impala | ✓ | ✓ | — | — | — |
Generické S3 | ✓ | ✓ | — | — | — |
Google BigQuery | ✓ | ✓ | ✓ | ✓ | — |
Greenplum | ✓ | ✓ | ✓ | ✓ | — |
Konektor | Metadata import | Obohacení metadat | Vazby v pravidlech vytvořených z definic kvality dat | Pravidla založená na SQL | Výstupní tabulky |
IBM Cloud Data Engine | ✓ | ✓ | — | — | — |
IBM Cloud Databases for MongoDB | ✓ | — | — | — | — |
IBM Cloud Databases for MySQL | ✓ | ✓ | — | — | — |
IBM Cloud Databases for PostgreSQL | ✓ | — | — | — | — |
IBM Cloud Object Storage | ✓ | ✓ | — | — | — |
IBM Data Virtualization Manager for z/OS 1 | ✓ | ✓ | — | — | — |
IBM Db2 | ✓ | ✓ | ✓ | ✓ | ✓ |
IBM Db2 Big SQL | ✓ | ✓ | — | — | — |
IBM Db2 for i | ✓ | — | — | — | — |
IBM Db2 for z/OS | ✓ | ✓ | — | — | — |
IBM Db2 on Cloud | ✓ | ✓ | — | — | ✓ |
IBM Db2 Warehouse | ✓ | ✓ | — | — | — |
IBM Informix | ✓ | ✓ | — | — | — |
IBM Netezza Performance Server | ✓ | ✓ | ✓ | ✓ | — |
IBM Watson Query | ✓ | ✓ | ✓ | ✓ | — |
IBM watsonx.data | ✓ | — | — | — | — |
Konektor | Metadata import | Obohacení metadat | Vazby v pravidlech vytvořených z definic kvality dat | Pravidla založená na SQL | Výstupní tabulky |
MariaDB | ✓ | ✓ | — | — | — |
Microsoft Azure Úložiště datového jezera | ✓ | ✓ | ✓ | — | — |
Microsoft Azure SQL Database | ✓ | ✓ | — | — | — |
Microsoft SQL Server | ✓ | ✓ | ✓ | ✓ | ✓ |
MongoDB | ✓ | ✓ | ✓ | ✓ | — |
MySQL | ✓ | ✓ | ✓ | ✓ | — |
Oracle 2 | ✓ | ✓ | ✓ | ✓ | ✓ |
PostgreSQL | ✓ | ✓ | ✓ | ✓ | ✓ |
Presto | ✓ | — | — | — | — |
Salesforce.com | ✓ | ✓ 3 | — | — | — |
SAP ASE | ✓ | ✓ | ✓ | ✓ | — |
SAP IQ | ✓ | — | — | — | — |
| sněhová vločka | ✓ | | ✓ | ✓ | ✓ |-| | Teradata | ✓ | ✓ | ✓ | ✓ |-|
Poznámky:
1 Pomocí produktu Data Virtualization Manager for z/OSpřidáte aktiva zakladačů dat a COBOL ze systémů sálového počítače do katalogů v produktu IBM Cloud Pak for Data. Zakladače jsou soubory, které popisují datovou strukturu programu v jazyce COBOL. Produkt Data Virtualization Manager for z/OS pomáhá vytvářet virtuální tabulky a pohledy z map zakladače COBOL. Tyto virtuální tabulky a pohledy pak můžete použít k importu a katalogizaci dat sálového počítače ze sálových počítačů do produktu IBM Cloud Pak for Data ve formě datových aktiv a aktiv zakladače COBOL.
Následující typy map zakladače COBOL nejsou importovány: ACI, Catalog, Natural
Po dokončení importu můžete přejít do katalogu a přezkoumat importovaná aktiva, včetně map zakladače COBOL, virtuálních tabulek a pohledů. Tato aktiva můžete použít stejným způsobem jako ostatní aktiva v produktu Cloud Pak for Data.
Další informace viz Přidání aktiv zakladače COBOL.
2 Popisy tabulek a sloupců se importují pouze v případě, že je připojení nakonfigurováno s jednou z následujících voleb Zjišťování metadat :
- Žádná synonyma
- Poznámky a synonyma
3 Některé objekty ve schématu SFORCE nejsou podporovány. Viz Salesforce.com.
4 Pouze soubory CSV.
5 Chcete-li vytvořit výstupní tabulky obohacení metadat v produktu Apache Hive ve starší verzi než 3.0.0, musíte použít náhradní řešení popsané v tématu Zápis výstupu obohacení metadat do starší verze produktu Apache Hive než 3.0.0.
Další informace
- Import metadat
- Obohacení datových aktiv
- Vytvoření pravidel z definic kvality dat
- Vytvoření pravidel založených na SQL
Nadřízené téma: Curation