Cos' è un prodotto di dati?
Data Product Hub è una soluzione self-service utilizzata dalle aziende orientate ai dati per condividere i prodotti di dati. Su Data Product Hub i produttori di dati possono pubblicare prodotti di dati curati da condividere con i consumatori di dati della loro comunità. I consumatori di dati possono accedere facilmente ai prodotti di dati per le esigenze aziendali.
I produttori di dati utilizzano la soluzione Data Product Hub completa per impacchettare, produrre e condividere i propri asset ricchi di dati. I produttori di dati gestiscono i dati come un prodotto per fornire più valore ai team dell'azienda. Quando un produttore pubblica il proprio prodotto di dati, assegna una breve descrizione, un dominio di business e un utilizzo consigliato per guidare i consumatori che stanno cercando un prodotto di dati. I produttori garantiscono che i prodotti di dati pubblicati siano rappresentati in modo accurato. I produttori garantiscono che gli elementi in un prodotto dati siano accurati e disponibili. I produttori sono inoltre responsabili del mantenimento di tutte le clausole pertinenti nel contratto di dati.
I consumatori di dati utilizzano Data Product Hub per rilevare e accedere ai prodotti di dati per le proprie esigenze aziendali. I consumatori possono leggere le descrizioni del prodotto di dati e decidere se si adattino alle proprie esigenze. I consumatori sono responsabili di leggere e rispettare le clausole pertinenti del contratto di dati. I consumatori di dati accedono rapidamente e facilmente ai dati giusti utilizzando un'interfaccia intuitiva.
I prodotti di dati possono contenere uno o più dati o asset correlati ai dati. Sono curati, confezionati e distribuiti per essere facilmente accessibili e riutilizzabili. A differenza degli asset di dati nei cataloghi di governance, i prodotti di dati sono gestiti come prodotti con gestione del ciclo di vita, ampia distribuzione e molteplici scopi per fornire il massimo valore di business.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività di questa documentazione.
Impacchettato e curato
Un prodotto dati è una raccolta di dati curati o di asset correlati ai dati che vengono impacchettati per il riutilizzo e la distribuzione su Data Product Hub. I prodotti dati possono contenere dati, nonché modelli, dashboard e altri tipi di asset di calcolo. Per fornire flessibilità, è possibile utilizzare diversi metodi per aggiungere elementi a un prodotto dati. Ad esempio, è possibile aggiungere elementi utilizzando le query, da un'origine diretta o da un catalogo connesso.
Gestito come prodotto
I prodotti dati vengono assegnati a un proprietario designato che li gestisce attraverso le fasi di bozza, pubblicazione e ritiro. Simili ad altri prodotti, i prodotti di dati hanno una domanda di mercato, una proposta di valore e termini e condizioni definiti. Il tipico flusso di lavoro per la creazione e la gestione dei prodotti di dati si ripete attraverso la definizione del caso di uso, la preparazione dei dati, la definizione del contratto di dati, il test e la pubblicazione.
Utilizzando Data Product Hub, è possibile applicare i princìpi di gestione del prodotto ai propri prodotti di dati, inclusi:
- Definire il caso di utilizzo per il prodotto dati: definire chiaramente lo scopo e gli obiettivi del prodotto dati, incluso il problema che risolve o il valore che fornisce agli utenti.
- Assegnare un proprietario responsabile: il proprietario gestisce il ciclo di vita di un prodotto dati dall'inizializzazione alla fine del ciclo di vita.
- Limita distribuzione: designare i responsabili dell'approvazione per i prodotti di dati per limitare la distribuzione ai consumatori approvati.
- Prepara i dati: assicurati che gli asset di dati siano di alta qualità, accurati e sicuri. Rimuovere le PII (Personal Identifiable Information). Scegliere un'origine dati e un metodo di consegna appropriati.
- Includi un contratto di dati: il contratto di dati stabilisce la trasparenza descrivendo i Termini e condizioni e gli SLA (Service Level Agreement).
- Test e convalida: eseguire un test completo del prodotto di dati prima della pubblicazione.
- Pubblicare nuove versioni se necessario.
Ottimizzato per la distribuzione su larga scala
I prodotti di dati sono altamente riutilizzabili in qualsiasi numero di consumatori che sono membri della comunità. Possono essere consegnati tramite più metodi di consegna per la massima disponibilità.
Associato a un contratto dati
I prodotti di dati sono associati a un contratto di dati che delinea termini e condizioni di utilizzo. Il contratto dati fornisce una garanzia su entrambe le estremità per i prodotti dati distribuiti tra i team.