Dopo aver creato un progetto, il passo successivo consiste nell'aggiungervi gli asset di dati in modo da poter utilizzare i dati. Tutti i collaboratori nel progetto sono automaticamente autorizzati ad accedere ai dati nel progetto.
Diversi tipi di asset possono avere nomi duplicati. Tuttavia, non è possibile aggiungere un tipo di asset con lo stesso nome più volte.
È possibile utilizzare i metodi seguenti per aggiungere asset di dati ai progetti:
Metodo | Quando utilizzare |
---|---|
Aggiungi file locali | Si dispone di dati in file CSV o simili sul sistema locale. |
Aggiungi dataset hub di risorse | Si desidera utilizzare dataset di esempio. |
Aggiungere connessioni al database | È necessario connettersi a un'origine dati remota. |
Aggiungere dati da un collegamento | Sono necessarie una o più tabelle o file da un'origine dati remota. |
Aggiungere una vista dinamica | È necessaria una vista che contenga un sottoinsieme di dati in una o più tabelle in un'origine dati remota. |
Importare metadati da un collegamento | Sono necessarie molte tabelle o file da un'origine dati remota. Si desidera pianificare e rieseguire il processo di importazione. |
Aggiungi asset di cartelle connesse da IBM Cloud Object Storage | È necessaria una cartella in IBM Cloud Object Storage che contenga una serie dinamica di file, ad esempio un feed di notizie. |
Aggiungi risorse catalogo | Sono necessari uno o più asset da un catalogo. |
Converti file nella memoria del progetto in asset | Si desidera convertire i file creati nel progetto in asset di dati. |
Aggiungi file locali
È possibile aggiungere un file dal sistema locale come asset di dati in un progetto.
- Autorizzazioni richieste
È necessario disporre del ruolo Editor o Admin nel progetto.
- Restrizioni
- Il file non può essere vuoto.
- Il nome file non può superare 255 caratteri.
- La dimensione massima per i file che è possibile caricare con l'interfaccia utente è 5 GB. Puoi caricare file più grandi in un progetto con le API.
Per aggiungere file di dati a un progetto:
Dalla pagina Asset del progetto, fare clic sull'icona Carica asset nel progetto . È anche possibile fare clic sulla stessa icona da un notebook o da un canvas.
Nel riquadro che si apre, ricercare i file o trascinarli nel riquadro. È necessario rimanere nella pagina fino a quando il carico non è completo.
I file vengono salvati nell'archivio oggetti associato al progetto e vengono elencati come asset di dati nella pagina Asset del progetto.
Quando si fa clic sul nome dell'asset di dati, è possibile visualizzare queste informazioni sugli asset di dati dai file:
- Il nome e la descrizione dell'asset
- I tag per l'asset
- Il nome della persona che ha creato l'asset
- La dimensione dei dati
- La data in cui l'asset è stato aggiunto al progetto
- La data dell'ultima modifica dell'asset
- Un' anteprima dei dati, per CSV, Avro, Parquet, TSV, Microsoft Excel, PDF, testo, JSON e file di immagine
- Un profilo dei dati, per i file CSV, Avro, Parquet, TSV e Microsoft Excel
È possibile aggiornare il contenuto di un asset di dati da un file aggiungendo un file con lo stesso nome e formato al progetto e quindi scegliendo di sostituire l'asset di dati esistente.
È possibile rimuovere l'asset di dati selezionando l'opzione Elimina dal menu azioni accanto al nome asset. Scegliere l'opzione Prepara dati per perfezionare i dati con Data Refinery.
Aggiungi dataset hub di risorse
È possibile aggiungere dataset dall'hub di risorse al progetto:
- Nell'hub della risorsa, individuare la scheda per il dataset che si desidera aggiungere.
- Fare clic su Aggiungi al progetto dalla barra delle azioni, selezionare il progetto e fare clic su Aggiungi.
Guarda questo breve video per vedere come caricare e analizzare i dataset pubblici.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Trascrizione del video Ora Trascrizione 00:00 Questo video mostra come accedere ai dataset pubblici nella galleria Cloud Pak for Data as a Service . 00:06 Inizia nel Resource Hub e utilizza i filtri per visualizzare solo i dataset. 00:13 Qui, troverete alcuni set di dati ricchi da utilizzare nella vostra analisi. 00:17 Ad esempio, è possibile cercare "economia" o "popolazione" o "tempo" o "posti di lavoro". 00:28 Sembra un insieme di dati interessante. 00:30 Aprire e visualizzare l'anteprima dei dati. 00:34 Da qui, è possibile condividere il dataset sui social media, ottenere un link diretto al dataset o scaricare il dataset. 00:45 È anche possibile copiare il dataset in un progetto specifico. 00:52 Ora, vai a quel progetto. 00:55 E nella scheda "Asset", vedrai che il dataset è stato aggiunto alla sezione degli asset di dati. 01:01 Successivamente, aggiungere un nuovo notebook. 01:05 Il titolo di questo quaderno sarà "Tassi di disoccupazione". 01:09 Selezionare un ambiente di runtime e una lingua. 01:14 Quando si è pronti, creare il notebook. 01:20 Quando il notebook viene caricato, accedere alle origini dati e individuare il file di disoccupazione. 01:27 Fare clic su "Inserisci nel codice" e scegliere come si desidera inserire i dati. 01:33 Le scelte in questa casella a discesa dipendono dalla lingua utilizzata in questo notebook. 01:38 Nota che il codice inserito include le credenziali di cui avrai bisogno per leggere il file di dati dall'istanza Object Storage . 01:45 Quando si esegue il codice, vengono visualizzate le prime cinque righe. 01:50 Ora, sei pronto per iniziare ad analizzare uno qualsiasi dei ricchi dataset in Resource Hub. 01:56 Trova ulteriori video nella documentazione Cloud Pak for Data as a Service .
Converti i file nell'archiviazione del progetto in asset
La memoria per il progetto contiene gli asset di dati caricati nel progetto, ma può contenere anche altri file. Ad esempio, è possibile salvare un DataFrame in un notebook nell'archivio dell'ambiente del progetto. È possibile convertire i file nell'archiviazione progetti in asset.
Per convertire i file nell'archiviazione del progetto in asset:
- Nella scheda Asset del progetto, fare clic su Importa asset.
- Selezionare File di progetto.
- Selezionare la cartella data_asset .
- Selezionare l'asset e fare clic su Importa.
Passi successivi
Ulteriori informazioni
Argomento principale Preparazione dei dati