Informazioni sui cookie del presente sito Per il corretto funzionamento, i nostri siti Web richiedono alcuni cookie (richiesto). Inoltre, con il suo consenso, potrebbero essere utilizzati altri cookie per l'analisi dell'utilizzo del sito, per migliorare l'esperienza utente e per scopi pubblicitari. Per ulteriori informazioni, consultare le. Visitando il nostro sito web, accettate il trattamento delle informazioni da parte nostra come descritto nelladichiarazione sulla privacy di IBM. Per consentire una corretta navigazione, le preferenze per i cookie dell'utente verranno condivise sui domini Web IBM qui elencati.
Aggiunta di dati a un progetto
Ultimo aggiornamento: 21 giu 2024
Dopo aver creato un progetto, il passo successivo consiste nell'aggiungervi gli asset di dati in modo da poter utilizzare i dati. Tutti i collaboratori nel progetto sono automaticamente autorizzati ad accedere ai dati nel progetto.
Diversi tipi di asset possono avere nomi duplicati. Tuttavia, non è possibile aggiungere un tipo di asset con lo stesso nome più volte.
È possibile utilizzare i metodi seguenti per aggiungere asset di dati ai progetti:
Metodo | Quando utilizzare |
---|---|
Aggiungi file locali | Si dispone di dati in file CSV o simili sul sistema locale. |
Aggiungi dataset hub di risorse | Si desidera utilizzare dataset di esempio. |
Aggiungere connessioni al database | È necessario connettersi a un'origine dati remota. |
Aggiungere dati da un collegamento | Sono necessarie una o più tabelle o file da un'origine dati remota. |
Aggiungere una vista dinamica | È necessaria una vista che contenga un sottoinsieme di dati in una o più tabelle in un'origine dati remota. |
Importare metadati da un collegamento | Sono necessarie molte tabelle o file da un'origine dati remota. Si desidera pianificare e rieseguire il processo di importazione. |
Aggiungi asset di cartelle connesse da IBM Cloud Object Storage | È necessaria una cartella in IBM Cloud Object Storage che contenga una serie dinamica di file, ad esempio un feed di notizie. |
Aggiungi risorse catalogo | Sono necessari uno o più asset da un catalogo. |
Converti file nella memoria del progetto in asset | Si desidera convertire i file creati nel progetto in asset di dati. |
Aggiungi file locali
È possibile aggiungere un file dal sistema locale come asset di dati in un progetto.
- Autorizzazioni richieste
È necessario disporre del ruolo Editor o Admin nel progetto.
- Restrizioni
- Il file non può essere vuoto.
- Il nome file non può superare 255 caratteri.
- La dimensione massima per i file che è possibile caricare con l'interfaccia utente è 5 GB. Puoi caricare file più grandi in un progetto con le API.
Importante : non è possibile aggiungere file eseguibili a un progetto. Tutti gli altri tipi di file aggiunti a un progetto non vengono controllati per il codice doloso. È necessario assicurarsi che i file non contengano malware o altri tipi di software dannosi che altri collaboratori potrebbero scaricare.
Per aggiungere file di dati a un progetto:
Dalla pagina Asset del progetto, fare clic sull'icona Carica asset nel progetto
. È anche possibile fare clic sulla stessa icona
da un notebook o da un canvas.
Nel riquadro che si apre, ricercare i file o trascinarli nel riquadro. È necessario rimanere nella pagina fino a quando il carico non è completo.
I file vengono salvati nell'archivio oggetti associato al progetto e vengono elencati come asset di dati nella pagina Asset del progetto.
Quando si fa clic sul nome dell'asset di dati, è possibile visualizzare queste informazioni sugli asset di dati dai file:
- Il nome e la descrizione dell'asset
- I tag per l'asset
- Il nome della persona che ha creato l'asset
- La dimensione dei dati
- La data in cui l'asset è stato aggiunto al progetto
- La data dell'ultima modifica dell'asset
- Un' anteprima dei dati, per CSV, Avro, Parquet, TSV, Microsoft Excel, PDF, testo, JSON e file di immagine
- Un profilo dei dati, per i file CSV, Avro, Parquet, TSV e Microsoft Excel
È possibile aggiornare il contenuto di un asset di dati da un file aggiungendo un file con lo stesso nome e formato al progetto e quindi scegliendo di sostituire l'asset di dati esistente.
È possibile rimuovere l'asset di dati selezionando l'opzione Elimina dal menu azioni accanto al nome asset. Scegliere l'opzione Prepara dati per perfezionare i dati con Data Refinery.
Aggiungi dataset hub di risorse
È possibile aggiungere dataset dall'hub di risorse al progetto:
- Nell'hub della risorsa, individuare la scheda per il dataset che si desidera aggiungere.
- Fare clic su Aggiungi al progetto dalla barra delle azioni, selezionare il progetto e fare clic su Aggiungi.
Guarda questo breve video per vedere come caricare e analizzare i dataset pubblici.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Trascrizione del video Ora Trascrizione 00:00 Questo video mostra come accedere ai dataset pubblici nella galleria Cloud Pak for Data as a Service . 00:06 Inizia nel Resource Hub e utilizza i filtri per visualizzare solo i dataset. 00:13 Qui, troverete alcuni set di dati ricchi da utilizzare nella vostra analisi. 00:17 Ad esempio, è possibile cercare "economia" o "popolazione" o "tempo" o "posti di lavoro". 00:28 Sembra un insieme di dati interessante. 00:30 Aprire e visualizzare l'anteprima dei dati. 00:34 Da qui, è possibile condividere il dataset sui social media, ottenere un link diretto al dataset o scaricare il dataset. 00:45 È anche possibile copiare il dataset in un progetto specifico. 00:52 Ora, vai a quel progetto. 00:55 E nella scheda "Asset", vedrai che il dataset è stato aggiunto alla sezione degli asset di dati. 01:01 Successivamente, aggiungere un nuovo notebook. 01:05 Il titolo di questo quaderno sarà "Tassi di disoccupazione". 01:09 Selezionare un ambiente di runtime e una lingua. 01:14 Quando si è pronti, creare il notebook. 01:20 Quando il notebook viene caricato, accedere alle origini dati e individuare il file di disoccupazione. 01:27 Fare clic su "Inserisci nel codice" e scegliere come si desidera inserire i dati. 01:33 Le scelte in questa casella a discesa dipendono dalla lingua utilizzata in questo notebook. 01:38 Nota che il codice inserito include le credenziali di cui avrai bisogno per leggere il file di dati dall'istanza Object Storage . 01:45 Quando si esegue il codice, vengono visualizzate le prime cinque righe. 01:50 Ora, sei pronto per iniziare ad analizzare uno qualsiasi dei ricchi dataset in Resource Hub. 01:56 Trova ulteriori video nella documentazione Cloud Pak for Data as a Service .
Converti i file nell'archiviazione del progetto in asset
La memoria per il progetto contiene gli asset di dati caricati nel progetto, ma può contenere anche altri file. Ad esempio, è possibile salvare un DataFrame in un notebook nell'archivio dell'ambiente del progetto. È possibile convertire i file nell'archiviazione progetti in asset.
Per convertire i file nell'archiviazione del progetto in asset:
- Nella scheda Asset del progetto, fare clic su Importa asset.
- Selezionare File di progetto.
- Selezionare la cartella data_asset .
- Selezionare l'asset e fare clic su Importa.
Passi successivi
Ulteriori informazioni
Argomento principale Preparazione dei dati
L'argomento è stato utile?
0/1000