Ambienti DataStage
Controllare il modo in cui i job DataStage vengono eseguiti sul motore di runtime configurando gli ambienti. Puoi eseguire i job DataStage in ambienti su IBM Cloud oppure puoi eseguire i job localmente configurando gli ambienti con i tuoi propri motori di runtime remoti DataStage .
Ambienti DataStage su IBM Cloud
IBM® DataStage® offre tre ambienti PX che è possibile utilizzare per eseguire i job. Un lavoro utilizza Default DataStage PX S runtime per impostazione predefinita. Tuttavia, prima di eseguire il flusso come un lavoro, è possibile aggiornare l'ambiente a uno qualsiasi dei tre ambienti disponibili.
I tre runtime di IBM Cloud consumano le CUH (capacity unit hours) tracciate. Si tiene traccia solo del tempo impiegato per eseguire i lavori. La creazione, la configurazione e l'aggiornamento dei flussi nell'area di disegno DataStage non utilizza alcun CUH.
Quando crei un lavoro in cui eseguire il flusso DataStage , puoi selezionare uno dei seguenti ambienti preimpostati:
Nome | Configurazione hardware |
---|---|
Default DataStage PX S |
1 conduttore: 2 vCPU e 8 GB di RAM |
Default DataStage PX M |
1 conduttore: 4 vCPU e 16 GB di RAM |
Default DataStage PX L |
1 Conductor: 8 vCPU e 32 GB RAM |
Il runtime predefinito di DataStage PX S viene utilizzato quando si esegue un lavoro per estrarre, trasformare e caricare i dati in DataStage, a meno che non si selezioni un ambiente diverso. Per lavori complessi con dataset di grandi dimensioni, seleziona piani con più vCPU e memoria per aumentare la capacità. Gli ambienti predefiniti utilizzano 2 partizioni.
Per aggiornare l'ambiente che si desidera utilizzare:
- Nell'area DataStage , selezionare l'icona delle impostazioni di esecuzione e selezionare l'ambiente che si desidera utilizzare.
- Selezionare un lavoro, modificare la configurazione del lavoro e, nella scheda Impostazioni di esecuzione, modificare l'ambiente.
Ambienti DataStage su motori di runtime remoti
È possibile eseguire i job in un ambiente non gestito da IBM utilizzando un motore di runtime remoto. Con un motore di runtime remoto DataStage , puoi utilizzare applicazioni e database installati in loco ed eseguire i lavori localmente. Un amministratore può configurare i motori di runtime remoti DataStage a livello di progetto. Gli sviluppatori con accesso Editor o Admin a un progetto con un motore di runtime remoto DataStage possono eseguire i job in tale ambiente.
Una volta selezionato un ambiente remoto come ambiente predefinito del progetto, è possibile utilizzare solo gli ambienti remoti in tale progetto. Non puoi tornare all'utilizzo degli ambienti IBM Cloud per i job DataStage di tale progetto.
- Eseguire i carichi di lavoro ed elaborare i dati localmente
- Evita costi di trasferimento dati
- Aumentare la sicurezza mantenendo i dati locali nell'ambiente cloud
- Utilizzare le funzioni DataStage da Cloud Pak for Data come gli stage definiti dall'utente, lo stage Java Integration, le routine di job Before / after e altro ancora, senza mantenere un'installazione completa di Cloud Pak for Data
Gli ambienti remoti non supportano i connettori che richiedono un caricamento del driver, i vault e il connettore del Servizio dati. Diversi connettori sono supportati solo tramite connessione di flusso.
Per ulteriori informazioni, vedere DataStage Anywhere.
Esecuzione di un flusso
È possibile creare un job in cui eseguire il flusso DataStage :
- Direttamente nell'area DataStage facendo clic sull'icona di esecuzione dalla barra degli strumenti DataStage (il nome predefinito di un job che esegue un flusso è il nome del flusso accodato a .DataStage job
- Dalla pagina FlussiDataStage del tuo progetto selezionando il flusso DataStage e facendo clic sul menu Azione e selezionando Nuovo job.
Quando si esegue un lavoro per estrarre, trasformare o caricare i dati in DataStage, viene avviato automaticamente un 'Default DataStage XS runtime
, elencato come runtime attivo nella pagina Ambienti del progetto. È possibile aggiornare l'ambiente che si desidera utilizzare selezionando l'icona delle impostazioni di esecuzione nell'area di disegno DataStage oppure selezionando un lavoro dalla scheda Lavori e modificandone le impostazioni.
Monitoraggio della fatturazione mensile
Devi essere un amministratore o proprietario dell'account IBM Cloud per visualizzare le informazioni sull'utilizzo della risorsa.
Per visualizzare i costi mensili, la quantità di CUH utilizzata, il numero di VPC utilizzati e il numero di utenti per la tua istanza del servizio, vai al dashboard di utilizzo del cloud. Per ciascuna istanza, fai clic su Gestisci> Fatturazione e utilizzo> Utilizzo, fai clic su Visualizza istanze accanto al nome servizio e fai quindi clic su Visualizza istanza accanto al nome istanza.
Log di runtime per i lavori
Per visualizzare i log cumulati per un lavoro DataStage :
- Dalla pagina Jobs del progetto, fai clic sul lavoro DataStage per cui vuoi visualizzare i log.
- Fare clic sull'esecuzione del lavoro. È possibile visualizzare il log del lavoro, copiare il log negli appunti o scaricarlo.