0 / 0

Ambienti DataStage

Ultimo aggiornamento: 06 mag 2025
Ambienti DataStage

Controllare il modo in cui i job DataStage vengono eseguiti sul motore di runtime configurando gli ambienti. Puoi eseguire i job DataStage in ambienti su IBM Cloud oppure puoi eseguire i job localmente configurando gli ambienti con i tuoi propri motori di runtime remoti DataStage .

Ambienti DataStage su IBM Cloud

IBM® DataStage® offre tre ambienti PX che è possibile utilizzare per eseguire i job. Un lavoro utilizza Default DataStage PX S runtime per impostazione predefinita. Tuttavia, prima di eseguire il flusso come un lavoro, è possibile aggiornare l'ambiente a uno qualsiasi dei tre ambienti disponibili.

I tre runtime di IBM Cloud consumano le CUH (capacity unit hours) tracciate. Si tiene traccia solo del tempo impiegato per eseguire i lavori. La creazione, la configurazione e l'aggiornamento dei flussi nell'area di disegno DataStage non utilizza alcun CUH.

Quando crei un lavoro in cui eseguire il flusso DataStage , puoi selezionare uno dei seguenti ambienti preimpostati:

Nome Configurazione hardware
Default DataStage PX S 1 conduttore: 2 vCPU e 8 GB di RAM
Default DataStage PX M 1 conduttore: 4 vCPU e 16 GB di RAM
Default DataStage PX L 1 Conductor: 8 vCPU e 32 GB RAM

Il runtime predefinito di DataStage PX S viene utilizzato quando si esegue un lavoro per estrarre, trasformare e caricare i dati in DataStage, a meno che non si selezioni un ambiente diverso. Per lavori complessi con dataset di grandi dimensioni, seleziona piani con più vCPU e memoria per aumentare la capacità. Gli ambienti predefiniti utilizzano 2 partizioni.

Per aggiornare l'ambiente che si desidera utilizzare:

  • Nell'area DataStage , selezionare l'icona delle impostazioni di esecuzione e selezionare l'ambiente che si desidera utilizzare.
  • Selezionare un lavoro, modificare la configurazione del lavoro e, nella scheda Impostazioni di esecuzione, modificare l'ambiente.
Gli amministratori possono creare nuovi ambienti per IBM Cloud per specificare le variabili di ambiente e modificare il numero di partizioni.
Nota: Diversi ambienti possono avere lo stesso DataStage possono avere lo stesso nome, perché a ogni ambiente viene assegnato un uuid unico.

Ambienti DataStage su motori di runtime remoti

È possibile eseguire i job in un ambiente non gestito da IBM utilizzando un motore di runtime remoto. Con un motore di runtime remoto DataStage , puoi utilizzare applicazioni e database installati in loco ed eseguire i lavori localmente. Un amministratore può configurare i motori di runtime remoti DataStage a livello di progetto. Gli sviluppatori con accesso Editor o Admin a un progetto con un motore di runtime remoto DataStage possono eseguire i job in tale ambiente.

Una volta selezionato un ambiente remoto come ambiente predefinito del progetto, è possibile utilizzare solo gli ambienti remoti in tale progetto. Non puoi tornare all'utilizzo degli ambienti IBM Cloud per i job DataStage di tale progetto.

Gli ambienti remoti forniscono i seguenti vantaggi:
  • Eseguire i carichi di lavoro ed elaborare i dati localmente
  • Evita costi di trasferimento dati
  • Aumentare la sicurezza mantenendo i dati locali nell'ambiente cloud
  • Utilizzare le funzioni DataStage da Cloud Pak for Data come gli stage definiti dall'utente, lo stage Java Integration, le routine di job Before / after e altro ancora, senza mantenere un'installazione completa di Cloud Pak for Data

Gli ambienti remoti non supportano i connettori che richiedono un caricamento del driver, i vault e il connettore del Servizio dati. Diversi connettori sono supportati solo tramite connessione di flusso.

Per ulteriori informazioni, vedere DataStage Anywhere.

Esecuzione di un flusso

È possibile creare un job in cui eseguire il flusso DataStage :

  • Direttamente nell'area DataStage facendo clic sull'icona di esecuzione dalla barra degli strumenti DataStage (il nome predefinito di un job che esegue un flusso è il nome del flusso accodato a .DataStage job
  • Dalla pagina FlussiDataStage del tuo progetto selezionando il flusso DataStage e facendo clic sul menu Azione e selezionando Nuovo job.

Quando si esegue un lavoro per estrarre, trasformare o caricare i dati in DataStage, viene avviato automaticamente un 'Default DataStage XS runtime, elencato come runtime attivo nella pagina Ambienti del progetto. È possibile aggiornare l'ambiente che si desidera utilizzare selezionando l'icona delle impostazioni di esecuzione nell'area di disegno DataStage oppure selezionando un lavoro dalla scheda Lavori e modificandone le impostazioni.

Monitoraggio della fatturazione mensile

Devi essere un amministratore o proprietario dell'account IBM Cloud per visualizzare le informazioni sull'utilizzo della risorsa.

Per visualizzare i costi mensili, la quantità di CUH utilizzata, il numero di VPC utilizzati e il numero di utenti per la tua istanza del servizio, vai al dashboard di utilizzo del cloud. Per ciascuna istanza, fai clic su Gestisci> Fatturazione e utilizzo> Utilizzo, fai clic su Visualizza istanze accanto al nome servizio e fai quindi clic su Visualizza istanza accanto al nome istanza.

Log di runtime per i lavori

Per visualizzare i log cumulati per un lavoro DataStage :

  1. Dalla pagina Jobs del progetto, fai clic sul lavoro DataStage per cui vuoi visualizzare i log.
  2. Fare clic sull'esecuzione del lavoro. È possibile visualizzare il log del lavoro, copiare il log negli appunti o scaricarlo.