0 / 0
Retourner à la version anglaise de la documentation

Exemples d'extraction de données à partir de fichiers Microsoft Excel (DataStage® )

Dernière mise à jour : 12 mars 2025
Exemples d'extraction de données à partir de fichiers Microsoft Excel (DataStage )

Vous pouvez générer des exemples de travail destinés à extraire des données de fichiers Microsoft Excel. Dans cet exemple, l'étape Sequential File est utilisée comme étape de sortie. Vous pouvez utiliser toute autre étape de sortie pour créer la sortie.

Pour obtenir les fichiers des exemples, extrayez le fichier IS_install\Clients\Samples\Connectors\UnstructuredData_Samples.zip.

Exemple 1 : Extraction de données à partir d'une plage dans un fichier Microsoft Excel

Créez un travail qui utilise l'étape Excel pour récupérer les données d'une plage dans une feuille de calcul Microsoft Excel.

Cet exemple utilise l'exemple de fichier Microsoft Excel Employee1.xls, qui contient les détails des employés travaillant dans une organisation. Ce fichier d'exemple comporte trois feuilles de calcul : Sheet1, Sheet2, et Sheet3.Sheet1 contient des informations sur les employés de chaque département de l'organisation. Sheet2 et Sheet3 sont vides. Dans cet exemple, vous extrayez des informations métier uniquement sur les employés qui travaillent pour le service B01.

Pour extraire des données d'une plage dans un fichier Excel :
  1. Créez un travail comprenant une étape Excel et une étape Sequential File.
  2. Double-cliquez sur l'étape Excel.
  3. Dans la fenêtre Configuration, indiquez le chemin d'accès complet du fichier d'entrée Microsoft Excel Employee1.xls.
  4. Dans la liste Option de plage, sélectionnez Spécifier toute la plage de données pour extraire les données d'une plage spécifique.
  5. Dans le Expression de plage champ, précisezSheet1!A16:K28 .
  6. Dans le champ En-tête de colonne, sélectionnez la Première ligne de plages de données. Lorsque la première ligne des plages de données est sélectionnée, la première ligne est considérée comme l'en-tête et l'étape Excel commence l'extraction à partir de la deuxième ligne.
  7. Décochez la case située à côté des colonnes E (NUMÉRO DE TÉLÉPHONE) et I (DATE DE NAISSANCE) de Microsoft Excel.
  8. Cliquez sur Import et OK. Lorsque vous cliquez sur Importer, le volet Carte situé en bas à droite de la fenêtre Configuration se met à jour.
  9. Dans la page Sortie > Colonne, changez le type de la colonne EMP_NO en Entier, puis cliquez sur OK.
  10. Cliquez deux fois sur l'étape Sequential File. Sur le Propriétés page, spécifiez le chemin où vous souhaitez que le fichier de sortie soit créé, suivi du nom du fichierOutputOfExample1.txt , et cliquez sur D'ACCORD.
  11. Enregistrez le travail. Vous pouvez maintenant compiler et exécuter le travail.

Le tableau suivant affiche les informations dans un fichier d'entrée Microsoft Excel contenant les informations relatives aux employés de différents services.

Tableau 1. Exemple de fichier Microsoft Excel avec les détails des employés
N° EMP PRÉNOM INIT 2E PRENOM NOM N° TÉL DATE EMBAUCHE base des opportunités professionnelles SEXE DATE DE NAISSANCE
Employés dans DEPT_A00
10 CHRISTINE I HAAS 3978 1/1/1995 PRES F 24/8/1963
20 MICHAEL L THOMSON 3476 10/10/2003 GESTIONNAIRE M 2/2/1976
30 SALLY A KWAN 4738 5/4/2005 GESTIONNAIRE F 11/5/1971
50 JOHN B GEYER 6789 17/8/1979 GESTIONNAIRE M 15/9/1955
Employés dans DEPT_B01
60 IRVING F STERN 6423 14/9/2003 GESTIONNAIRE M 7/7/1975
70 EVA D PULASKI 7831 30/9/2003 GESTIONNAIRE F 26/05/2003
90 EILEEN W HENDERSON 5498 15/8/2000 GESTIONNAIRE F 15/5/1971
100 THEODORE Q SPENSER 742 19/6/2000 GESTIONNAIRE M 18/12/1980
110 VINCENZO G LUCCHESSI 3490 16/5/1988 SALESREP M 5/11/1958
130 SEAN   O'CONNELL 2167 12/51993 CLERK M 18/10/1972
130 DELORES M QUINTANA 4578 28/7/2001 Analyste F 15/9/1955
140 HEATHER A NICHOLLS 1793 12/15/2006 Analyste F 19/1/1976
150 BRUCE   ADAMSON 4510 12/2/2002 DESIGNER M 17/5/1972
160 ELIZABETH R PIANKA 3782 11/10/2006 DESIGNER F 12/4/1980
1770 MASATOSHI J YOSHIMURA 2890 15/9/1999 DESIGNER M 5/1/1981
180 MARILYN S SCOUTTEN 1682 7/7/2003 DESIGNER F 21/2/1978

Une fois le travail exécuté, vous pouvez ouvrir leOutputOfExample1.txt fichier pour voir le résultat.

Le fichier OutputOfExample1.txt affiche les données de DEPT_B01 à l'exception des colonnes PHONE NO et BIRTH DATE :
"60","IRVING","F","STERN","2003-09-14","MANAGER ","M","72250","500"
"70","EVA","D","PULASKI","2005-09-30","MANAGER ","F","96170","700"
"90","EILEEN","W","HENDERSON","2000-08-15","MANAGER ","F","89750","600"
"100","THEODORE","Q","SPENSER","2000-06-19","MANAGER ","M","86150","500"
"110","VINCENZO","G","LUCCHESSI","1988-05-16","SALESREP","M","66500","900"
"120","SEAN"," ","O'CONNELL","1993-12-05","CLERK   ","M","49250","600"
"130","DELORES","M","QUINTANA","2001-07-28","ANALYST ","F","73800","500"
"140","HEATHER","A","NICHOLLS","2006-12-15","ANALYST ","F","68420","600"
"150","BRUCE"," ","ADAMSON","2002-02-12","DESIGNER","M","55280","500"
"160","ELIZABETH","R","PIANKA","2006-10-11","DESIGNER","F","62250","400"
"170","MASATOSHI","J","YOSHIMURA","1999-09-15","DESIGNER","M","44680","500"
"180","MARILYN","S","SCOUTTEN","2003-07-07","DESIGNER","F","51340","500"

Exemple 2 : Extraction de données à partir de plusieurs feuilles Microsoft Excel

Cet exemple utilise l'exemple de fichier Microsoft Excel Employee2.xls. Ce fichier exemple contient les feuilles suivantes : DEPT A00, DEPT B01, DEPT C01 et DEPT D01. Chaque feuille contient des renseignements sur les employés du service.

La structure des données de chaque feuille est similaire. Chaque feuille comporte les colonnes EMP NO, FIRST NAME, MID INIT, LAST NAME, PHONE NO, HIRE DATE, JOB et ADDRESS (n° d'employé, prénom, 2e prénom, nom, n° de tél., date d'embauche, poste et adresse), et la troisième ligne est l'en-tête. Mais chaque feuille a un nombre de lignes différent.

Pour extraire des données de plusieurs fichiers :
  1. Dans la fenêtre Configuration, indiquez le chemin d'accès complet du fichier d'entrée Microsoft Excel Employee2.xls.
  2. Dans Option de plage, sélectionnez Indiquer la ligne de début.
  3. Dans la zone Expression de plage, indiquez A3:H3. Lorsque l'étape est exécutée avec l'option Spécifier la première ligne et qu'aucun nom de feuille spécifique n'est spécifié dans l'expression Gamme, le travail trouve la dernière ligne et extrait les lignes jusqu'à la dernière ligne au moment de l'exécution.
  4. Dans le En-tête de colonne, sélectionnez la Première ligne de plages de données.
  5. Sur le Propriété, cochez la case en regard de la propriété pour extraire la valeur de la propriété. Dans cet exemple, sélectionnez Sheetname comme propriété.
  6. Cliquez sur Import. L'étape génère les correspondances entre les colonnes.
  7. Pour faire le SheetNname colonne la première colonne de la liste, sélectionnez la SheetName colonne et cliquez sur En haut jusqu'à ce que le SheetName column est la première colonne de la liste.
  8. Dans la table de mappage, insérez une ligne pour la colonne ADDRESS dans le fichier d'entrée contenant un lien hypertexte.
    1. Cliquez sur Insérer
    2. Dans l'option Elément Excel, sélectionnez Column ADDRESS.
    3. Dans la cellule d'option Import de la nouvelle ligne, sélectionnez l'adresse Lien hypertexte.
    4. Indiquez le nom de colonne DataStage EMAIL_ADDRESS pour la nouvelle ligne. Cliquez sur OK.
  9. Cliquez sur l'onglet Sortie > Colonne pour modifier le type de données ou d'autres attributs.
  10. Remplacez le type de colonne EMP_NO par Entier. Cliquez sur OK.
  11. Sur la page Propriétés, indiquez le chemin où vous souhaitez que le fichier de sortie soit créé, suivi du nom de fichier OutputOfExample2.txt. Cliquez sur OK.
  12. Enregistrez le travail. Vous pouvez maintenant compiler et exécuter le travail.

Un exemple de fichiers Microsoft Excel d'entrée qui contiennent les informations sur les employés de chaque département dans les différentes feuilles. Les extraits de données sur les salariés de toutes les feuilles sont affichés sous la forme des tableaux suivants :

Tableau 2. Informations sur les employés dans DEPT_A00
N° EMP PRÉNOM INIT 2E PRENOM NOM N° TÉL DATE EMBAUCHE base des opportunités professionnelles SEXE DATE DE NAISSANCE
10 CHRISTINE I HAAS 3978 1/1/1995 PRES F 24/8/1963
20 MICHAEL L THOMSON 3476 10/10/2003 GESTIONNAIRE M 2/2/1976
30 SALLY A KWAN 4738 5/4/2005 GESTIONNAIRE F 11/5/1971
50 JOHN B GEYER 6789 17/8/1979 GESTIONNAIRE M 15/9/1955
Tableau 3. Détails des employés de la feuille Employees dans DEPT_B01
N° EMP PRÉNOM INIT 2E PRENOM NOM N° TÉL DATE EMBAUCHE base des opportunités professionnelles SEXE DATE DE NAISSANCE
60 IRVING F STERN 6423 14/9/2003 GESTIONNAIRE M 7/7/1975
70 EVA D PULASKI 7831 30/9/2003 GESTIONNAIRE F 26/05/2003
90 EILEEN W HENDERSON 5498 15/8/2000 GESTIONNAIRE F 15/5/1971
100 THEODORE Q SPENSER 742 19/6/2000 GESTIONNAIRE M 18/12/1980
110 VINCENZO G LUCCHESSI 3490 16/5/1988 SALESREP M 5/11/1958
130 SEAN   O'CONNELL 2167 12/51993 CLERK M 18/10/1972
130 DELORES M QUINTANA 4578 28/7/2001 Analyste F 15/9/1955
140 HEATHER A NICHOLLS 1793 12/15/2006 Analyste F 19/1/1976
150 BRUCE   ADAMSON 4510 12/2/2002 DESIGNER M 17/5/1972
160 ELIZABETH R PIANKA 3782 11/10/2006 DESIGNER F 12/4/1980
1770 MASATOSHI J YOSHIMURA 2890 15/9/1999 DESIGNER M 5/1/1981
180 MARILYN S SCOUTTEN 1682 7/7/2003 DESIGNER F 21/2/1978

Après l'exécution du travail, vous pouvez ouvrir le fichier OutputOfExample2.txt qui contient le résultat suivant.

"DEPT A00","10","CHRISTINE","I","HAAS","3978","1995-01-01","PRES    ","CHRISTINE HAAS","mailto:CHRISTINE%[email protected]"
"DEPT A00","20","MICHAEL","L","THOMPSON","3476","2003-10-10","MANAGER ","MICHAEL THOMPSON","mailto:MICHAEL%[email protected]"
"DEPT A00","30","SALLY","A","KWAN","4738","2005-04-05","MANAGER ","SALLY KWAN","mailto:SALLY%[email protected]"
"DEPT A00","50","JOHN","B","GEYER","6789","1979-08-17","MANAGER ","JOHN GEYER","mailto:JOHN%[email protected]"
"DEPT B01","60","IRVING","F","STERN","6423","2003-09-14","MANAGER ","IRVING STERN","mailto:IRVING%[email protected]"
"DEPT B01","70","EVA","D","PULASKI","7831","2005-09-30","MANAGER ","EVA PULASKI","mailto:EVA%[email protected]"
"DEPT B01","90","EILEEN","W","HENDERSON","5498","2000-08-15","MANAGER ","EILEEN HENDERSON","mailto:EILEEN%[email protected]"
"DEPT B01","100","THEODORE","Q","SPENSER","972","2000-06-19","MANAGER ","THEODORE SPENSER","mailto:THEODORE%[email protected]"
"DEPT B01","110","VINCENZO","G","LUCCHESSI","3490","1988-05-16","SALESREP","VINCENZO LUCCHESSI","mailto:VINCENZO%[email protected]"
"DEPT B01","120","SEAN"," ","O'CONNELL","2167","1993-12-05","CLERK   ","SEAN O'CONNELL","mailto:SEAN%20O'[email protected]"
"DEPT B01","130","DELORES","M","QUINTANA","4578","2001-07-28","ANALYST ","DELORES QUINTANA","mailto:DELORES%[email protected]"
"DEPT B01","140","HEATHER","A","NICHOLLS","1793","2006-12-15","ANALYST ","HEATHER NICHOLLS","mailto:HEATHER%[email protected]"
"DEPT B01","150","BRUCE"," ","ADAMSON","4510","2002-02-12","DESIGNER","BRUCE ADAMSON","mailto:BRUCE%[email protected]"
"DEPT B01","160","ELIZABETH","R","PIANKA","3782","2006-10-11","DESIGNER","ELIZABETH PIANKA","mailto:ELIZABETH%[email protected]"
"DEPT B01","170","MASATOSHI","J","YOSHIMURA","2890","1999-09-15","DESIGNER","MASATOSHI YOSHIMURA","mailto:MASATOSHI%[email protected]"
"DEPT B01","180","MARILYN","S","SCOUTTEN","1682","2003-07-07","DESIGNER","MARILYN SCOUTTEN","mailto:MARILYN%[email protected]"
"DEPT C01","190","JAMES","H","WALKER","2986","2004-07-26","DESIGNER","JAMES WALKER","mailto:JAMES%[email protected]"
"DEPT C01","200","DAVID"," ","BROWN","4501","2002-03-03","DESIGNER","DAVID BROWN","mailto:DAVID%[email protected]"
"DEPT C01","210","WILLIAM","T","JONES","942","1998-04-11","DESIGNER","WILLIAM JONES","mailto:WILLIAM%[email protected]"
"DEPT C01","220","JENNIFER","K","LUTZ","672","1998-08-29","DESIGNER","JENNIFER LUTZ","mailto:JENNIFER%[email protected]"
"DEPT C01","230","JAMES","J","JEFFERSON","2094","1996-11-21","CLERK   ","JAMES JEFFERSON","mailto:JAMES%[email protected]"
"DEPT C01","240","SALVATORE","M","MARINO","3780","2004-12-05","CLERK   ","SALVATORE MARINO","mailto:SALVATORE%[email protected]"
"DEPT C01","250","DANIEL","S","SMITH","961","1999-10-30","CLERK   ","DANIEL SMITH","mailto:DANIEL%[email protected]"
"DEPT C01","260","SYBIL","P","JOHNSON","8953","2005-09-11","CLERK   ","SYBIL JOHNSON","mailto:SYBIL%[email protected]"
"DEPT D01","270","MARIA","L","PEREZ","9001","2006-09-30","CLERK   ","MARIA PEREZ","mailto:MARIA%[email protected]"
"DEPT D01","280","ETHEL","R","SCHNEIDER","8997","1997-03-24","OPERATOR","ETHEL SCHNEIDER","mailto:ETHEL%[email protected]"
"DEPT D01","290","JOHN","R","PARKER","4502","2006-05-30","OPERATOR","JOHN PARKER","mailto:JOHN%[email protected]"
"DEPT D01","300","PHILIP","X","SMITH","2095","2002-06-19","OPERATOR","PHILIP SMITH","mailto:PHILIP%[email protected]"
"DEPT D01","310","MAUDE","F","SETRIGHT","3332","1994-09-12","OPERATOR","MAUDE SETRIGHT","mailto:MAUDE%[email protected]"
"DEPT D01","320","RAMLAL","V","MEHTA","9990","1995-07-07","FIELDREP","RAMLAL MEHTA","mailto:RAMLAL%[email protected]"
"DEPT D01","330","WING"," ","LEE","2103","2006-02-23","FIELDREP","WING LEE","mailto:WING%[email protected]"
"DEPT D01","340","JASON","R","GOUNOT","5698","1977-05-05","FIELDREP","JASON GOUNOT","mailto:JASON%[email protected]"

Exemple 3 : Extraction de données de plusieurs plages avec des structures de données différentes dans un fichier Microsoft Excel

Cet exemple utilise l'exemple de fichier Microsoft Excel Employee3.xls. Cet exemple de fichier comporte deux feuilles de calcul, Departments and Employees, qui ont des structures de données différentes.

Dans cet exemple, l'étape Excel comporte deux liens de sortie. Vous extrayez des données de la feuille Departments vers le premier lien et de la feuille Employees vers le second lien.

Pour extraire différentes structures de données :
  1. Créez un travail qui comprend une étape Excel et deux étapes Sequential File. Vous pouvez renommer vos liens en Départements et Employés.
  2. Double-cliquez sur l'étape Excel. Dans la fenêtre Configuration, indiquez le chemin d'accès complet du fichier d'entrée Microsoft Excel Employee3.xls.
  3. Spécifiez les données à extraire de la feuille de calcul Départements et effectuez les sous-étapes suivantes pour générer les correspondances entre les colonnes.
    1. Du Lien zone de liste, sélectionnez Départements.
    2. Du Option de plage liste, sélectionnez Spécifiez toute la plage.
    3. Dans la zone Expression de plage, indiquez Departments!A2:C6 .
    4. Dans le En-tête de colonne, sélectionnez la Première ligne de plages de données.
    5. Cliquez sur Importer, puis sur OK.
  4. Indiquez les données à extraire de la feuille de calcul Employees et effectuez les sous-étapes ci-dessous pour générer les mappages de colonnes.
    1. Dans la zone de liste Lien, sélectionnez Employees.
    2. Du Option de plage liste, Spécifiez toute la plage.
    3. Dans la zone Expression de plage, indiquez Employees!A2:L34.
    4. Dans En-tête de colonne, sélectionnez Première ligne des plages de données.
    5. Cliquez sur Importer, puis sur OK.
  5. Sur la page Sortie, sélectionnez le lien Employees comme nom de sortie.
  6. Sur la page Colonnes, changez le type de données de la colonne EMP_NO en un entier, puis cliquez sur OK.
  7. Double-cliquez sur le premier Sequential File scèneOutput_1 et spécifiez le chemin pour créer le fichier de sortie, suivi du nom du fichierOutputOfExample3_1.txt .
  8. Double-cliquez sur la deuxième étape Sequential File Output_2, et indiquez le chemin d'accès pour créer le fichier de sortie, suivi du nom du fichier OutputOfExample3_2.txt
  9. Enregistrez le travail. Vous pouvez maintenant compiler et exécuter le travail.

Un exemple de fichier d'entrée Microsoft Excel Employee3.xls contient des informations sur les départements dans la feuille Départements et des informations sur les employés dans la feuille Employés. Le travail extrait les données du département vers le fichier OutputOfExample3_1.txt et les données des employés vers OutputOfExample3_2.txt.

Une fois le travail exécuté, ouvrez le fichier OutputOfExample3_1.txt et le fichier OutputOfExample3_2.txt. Le fichier OutputOfExample3_1.txt doit correspondre à la feuille Departments et le fichier OutputOfExample3_2.txt doit correspondre à la feuille Employees du fichier Employee.xls.