Planification de l'expérience de vos blocs-notes et de vos scripts
Pour planifier l'utilisation de blocs-notes et de scripts Jupyter, commencez par comprendre les choix que vous avez, les implications de ces choix et la manière dont ces choix affectent l'ordre des tâches de mise en oeuvre.
Vous pouvez effectuer la plupart des tâches liées aux carnets de notes et aux scripts avec le rôle d'éditeur ou d'administrateur dans un projet d'analyse.
Avant de commencer à utiliser des blocs-notes et des scripts, tenez compte des questions suivantes, car la plupart des tâches doivent être effectuées dans un ordre particulier:
- Dans quel langage de programmation souhaitez-vous travailler?
- Que feront vos cahiers?
- Avec quelles bibliothèques souhaitez-vous travailler?
- Comment utiliser le bloc-notes ou le script dans IBM watsonx?
Pour créer un plan d'utilisation des blocs-notes ou des scripts Jupyter, déterminez les tâches suivantes que vous devez effectuer.
Tâche | Obligatoire ? | Délai |
---|---|---|
Création d'un projet | Oui | Ce doit être votre première tâche |
Ajout d'actifs de données au projet | Oui | Avant de commencer à créer des blocs-notes |
Prélèvement d'un langage de programmation | Oui | Avant de sélectionner l'outil |
Sélection d'un outil | Oui | Après avoir sélectionné la langue |
Vérification des packages de bibliothèque | Oui | Avant de sélectionner un environnement d'exécution |
Choix d'un environnement d'exécution approprié | Oui | Avant d'ouvrir l'environnement de développement |
Gestion du cycle de vie des blocs-notes et des scripts | Non | Lorsque le bloc-notes ou le script est prêt |
Utilisations pour les blocs-notes et les scripts après la création | Non | Lorsque le bloc-notes est prêt |
Création d'un projet
Vous devez créer un projet avant de pouvoir commencer à travailler dans des blocs-notes.
Projets Vous pouvez créer un projet vide, à partir d'un fichier ou d'une URL. Dans ce projet:
- Vous pouvez utiliser Jupyter Notebook et RStudio.
- Les blocs-notes sont des actifs du projet.
- La collaboration de bloc-notes est basée sur le verrouillage par l'utilisateur au niveau du projet.
- Les scripts R et les applications Shiny ne font pas partie des actifs du projet.
- Il n'y a pas de collaboration sur les scripts R ou les applications Shiny.
Sélection d'un langage de programmation
Vous pouvez choisir de travailler dans les langues suivantes:
- Blocs-notes
- Python et R
- Scripts
- Scripts R et applications R Shiny
Sélection d'un outil
Dans IBM watsonx, vous pouvez utiliser des blocs-notes et des scripts dans l'outil suivant:
- Editeur de bloc-notes Jupyter
- Dans l'éditeur Jupyter Notebook , vous pouvez créer des blocs-notes Python ou R. Les blocs-notes sont des actifs dans un projet. La collaboration n'est qu'au niveau du projet. Le bloc-notes est verrouillé par un utilisateur lorsqu'il est ouvert et ne peut être déverrouillé que par le même utilisateur ou par un administrateur de projet.
- RStudio
- Dans RStudio, vous pouvez créer des scripts R et des applications Shiny. Les scripts R ne sont pas des actifs dans un projet, ce qui signifie qu'il n'y a pas de collaboration au niveau du projet.
Vérification des packages de bibliothèque
Lorsque vous ouvrez un bloc-notes dans un environnement d'exécution, vous avez accès à une large sélection de packages de bibliothèques de sciences des données préinstallées. De nombreux environnements incluent également des bibliothèques fournies par IBM sans frais supplémentaires, tels que:
- La bibliothèque Watson Natural Language Processing dans les environnements Python
- Bibliothèques pour vous aider à accéder aux actifs de projet
- Bibliothèques pour les séries temporelles ou l'analyse géo-spatiale dans les environnements Spark
Pour obtenir la liste des packages de bibliothèque et des versions incluses dans un modèle d'environnement, sélectionnez le modèle dans la page Modèles de l'onglet Gérer de la page Environnements du projet.
Si des bibliothèques sont manquantes dans un modèle, vous pouvez les ajouter:
- Par le biais du bloc-notes ou du script
- Vous pouvez utiliser des commandes d'installation de package familières pour votre environnement. Par exemple, dans les blocs-notes Python , vous pouvez utiliser
mamba
,conda
oupip
. - En créant un modèle d'environnement personnalisé
- Lorsque vous créez un modèle personnalisé, vous pouvez créer une personnalisation de logiciel et ajouter les bibliothèques que vous souhaitez inclure. Pour plus de détails, voir Personnalisation des modèles d'environnement.
Choix d'un environnement d'exécution
Le choix de l'environnement de calcul pour votre bloc-notes dépend de la quantité de données que vous souhaitez traiter et de la complexité des processus d'analyse de données.
watsonx.ai Studio propose de nombreux modèles d'environnement par défaut avec différentes tailles de matériel et configurations logicielles pour vous aider à démarrer rapidement, sans avoir à créer vos propres modèles. Ces modèles inclus sont répertoriés dans la page Modèles de l'onglet Gérer de la page Environnements du projet. Pour plus d'informations sur les environnements inclus, voir Environnements.
Si les modèles disponibles ne répondent pas à vos besoins, vous pouvez créer des modèles personnalisés et déterminer la taille du matériel et la configuration logicielle. Pour plus de détails, voir Personnalisation des modèles d'environnement.
Gestion de données
Pour utiliser des données dans un bloc-notes:
- Ajoutez les données à votre projet, ce qui transforme les données en un actif de projet. Voir Ajout de données à un projet pour connaître les différentes méthodes d'ajout de données à un projet.
- Utilisez le code généré qui charge les données de l'actif dans une structure de données de votre bloc-notes. Pour obtenir la liste des types de données pris en charge, voir Prise en charge du chargement de données.
- Ecrivez votre propre code pour charger des données si la source de données n'est pas ajoutée en tant qu'actif de projet ou si la prise en charge de l'ajout de code généré n'est pas disponible pour l'actif de projet.
Gestion du cycle de vie des blocs-notes et des scripts
Après avoir créé et testé un bloc-notes dans votre outil, vous pouvez:
- Publiez-le dans un catalogue afin que les autres membres du catalogue puissent utiliser le bloc-notes dans leurs projets. Voir Publication d'actifs d'un projet dans un catalogue.
- Partagez une copie en lecture seule en dehors de watsonx.ai Studio afin que les personnes qui ne collaborent pas à vos projets puissent la voir et l'utiliser. Voir Partage de blocs-notes avec une URL.
- Publiez-le dans un référentiel GitHub . Voir Publication de blocs-notes sur GitHub.
- Publiez-le en tant que gist. Voir Publication d'un bloc-notes en tant que gist.
Les scripts R et les applications Shiny ne peuvent pas être publiés ou partagés en utilisant les fonctionnalités d'un projet.
Utilisations pour les blocs-notes et les scripts après la création
Les options d'un bloc-notes créé et prêt à être utilisé dans IBM watsonx sont les suivantes:
Exécution en tant que travail dans un projet. Voir Création et gestion de travaux dans un projet.
Exécution dans le cadre d'un pipeline. Voir Configuration des noeuds de pipeline.
Pour vous assurer qu'un bloc-notes peut être exécuté en tant que travail ou dans un pipeline:
- Assurez-vous qu'aucune cible ne nécessite d'entrée interactive de la part d'un utilisateur.
- Assurez-vous que le bloc-notes consigne suffisamment d'informations détaillées pour permettre de comprendre la progression et les échecs en consultant le journal.
- Utilisez des variables d'environnement dans le code pour accéder aux configurations si un bloc-notes ou un script les requiert, par exemple le fichier de données d'entrée ou le nombre d'exécutions d'entraînement.
Utiliser le client Runtime Python de watsonx.ai pour construire, entraîner et déployer vos modèles. Voir les exemples de clients Python en temps réel dewatsonx.ai
Utiliser l'API REST de watsonx.ai Runtime pour construire, entraîner et déployer vos modèles.
Les scripts R et les applications Shiny ne peuvent être créés et utilisés que dans l'IDE RStudio d'IBM watsonx. Vous ne pouvez pas créer de tâches pour les scripts R ou les déploiements R Shiny.
Rubrique parent: Blocs-notes et scripts