Après avoir téléchargé votre modèle de fondation personnalisé vers le stockage d'objets dans le nuage, créez une connexion au modèle et à la ressource de modèle correspondante. Utilisez la connexion pour créer un bien modèle dans un projet ou un espace.
Pour créer une ressource de modèle, ajoutez une connexion au modèle, puis créez une ressource de modèle. Si vous souhaitez d'abord tester votre modèle de base personnalisé dans un projet (par exemple en l'évaluant dans un carnet Jupyter), ajoutez votre bien de modèle de base personnalisé à un projet, puis promouvez-le dans un espace.
Après avoir ajouté le modèle, vous pouvez le déployer et utiliser Prompt Lab pour l'inférer.
Important :
Si vous téléchargez votre modèle dans un espace de stockage distant, vous devez créer une connexion basée sur vos informations d'identification personnelles. Seules les connexions utilisant des informations d'identification personnelles sont autorisées pour le stockage à distance dans le nuage. Par conséquent, les autres utilisateurs du même espace de déploiement n'ont pas accès au contenu du modèle mais sont autorisés à faire de l'inférence sur les déploiements du modèle. Créez la connexion en utilisant votre clé d'accès et votre clé d'accès secrète. Pour plus d'informations sur l'activation des informations d'identification personnelles pour votre compte, voir Paramètres du compte.
Avant de commencer
Copy link to section
Vous devez activer les informations d'identification des tâches pour pouvoir déployer un modèle de fondation personnalisé. Pour plus d'informations, voir Adding task credentials.
Ajout d'une connexion au modèle à partir de votre espace de déploiement
Copy link to section
Pour ajouter une connexion au modèle à partir de votre espace de déploiement :
Allez dans l'onglet Assets et cliquez sur Importer des actifs.
Sélectionnez Data assets et suivez les étapes qui s'affichent à l'écran.
Important :
Pour Credentials, sélectionnez Access key and Secret access key. Si vous sélectionnez une autre option, votre déploiement ne fonctionnera pas.
Ajouter une connexion au modèle à partir de votre projet
Copy link to section
Pour ajouter une connexion au modèle de votre projet :
Allez dans l'onglet Assets et cliquez sur New asset.
Sélectionnez Connecter à une source de données et suivez les étapes qui s'affichent à l'écran.
Lorsqu'il vous est demandé d'indiquer credential setting, veillez à sélectionner personal credentials. Si vous ne voyez pas l'option de paramétrage des informations d'identification, vous devez l'activer dans votre compte. Pour plus d'informations, voir Paramètres du compte.
Important :
Pour Credentials, sélectionnez Access key and Secret access key. Si vous sélectionnez une autre option, votre déploiement ne fonctionnera pas.
Pour des informations détaillées sur la manière de créer des types spécifiques de connexions, voir Connecteurs.
Création d'une ressource modèle
Copy link to section
Pour créer une ressource de modèle de fondation personnalisée :
Dans votre espace de déploiement ou votre projet, allez dans Assets puis cliquez sur Import assets.
Sélectionnez Modèle de fondation personnalisé.
Sélectionnez la connexion au stockage en nuage où se trouve le modèle.
Sélectionnez le dossier qui contient votre modèle.
en entrant les informations requises. Si vous ne soumettez aucune entrée pour les paramètres du modèle, les valeurs par défaut sont utilisées.
Copy to clipboardCopié dans le presse-papiersShow more
Paramètres globaux pour les modèles de fondation personnalisés
Copy link to section
Vous pouvez utiliser des paramètres globaux pour déployer vos modèles de fondation personnalisés. Réglez la valeur du paramètre de votre modèle de base dans la fourchette spécifiée dans le tableau suivant. Si vous ne le faites pas, votre déploiement risque d'échouer et l'inférence ne sera pas possible.
Paramètres globaux pour les modèles de fondation personnalisés
Paramètre
Type
Plage de valeurs
Valeur par défaut
Descriptif
dtype
Chaîne
float16, bfloat16
float16
Ce paramètre permet de spécifier le type de données pour votre modèle.
max_batch_size
Nombre
max_batch_size >= 1
256
Ce paramètre permet de spécifier la taille maximale du lot pour votre modèle.
max_concurrent_requests
Nombre
max_concurrent_requests >= 1 et max_concurrent_requests >= max_batch_size
1 024
Utilisez ce paramètre pour spécifier le nombre maximum de requêtes simultanées qui peuvent être faites à votre modèle. Ce paramètre n'est pas disponible pour les déploiements qui utilisent la watsonx-cfm-caikit-1.1 spécification logicielle.
max_new_tokens
Nombre
max_new_tokens >= 20
2047
Utilisez ce paramètre pour spécifier le nombre maximum de jetons que votre modèle génère pour une requête d'inférence.
max_sequence_length
Nombre
max_sequence_length >= 20 et max_sequence_length > max_new_tokens
2048
Ce paramètre permet de spécifier la longueur maximale de la séquence pour votre modèle.