0 / 0
Retourner à la version anglaise de la documentation
Ajouter une fonction de chat génératif à vos applications avec l'API de chat
Dernière mise à jour : 06 déc. 2024
Ajouter une fonction de chat génératif à vos applications avec l'API de chat

Utilisez l'API de chat watsonx.ai pour créer des flux de conversation qui utilisent des modèles de fondation pour générer des réponses.

L'API de chat de watsonx.ai met en œuvre des méthodes pour interagir avec les modèles de fondation de manière conversationnelle. Vous pouvez identifier différents types de messages, tels qu'une invite du système, les entrées de l'utilisateur et les sorties du foundation model, y compris les questions et réponses de suivi spécifiques à l'utilisateur. Utilisez l'API de chat pour imiter le flux de travail que vous obtenez lorsque vous interagissez avec un foundation model à partir de Prompt Lab en mode chat.

Modèles de fondations soutenus

Les modèles Foundation avec les ID de modèle suivants peuvent être utilisés pour construire un flux de travail conversationnel avec l'API de chat :

  • ibm/granite-20b-code-instruct
  • ibm/granite-34b-code-instruct
  • ibm/granite-3-2b-instruct
  • ibm/granite-3-8b-instruct
  • meta-llama/llama-3-1-70b-instruct
  • meta-llama/llama-3-1-8b-instruct
  • meta-llama/llama-3-2-1b-instruct
  • meta-llama/llama-3-2-3b-instruct
  • meta-llama/llama-3-2-11b-vision-instruct
  • meta-llama/llama-3-2-90b-vision-instruct
  • meta-llama/llama-3-3-70b-instruct
  • meta-llama/llama-3-405b-instruct
  • meta-llama/llama-3-70b-instruct
  • meta-llama/llama-3-8b-instruct
  • meta-llama/llama-guard-3-11b-vision
  • mistral-large

Pour obtenir de manière programmatique une liste des modèles de fondation qui prennent en charge l'API de chat, spécifiez le paramètre " filters=function_text_chat lorsque vous soumettez une demande de méthode " Liste des modèles de fondation disponibles".

Voir la référence de l'API.

Par exemple :

curl -X GET \
  'https://{region}.ml.cloud.ibm.com/ml/v1/foundation_model_specs?version=2024-10-10&filters=function_text_chat'

Pour plus d'informations sur les modèles de base qui prennent en charge l'appel d'outils, voir Construire des flux de travail pilotés par des agents avec l'API de chat.

Exemples de blocs-notes

Les exemples de carnets suivants sont disponibles :

Détails relatifs aux API

Pour plus de détails sur les méthodes de l'API, voir la documentation de référence de l'API.

Les exemples suivants montrent comment utiliser l'API REST pour les tâches suivantes :

Exemple d'un chat à utilisateurs multiples

Par exemple, la commande suivante soumet une demande de discussion avec le foundation model.

Dans l'exemple suivant, remplacez la variable " {url} par la valeur correspondant à votre instance, par exemple " us-south.ml.cloud.ibm.com. Ajoutez votre propre jeton porteur et votre identifiant de projet.

curl --request POST '{url}/ml/v1/text/chat?version=2024-10-08'
-H 'Authorization: Bearer eyJhbGciOiJSUzUxM...'
-H 'Content-Type: application/json'
-H 'Accept: application/json'
-d '{
  "model_id": "meta-llama/llama-3-8b-instruct",
  "project_id": "4947c695-a374-428c-acca-332c1a1dc9e9",
  "messages": [
    {
      "role": "system",
      "content": "You are a helpful assistant that avoids causing harm. When you do not know the answer to a question, you say 'I don't know'."
    },
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "I have a question about Earth. How many moons does the Earth have?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": "The Earth has one natural satellite, which is simply called the Moon."
    },
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "What about Saturn?"
        }
      ]
    }
  ],
  "max_tokens": 300,
  "time_limit": 1000
}'
  

Exemple de réponse :

{
  "id": "chat-45932923166b4607bde75207a0a9f5d4",
  "model_id": "meta-llama/llama-3-8b-instruct",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Saturn has a total of 82 confirmed moons!"
      },
      "finish_reason": "stop"
    }
  ],
  "created": 1728404199,
  "created_at": "2024-10-08T16:16:40.102Z",
  "usage": {
    "completion_tokens": 12,
    "prompt_tokens": 87,
    "total_tokens": 99
  },
  "system": {
    "warnings": [
      {
        "message": "This model is a Non-IBM Product governed by a third-party license that may impose use restrictions and other obligations. By using this model you agree to its terms as identified in the following URL.",
        "id": "disclaimer_warning",
        "more_info": "https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/fm-models.html?context=wx"
      }
    ]
  }
}

Exemple de discussion autour d'une image

Cet exemple demande au modèle d'expliquer ce que l'image suivante illustre.

Un diagramme qui montre un exemple de texte alternatif efficace pour une image.

L'exemple de code équivaut à un chat avec une image du Prompt Lab. Pour plus d'informations sur la méthode alternative qui utilise l'interface utilisateur, voir Chat avec des images téléchargées.

Les exigences en matière d'images pour les images que vous référencez à partir de l'API de chat sont les suivantes :

  • Ajouter une image par chat
  • Les types de fichiers pris en charge sont PNG ou JPEG
  • Une image compte pour environ 1 200 à 3 000 jetons, selon la taille de l'image

Pour que l'image puisse être traitée, vous devez l'encoder en Base64, qui convertit les données binaires de l'image en une chaîne de caractères. Vous pouvez utiliser un outil en ligne pour convertir l'image ou utiliser un code.

L'exemple de code Python suivant encode une image hébergée. Si vous appelez l'API REST à partir d'un cahier Python, vous pouvez utiliser ce code pour encoder l'image. Ensuite, lorsque vous définissez la requête POST, vous pouvez spécifier la variable encoded_string comme valeur url

import wget, os, base64

filename = 'image.png'
url = 'https://www.ibm.com/able/static/content_2_5_eg-241650b1f0e19a9f82206c9124b7895f.png'

if not os.path.isfile(filename):
    wget.download(url, out=filename)

with open(filename, 'rb') as image_file:
    encoded_string = base64.b64encode(image_file.read()).decode('utf-8')

La demande API REST suivante utilise l'API "chat" pour discuter d'une image spécifiée par une chaîne Base64-encoded.

Dans l'exemple suivant, remplacez{url}variable with the right value for your instance, such asus-south.ml.cloud.ibm.com. Ajoutez votre propre jeton de porteur et votre ID de projet.

curl --request POST '{url}/ml/v1/text/chat?version=2024-10-09'
-H 'Authorization: Bearer eyJhbGciOiJSUzUxM...'
-H 'Content-Type: application/json'
-H 'Accept: application/json'
-d '{
    "model_id": "meta-llama/llama-3-2-11b-vision-instruct",
    "project_id": "4947c695-a374-428c-acca-332c1a1dc9e9",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": ""
            }
          },
          {
            "type": "text",
            "text": "What does the image convey about alternative image text?"
          }
        ]
      }
    ],
    "max_tokens": 300,
    "time_limit": 10000
  }'

Exemple de réponse :

{
  "id": "chat-f5f3ab2b8d7f4657b72a4f868e24f3fd",
  "model_id": "meta-llama/llama-3-2-90b-vision-instruct",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The image shows a bar chart on a laptop screen with alternative image text that describes the content of the image. The alternative image text is \"bar chart showing month's daily sales against historical average.\" This text provides a clear and concise description of the image, allowing users who cannot see the image to understand its content.\n\n**Key Points:**\n\n*   The image is a bar chart on a laptop screen.\n*   The alternative image text describes the content of the image.\n*   The alternative image text is \"bar chart showing month's daily sales against historical average.\"\n*   The text provides a clear and concise description of the image.\n\n**Conclusion:**\n\nThe image conveys that alternative image text should be used to provide a clear and concise description of an image, even if the image cannot be seen. This is important for accessibility reasons, as it allows users who cannot see the image to still understand its content."
      },
      "finish_reason": "stop"
    }
  ],
  "created": 1728564568,
  "model_version": "3.2.0",
  "created_at": "2024-10-10T12:49:35.286Z",
  "usage": {
    "completion_tokens": 184,
    "prompt_tokens": 21,
    "total_tokens": 205
  },
  "system": {
    "warnings": [
      {
        "message": "This model is a Non-IBM Product governed by a third-party license that may impose use restrictions and other obligations. By using this model you agree to its terms as identified in the following URL.",
        "id": "disclaimer_warning",
        "more_info": "https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/fm-models.html?context=wx"
      }
    ]
  }
}

Dépannage de l'API de chat

Si la réponse est au format HTML et mentionne " Gateway time-out, la demande a probablement été trop longue et a expiré. Augmenter la valeur du champ " time_limit que vous spécifiez dans la demande.

En savoir plus

Sujet parent : Coder des solutions d'IA générative

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus