0 / 0
Zurück zur englischen Version der Dokumentation
Einsatz von KI-Service-Assets
Letzte Aktualisierung: 15. Nov. 2024
Einsatz von KI-Service-Assets

Je nach Anwendungsfall können Sie eine Online- oder eine Batch-Bereitstellung für Ihr KI-Service-Asset in Ihrem Bereitstellungsbereich erstellen. Stellen Sie Ihren KI-Dienst über die watsonx.ai, die REST-API oder die Python bereit.

Einsatzarten für den KI-Dienst

Je nach Anwendungsfall können Sie das KI-Service-Asset als Online- oder Batch-Bereitstellung einsetzen. Wählen Sie die Bereitstellungsart auf der Grundlage der im KI-Dienst verwendeten Funktionen.

  • Sie müssen eine Online-Bereitstellung für Ihr KI-Service-Asset für Online-Scoring (KI-Service enthält die Funktion " generate() ) oder Streaming-Anwendungen (KI-Service enthält die Funktion " generate_stream() ) erstellen.
  • Sie müssen eine Batch-Bereitstellung für Ihr AI-Service-Asset für Batch-Scoring-Anwendungen erstellen (AI-Service enthält die Funktion " generate_batch() ).

Bereitstellung von KI-Diensten über die Benutzeroberfläche

Sie können Ihr KI-Service-Asset über die Benutzeroberfläche Ihres Bereitstellungsraums bereitstellen.

Voraussetzungen

  1. Sie müssen die Anmeldedaten für Ihre Aufgaben einrichten, um Ihre KI-Dienste bereitzustellen. Weitere Informationen finden Sie unter Hinzufügen von Berechtigungsnachweisen für Aufgaben.

  2. Sie müssen Ihre KI-Dienste in Ihrem Einsatzgebiet bekannt machen.

    Förderung eines KI-Service-Assets in einem Einsatzgebiet

Erstellung einer Online-Bereitstellung für AI-Dienste

Gehen Sie wie folgt vor, um eine Online-Bereitstellung für Ihr AI-Service-Asset über die Benutzeroberfläche des Bereitstellungsbereichs zu erstellen:

  1. Gehen Sie in Ihrem Bereitstellungsbereich auf die Registerkarte Assets.

  2. Klicken Sie für Ihr AI-Service-Asset in der Asset-Liste auf das Menü-Symbol und wählen Sie Bereitstellen.

  3. Wählen Sie Online als Bereitstellungsart.

    Der Screenshot zeigt, wie man eine Online-Bereitstellung für einen KI-Dienst erstellt

  4. Geben Sie einen Namen für Ihre Bereitstellung ein und geben Sie optional einen Serving-Namen, eine Beschreibung und Tags ein.

  5. Klicken Sie auf Erstellen.

Erstellen einer Batch-Bereitstellung für AI-Dienste

Gehen Sie wie folgt vor, um eine Batch-Bereitstellung für Ihr AI-Service-Asset über die Benutzeroberfläche des Bereitstellungsbereichs zu erstellen:

  1. Gehen Sie in Ihrem Bereitstellungsbereich auf die Registerkarte Assets.

  2. Klicken Sie für Ihr AI-Service-Asset in der Asset-Liste auf das Menü-Symbol und wählen Sie Bereitstellen.

  3. Wählen Sie Batch als Bereitstellungsart.

    Der Screenshot zeigt, wie man eine Batch-Bereitstellung für einen KI-Dienst erstellt

  4. Geben Sie einen Namen für Ihre Bereitstellung ein und geben Sie optional einen Serving-Namen, eine Beschreibung und Tags ein.

  5. Wählen Sie eine Hardware-Spezifikation:

    • Extra klein: 1 CPU und 4 GB RAM
    • Klein: 2 CPU und 8 GB RAM
    • Mittel: 4 CPU und 16 GB RAM
    • Groß: 8 CPU und 32 GB RAM
    • Extra groß: 16 CPU und 64 GB RAM
  6. Klicken Sie auf Erstellen.

Bereitstellung von KI-Diensten mit der Python

Sie können eine Online- oder Batch-Bereitstellung für Ihr KI-Service-Asset mithilfe der Python erstellen.

Online-Bereitstellung erstellen

Das folgende Beispiel zeigt, wie Sie eine Online-Bereitstellung für Ihren KI-Dienst mithilfe der Python watsonx.ai erstellen:

deployment_details = client.deployments.create(
    artifact_id=ai_service_id,
    meta_props={
        client.deployments.ConfigurationMetaNames.NAME: "ai-service - online test",
        client.deployments.ConfigurationMetaNames.ONLINE: {},
        client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
            "id": client.hardware_specifications.get_id_by_name("XS")
        },
    },
)
deployment_id = client.deployments.get_uid(deployment_details)
print("The deployment id:", deployment_id)

Erstellen einer Batch-Bereitstellung

Das folgende Beispiel zeigt, wie Sie eine Batch-Bereitstellung für Ihren KI-Dienst mithilfe der Python watsonx.ai erstellen:

deployment_details = client.deployments.create(
    artifact_id=ai_service_id,
    meta_props={
        client.deployments.ConfigurationMetaNames.NAME: f"ai-service - batch",
        client.deployments.ConfigurationMetaNames.BATCH: {},
        client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
            "id": client.hardware_specifications.get_id_by_name("XS")
        },
    },
)
deployment_id = client.deployments.get_uid(deployment_details)
print("The batch deployment id:", deployment_id)

Bereitstellung von KI-Diensten mit REST API

Sie können den REST-API-Endpunkt ' /ml/v4/deployments watsonx.ai verwenden, um eine Online- oder Batch-Bereitstellung für Ihr KI-Service-Asset zu erstellen.

Online-Bereitstellung erstellen

Das folgende Beispiel zeigt, wie Sie mit Hilfe der REST-API eine Online-Bereitstellung für Ihren KI-Dienst erstellen:

# POST /ml/v4/deployments
response = requests.post(
    f'{HOST}/ml/v4/deployments?version={VERSION}',
    headers=headers,
    verify=False,
    json={
        "space_id": space_id,
        "name": "genai flow online",
        "custom": {
            "key1": "value1",
            "key2": "value2",
            "model": "meta-llama/llama-3-8b-instruct"
        },
        "asset": {
            "id": asset_id
        },
        "online": {}
    }
)

Erstellen einer Batch-Bereitstellung

Das folgende Beispiel zeigt, wie Sie mit Hilfe der REST-API eine Batch-Bereitstellung für Ihren KI-Dienst erstellen:

response = requests.post(
    f'{HOST}/ml/v4/deployments?version={VERSION}',
    headers=headers,
    verify=False,
    json={
        "hardware_spec": {
          "id": "........",
          "num_nodes": 1
        },
        "space_id": space_id,
        "name": "ai service batch dep",
        "custom": {
            "key1": "value1",
            "key2": "value2",
            "model": "meta-llama/llama-3-8b-instruct"
        },
        "asset": {
            "id": asset_id
        },
        "batch": {}
    }
)
print(f'POST {HOST}/ml/v4/deployments?version={VERSION}', response.status_code)
print(json.dumps(response.json(), indent=2))

dep_id = response.json()["metadata"]["id"]

print(f"{dep_id=}")

Weitere Informationen

Übergeordnetes Thema: Bereitstellung von KI-Diensten mit direkter Kodierung

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen