Um einen KI-Dienst bereitzustellen, müssen Sie ein Repository-Asset in watsonx.ai Runtime erstellen, das den KI-Dienst enthält, und die Python in das Asset hochladen.
Anforderungen für die Erstellung von KI-Service-Assets
Wenn Sie eine integrierte Entwicklungsumgebung (IDE) wie VSCode, eclipse, PyCharm, oder andere verwenden, um Ihre generative KI-Anwendung zu erstellen, müssen Sie eine Python erstellen, um Ihren KI-Dienst zu speichern. Sobald Sie die Funktion definiert haben, müssen Sie den AI-Dienst komprimieren, um ein ' gzip
(Dateiformat.gz
) zu erstellen.
Wenn Sie die Python watsonx.ai verwenden, um Ihr KI-Service-Asset zu erstellen, speichert die Bibliothek die Funktion automatisch im Archiv " gzip
für Sie. Wenn Sie jedoch ein KI-Service-Asset über die REST-API erstellen, müssen Sie Ihre Python manuell in ein " gzip
komprimieren.
Sie müssen die Softwarespezifikation " runtime-24.1-py3.11
verwenden, um ein KI-Service-Asset zu erstellen und bereitzustellen, das in Python kodiert ist.
Erstellen von KI-Service-Assets mit der Python
Sie können die Funktion " store_ai_service
der Python watsonx.ai verwenden, um ein KI-Service-Asset zu erstellen.
Das folgende Code-Beispiel zeigt, wie ein KI-Service-Asset mit Hilfe der Python erstellt wird:
documentation_request = {
"application/json": {
"$schema": "http://json-schema.org/draft-07/schema#",
"type": "object",
"properties": {
"query": {"type": "string"},
"parameters": {
"properties": {
"max_new_tokens": {"type": "integer"},
"top_p": {"type": "number"},
},
"required": ["max_new_tokens", "top_p"],
},
},
"required": ["query"],
}
}
documentation_response = {
"application/json": {
"$schema": "http://json-schema.org/draft-07/schema#",
"type": "object",
"properties": {"query": {"type": "string"}, "result": {"type": "string"}},
"required": ["query", "result"],
}
}
meta_props = {
client.repository.AIServiceMetaNames.NAME: "AI service example",
client.repository.AIServiceMetaNames.DESCRIPTION: "This is AI service function",
client.repository.AIServiceMetaNames.SOFTWARE_SPEC_ID: client.software_specifications.get_id_by_name(
"runtime-24.1-py3.11"
),
client.repository.AIServiceMetaNames.REQUEST_DOCUMENTATION: documentation_request,
client.repository.AIServiceMetaNames.RESPONSE_DOCUMENTATION: documentation_response,
}
stored_ai_service_details = client.repository.store_ai_service(
basic_generate_demo, meta_props
)
ai_service_id = client.repository.get_ai_service_id(stored_ai_service_details)
print("The AI service asset id:", ai_service_id)
- Die Parameter "
REQUEST_DOCUMENTATION
und "RESPONSE_DOCUMENTATION
sind optional. Sie können diese Parameter verwenden, um das Schema der Anfrage und der Antwort der Funktionen "generate
und "generate_stream
zu speichern. - Der Funktionsaufruf '
client.repository.store_ai_service
speichert die AI-Servicefunktion 'basic_generate_demo
intern in einer 'gzip
-Datei.
Weitere Informationen finden Sie in der Dokumentation der Pythonwatsonx.ai zur Erstellung eines KI-Service-Assets.
Erstellen eines AI-Service-Assets mit REST API
Sie können den REST-API-Endpunkt " /ml/v4/ai_services
verwenden, um das KI-Dienst-Asset im watsonx.ai Runtime-Repository zu erstellen. Weitere Informationen finden Sie in der REST-API-Dokumentation vonwatsonx.ai.
Weitere Informationen
Übergeordnetes Thema: Bereitstellung von KI-Diensten mit direkter Kodierung