0 / 0
Go back to the English version of the documentation
Watson Machine Learning planları ve bilgi işlem kullanımı

Watson Machine Learning planları ve bilgi işlem kullanımı

AutoAI modellerini eğittiğinizde, makine öğrenimi modellerini çalıştırdığınızda ya da devreye alınan modelleri puanladığınızda kapasite birimi saatleriyle (CUH) ölçülen Watson Machine Learning kaynaklarını kullanırsınız. Temel modellerle inferencing hizmetlerini çalıştırdığınızda kaynak birimleriyle (RU) ölçülen Watson Machine Learning kaynaklarını kullanırsınız. Bu konuda, seçebileceğiniz çeşitli planlar, hangi hizmetlerin dahil olduğu ve bilgi işlem kaynaklarının nasıl hesaplandığı açıklanır.

Cloud Pak for Data as a Service ve watsonx içinde Watson Machine Learning

Önemli:

Watson Machine Learning planı, watsonx.aiile ilgili ayrıntıları içerir. Watsonx.ai , temel modeller ve makine öğrenimi modelleriyle desteklenen, üretken yapay zekâyla çalışmak için bütünleştirilmiş araçların bir stüdyosudur. Cloud Pak for Data as a Servicekullanıyorsanız, temel modellerle çalışmaya ve Kaynak Birimlerini kullanarak bilgi istemi inferansına ilişkin ayrıntılar planınız için geçerli değildir.

Hem watsonx hem de Cloud Pak for Data as a Serviceiçin etkinleştirildiyseniz, iki platform arasında geçiş yapabilirsiniz.

Watson Machine Learning planının seçilmesi

Planların karşılaştırmasını görüntüleyin ve gereksinimlerinize uygun bir plan seçmek için ayrıntıları göz önünde bulundurun.

Watson Machine Learning planları

Watson Machine Learning planları, Watson Machine Learning ile eğitildiğiniz ve devreye aldığınız modeller için ve temel modellerle kullandığınız bilgi istemleri için faturalandırmanızı düzenler. Gereksinimlerinize göre bir plan seçin:

  • Lite , sınırlı kapasiteye sahip ücretsiz bir plandır. Watson Machine Learning ürününü değerlendiriyorsanız ve yetenekleri denemek istiyorsanız bu planı seçin.
  • Essentials , size gereksinimlerinize uygun modeller oluşturma, devreye alma ve yönetme esnekliği sağlayan, kullandığın kadar öde planıdır.
  • Standart , bir kuruluşun makine öğrenimi gereksinimlerinin tümünü desteklemek üzere tasarlanmış, yüksek kapasiteli bir kurumsal plandır. Kapasite birimi saatleri sabit bir hızda sağlanırken, kaynak birimi tüketimi "olduğu gibi öde" dir.

Plan ayrıntıları ve fiyatlandırması için bkz. IBM Cloud Machine Learning.

Kapasite Birim Saatleri (CUH), belirteçler ve Kaynak Birimleri (RU)

Ölçüm ve faturalama amacıyla, makine öğrenimi modelleri ve devreye alımları veya temel modelleri aşağıdaki birimlerle ölçülür:

  • Kapasite Birim Saatleri (CUH), kullanım ve faturalandırma amacıyla birim saat başına kaynak tüketimini ölçer. CUH, Temel Model çıkarma dışında tüm Watson Machine Learning etkinliğini ölçer.

  • Kaynak Birimleri (RU) temel model inferencing tüketimini ölçer. İnferencing, bir bilgi istemine yanıt olarak çıktı oluşturmak için temel modeli çağırma işlemindir. Her RU, 1.000 simgeyeeşittir. Simge, temel model bilgi istemine ilişkin giriş ya da çıkışta kullanılan temel bir metin birimidir (genellikle 4 karakter ya da 0.75 sözcük). Kullanım gereksinimlerinize karşılık gelen bir plan seçin.

  • Hız sınırı , belirli bir Watson Machine Learning plan eşgörünümüne ilişkin temel modeller için işlenen saniye başına sınırlama isteği sayısını izler ve sınırlar. Ücret sınırı, ücretli planlar için ücretsiz Lite planından daha yüksek.

Watson Machine Learning plan ayrıntıları

Lite planı, watsonx.ai' nin yeteneklerini değerlendirmek için yeterli sayıda ücretsiz kaynak sağlar. Daha sonra, plan özelliklerine ve kapasitesine dayalı olarak kuruluşunuzun gereksinimlerini karşılayan ücretli bir plan seçebilirsiniz.

Tablo 1. Plan ayrıntıları
Plan özellikleri Basit Essentials Standart
CUH ' da Machine Learning kullanımı Ayda 20 CUH CUH oranına dayalı CUH faturalandırması, tüketim saatleriyle çarpılır Ayda 2500 CUH
Belirteçlerde ya da Kaynak Birimlerinde (RU) temel model infermantamesi Ayda 50.000 belirteç Kullanım için faturalandı (1000 belirteç = 1 RU) Kullanım için faturalandı (1000 belirteç = 1 RU)
Devreye alma başına koşut Decision Optimization toplu iş sayısı üst sınırı 2 5 100
Alan başına alıkonan konuşlandırma işleri 100 1000 3000
Boşta durma süresi 1 gün 3 gün 3 gün
HIPAA desteği Yoktur Yoktur Yalnızca Dallas bölgesi
IBM Cloud hesabınızda etkinleştirilmelidir
Plan tanıtıcısı başına hız sınırı Saniyede 2 çıkarım isteği Saniyede 8 çıkarım isteği Saniyede 8 çıkarım isteği

Not: Essentials 'tan Standard 'a yükseltme yaparsanız, Essentials planına geri dönemezsiniz. Yeni bir plan oluşturmalısınız.

Tüm planlar için:

  • Foundational Model inferencing Kaynak Birimleri (RU), giriş ve çıkış da dahil olmak üzere Bilgi İstemi Laboratuvarı infermantasyonda kullanılabilir. Yani, giriş için girdiğiniz bilgi istemi, oluşturulan çıkışa ek olarak sayılır. (yalnızcawatsonx )
  • Temel model inferencing özelliği yalnızca Dallas ve Frankfurt veri merkezlerinde kullanılabilir. (yalnızcawatsonx )
  • RU hızını üç model sınıfı belirler. RU başına fiyat, model sınıfına göre değişir. (yalnızcawatsonx )
  • Eğitim için kapasite-birim-saat (CUH) hızı tüketimi, eğitim aracı, donanım belirtimi ve çalıştırma zamanı ortamına dayalıdır.
  • Devreye alma için kapasite birim saat (CUH) hızı tüketimi, devreye alma tipine, donanım belirtimine ve yazılım belirtimine dayalıdır.
  • Watson Machine Learning , her bir devreye alma alanıiçin tutulan devreye alma işleri sayısına sınırlar koyar. Sınırınızı aşarsanız, var olan işleri silmeden ya da planınızı yükseltmeden yeni yerleştirme işleri oluşturamazsınız. Varsayılan olarak, iş meta verileri 30 gün sonra otomatik olarak silinir. Bir iş yaratırken bu değeri geçersiz kılabilirsiniz. Bkz. İşleri yönetme.
  • Boşta durma süresi, puanlama istekleri arasında etkin bir devreye almayı göz önünde bulundurmak için geçen süreyi ifade eder. Bir devreye alma belirli bir süre için puanlama isteklerini almazsa, etkin değil ya da boşta olarak kabul edilir ve SPSSdışındaki tüm çerçeveler için faturalama durur.
  • Bir plan en azından belirtilen oran sınırına izin verir ve gerçek oran sınırı belirtilen sınırdan daha yüksek olabilir. Örneğin, Lite planı bir hata vermeden saniyede 2 'den fazla isteği işleyebilir. Ücretli bir planınız varsa ve hata durumunda hız sınırına ulaştığınıza inanıyorsanız, yardım almak için IBM Destek ile iletişim kurun.

Plan ayrıntıları ve fiyatlandırması için bkz. IBM Cloud Machine Learning.

Kaynak birimi ölçümü (watsonx)

Kaynak Birimleri faturalandırması, temel modele ilişkin faturalama sınıfının oranına dayalı olarak Kaynak Birimlerinin (RU) sayısıyla çarpılır. Bir Kaynak Birimi, temel model çıkarmanın giriş ve çıkışından 1000 simgeye eşittir. Üç temel model faturalama sınıfında farklı RU oranları vardır.

Modeli Köken Faturalama sınıfı RU başına fiyat
granite-13b-instruct-v1 IBM Sınıf 3 RU başına $0.0050
granite-13b-chat-v1 IBM Sınıf 3 RU başına $0.0050
flan-t5-xxl-11b Açık kaynak Sınıf 2 RU başına $0.0018
flan-ul2-20b Açık kaynak Sınıf 3 RU başına $0.0050
gpt-neox-20b Açık kaynak Sınıf 3 RU başına $0.0050
llama-2-13b-chat Açık kaynak Sınıf 2 RU başına $0.0018
llama-2-70b-chat Açık kaynak Sınıf 3 RU başına $0.0050
mpt-7b-instruct2 Açık kaynak Sınıf 1 RU başına0.0006 $
mt0-xxl-13b Açık kaynak Sınıf 2 RU başına $0.0018
starcoder-15.5b Açık kaynak Sınıf 2 RU başına $0.0018

Kapasite Birim Saati ölçümü (watsonx ve Watson Machine Learning)

CUH tüketimi, bir görev için uyguladığınız hesaplamalı donanım kaynaklarının yanı sıra yazılım belirtimi ve model tipi gibi diğer faktörlerden etkilenir.

Varlık tipine göre CUH tüketim oranları

Masa 3. Varlık tipine göre CUH tüketim oranları
Varlık tipi Kapasite tipi Saat başına kapasite birimi
AutoAI deneyi 8 vCPU ve 32 GB RAM 20
Decision Optimization eğitimi 2 vCPU ve 8 GB RAM
4 vCPU ve 16 GB RAM
8 vCPU ve 32 GB RAM
16 vCPU ve 64 GB RAM
6
7
9
13
Decision Optimization devreye alımları 2 vCPU ve 8 GB RAM
4 vCPU ve 16 GB RAM
8 vCPU ve 32 GB RAM
16 vCPU ve 64 GB RAM
30
40
50
60
Machine Learning modelleri
(eğitim, değerlendirme ya da puanlama)
1 vCPU ve 4 GB RAM
2 vCPU ve 8 GB RAM
4 vCPU ve 16 GB RAM
8 vCPU ve 32 GB RAM
16 vCPU ve 64 GB RAM
0.5
1
2
4
8

Devreye alma ve çerçeve tipine göre CUH tüketimi

Konuşlandırmalar için CUH tüketimi şu formüller kullanılarak hesaplanır:

Masa 4. Devreye alma ve çerçeve tipine göre CUH tüketimi
Devreye alma tipi Çerçeve CUH hesaplaması
Çevrimiçi AutoAI, Python işlevleri ve komut dosyaları, SPSS, Scikit-Özel kitaplıkları öğrenin, Tensorflow, RShiny deployment_active_duration * no_of_nodes * CUH_rate_for_capacity_type_framework
Çevrimiçi Spark, PMML, Scikit-Learn, Pytorch, XGBoost score_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework
Toplu tüm çerçeveler job_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework

Kaynak kullanımının izlenmesi

Sahip olduğunuz varlıklara ilişkin CUH ya da RU kullanımını izleyebilir ya da bir proje ya da alanda işbirliği yapabilirsiniz. Bir hesap sahibi ya da yöneticiyseniz, bir hesabın tamamı için CUH ya da RU kullanımını izleyebilirsiniz.

Bir projede CUH ya da RU kullanımını izleme

Bir projedeki CUH ya da RU tüketimini izlemek için:

  1. Bir proje için Yönet sekmesine gidin.

  2. Proje ya da alandaki varlıklara ilişkin kaynak tüketiminin bir özetini gözden geçirmek ya da belirli varlıklara ilişkin kaynak tüketimi ayrıntılarını gözden geçirmek için Kaynaklar ' ı tıklatın.

    Bir projedeki kaynakların izlenmesi

Bir hesap için CUH kullanımını izleme

IBM Cloud hesap sahibi ya da yöneticisiyseniz ya da Watson Machine Learning hizmet sahibiyseniz, Ortam Yürütme Ortamları sayfasında bir hesabın çalıştırma zamanı kullanımını izleyebilirsiniz. Ayrıntılar için bkz. Kaynakları izleme.

Bir dizüstü bilgisayarda makine öğrenimi için CUH tüketimini izleme

Bir dizüstü bilgisayardaki kapasite birimi saatlerini hesaplamak için aşağıdaki işlemleri kullanın:

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

Örneğin:

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

5.49 CUH değerini döndürür

Ayrıntılar için IBM Watson Machine Learning API belgelerinin Hizmet Eşgörünümleri bölümüne bakın.

Daha fazla bilgi

Üst konu: Watson Machine Learning

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more