Translation not up to date
AutoAI modellerini eğittiğinizde, makine öğrenimi modellerini çalıştırdığınızda ya da devreye alınan modelleri puanladığınızda kapasite birimi saatleriyle (CUH) ölçülen Watson Machine Learning kaynaklarını kullanırsınız. Temel modellerle inferencing hizmetlerini çalıştırdığınızda kaynak birimleriyle (RU) ölçülen Watson Machine Learning kaynaklarını kullanırsınız. Bu konuda, seçebileceğiniz çeşitli planlar, hangi hizmetlerin dahil olduğu ve bilgi işlem kaynaklarının nasıl hesaplandığı açıklanır.
Cloud Pak for Data as a Service ve watsonx içinde Watson Machine Learning
Watson Machine Learning planı, watsonx.aiile ilgili ayrıntıları içerir. Watsonx.ai , temel modeller ve makine öğrenimi modelleriyle desteklenen, üretken yapay zekâyla çalışmak için bütünleştirilmiş araçların bir stüdyosudur. Cloud Pak for Data as a Servicekullanıyorsanız, temel modellerle çalışmaya ve Kaynak Birimlerini kullanarak bilgi istemi inferansına ilişkin ayrıntılar planınız için geçerli değildir.
watsonx.aiile ilgili daha fazla bilgi için bkz:
- IBM watsonx.aiürününe genel bakış
- IBM watsonx ve Cloud Pak for Data as a Servicekarşılaştırması
- IBM watsonx.aiiçin kaydolma
Hem watsonx hem de Cloud Pak for Data as a Serviceiçin etkinleştirildiyseniz, iki platform arasında geçiş yapabilirsiniz.
Watson Machine Learning planının seçilmesi
Planların karşılaştırmasını görüntüleyin ve gereksinimlerinize uygun bir plan seçmek için ayrıntıları göz önünde bulundurun.
- Watson Machine Learning planları
- Kapasite Birim Saatleri (CUH), belirteçler ve Kaynak Birimleri (RU)
- Watson Machine Learning plan ayrıntıları
- Kapasite Birimi Saat ölçümü
- CUH ve RU kullanımının izlenmesi
Watson Machine Learning planları
Watson Machine Learning planları, Watson Machine Learning ile eğitildiğiniz ve devreye aldığınız modeller için ve temel modellerle kullandığınız bilgi istemleri için faturalandırmanızı düzenler. Gereksinimlerinize göre bir plan seçin:
- Lite , sınırlı kapasiteye sahip ücretsiz bir plandır. Watson Machine Learning ürününü değerlendiriyorsanız ve yetenekleri denemek istiyorsanız bu planı seçin.
- Essentials , size gereksinimlerinize uygun modeller oluşturma, devreye alma ve yönetme esnekliği sağlayan, kullandığın kadar öde planıdır.
- Standart , bir kuruluşun makine öğrenimi gereksinimlerinin tümünü desteklemek üzere tasarlanmış, yüksek kapasiteli bir kurumsal plandır. Kapasite birimi saatleri sabit bir hızda sağlanırken, kaynak birimi tüketimi "olduğu gibi öde" dir.
Plan ayrıntıları ve fiyatlandırması için bkz. IBM Cloud Machine Learning.
Kapasite Birim Saatleri (CUH), belirteçler ve Kaynak Birimleri (RU)
Ölçüm ve faturalama amacıyla, makine öğrenimi modelleri ve devreye alımları veya temel modelleri aşağıdaki birimlerle ölçülür:
Kapasite Birim Saatleri (CUH), kullanım ve faturalandırma amacıyla birim saat başına kaynak tüketimini ölçer. CUH, Temel Model çıkarma dışında tüm Watson Machine Learning etkinliğini ölçer.
Kaynak Birimleri (RU) temel model inferencing tüketimini ölçer. İnferencing, bir bilgi istemine yanıt olarak çıktı oluşturmak için temel modeli çağırma işlemindir. Her RU, 1.000 simgeyeeşittir. Simge, temel model bilgi istemine ilişkin giriş ya da çıkışta kullanılan temel bir metin birimidir (genellikle 4 karakter ya da 0.75 sözcük). Kullanım gereksinimlerinize karşılık gelen bir plan seçin. Belirteçlerle ilgili ayrıntılar için bkz. Simgeler ve simgeleştirme.
Hız sınırı , belirli bir Watson Machine Learning plan eşgörünümüne ilişkin temel modeller için işlenen saniye başına sınırlama isteği sayısını izler ve sınırlar. Ücret sınırı, ücretli planlar için ücretsiz Lite planından daha yüksek.
Watson Machine Learning plan ayrıntıları
Lite planı, watsonx.ai' nin yeteneklerini değerlendirmek için yeterli sayıda ücretsiz kaynak sağlar. Daha sonra, plan özelliklerine ve kapasitesine dayalı olarak kuruluşunuzun gereksinimlerini karşılayan ücretli bir plan seçebilirsiniz.
Plan özellikleri | Basit | Essentials | Standart |
---|---|---|---|
CUH ' da Machine Learning kullanımı | Ayda 20 CUH | CUH oranına dayalı CUH faturalandırması, tüketim saatleriyle çarpılır | Ayda 2500 CUH |
Belirteçlerde ya da Kaynak Birimlerinde (RU) temel model infermantamesi | Ayda 50.000 belirteç | Kullanım için faturalandı (1000 belirteç = 1 RU) | Kullanım için faturalandı (1000 belirteç = 1 RU) |
Devreye alma başına koşut Decision Optimization toplu iş sayısı üst sınırı | 2 | 5 | 100 |
Alan başına alıkonan konuşlandırma işleri | 100 | 1000 | 3000 |
Boşta durma süresi | 1 gün | 3 gün | 3 gün |
HIPAA desteği | Yoktur | Yoktur | Yalnızca Dallas bölgesi IBM Cloud hesabınızda etkinleştirilmelidir |
Plan tanıtıcısı başına hız sınırı | Saniyede 2 çıkarım isteği | Saniyede 8 çıkarım isteği | Saniyede 8 çıkarım isteği |
Tüm planlar için:
- Foundational Model inferencing Kaynak Birimleri (RU), giriş ve çıkış da dahil olmak üzere Bilgi İstemi Laboratuvarı infermantasyonda kullanılabilir. Yani, giriş için girdiğiniz bilgi istemi, oluşturulan çıkışa ek olarak sayılır. (yalnızcawatsonx )
- Temel model inferencing özelliği yalnızca Dallas ve Frankfurt veri merkezlerinde kullanılabilir. (yalnızcawatsonx )
- RU hızını üç model sınıfı belirler. RU başına fiyat, model sınıfına göre değişir. (yalnızcawatsonx )
- Eğitim için kapasite-birim-saat (CUH) hızı tüketimi, eğitim aracı, donanım belirtimi ve çalıştırma zamanı ortamına dayalıdır.
- Devreye alma için kapasite birim saat (CUH) hızı tüketimi, devreye alma tipine, donanım belirtimine ve yazılım belirtimine dayalıdır.
- Watson Machine Learning , her bir devreye alma alanıiçin tutulan devreye alma işleri sayısına sınırlar koyar. Sınırınızı aşarsanız, var olan işleri silmeden ya da planınızı yükseltmeden yeni yerleştirme işleri oluşturamazsınız. Varsayılan olarak, iş meta verileri 30 gün sonra otomatik olarak silinir. Bir iş yaratırken bu değeri geçersiz kılabilirsiniz. Bkz. İşleri yönetme.
- Boşta durma süresi, puanlama istekleri arasında etkin bir devreye almayı göz önünde bulundurmak için geçen süreyi ifade eder. Bir devreye alma belirli bir süre için puanlama isteklerini almazsa, etkin değil ya da boşta olarak kabul edilir ve SPSSdışındaki tüm çerçeveler için faturalama durur.
- Bir plan en azından belirtilen oran sınırına izin verir ve gerçek oran sınırı belirtilen sınırdan daha yüksek olabilir. Örneğin, Lite planı bir hata vermeden saniyede 2 'den fazla isteği işleyebilir. Ücretli bir planınız varsa ve hata durumunda hız sınırına ulaştığınıza inanıyorsanız, yardım almak için IBM Destek ile iletişim kurun.
Plan ayrıntıları ve fiyatlandırması için bkz. IBM Cloud Machine Learning.
Kaynak birimi ölçümü (watsonx)
Kaynak Birimleri faturalandırması, temel modele ilişkin faturalama sınıfının oranına dayalı olarak Kaynak Birimlerinin (RU) sayısıyla çarpılır. Bir Kaynak Birimi, temel model çıkarmanın giriş ve çıkışından 1000 simgeye eşittir. Üç temel model faturalama sınıfında farklı RU oranları vardır.
Modeli | Köken | Faturalama sınıfı | RU başına fiyat |
---|---|---|---|
granite-13b-instruct-v1 | IBM | Sınıf 3 | RU başına $0.0050 |
granite-13b-chat-v1 | IBM | Sınıf 3 | RU başına $0.0050 |
flan-t5-xxl-11b | Açık kaynak | Sınıf 2 | RU başına $0.0018 |
flan-ul2-20b | Açık kaynak | Sınıf 3 | RU başına $0.0050 |
gpt-neox-20b | Açık kaynak | Sınıf 3 | RU başına $0.0050 |
llama-2-13b-chat | Açık kaynak | Sınıf 2 | RU başına $0.0018 |
llama-2-70b-chat | Açık kaynak | Sınıf 3 | RU başına $0.0050 |
mpt-7b-instruct2 | Açık kaynak | Sınıf 1 | RU başına0.0006 $ |
mt0-xxl-13b | Açık kaynak | Sınıf 2 | RU başına $0.0018 |
starcoder-15.5b | Açık kaynak | Sınıf 2 | RU başına $0.0018 |
Her bir modelle ilgili daha fazla bilgi için Desteklenen temel modellerbaşlıklı konuya bakın. Her bir model için bölgesel destek hakkında bilgi için bkz. Temel modeller için bölgesel kullanılabilirlik.
Kapasite Birimi Saat ölçümü (watsonx ve Watson Machine Learning)
CUH tüketimi, bir görev için uyguladığınız hesaplamalı donanım kaynaklarının yanı sıra yazılım belirtimi ve model tipi gibi diğer faktörlerden etkilenir.
Varlık tipine göre CUH tüketim oranları
Varlık tipi | Kapasite tipi | Saat başına kapasite birimi |
---|---|---|
AutoAI deneyi | 8 vCPU ve 32 GB RAM | 20 |
Decision Optimization eğitimi | 2 vCPU ve 8 GB RAM 4 vCPU ve 16 GB RAM 8 vCPU ve 32 GB RAM 16 vCPU ve 64 GB RAM |
6 7 9 13 |
Decision Optimization devreye alımları | 2 vCPU ve 8 GB RAM 4 vCPU ve 16 GB RAM 8 vCPU ve 32 GB RAM 16 vCPU ve 64 GB RAM |
30 40 50 60 |
Machine Learning modelleri (eğitim, değerlendirme ya da puanlama) |
1 vCPU ve 4 GB RAM 2 vCPU ve 8 GB RAM 4 vCPU ve 16 GB RAM 8 vCPU ve 32 GB RAM 16 vCPU ve 64 GB RAM |
0.5 1 2 4 8 |
Devreye alma ve çerçeve tipine göre CUH tüketimi
Konuşlandırmalar için CUH tüketimi şu formüller kullanılarak hesaplanır:
Devreye alma tipi | Çerçeve | CUH hesaplaması |
---|---|---|
Çevrimiçi | AutoAI, Python işlevleri ve komut dosyaları, SPSS, Scikit-Özel kitaplıkları öğrenin, Tensorflow, RShiny | deployment_active_duration * no_of_nodes * CUH_rate_for_capacity_type_framework |
Çevrimiçi | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | score_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework |
Toplu | tüm çerçeveler | job_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework |
Kaynak kullanımının izlenmesi
Sahip olduğunuz varlıklara ilişkin CUH ya da RU kullanımını izleyebilir ya da bir proje ya da alanda işbirliği yapabilirsiniz. Bir hesap sahibi ya da yöneticiyseniz, bir hesabın tamamı için CUH ya da RU kullanımını izleyebilirsiniz.
Bir projede CUH ya da RU kullanımını izleme
Bir projedeki CUH ya da RU tüketimini izlemek için:
Bir proje için Yönet sekmesine gidin.
Proje ya da alandaki varlıklara ilişkin kaynak tüketiminin bir özetini gözden geçirmek ya da belirli varlıklara ilişkin kaynak tüketimi ayrıntılarını gözden geçirmek için Kaynaklar ' ı tıklatın.
Bir hesap için CUH kullanımını izleme
IBM Cloud hesap sahibi ya da yöneticisiyseniz ya da Watson Machine Learning hizmet sahibiyseniz, Ortam Yürütme Ortamları sayfasında bir hesabın çalıştırma zamanı kullanımını izleyebilirsiniz. Ayrıntılar için bkz. Kaynakları izleme.
Bir dizüstü bilgisayarda makine öğrenimi için CUH tüketimini izleme
Bir dizüstü bilgisayardaki kapasite birimi saatlerini hesaplamak için aşağıdaki işlemleri kullanın:
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
Örneğin:
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
5.49 CUH değerini döndürür
Ayrıntılar için IBM Watson Machine Learning API belgelerinin Hizmet Eşgörünümleri bölümüne bakın.
Daha fazla bilgi
- AutoAI deneyleri için bilgi işlem seçenekleri
- Model eğitimi ve puanlaması için hesaplama seçenekleri
Üst konu: Watson Machine Learning