0 / 0
Go back to the English version of the documentation
AutoAI uygulama ayrıntıları
Last updated: 25 Ağu 2023
AutoAI uygulama ayrıntıları

AutoAI , verileri otomatik olarak hazırlar, algoritmaları ya da tahmin edicileri uygular ve verileriniz ve kullanım örneğiniz için en uygun model boru hatlarını oluşturur.

Aşağıdaki bölümlerde, boru hatlarının oluşturulmasına ilişkin bu teknik ayrıntılardan bazıları açıklanır ve AutoAI ' nin nasıl tasarlandığını ve uygulandığını açıklayan araştırma belgelerinin bir listesi sağlanır.

Verilerin eğitim için hazırlanması (veri ön işleme)

Otomatik veri hazırlama ya da ön işleme sırasında AutoAI , eğitim verilerini analiz eder ve model seçimi ve ardışık düzen oluşturma için hazırlar. Çoğu veri kümesi eksik değerler içerir, ancak makine öğrenimi algoritmaları genellikle eksik değer beklemez. Bu kural dışında, xgboost 3.4bölümünde açıklanmıştır. AutoAI algoritmaları, çeşitli teknikleri kullanarak ve verilerinizi makine öğrenimi için hazır hale getirerek veri kümenizde çeşitli eksik değer imputasyonları gerçekleştirir. Buna ek olarak AutoAI , kategorik ya da sayısal gibi veri tiplerine dayalı olarak özellikleri algılar ve kategorilere ayırır. Özellik sınıflandırmasına dayalı kodlama ve ölçekleme stratejilerini keşfediyor.

Veri hazırlığı şu adımları içerir:

Özellik sütunu sınıflandırması

  • Özellik sütunlarının tiplerini algılar ve bunları kategorik ya da sayısal sınıf olarak sınıflandırır
  • Çeşitli eksik değer tiplerini algılar (varsayılan, kullanıcı tarafından sağlanan, aykırı değerler)

Özellik mühendisliği

  • Hedef değerleri eksik olan satırları işler (bırakma (varsayılan) ya da hedef yükleme)
  • Benzersiz değer sütunlarını bırakır (tarihsaat ve zaman damgaları dışında)
  • Değişmez değer kolonlarını bırakır

Ön işleme (veri yükleme ve kodlama)

  • Sklearn yükleme/kodlama/ölçekleme stratejilerini uygular (her özellik sınıfında ayrı olarak). Örneğin, üründe kullanılan eksik değer yükleme stratejileri için geçerli varsayılan yöntem kategorik değişkenler için most frequent ve sayısal değişkenler için mean yöntemidir.
  • Eğitim kümesinde görülmeyen test kümesinin etiketlerini işler
  • HPO özelliği: Bir veri kümesi ve algoritma ile yükleme/kodlama/ölçekleme stratejilerini optimize eder

Otomatik model seçimi

AutoAI deney eğitiminin ikinci aşaması otomatik model seçimidir. Otomatikleştirilmiş model seçimi algoritması, Üst Sınırlar stratejisini kullanarak Veri Ayırma özelliğini kullanır. Bu yaklaşım, büyük bir algoritma kümesi arasında küçük eğitim verileri alt kümelerini sıralı olarak ayırır. Amaç, yanlış ayrılmış örneklerin maliyetini en aza indirirken, tüm veriler üzerinde eğitildiğinde neredeyse optimum doğruluk sağlayan bir algoritma seçmektir. Sistem şu anda tüm Scikit-learn algoritmalarını ve popüler XGBoost ve LightGBM algoritmalarını desteklemektedir. Büyük veri kümelerindeki modellerin eğitimi ve değerlendirilmesi pahalıya mal olur. Küçük alt kümeleri başlatma ve veri kümesi üzerinde iyi çalışan modellere artımlı olarak daha büyük olanları ayırma yaklaşımı, performanstan ödün vermeden zaman kazandırır. Performansı daha da artırmak için sisteme anlık makine öğrenimi algoritmaları eklendi.

Model için algoritma seçilmesi

Algoritmalar, modelin verilerini ve niteliğini eşleştirmek için seçilir, ancak model bu seçenek için yapılandırıldıysa, çalıştırma zamanı doğruluğunu ve süresini dengeleyebilirler. Örneğin, Snap ML algoritmaları genellikle eğitim için Scikit-learn algoritmalarından daha hızlıdır. Bunlar genellikle, eğitimin daha kısa bir çalışma süresi ve doğruluk için optimize edildiği durumlar için AutoAI tarafından otomatik olarak seçilen tercih edilen algoritmalardır. Eğitim hızı bir öncelikse bunları el ile seçebilirsiniz. Ayrıntılar için bkz. Snap ML belgeleri. SnapML algoritmalarının ne zaman yararlı olduğu hakkında bir tartışma için SnapML algoritmalarının kullanılmasıyla ilgili web günlüğü gönderisibaşlıklı konuya bakın.

Sınıflandırma modelleri için kullanılan algoritmalar

Bu algoritmalar, sınıflandırma sorunları için model seçimi için kullanılan varsayılan algoritmalardır.

Tablo 1: Sınıflandırma için varsayılan algoritmalar
Algoritma Açıklama
Karar Ağacı Sınıflandırıcısı Bir öğeyle ilgili gözlemleri (dallarda gösterilir), öğenin hedef değeriyle ilgili sonuçlarla (yapraklarda gösterilir) eşler. Hem ikili hem de çok değişkenli etiketleri ve hem sürekli hem de kategorik özellikleri destekler.
Fazladan Ağaç Sınıflandırıcı Rasgele karar ağaçlarına dayalı bir ortalama algoritması.
Renk Geçişi Artırılmış Ağaç Sınıflandırıcısı Bir karar ağaçları topluluğu biçiminde bir sınıflandırma öngörü modeli üretir. İkili etiketleri ve hem sürekli hem de kategorik özellikleri destekler.
LGBM Sınıflandırıcısı Yaprak (yatay) ağaç tabanlı öğrenme algoritmasını kullanan renk geçişi artırma çerçevesi.
Lojistik Regresyon İki sonuçtan birini belirleyen bir ya da daha fazla bağımsız değişkenin bulunduğu bir veri kümesini analiz eder. Yalnızca ikili lojistik regresyon desteklenir
Rasgele Orman Sınıflandırıcısı Her karar ağacının kipi olan etiketi üretmek için birden çok karar ağacı oluşturur. Hem ikili hem de çok yönlü etiketleri ve hem sürekli hem de kategorik özellikleri destekler.
SnapDecisionTreeClassifier Bu algoritma, IBM Snap ML kitaplığını kullanarak bir karar ağacı sınıflandırıcısı sağlar.
SnapLogisticRegresyon Bu algoritma, IBM Snap ML çözücüyle düzenli lojistik regresyon sağlar.
SnapRandomForestClassifier Bu algoritma, IBM Snap ML kitaplığını kullanarak rasgele bir orman sınıflandırıcısı sağlar.
SnapSVMClassifier Bu algoritma, IBM Snap ML çözücüyle düzenli bir destek vektör makinesi sağlar.
XGBoost Sınıflandırıcısı Sınıflandırma sorunları için kullanılabilecek doğru emin yordam. XGBoost modelleri, web arama sıralaması ve ekoloji de dahil olmak üzere çeşitli alanlarda kullanılır.
SnapBoostingMachineClassifier İkili karar ağaçlarını rasgele fourier özellikli doğrusal modellerle karıştıran ikili ve çok sınıflı sınıflandırma görevleri için makinenin güçlendirilmesi.

Regresyon modelleri için kullanılan algoritmalar

Bu algoritmalar, regresyon sorunları için otomatik model seçimi için kullanılan varsayılan algoritmalardır.

Tablo 2: Regresyon için varsayılan algoritmalar
Algoritma Açıklama
Karar Ağacı Regresyonu Bir öğeyle ilgili gözlemleri (dallarda gösterilir), öğenin hedef değeriyle ilgili sonuçlarla (yapraklarda gösterilir) eşler. Hem sürekli hem de kategorik özellikleri destekler.
Fazladan Ağaç Regresyonu Rasgele karar ağaçlarına dayalı bir ortalama algoritması.
Ton Geçişi Artıran Regresyon Karar ağaçları topluluğu biçiminde bir regresyon tahmin modeli oluşturur. Hem sürekli hem de kategorik özellikleri destekler.
LGBM Regresyonu Ağaç tabanlı öğrenme algoritmalarını kullanan gradyan geliştirme çerçevesi.
Doğrusal Regresyon Skaler bağımlı y değişkeni ile bir veya daha fazla açıklayıcı değişken (veya bağımsız değişkenler) x arasındaki doğrusal ilişkiyi modeller.
Rasgele Orman Regresyonu Her bir karar ağacının ortalama tahminini üretmek için birden çok karar ağacı oluşturur. Hem sürekli hem de kategorik özellikleri destekler.
Kabartma Sırt regresyonu, Sıradan En Az kareler 'e benzer, ancak katsayıların boyutuna bir ceza getirir.
SnapBoostingMachineRegressor Bu algoritma, bir karar ağaçları topluluğu oluşturmak için kullanılabilecek IBM Snap ML kitaplığını kullanarak bir güçlendirici makine sağlar.
SnapDecisionTreeRegressor Bu algoritma, IBM Snap ML kitaplığını kullanarak bir karar ağacı sağlar.
SnapRandomForestRegressor Bu algoritma, IBM Snap ML kitaplığını kullanarak rasgele bir orman sağlar.
XGBoost Regresyonu GBRT, regresyon sorunları için kullanılabilecek doğru ve etkili bir kullanıma hazır yordamdır. Gradyan Tree Boosting modelleri, web arama sıralaması ve ekoloji de dahil olmak üzere çeşitli alanlarda kullanılır.

Model tipine göre metrikler

Eğitim sırasında boru hatlarının doğruluğunu ölçmek ve verileri puanlamak için aşağıdaki ölçümler mevcuttur.

İkili sınıflandırma metrikleri

  • Doğruluk (boru hatlarını sıralamak için varsayılan)
  • Roc auc
  • Ortalama duyarlık
  • F
  • Negatif günlük kaybı
  • Hassasiyet
  • Geri alma

Çok sınıflı sınıflandırma metrikleri

Çok sınıflı modellere ilişkin metrikler, bir ardışık işlemin belirtilen ölçüme karşı ne kadar iyi performans gösterdiğine ilişkin puanlar oluşturur. Örneğin, bir F1 puan ortalaması duyarlık (yapılan tahminlerin, kaç pozitif öngörü doğru olduğunu) ve geri çağırma (tüm olası olumlu tahminlerin, kaç tanesinin doğru tahmin edildiğini).

Belirli bir metriği genel olarak (makro), etiket başına (mikro) hesaplayarak ya da dengesiz bir veri kümesini daha fazla gösterimli sınıfları desteklemesi için ağırlıklayarak bir puanı daha da daraltabilirsiniz.

  • Mikro niteleyiciye sahip metrikler, toplam gerçek pozitif, yanlış negatif ve yanlış pozitif sayısını sayarak metrikleri genel olarak hesaplar.
  • Makro niteleyicisine sahip metrikler, her etikete ilişkin metrikleri hesaplar ve bunların ağırlıklı olmayan ortalamalarını bulur. Tüm etiketler eşit olarak ağırlıklandırılır.
  • Ağırlıklı niteleyiciye sahip metrikler, her bir etiket için metrikleri hesaplar ve her bir sınıfın katkısına göre ağırlıklı ortalamalarını bulur. Örneğin, elma, şeftali ve erik kategorilerini içeren bir veri kümesinde, daha fazla elma örneği varsa, ağırlıklı metrik elmaları doğru şekilde tahmin etmek için daha fazla önem verir. Bu, etiket dengesizliğini hesaba katmak için makroyu değiştirir. Dengesiz bir veri kümesi için F1-weighted gibi ağırlıklı bir metrik kullanın.

Bunlar çok sınıflı sınıflandırma metrikleridir:

  • Doğruluk (boru hatlarını sıralamak için varsayılan)
  • F1
  • F1 Mikro
  • F1 Makro
  • F1 Ağırlıklı
  • Hassasiyet
  • Duyarlık Mikro
  • Duyarlık Makrosu
  • Duyarlık Ağırlıklı
  • Geri alma
  • Micro 'yu Geri çağır
  • Makroyu Geri Çağır
  • Geri Çağırma Ağırlıklı

Regresyon metrikleri

  • Negatif kök ortalama karesi hatası (ardışık düzeni derecelendirmek için varsayılan)
  • Negatif ortalama mutlak hatası
  • Negatif kök ortalama karesi günlük hatası
  • Açıklanan fark
  • Negatif ortalama karesi hatası
  • Negatif ortalama karesi günlük hatası
  • Negatif medyan mutlak hatası
  • R2

Otomatikleştirilmiş Özellik Mühendisliği

AutoAI sürecinin üçüncü aşaması otomatikleştirilmiş özellik mühendisliğidir. Otomatik özellik mühendisliği algoritması, Cognito: Automated Feature Engineering for Superted Learning ve Feature Engineering for Predictive Modeling by Reinforcement Learningaraştırma belgelerinde açıklanan Cognito 'ya dayalıdır. Sistem, bir keşif-sömürü stratejisi aracılığıyla modelin doğruluğunu aşamalı olarak en üst düzeye çıkarırken hiyerarşik ve kapsamlı olmayan bir şekilde çeşitli özellik oluşturma seçeneklerini keşfediyor. Bu yöntem, özellik mühendisliği için "deneme yanılma" stratejisinden esinlenmiştir, ancak bir insan yerine özerk bir ajan tarafından yürütülür.

Özellik önem düzeyi için kullanılan metrikler

Karar Ağacı, Ekstra Ağaçlar, Rasgele Orman, XGBoost, Gradient Boosted ve LGBM gibi ağaç tabanlı sınıflandırma ve regresyon algoritmaları için, özellik önemleri, bölünmüş noktaları seçmek için kullanılan ölçütün indirgenmesine dayalı olarak doğuştan gelen özellik önem puanlarıdır ve bu algoritmalar eğitim verileri üzerinde eğitildiğinde hesaplanır.

Logistic Regression, LInear Regression, SnapSVMve Ridge gibi ağaç dışı algoritmalar için, özellik önemleri, ağaç olmayan algoritmayla aynı eğitim verileri üzerinde eğitilen Random Forest algoritmasının önemleridir.

Herhangi bir algoritma için, tüm özellik önemleri sıfır ile bir aralığındadır ve maksimum özellik önemine göre oran olarak normalleştirilmiştir.

Veri dönüşümleri

AutoAI , özellik mühendisliği için çeşitli özellik oluşturma seçeneklerini yapılandırılmış, kapsamlı olmayan bir şekilde keşfeden ve aynı zamanda pekiştirmeli öğrenmeyi kullanarak model doğruluğunu aşamalı olarak en üst düzeye çıkaran yeni bir yaklaşım kullanır. Bu, model seçim adımının algoritmalarıyla ya da algoritmalarıyla en iyi eşleşen veriler için eniyilenmiş bir dönüştürme sırasıyla sonuçlanır. Bu çizelge, kullanılan bazı dönüşümleri ve yararlı oldukları bilinen bazı koşulları listeler. Bu, karmaşık ve yorumlanması zor olabilen, dönüşümün yararlı olduğu senaryoların kapsamlı bir listesi değildir. Son olarak, listelenen senaryolar, dönüşümlerin nasıl seçildiğine ilişkin bir açıklama değildir. Uygulanacak dönüşümlerin seçimi, deneme yanılma, performans odaklı bir şekilde yapılır.

Tablo 3: Özellik mühendisliği için dönüşümler
Ad Kod function
İlke Bileşeni Çözümlemesi pca Verilerin boyutlarını azaltın ve daha uygun bir koordinat sisteminde yeniden hizalayın. Doğrusal ilişkili verilerde 'boyutsallığın laneti' ile başa çıkmanıza yardımcı olur. Yedekliliği ortadan kaldırır ve verilerdeki önemli sinyalleri ayırır.
Standart Ölçekleyici stdscaler Veri özelliklerini standart bir aralığa ölçekler. Bu, belirli öğrenme algoritmalarının ve PCA gibi diğer dönüşümlerin etkinliğinin ve verimliliğinin sağlanmasına yardımcı olur.
Logaritma günlük Özelliklerdeki doğru çarpıklığı azaltır ve daha simetrik hale getirir. Sonuçtaki simetri, algoritmaların verileri daha iyi anlamasına yardımcı olur. Ortalama ve varyansa dayalı ölçekleme bile simetrik veriler üzerinde daha anlamlıdır. Ayrıca, bir logaritma aracılığıyla en iyi açıklanan özellik ve hedef arasındaki belirli fiziksel ilişkileri yakalayabilir.
Küp Kökü cbrt Logaritma gibi verilerdeki doğru çarpıklığı azaltır, ancak etki kaydından daha zayıftır, bu da bazı durumlarda daha uygun olabilir. Günlüğün uygulanmadığı negatif ya da sıfır değerleri için de geçerlidir. Küp kökü, birimin uzunluğa indirilmesi gibi birimleri de değiştirebilir.
Kare kök KAREKÖK Verilerdeki hafif sağ şüpheciliği azaltır. Günlük ya da küp kökünden daha zayıftır. Sıfırlarla çalışır ve alan gibi uzamsal boyutları uzunluğa düşürür.
Kare Kare Bu tür dağılımları daha simetrik hale getirmek için sol çarpıklığı orta ölçüde azaltır. Ayrıca süper doğrusal büyüme gibi bazı fenomenleri yakalamaya yardımcı olabilir.
Ürün ürün İki özellikten oluşan bir ürün, doğrusal olmayan bir ilişkiyi, hedef değeri tek başına tek tek değerlerden daha iyi tahmin etmek için ortaya çıkarabilir. Örneğin, satılan parça sayısına göre öğe maliyeti, bir işletmenin boyutunun tek başına olanlardan daha iyi bir göstergesidir.
Sayısal XOR Ya da Bu dönüşüm, bitli XOR ' a benzer şekilde, ancak genel bir sayısal bağlamda değişkenler arasındaki ilişkilerin "dışlayıcı ayrık" tipinin yakalanmasına yardımcı olur.
Toplam toplam Bazen iki özelliğin toplamı, öngörü hedefiyle tek başına özelliklerden daha iyi ilişkilidir. Örneğin, farklı kaynaklardan alınan krediler, özetlendiğinde, kredi başvurusunda bulunanın toplam borçlanmasının daha iyi bir fikir olduğunu belirtir.
Böl Böl Bölünme, bir ülkenin ortalama ömrünü sadece GSYİH ' dan veya yalnızca nüfustan daha iyi temsil eden, nüfus üzerinde gayri safi yurtiçi hasıla (kişi başına GSYİH) gibi miktarları ifade etmek için kullanılan temel bir operattır.
Maksimum maks İki değerden daha yüksek bir değer alın.
yuvarlama round Bu dönüşüm, yanlış gözlemlerin sonucu olabilecek aşırı uydurma oranını azaltmak için pertürbasyon veya bazı sesler ekleme olarak görülebilir.
Mutlak Değer MUTLAK Sadece büyüklüğü göz önünde bulundurun, gözlem işaretini değil. Bazen, bir gözlemin yönü ya da işareti, gerçek harekette harcanan yakıt ya da zamanı düşünürken, fiziksel yer değiştirme gibi büyüklüğü kadar önemli değildir.
Hiperbolik tanjant TANH Doğrusal olmayan aktivasyon fonksiyonu, sinirsel ağ aktivasyon fonksiyonlarına benzer şekilde tahmin doğruluğunu artırabilir.
Sinüs SİN Basit harmonik hareketler gibi periyodik eğilimleri keşfetmek için verileri yeniden yönleyebilir.
Kosinüs COS Basit harmonik hareketler gibi periyodik eğilimleri keşfetmek için verileri yeniden yönleyebilir.
Tanjant TAN Trigonometrik tanjant dönüşümü genellikle diğer dönüşümlerle birlikte yardımcı olur.
Özellik Agglomeration özellik agglomeration Farklı özelliklerin gruplar halinde kümelenmesi, uzaklığa veya benzerliğe dayalı olarak öğrenme algoritması için sınıflandırma kolaylığı sağlar.
Sigmoid sigmoid Doğrusal olmayan aktivasyon fonksiyonu, sinirsel ağ aktivasyon fonksiyonlarına benzer şekilde tahmin doğruluğunu artırabilir.
Yalıtım Ormanı izoforestanomali Her bir örnek için anomali puanı içeren yeni bir özellik oluşturmak için bir Isolation Forest kullanarak kümeleme gerçekleştirir.
Sözcük-vektör word2vec Metin analizi için kullanılan bu algoritma, diğer tüm dönüşümlerden önce uygulanır. Giriş olarak bir metin korpus alır ve bir dizi vektör çıkarır. Metni sayısal bir gösteriye dönüştürerek benzer sözcükleri algılayabilir ve karşılaştırabilir. Yeterli veriyle eğitildiğinde word2vec , bir sözcüğün anlamı ya da diğer sözcüklerle ilişkisi hakkında doğru tahminler yapabilir. Tahminler, duygu analizi uygulamalarında metni analiz etmek ve anlamı tahmin etmek için kullanılabilir.

Hiperparametre Eniyilemesi

AutoAI ' de son aşama hiperparametre optimizasyonudur. AutoAI yaklaşımı, önceki aşamalardan en iyi performans gösteren boru hatlarının parametrelerini optimize eder. Bu, RBFOpt adlı bir kara kutu hiperparametre eniyileyicisi kullanılarak bu ardışık hatların parametre aralıkları keşfedilerek yapılır. RBFOpt, RBFOpt: yüksek maliyetli işlev değerlendirmeleri ile kara kutu optimizasyonu için açık kaynaklı bir kitaplıkaraştırma belgesinde açıklanmıştır. RBFOpt, eğitim ve bir algoritma puanlaması gibi yüksek maliyetli değerlendirmelerle optimizasyonlar için oluşturulduğundan, AutoAI deneyleri için uygundur. RBFOpt 'un yaklaşımı, her yinelemenin uzun değerlendirme sürelerine rağmen hızlı bir şekilde yakınsamak için bilinmeyen bir hedef fonksiyonun vekil modelini oluşturur ve yinelemeli olarak iyileştirir.


AutoAI Sık Sorulan Sorular

Aşağıda, AutoAI deneyi yaratılmasıyla ilgili sık sorulan sorular yer almaktadır.

Kaç tane boru hattı oluşturuldu?

İki AutoAI parametresi boru hattı sayısını belirler:

  • max_num_daub_ensembles: Seçilen algoritmanın ya da tahmin tiplerinin (örneğin, LGBMClassifierEstimator, XGBoostClassifierTahmini mator ya da LogisticRegressionardışık düzende kullanılacak tahmin aracı sayısı üst sınırı (DAUB model seçimine göre sınıflandırılmış üst-K).  Varsayılan değer, model seçim algoritması tipine göre yalnızca en yüksek sıralamayı kullanan 1 'dir.

  • num_folds: Tüm veri kümesine ek olarak, boru hatlarını eğitmek için tam veri kümesinin alt kümelerinin sayısı. Varsayılan değer, tam veri kümesinin eğitilmesi için 1 'dir.

AutoAI , her katlama ve algoritma tipi için aşağıdakilere karşılık gelen dört artırılmış iyileştirme hattı oluşturur:

  1. Bu algoritma tipi için varsayılan sklearn parametrelerine sahip ardışık düzen,
  2. HPO kullanarak optimize edilmiş algoritmayla ardışık işlem hattı
  3. Optimize edilmiş özellik mühendisliğine sahip ardışık işlem hattı
  4. HPO kullanarak optimize edilmiş özellik mühendisliği ve optimize edilmiş algoritma ile ardışık işlem hattı

Oluşturulan toplam boru hattı sayısı:

TotalPipelines= max_num_daub_ensembles * 4, if num_folds = 1:  
                       
TotalPipelines= (num_folds+1) * max_num_daub_ensembles * 4,  if num_folds > 1 :

Modelim için hangi hiperparametre eniyilemesi uygulanır?

AutoAI , hiperparametre optimizasyonunun (HPO) gerektirdiği yüksek maliyetli makine öğrenimi modeli eğitimi ve puanlama değerlendirmeleri için uyarlanmış RBfOptadlı model tabanlı, türevsiz bir genel arama algoritması kullanır. Gauss modelini bilinmeyen amaç işlevine uyan Bayes optimizasyonunun aksine, RBfOpt , makine öğrenimi sorununun hedef işlevini en üst düzeye çıkaran hiper parametre yapılandırmalarının keşfini hızlandırmak için radyal temel işlev kipine uygundur. Bu hızlanma, pahalı eğitim ve puanlama makine öğrenimi modelleri değerlendirmelerinin sayısının en aza indirilmesi ve kısmi türevlerin hesaplanması gerekliliğini ortadan kaldırarak elde edilir.

Her bir katlama ve algoritma tipi için AutoAI , algoritma tipi için eniyilemek üzere HPO kullanan iki ardışık işlem hattı yaratır.

  • İlki, yukarıdaki önişlemden geçirilmiş (örtük/kodlanmış/ölçeklenmiş) veri kümesine (ardışık işlem hattı 2) dayalı olarak bu algoritma tipinin eniyilenmesine dayalıdır.
  • İkincisi, önceden işlenmiş (imputed/encoded/scted) veri kümesinin eniyilenmiş özellik mühendisliğine dayalı olarak algoritma tipini eniyilemeye dayalıdır.

AutoAI tarafından oluşturulan tüm ardışık işlemlere ilişkin algoritmaların parametre değerleri durum iletilerinde yayınlanır.

RbfOpt algoritmasına ilişkin daha fazla ayrıntı için bkz:

Araştırma referansları

Bu liste, otomatikleştirilmiş model oluşturma sürecinde güven ve şeffaflığı teşvik etmek için AutoAI ' nin nasıl tasarlandığını ve uygulandığını ayrıntılı olarak açıklayan bazı temel araştırma makalelerini içerir.

Sonraki adımlar

AutoAI deneylerinde veri yükleme

Üst konu: AutoAI genel bakış

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more