0 / 0
Go back to the English version of the documentation
Data Refinery akışlarının yönetilmesi
Last updated: 31 Ağu 2023
Data Refinery akışlarının yönetilmesi

Data Refinery akışı, verileri temizlemek, şekillendirmek ve geliştirmek için sıralı bir adım kümeidir. Bir veri kümesine işlemleri uygulayarak verilerinizi iyileştirirken , gerçek zamanlı olarak değiştirebileceğiniz ve ileride kullanmak üzere kaydedebileceğiniz, dinamik olarak özelleştirilmiş bir Data Refinery akışı oluşturabilirsiniz.

Bunlar, verilerinizi daraltırken yapabileceğiniz işlemlerdir:

Data Refinery akışıyla çalışılması

Adımlar

Veri kümeleriyle çalışma

Proje sayfasındaki işlemler

Data Refinery akışıyla çalışma

Data Refinery akışını kaydet

Data Refinery araç çubuğundaki Data Refinery akış simgesini Kaydet simgesi tıklatarak bir Data Refinery akışını kaydedin. Data Refinery akışları, çalıştığınız projeye kaydedilir. Daha sonra bir veri kümesini iyileştirmeye devam edebilmeniz için Data Refinery akışını kaydedin.

Data Refinery akışının varsayılan çıkışı, bir veri varlığı kaynak-dosyası-adı_shaped.csvolarak kaydedilir. Örneğin, kaynak dosya mydata.csvise, Data Refinery akışı için varsayılan ad ve çıkış mydata_csv_shapedolur. Data Refinery akışının hedefini değiştirerekadı düzenleyebilir ve bir uzantı ekleyebilirsiniz.

Data Refinery akışı için bir iş çalıştırma ya da zamanlama

Data Refinery , zaman alan ve iyileştirilmesi zor olan büyük veri kümelerini destekler. Hızlı ve verimli çalışabilmeniz için Data Refinery , veri kümesindeki satırların örnek bir alt kümesinde çalışır. Örnek boyutu, hangisi önce gelirse, 1 MB ya da 10.000 satırdır. Data Refinery akışı için bir iş çalıştırdığınızda, tüm veri kümesi işlenir. İşi çalıştırdığınızda, yürütme ortamını seçebilir ve bir kerelik ya da yinelenen bir zamanlama ekleyebilirsiniz.

Data Refinery, Data Refinery araç çubuğundan İşler simgesini Bir işi çalıştır ya da zamanla simgesitıklatın ve Kaydet ve bir iş oluştur ya da İşleri kaydet ve görüntüleseçeneğini belirleyin.

Bir Data Refinery akışını kaydettikten sonra, Proje sayfasından da bunun için bir iş oluşturabilirsiniz. Varlıklar sekmesine gidin, Data Refinery akışını seçin ve taşma menüsünden Yeni iş seçeneğini belirleyin (Taşma Menüsü).

İş ayrıntılarını görüntülemek ya da işi düzenlemek ya da çalıştırmak için Yönetici ya da Düzenleyici rolünüz olmalıdır. Projeye ilişkin Görüntüleyici rolüyle yalnızca iş ayrıntılarını görüntüleyebilirsiniz.

İşlerle ilgili daha fazla bilgi için Data Refinery' de iş oluşturmabaşlıklı konuya bakın.

Data Refinery akışını yeniden adlandır

Data Refinery araç çubuğunda Bilgi bölmesini açın Bilgi simgesi. Ya da Akış ayarlarını ayarlar simgesi açın ve Genel sekmesine gidin.

Adımlar

Bir adımı geri al ya da yinele

Araç çubuğundaki geri al (geri al simgesi) simgesini ya da yinele (yinele simgesi) simgesini tıklatın.

Bir adımı düzenleme, çoğaltma, ekleme ya da silme

Adımlar bölmesinde, değiştirmek istediğiniz işlemin adımındaki taşma menüsünü (Taşma Menüsü) tıklatın. Eylemi seçin (Düzenle, Çoğalt, Adım önüne ekle, Adım sonraya ekleya da Sil).

  • Düzenleseçeneğini belirlerseniz, Data Refinery düzenleme kipine girer ve komut satırında ya da İşlem bölmesinde düzenlenecek işlemi görüntüler. Düzenlenen işlemi uygulayın.

  • Çoğaltseçeneğini belirlerseniz, yinelenen adım seçilen adımdan sonra eklenir.

Not:

Çoğalt işlemi, Birleştir ya da Birleştir işlemleri için kullanılamaz.

Data Refinery , değişiklikleri yansıtmak için Data Refinery akışını günceller ve tüm işlemleri yeniden çalıştırır.

Data Refinery akış adımlarını bir "anlık görünüm" içinde görüntüleme

Verilerinizin herhangi bir zamanda nasıl göründüğünü görmek için, önceki bir adımı tıklatarak Data Refinery görünümünü anlık görüntü görünümüne koyun. Örneğin, Veri kaynağı' nı tıklatırsanız, arıtmaya başlamadan önce verilerinizin nasıl göründüğünü görürsünüz. İşlem uygulandıktan sonra verilerinizin nasıl göründüğünü görmek için herhangi bir işlem adımını tıklatın. Anlık görüntü görünümünden çıkmak için View step x of y (Adım x/y) seçeneğini tıklatın ya da anlık görüntü görünümüne girmek için seçtiğiniz adımı tıklatın.

Data Refinery akış verilerini bir CSV dosyasına aktarma

Bir Data Refinery akış işini kaydetmeden ya da çalıştırmadan Data Refinery akışınızın geçerli adımındaki verileri bir CSV dosyasına aktarmak için araç çubuğunda Dışa Aktar (dışa aktarma simgesi) düğmesini tıklatın. Örneğin, devam eden bir Data Refinery akışının hızlı çıkışını istiyorsanız bu seçeneği kullanın. Verileri dışa aktardığınızda, Data Refinery akışının geçerli adımında bir CSV dosyası oluşturulur ve bilgisayarınızın Downloads (Yüklemeler) klasörüne (ya da kullanıcı tarafından belirtilen karşıdan yükleme konumuna) yüklenir. Anlık Görünüm' de yer alıyorsanız, CSV dosyasının çıkışı tıklattığınız adımdır. Verilerin bir örneğini (altkümesini) görüntülüyorsanız, çıkışta yalnızca örnek veriler bulunur.

Veri kümeleriyle çalışma

Data Refinery akışının kaynağını değiştirme

Data Refinery akışının kaynağını değiştirin. Aynı Data Refinery akışını farklı bir kaynak veri kümesiyle çalıştırın. Kaynağı değiştirmenin iki yolu vardır:

  • Adımlar bölmesinde: Veri kaynağıyanındaki taşma menüsünü (Taşma Menüsü) tıklatın, Düzenleseçeneğini belirleyin ve farklı bir kaynak veri kümesi seçin.
    Kaynağı düzenle

  • Akış ayarlarında: Aynı yerde birden çok veri kaynağını değiştirmek istiyorsanız bu yöntemi kullanabilirsiniz. Örneğin, bir Birleştirme ya da Birleşme işlemi için. Araç çubuğunda Akış ayarlarını açın ayarlar simgesi. Kaynak veri kümeleri sekmesine gidin ve veri kaynağının yanındaki taşma menüsünü (Taşma Menüsü) tıklatın. Veri kaynağını değiştirseçeneğini belirleyin ve farklı bir kaynak veri kümesi seçin.

En iyi sonuçlar için, yeni veri kümesinin özgün veri kümesiyle uyumlu bir şeması olmalıdır (örneğin, sütun adları, sütun sayısı ve veri tipleri). Yeni veri kümesi farklı bir şemaya sahipse, şemayla çalışmayan işlemler hata gösterir. İşlemleri düzenleyebilir ya da silebilirsiniz ya da kaynağı daha uyumlu bir şemaya sahip bir kaynak olarak değiştirebilirsiniz.

Örnek boyutunu düzenle

İşi Data Refinery akışı için çalıştırdığınızda, işlemler tam veri kümesinde gerçekleştirilir. Ancak, veri kümesinin boyutuna bağlı olarak, işlemleri Data Refineryalanında etkileşimli olarak uyguladığınızda, yalnızca bir veri örneğini görüntüleyebilirsiniz.

Data Refinery akış işinin sonuçlarına daha yakın olacak sonuçları görmek için örnek boyutunu artırın, ancak Data Refinery' de sonuçların görüntülenmesinin daha uzun sürebileceğini unutmayın. Üst sınır, hangisi önce gelirse, 10.000 satırlık ya da 1 MB ' lik bir üst satır sayısıdır. Daha hızlı sonuçları görüntülemek için örnek boyutunu azaltın. Verilerin boyutuna ve işlemlerin sayısına ve karmaşıklığına bağlı olarak, veri kümesi için neyin en iyi işe yaradığını görmek için örnek boyutunu denemek isteyebilirsiniz.

Araç çubuğunda Akış ayarlarını açın ayarlar simgesi. Kaynak veri kümeleri sekmesine gidin ve veri kaynağının yanındaki taşma menüsünü (Taşma Menüsü) tıklatın ve Örneği düzenleseçeneğini belirleyin.

Kaynak özelliklerini düzenle

Kullanılabilir özellikler veri kaynağına bağlıdır. Veri varlıkları ve farklı bağlantı türlerinden veriler için farklı özellikler kullanılabilir. Dosya biçimini yalnızca çıkarsanan dosya biçimi yanlışsa değiştirin. Dosya biçimini değiştirirseniz, kaynak yeni biçimle okunur, ancak kaynak dosya değişmeden kalır. Biçim kaynağı özelliklerinin değiştirilmesi yinelenen bir işlem olabilir. Bir seçeneği uyguladıktan sonra verilerinizi inceleyin.

Araç çubuğunda Akış ayarlarını açın ayarlar simgesi. Kaynak veri kümeleri sekmesine gidin ve veri kaynağının yanındaki taşma menüsünü (Taşma Menüsü) tıklatın ve Biçimi düzenleseçeneğini belirleyin.

Önemli: Kaynak özellikleri düzenlerseniz dikkatli olun. Veriler okunduğunda ya da Data Refinery akış işi bozuk olduğunda yanlış seçimler beklenmeyen sonuçlar üretebilir. Data Refinery akışının sonuçlarını dikkatle inceleyin.

Data Refinery akışının hedefini değiştirme

Varsayılan olarak, Data Refinery hedefi, çalıştığınız projede bir veri varlığı olarak kaydedilir.

Hedef konumudeğiştirmek için araç çubuğundan Akış ayarlarını ayarlar simgesi açın. Hedef veri kümesi sekmesine gidin, Hedef seç' i tıklatın ve farklı bir hedef konum seçin.

Hedef özellikleri düzenle

Kullanılabilir özellikler veri kaynağına bağlıdır. Veri varlıkları ve farklı bağlantı türlerinden veriler için farklı özellikler kullanılabilir.

Hedef veri kümesinin özelliklerini değiştirmek için araç çubuğundan Akış ayarlarını ayarlar simgesi açın. Hedef veri kümesi sekmesine gidin ve Özellikleri düzenle' yi tıklatın.

Data Refinery akış hedefinin adını değiştirme

Hedef veri kümesinin adı, hedef özellikleri düzenlerken değiştirebileceğiniz alanlara eklenir.

Varsayılan olarak, Data Refinery hedefi, projede kaynak-dosya-adı_shaped.csv veri varlığı olarak kaydedilir. Örneğin, kaynak mydata.csvise, Data Refinery akışı için varsayılan ad ve çıkış veri varlığıdır mydata_csv_shaped.

Bir bağlantıdaki hedef veri kümesi için farklı özellikler ve adlandırma kuralları geçerlidir. Örneğin, veri kümesi Cloud Object Storage(Bulut Nesne Depolaması) içindeyse, veri kümesi Bucket ve File name (Dosya adı) alanlarında tanımlanır. Veri kümesi bir Db2 veritabanıysa, veri kümesi Şema adı ve Çizelge adı alanlarında belirtilir.

Önemli: Hedef özellikleri düzenlerseniz dikkatli olun. Yanlış seçimler beklenmeyen sonuçlar üretebilir ya da Data Refinery akış işini boz. Data Refinery akışının sonuçlarını dikkatle inceleyin.

Proje sayfasındaki işlemler

Çalışmaya devam etmek için bir Data Refinery akışını yeniden açın

Bir Data Refinery akışını yeniden açmak ve verilerinizi iyileştirmeye devam etmek için projenin Varlıklar sekmesine gidin. Varlık tiplerialtında Akışlar'ı genişletin ve Data Refinery akışı' nı tıklatın. Data Refinery akış adını tıklatın.

Data Refinery akışını yinele

Data Refinery akışının bir kopyasını oluşturmak için projenin Varlıklar sekmesine gidin, Akışlar'ı genişletin ve Data Refinery akışı' nı tıklatın. Data Refinery (Veri Daraltma) akışını seçin ve taşma menüsünden Duplicate (Çoğalt) seçeneğini belirleyin (Taşma Menüsü). Data Refinery akışı, Data Refinery akışları listesine "özgün-adı kopya 1" olarak eklenir.

Data Refinery akışını silme

Bir Data Refinery akışını silmek için projenin Varlıklar sekmesine gidin, Akışlar' ı genişletin ve Data Refinery akışınıtıklatın. Data Refinery akışını seçin ve taşma menüsünden Delete (Sil) seçeneğini belirleyin (Taşma Menüsü).

Bir Data Refinery akışını bir alana yükseltme

Devreye alma alanları, projelerinizden ayrı bir ortamda ilgili varlıklar kümesini yönetmek için kullanılır. Watson Machine Learningiçin devreye alma işine ilişkin verileri hazırlamak için bir alan kullanırsınız. Data Refinery akışlarını birden çok projeden tek bir alana yükseltebilirsiniz. Data Refinery akışı bir alanda düzenlenemediğinden, yükseltmeden önce Data Refinery akışındaki adımları tamamlayın.

Bir Data Refinery akışını bir alana yükseltmek için projenin Varlıklar sekmesine gidin, Akışlar' ı genişletin ve Data Refinery akışınıtıklatın. Data Refinery (Veri İnceliği) akışını seçin. Data Refinery akışına ilişkin taşma menüsünü (Taşma Menüsü) tıklatın ve Yükseltseçeneğini belirleyin. Data Refinery akışı ve diğer bağımlı veriler için kaynak dosya da yükseltilir.

Bir alanda Data Refinery akışı için bir iş oluşturmak ya da çalıştırmak üzere alanın Varlıklar sekmesine gidin, Data Refinery akışına gidin ve taşma menüsünden (Taşma Menüsü) Yeni iş (Bir işi çalıştır ya da zamanla simgesi) seçeneğini belirleyin. İşi önceden yarattıysanız, işi düzenlemek ya da iş çalıştırma ayrıntılarını görüntülemek için İşler sekmesine gidin. Data Refinery akış işinin şekilli çıkışı alanın Varlıklar sekmesinde bulunur. İş ayrıntılarını görüntülemek ya da işi düzenlemek ya da çalıştırmak için Yönetici ya da Düzenleyici rolünüz olmalıdır. Proje için Görüntüleyici rolüyle yalnızca iş ayrıntılarını görüntüleyebilirsiniz. Şekilli çıkışı, Watson Machine Learningiçindeki bir iş için giriş verileri olarak kullanabilirsiniz.

Kısıtlama:

Bir Data Refinery akışını bir projeden bir alana yükselttiğinizde ve Data Refinery akışının hedefi bağlı bir veri varlığıolduğunda, bağlı veri varlığını el ile yükseltmeniz gerekir. Bu işlem, alanda Data Refinery akış işini çalıştırdığınızda bağlı veri varlığının verilerinin güncellenmesini sağlar. Tersi durumda, Data Refinery akış işinin başarılı bir çalışması, alanda yeni bir veri varlığı yaratır.

Alanlarla ilgili bilgi için bkz. Konuşlandırma alanları.

Üst konu: Verileri yeniden bulma

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more