Translation not up to date
Data Refinery akışı, verileri temizlemek, şekillendirmek ve geliştirmek için sıralı bir adım kümeidir. Bir veri kümesine işlemleri uygulayarak verilerinizi iyileştirirken , gerçek zamanlı olarak değiştirebileceğiniz ve ileride kullanmak üzere kaydedebileceğiniz, dinamik olarak özelleştirilmiş bir Data Refinery akışı oluşturabilirsiniz.
Bunlar, verilerinizi daraltırken yapabileceğiniz işlemlerdir:
Data Refinery akışıyla çalışılması
- Data Refinery akışını kaydetme
- Data Refinery akışı için bir iş çalıştır ya da zamanla
- Data Refinery akışının yeniden adlandırılması
Adımlar
- Bir adımı geri al ya da yinele
- Bir adımı düzenleme, çoğaltma, ekleme ya da silme
- Bir "anlık görüntü" görünümünde Data Refinery akış adımlarını görüntüleyin
- Data Refinery akış verilerini bir CSV dosyasına aktarma
Veri kümeleriyle çalışma
- Bir Data Refinery akışının kaynağını değiştirme
- Örnek boyutunun düzenlenmesi
- Kaynak özelliklerini düzenle
- Data Refinery akışının hedefini değiştirme
- Hedef özelliklerin düzenlenmesi
- Data Refinery akış hedefinin adını değiştirme
Proje sayfasındaki işlemler
- Çalışmaya devam etmek için bir Data Refinery akışını yeniden açın
- Bir Data Refinery akışını yineleme
- Bir Data Refinery akışının silinmesi
- Bir Data Refinery akışını bir alana yükseltme
Data Refinery akışıyla çalışma
Data Refinery akışını kaydet
Data Refinery araç çubuğundaki Data Refinery akış simgesini tıklatarak bir Data Refinery akışını kaydedin. Data Refinery akışları, çalıştığınız projeye kaydedilir. Daha sonra bir veri kümesini iyileştirmeye devam edebilmeniz için Data Refinery akışını kaydedin.
Data Refinery akışının varsayılan çıkışı, bir veri varlığı kaynak-dosyası-adı_shaped.csvolarak kaydedilir. Örneğin, kaynak dosya mydata.csv
ise, Data Refinery akışı için varsayılan ad ve çıkış mydata_csv_shaped
olur. Data Refinery akışının hedefini değiştirerekadı düzenleyebilir ve bir uzantı ekleyebilirsiniz.
Data Refinery akışı için bir iş çalıştırma ya da zamanlama
Data Refinery , zaman alan ve iyileştirilmesi zor olan büyük veri kümelerini destekler. Hızlı ve verimli çalışabilmeniz için Data Refinery , veri kümesindeki satırların örnek bir alt kümesinde çalışır. Örnek boyutu, hangisi önce gelirse, 1 MB ya da 10.000 satırdır. Data Refinery akışı için bir iş çalıştırdığınızda, tüm veri kümesi işlenir. İşi çalıştırdığınızda, yürütme ortamını seçebilir ve bir kerelik ya da yinelenen bir zamanlama ekleyebilirsiniz.
Data Refinery, Data Refinery araç çubuğundan İşler simgesini tıklatın ve Kaydet ve bir iş oluştur ya da İşleri kaydet ve görüntüleseçeneğini belirleyin.
Bir Data Refinery akışını kaydettikten sonra, Proje sayfasından da bunun için bir iş oluşturabilirsiniz. Varlıklar sekmesine gidin, Data Refinery akışını seçin ve taşma menüsünden Yeni iş seçeneğini belirleyin ().
İş ayrıntılarını görüntülemek ya da işi düzenlemek ya da çalıştırmak için Yönetici ya da Düzenleyici rolünüz olmalıdır. Projeye ilişkin Görüntüleyici rolüyle yalnızca iş ayrıntılarını görüntüleyebilirsiniz.
İşlerle ilgili daha fazla bilgi için Data Refinery' de iş oluşturmabaşlıklı konuya bakın.
Data Refinery akışını yeniden adlandır
Data Refinery araç çubuğunda Bilgi bölmesini açın . Ya da Akış ayarlarını açın ve Genel sekmesine gidin.
Adımlar
Bir adımı geri al ya da yinele
Araç çubuğundaki geri al () simgesini ya da yinele () simgesini tıklatın.
Bir adımı düzenleme, çoğaltma, ekleme ya da silme
Adımlar bölmesinde, değiştirmek istediğiniz işlemin adımındaki taşma menüsünü () tıklatın. Eylemi seçin (Düzenle, Çoğalt, Adım önüne ekle, Adım sonraya ekleya da Sil).
Düzenleseçeneğini belirlerseniz, Data Refinery düzenleme kipine girer ve komut satırında ya da İşlem bölmesinde düzenlenecek işlemi görüntüler. Düzenlenen işlemi uygulayın.
Çoğaltseçeneğini belirlerseniz, yinelenen adım seçilen adımdan sonra eklenir.
Çoğalt işlemi, Birleştir ya da Birleştir işlemleri için kullanılamaz.
Data Refinery , değişiklikleri yansıtmak için Data Refinery akışını günceller ve tüm işlemleri yeniden çalıştırır.
Data Refinery akış adımlarını bir "anlık görünüm" içinde görüntüleme
Verilerinizin herhangi bir zamanda nasıl göründüğünü görmek için, önceki bir adımı tıklatarak Data Refinery görünümünü anlık görüntü görünümüne koyun. Örneğin, Veri kaynağı' nı tıklatırsanız, arıtmaya başlamadan önce verilerinizin nasıl göründüğünü görürsünüz. İşlem uygulandıktan sonra verilerinizin nasıl göründüğünü görmek için herhangi bir işlem adımını tıklatın. Anlık görüntü görünümünden çıkmak için View step x of y (Adım x/y) seçeneğini tıklatın ya da anlık görüntü görünümüne girmek için seçtiğiniz adımı tıklatın.
Data Refinery akış verilerini bir CSV dosyasına aktarma
Bir Data Refinery akış işini kaydetmeden ya da çalıştırmadan Data Refinery akışınızın geçerli adımındaki verileri bir CSV dosyasına aktarmak için araç çubuğunda Dışa Aktar () düğmesini tıklatın. Örneğin, devam eden bir Data Refinery akışının hızlı çıkışını istiyorsanız bu seçeneği kullanın. Verileri dışa aktardığınızda, Data Refinery akışının geçerli adımında bir CSV dosyası oluşturulur ve bilgisayarınızın Downloads (Yüklemeler) klasörüne (ya da kullanıcı tarafından belirtilen karşıdan yükleme konumuna) yüklenir. Anlık Görünüm' de yer alıyorsanız, CSV dosyasının çıkışı tıklattığınız adımdır. Verilerin bir örneğini (altkümesini) görüntülüyorsanız, çıkışta yalnızca örnek veriler bulunur.
Veri kümeleriyle çalışma
Data Refinery akışının kaynağını değiştirme
Data Refinery akışının kaynağını değiştirin. Aynı Data Refinery akışını farklı bir kaynak veri kümesiyle çalıştırın. Kaynağı değiştirmenin iki yolu vardır:
Adımlar bölmesinde: Veri kaynağıyanındaki taşma menüsünü () tıklatın, Düzenleseçeneğini belirleyin ve farklı bir kaynak veri kümesi seçin.
Akış ayarlarında: Aynı yerde birden çok veri kaynağını değiştirmek istiyorsanız bu yöntemi kullanabilirsiniz. Örneğin, bir Birleştirme ya da Birleşme işlemi için. Araç çubuğunda Akış ayarlarını açın . Kaynak veri kümeleri sekmesine gidin ve veri kaynağının yanındaki taşma menüsünü () tıklatın. Veri kaynağını değiştirseçeneğini belirleyin ve farklı bir kaynak veri kümesi seçin.
En iyi sonuçlar için, yeni veri kümesinin özgün veri kümesiyle uyumlu bir şeması olmalıdır (örneğin, sütun adları, sütun sayısı ve veri tipleri). Yeni veri kümesi farklı bir şemaya sahipse, şemayla çalışmayan işlemler hata gösterir. İşlemleri düzenleyebilir ya da silebilirsiniz ya da kaynağı daha uyumlu bir şemaya sahip bir kaynak olarak değiştirebilirsiniz.
Örnek boyutunu düzenle
İşi Data Refinery akışı için çalıştırdığınızda, işlemler tam veri kümesinde gerçekleştirilir. Ancak, veri kümesinin boyutuna bağlı olarak, işlemleri Data Refineryalanında etkileşimli olarak uyguladığınızda, yalnızca bir veri örneğini görüntüleyebilirsiniz.
Data Refinery akış işinin sonuçlarına daha yakın olacak sonuçları görmek için örnek boyutunu artırın, ancak Data Refinery' de sonuçların görüntülenmesinin daha uzun sürebileceğini unutmayın. Üst sınır, hangisi önce gelirse, 10.000 satırlık ya da 1 MB ' lik bir üst satır sayısıdır. Daha hızlı sonuçları görüntülemek için örnek boyutunu azaltın. Verilerin boyutuna ve işlemlerin sayısına ve karmaşıklığına bağlı olarak, veri kümesi için neyin en iyi işe yaradığını görmek için örnek boyutunu denemek isteyebilirsiniz.
Araç çubuğunda Akış ayarlarını açın . Kaynak veri kümeleri sekmesine gidin ve veri kaynağının yanındaki taşma menüsünü () tıklatın ve Örneği düzenleseçeneğini belirleyin.
Kaynak özelliklerini düzenle
Kullanılabilir özellikler veri kaynağına bağlıdır. Veri varlıkları ve farklı bağlantı türlerinden veriler için farklı özellikler kullanılabilir. Dosya biçimini yalnızca çıkarsanan dosya biçimi yanlışsa değiştirin. Dosya biçimini değiştirirseniz, kaynak yeni biçimle okunur, ancak kaynak dosya değişmeden kalır. Biçim kaynağı özelliklerinin değiştirilmesi yinelenen bir işlem olabilir. Bir seçeneği uyguladıktan sonra verilerinizi inceleyin.
Araç çubuğunda Akış ayarlarını açın . Kaynak veri kümeleri sekmesine gidin ve veri kaynağının yanındaki taşma menüsünü () tıklatın ve Biçimi düzenleseçeneğini belirleyin.
Data Refinery akışının hedefini değiştirme
Varsayılan olarak, Data Refinery hedefi, çalıştığınız projede bir veri varlığı olarak kaydedilir.
Hedef konumudeğiştirmek için araç çubuğundan Akış ayarlarını açın. Hedef veri kümesi sekmesine gidin, Hedef seç' i tıklatın ve farklı bir hedef konum seçin.
Hedef özellikleri düzenle
Kullanılabilir özellikler veri kaynağına bağlıdır. Veri varlıkları ve farklı bağlantı türlerinden veriler için farklı özellikler kullanılabilir.
Hedef veri kümesinin özelliklerini değiştirmek için araç çubuğundan Akış ayarlarını açın. Hedef veri kümesi sekmesine gidin ve Özellikleri düzenle' yi tıklatın.
Data Refinery akış hedefinin adını değiştirme
Hedef veri kümesinin adı, hedef özellikleri düzenlerken değiştirebileceğiniz alanlara eklenir.
Varsayılan olarak, Data Refinery hedefi, projede kaynak-dosya-adı_shaped.csv veri varlığı olarak kaydedilir. Örneğin, kaynak mydata.csv
ise, Data Refinery akışı için varsayılan ad ve çıkış veri varlığıdır mydata_csv_shaped
.
Bir bağlantıdaki hedef veri kümesi için farklı özellikler ve adlandırma kuralları geçerlidir. Örneğin, veri kümesi Cloud Object Storage(Bulut Nesne Depolaması) içindeyse, veri kümesi Bucket ve File name (Dosya adı) alanlarında tanımlanır. Veri kümesi bir Db2 veritabanıysa, veri kümesi Şema adı ve Çizelge adı alanlarında belirtilir.
Proje sayfasındaki işlemler
Çalışmaya devam etmek için bir Data Refinery akışını yeniden açın
Bir Data Refinery akışını yeniden açmak ve verilerinizi iyileştirmeye devam etmek için projenin Varlıklar sekmesine gidin. Varlık tiplerialtında Akışlar'ı genişletin ve Data Refinery akışı' nı tıklatın. Data Refinery akış adını tıklatın.
Data Refinery akışını yinele
Data Refinery akışının bir kopyasını oluşturmak için projenin Varlıklar sekmesine gidin, Akışlar'ı genişletin ve Data Refinery akışı' nı tıklatın. Data Refinery (Veri Daraltma) akışını seçin ve taşma menüsünden Duplicate (Çoğalt) seçeneğini belirleyin (). Data Refinery akışı, Data Refinery akışları listesine "özgün-adı kopya 1" olarak eklenir.
Data Refinery akışını silme
Bir Data Refinery akışını silmek için projenin Varlıklar sekmesine gidin, Akışlar' ı genişletin ve Data Refinery akışınıtıklatın. Data Refinery akışını seçin ve taşma menüsünden Delete (Sil) seçeneğini belirleyin ().
Bir Data Refinery akışını bir alana yükseltme
Devreye alma alanları, projelerinizden ayrı bir ortamda ilgili varlıklar kümesini yönetmek için kullanılır. Watson Machine Learningiçin devreye alma işine ilişkin verileri hazırlamak için bir alan kullanırsınız. Data Refinery akışlarını birden çok projeden tek bir alana yükseltebilirsiniz. Data Refinery akışı bir alanda düzenlenemediğinden, yükseltmeden önce Data Refinery akışındaki adımları tamamlayın.
Bir Data Refinery akışını bir alana yükseltmek için projenin Varlıklar sekmesine gidin, Akışlar' ı genişletin ve Data Refinery akışınıtıklatın. Data Refinery (Veri İnceliği) akışını seçin. Data Refinery akışına ilişkin taşma menüsünü () tıklatın ve Yükseltseçeneğini belirleyin. Data Refinery akışı ve diğer bağımlı veriler için kaynak dosya da yükseltilir.
Bir alanda Data Refinery akışı için bir iş oluşturmak ya da çalıştırmak üzere alanın Varlıklar sekmesine gidin, Data Refinery akışına gidin ve taşma menüsünden () Yeni iş () seçeneğini belirleyin. İşi önceden yarattıysanız, işi düzenlemek ya da iş çalıştırma ayrıntılarını görüntülemek için İşler sekmesine gidin. Data Refinery akış işinin şekilli çıkışı alanın Varlıklar sekmesinde bulunur. İş ayrıntılarını görüntülemek ya da işi düzenlemek ya da çalıştırmak için Yönetici ya da Düzenleyici rolünüz olmalıdır. Proje için Görüntüleyici rolüyle yalnızca iş ayrıntılarını görüntüleyebilirsiniz. Şekilli çıkışı, Watson Machine Learningiçindeki bir iş için giriş verileri olarak kullanabilirsiniz.
Bir Data Refinery akışını bir projeden bir alana yükselttiğinizde ve Data Refinery akışının hedefi bağlı bir veri varlığıolduğunda, bağlı veri varlığını el ile yükseltmeniz gerekir. Bu işlem, alanda Data Refinery akış işini çalıştırdığınızda bağlı veri varlığının verilerinin güncellenmesini sağlar. Tersi durumda, Data Refinery akış işinin başarılı bir çalışması, alanda yeni bir veri varlığı yaratır.
Alanlarla ilgili bilgi için bkz. Konuşlandırma alanları.
Üst konu: Verileri yeniden bulma