0 / 0
Go back to the English version of the documentation
TEMIZLE
Last updated: 13 Eki 2023
TEMIZLE

Data Refinery , aşağıdaki GUI işlemleri kategorilerini destekler.

Bir GUI işlemi seçmek için Yeni adım seçeneğini tıklatın.

İşlemlerin bir alt kümesi, her bir sütunun taşma menüsünden (Taşma Menüsü) kullanılabilir. Sütun üstbilgisindeki Düzenle simgesini tıklatarak bir sütunu yeniden adlandırabilirsiniz.

Sütun tipini dönüştür
Data Refineryiçinde bir dosya açtığınızda, verilerde dizgi dışı veri tipleri saptanırsa, Sütun tipini dönüştür işlemi otomatik olarak ilk adım olarak uygulanır. Veri tipleri otomatik olarak çıkarılan veri tiplerine dönüştürülür. Seçilen bir kolona ilişkin otomatik dönüştürmeyi değiştirmek için, adımın taşma menüsünü (Taşma Menüsü) tıklatın ve Düzenleseçeneğini belirleyin. Diğer işlemlerde olduğu gibi, adımı geri alabilirsiniz. Sütun tipini dönüştür işlemi, dosyayı Data Refinery' da her açtığınızda yeniden uygulanır. Otomatik dönüştürme yalnızca dosya tabanlı veri kaynakları için gerektiği şekilde uygulanır. (Veritabanı bağlantısından bir veri kaynağı için geçerli değildir.)

Her bir sütunun verilerinin hangi veri tipine dönüştürüldüğünü onaylamak için, veri tiplerini görüntülemek üzere taşma menüsünden (Taşma Menüsü) Düzenle ' yi tıklatın. Bilgiler, tarih ya da zaman damgası verilerinin biçimini içerir.

Veriler bir Tamsayıya ya da Ondalık veri tipine dönüştürülmüşse, geçerli tüm sütunlar için ondalık simgesini ve binlik gruplama simgesini belirtebilirsiniz. Ondalık veri tipine dönüştürülen dizgiler, ondalık simge için bir nokta ve binlik gruplama simgesi için bir virgül kullanır. Diğer bir seçenek olarak, ondalık simge ve nokta için virgül ya da binlik gruplama simgesi için özel bir simge seçebilirsiniz. Ondalık simgesi ve binlik gruplama simgesi aynı olamaz.

Kaynak veriler, bir sonlandırıcı ya da tanınmayan bir karakterle karşılaşılıncaya kadar soldan sağa okunur. Örneğin, 12,834 dizgi verilerini Ondalık değerine dönüştürüyorsanız ve virgül (,) ile ne yapacağını belirtmezseniz, veriler 12olarak kesilir. Benzer şekilde, kaynak verilerde birden çok nokta (.) varsa ve ondalık simge için nokta seçerseniz, ilk nokta ondalık ayırıcı olarak kullanılır ve ikinci noktayı izleyen basamaklar kesilir. 1.834.230,000 kaynak dizgisi 1.834değerine dönüştürülür.

Kolon tipini dönüştür işlemi şu tarih ve zaman damgası biçimlerini otomatik olarak dönüştürür:

  • Tarih: ymd, ydm
  • Zaman damgası: ymdHMS, ymdHM, ydmHMS, ydmHM

Tarih ve Zaman Damgası dizgileri yıl için dört basamak kullanmalıdır.

Data Refinery akışının herhangi bir noktasında bir sütunun veri tipini değiştirmek için Sütun tipini dönüştür işlemini el ile uygulayabilirsiniz. Bu işlemin sonucunu tutmak için yeni bir sütun oluşturabilir ya da var olan sütunun üzerine yazabilirsiniz.

İpucu: Bir sütunun veri tipi, kullanabileceğiniz işlemleri belirler. Veri tipinin değiştirilmesi, o sütun için hangi işlemlerin ilgili olduğunu etkileyebilir.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Kolon tipi dönüştürme işlemi, ilk kolonu otomatik olarak Dizgi 'den Tamsayıya dönüştürdü. Diğer üç sütunun veri tiplerini değiştirelim.
    2. Avrupa sütununun veri tipini dizgiden ondalık değere değiştirmek için sütunu seçin ve Dönüştür sütun tipi işlem adımını düzenleyin.
    3. Avrupa sütununun veri tipini dizgiden ondalık değere değiştirmek için sütunu seçin ve Dönüştür sütun tipi işlem adımını düzenleyin.
    4. Ondalık seçin.
    5. Sütun, virgül sınırlayıcısını kullanır, bu nedenle ondalık simge için Virgül (,) seçeneğini belirleyin.
    6. Sonraki kolonu (DATETIME) seçin. Zaman Damgası ve bir biçim seçin.
    7. Uygula düğmesini tıklatın.
    8. Kolonlar artık Tamsayı, Ondalık, Tarih ve Zaman Damgası veri tipleridir. Adımlar panosunda Dönüştür kolon tipi adımı güncellenir.

Kolon değerini eksik olarak dönüştür
Seçilen kolondaki değerler belirtilen kolondaki değerlerle eşleşiyorsa ya da belirtilen bir değerle eşleşiyorsa, değerleri eksik değerlere dönüştürün.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Kolon değerini eksik olarak dönüştür işlemi, seçilen bir kolondaki değerleri, belirli bir kolondaki değerlerle eşleşiyorsa ya da belirtilen bir değerle eşleşiyorsa, eksik değerlere dönüştürür.
    2. Eksik bir değer, değeri olmayan bir alan olan SQL NULL ile eşdeğerdir. Sıfır değerinden ya da boşluk içeren bir değerden farklıdır.
    3. Verilerin eksik değerler olarak daha iyi gösterileceğini düşündüğünüzde, Kolon değerini eksik işleme dönüştür işlemini kullanabilirsiniz. Örneğin, eksik değerleri değiştir işleminde ya da bir Süzgeç işleminde eksik değerleri kullanmak istediğinizde.
    4. Eşleşen bir değere dayalı olarak değerleri eksik olarak değiştirmek için Sütun değerini eksik işleme dönüştür işlemini kullanalım.
    5. DESC sütununda İPTAL EDİLDİ değerine sahip birçok satır olduğuna dikkat edin. İPTAL EDİLDİ dizgilerini eksik değerlere dönüştürelim.
    6. Kolon değerini eksik işleme dönüştür CLEANSE kategorisi altında.
    7. Eksik değerlerle değiştirilecek dizgiyi yazın.
    8. Daha önce İPTAL EDİLDİ olan değerlerin değerleri artık eksik.

Tarih ya da saat değerini al
Tarih ya da zaman damgası veri tipi olan bir kolondan, tarih ya da saat değerinin seçilen bir kısmını çıkarın.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Tarih ya da saat değerini alma işlemi, tarih ya da zaman damgası veri tipi olan bir kolondan bir tarih ya da saat değerinin seçilen bir kısmını alır.
    2. DATE kolonu bir Dizgi veri tipidir. Önce, sütun tipini Tarih veri tipine dönüştürmek için Dönüştür işlemini kullanalım.
    3. DATE (Tarih) kolonunun menüsünden kolon tipi dönüştürme işlemini seçin. Tarih seçin.
    4. Bir Tarih biçimi seçin.
    5. DATE sütunu artık bir tarih veri tipi.
    6. ISO Tarih biçimi, Dizgi veri tipi Tarih veri tipine dönüştürüldüğünde kullanılır. Örneğin, 01/08/2018 dizesi 2018-01-08 tarihine dönüştürüldü.
    7. Artık tarihin yıl bölümünü yeni bir sütuna çıkarabiliriz.
    8. Tarih ya da saat değerini alma işlemi CLEANSE kategorisi altında.
    9. Alınacak tarihin bölümü için Yıl seçeneğini belirleyin ve yeni sütun adı için YEAR yazın.
    10. DATE kolonunun yıl kısmı YEAR kolonunda yer alır.
    11. Steps (Adımlar) panosunda Extract date (tarih) ya da time (saat) değeri işlemi görüntülenir.

Süzgeç
Satırları seçilen sütunlara göre süzgeçten geçir. Seçilen sütun değerleriyle satırları alıkoyun; diğer tüm satırları süzün.

Bu dizgi Süzgeç işleçleri için değeri tırnak işareti içine almayın. Değer tırnak işareti içeriyorsa, bunları eğik çizgi karakteriyle sınırla. Örneğin: \"text\":

  • Bunları İçerir
  • Bunu içermeyen
  • Bununla başlar
  • Bununla başlamaz
  • Bununla bitir
  • Bununla bitmez

Folowing, sayısal, dizgi ve Boole (mantıksal) ve tarih ve zaman damgası kolonlarına ilişkin işleçlerdir:

Operatör Sayısal Dizgi Boole Tarih ve zaman damgası
Bunları İçerir
Bunu içermeyen
Bununla bitmez
Bununla başlamaz
Bununla biter
İki sayı arasında
Boştur
Eşittir
Yanlış
Büyüktür
Büyüktür veya eşittir
Bu konumdadır
Küçüktür
Küçüktür veya eşittir
Boş değil
Eşit değildir
Burada değil
Boş değerli değildir
Boş değerlidir
Doğru
Bununla başlar
  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Satırları seçilen sütunlara göre süzmek için Süzgeç işlemini kullanın. Bir Süzgeç işleminde birden çok koşul uygulayabilirsiniz.
    2. Emp ID sütunundaki dizginin 8 ile başladığı satırlar dışındaki tüm satırları süzmek için düzenli bir ifade kullanın.
    3. Satırları iki durum kısaltmasıyla süzgeçten geçirin.
    4. Uygula düğmesini tıklatın. Yalnızca Emp tanıtıcısının 8 ile başladığı ve State 'in AR ya da TX olduğu satırlar tabloda yer alır.
    5. Satırlar artık AR ve PA tarafından süzgeçten geçirilir. Adımlar panosundaki Süzgeç adımı güncellenir.

Kolonun kaldırılması
Seçilen kolonun kaldırılması.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Bir sütunu veri varlığından hızlı bir şekilde kaldırmak için Sütun kaldırma işlemini kullanın.
    2. Bir sütunu kaldırmanın en hızlı yolu sütunun menüsüdür.
    3. Kaldırılan sütunun adı Steps (Adımlar) panosunda bulunur.
    4. Başka bir sütunu kaldırın.
    5. Kaldırılan sütunun adı Steps (Adımlar) panosunda bulunur.

Yinelemeleri kaldır
Yinelenen kolon değerleri içeren satırları kaldır.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Yinelemeleri kaldır işlemi, yinelenen kolon değerleri olan satırları kaldırır.
    2. Veri kümesi 43 satır içerir. APPLYCODE kolonundaki satırların çoğunda yinelenen değerler var. Veri kümesini, APPLYCODE kolonundaki her değerin yalnızca bir kez geçtiği satırlara indirgemek istiyoruz.
    3. APPLYCODE kolonunun menüsünde yinelenenleri kaldır işlemini seçin.
    4. Yinelemeleri kaldır işlemi, üst satırdan başlayarak yinelenen bir değerin her oluşumunu kaldırdı. Veri kümesi şimdi 4 satırdır.

Boş satırları kaldır
Seçilen sütun için boş ya da eksik değeri olan satırları kaldırın.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Boş satırları kaldır işlemi, seçilen kolon için boş ya da eksik değeri olan satırları kaldırır.
    2. Eksik bir değer, değeri olmayan bir alan olan SQL NULL ile eşdeğerdir. Sıfır değerinden ya da boşluk içeren bir değerden farklıdır.
    3. Veri kümesi 43 satır içerir. TRACK sütunundaki satırların çoğunda eksik değerler var. Veri kümesini, TRACK sütununda bir değeri olan satırlara indirmek istiyoruz.
    4. TRACK sütununun menüsünden boş satırları kaldır işlemini seçin.
    5. Boş satırları kaldır işlemi, TRACK kolonunda boş ya da eksik değeri olan her satırı kaldırdı. Veri kümesi şimdi 21 satırdır.

Eksik değerleri değiştir
Kolonun eksik değerlerini belirtilen bir değerle ya da aynı satırdaki belirli bir kolondaki değerle değiştir.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Eksik değerleri değiştir işlemi, bir kolondaki eksik değerleri belirtilen bir değerle ya da aynı satırdaki belirtilen bir kolondaki değerle değiştirir.
    2. STATE kolonunda boş değerleri olan birçok satır var. Bu boş değerleri bir dizgiyle değiştirmek istiyoruz.
    3. Eksik değerleri değiştir işlemi CLEANSE kategorisi altında.
    4. Durum kolonu için, eksik değerleri Incomplete (Tamamlanmadı) dizgisiyle değiştirin.
    5. Eksik değerler artık Tamamlanmadı değerine sahip.
    6. Steps (Adımlar) panosunda, Replace missing values (Eksik değerleri değiştir) işlemi görüntülenir.

Alt dizgiyi değiştir
Belirtilen alt dizgiyi belirtilen metinle değiştir.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Alt dizgiyi değiştir işlemi, belirttiğiniz metinle bir alt dizgiyi değiştirir.
    2. REDDETME kolonunda BANC dizgisini içeren birçok satır vardır. Bu dizeyi BANK ile değiştirmek istiyoruz.
    3. Alt dizgiyi değiştir işlemi CLEANSE kategorisi altındadır.
    4. Değiştirilecek dizgiyi ve yerine konacak dizgiyi yazın.
    5. BANC dizgisinin tüm geçişleri BANK ile değiştirildi.
    6. Steps (Adımlar) panosunda Replace alt dizgi işlemi görüntülenir.

Yerine koyma değeri
Seçilen kolondaki gerçek veriler için rasgele bir karakter dizgisi değiştirerek, görünümdeki gizli duyarlı bilgilerin yerini alır.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Yerine koyma işlemi, seçilen sütundaki veriler için rasgele bir karakter dizgisi yerine koyarak hassas bilgileri gizler.
    2. Bir sütundaki verileri değiştirmenin en hızlı yolu, sütunun menüsünden Yerine Koyma Değerini seçmektir.
    3. Yerine koyma değeri işlemi Steps (Adımlar) panosunda gösterilir.
    4. Başka bir sütundaki değerleri yerine koyun.
    5. İkinci Yerine Koyma Değeri işlemi Adımlar panosunda gösterilir.

Metin

Metin işlemlerini yalnızca dizgi kolonlarına uygulayabilirsiniz. Bir işlemin sonucunu tutmak için yeni bir sütun oluşturabilir ya da var olan sütunun üzerine yazabilirsiniz.

Metin > Boşlukları daralt
Metinde art arda birden çok boşluğu tek bir boşluğa daraltır.

Metin > Dizgiyi bitiştir
Herhangi bir dizgiyi metne bağla. Dizgiyi metnin başına alabilir, dizgiyi metnin sonuna ya da her ikisine birden ekleyebilirsiniz.

Metin > Küçük Harf
Metni küçük harfe dönüştürün.

Metin > Karakter sayısı
Metindeki karakter sayısını döndürür.

Text > Pad characters
Metni belirtilen dizgiyle doldurun. Metni soldan mı, sağdan mı, yoksa hem soldan mı, hem de sağdan mı dolduracağınızı belirleyin.

Metin > Alt dizgi
Belirtilen konumdan başlayan ve belirtilen uzunluğa sahip metinden alt dizgiler oluşturun.

Metin > Başlık büyük ve küçük harfe
Metni başlık büyük ve küçük harfe dönüştürün.

Metin > Tırnakları kırp
Metinden tek ya da çift tırnak imlerini kaldırın.

Metin > Kırp boşlukları
Metinden baştaki, sondaki ve fazladan boşlukları kaldırın.

Metin > Büyük harf
Metni büyük harfe dönüştürün.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Metin işlemini dizgi kolonlarına uygulayabilirsiniz. Sonuç için yeni bir sütun oluşturun ya da var olan sütunun üzerine yazın.
    2. Önce, bir dizgiyi WORD sütunundaki değerlerle birleştirin.
    3. Kullanılabilir Metin işlemleri.
    4. Dizgiyi sağ tarafa bitiştirin, sonuna boşluk ekleyin ve yukarı yazın.
    5. WORD kolonundaki değerlerin sonuna boşluk ve sözcük yukarı eklenir.
    6. Adımlar panosunda Metin işlemi görüntülenir.
    7. Daha sonra, ANIMAL kolonundaki değerleri bir dizgiyle doldurun.
    8. ANIMAL sütunundaki değerleri ve işareti (&) ile doldur en az 7 karakter için sağdaki simgeler.
    9. ANIMAL sütunundaki değerler, her bir dizginin en az yedi karakter olması için & simgesiyle doldurilir.
    10. Opossum, pangolin, platypus ve hedgehog değerlerinin bir doldurma karakteri içermediğine dikkat edin, çünkü bu dizgiler zaten yedi ya da daha fazla karakter uzunluğundandır.
    11. Daha sonra, tanıtıcı sütunundan t karakterini kaldırmak için Alt Dizgiyi kullanın.
    12. Yeni dizgiyi o konumda başlatmak için Konum 2 'yi seçin. Dört karakterlik bir dizilim için Uzunluk 4 'ü seçin.
    13. Tanıtıcı sütunundaki ilk t karakteri NEW-ID sütunundan kaldırılır.

DERLEM

Hesapla
Başka bir sütunla ya da belirli bir değerle hesaplama gerçekleştirin. İşleçler şunlardır:

  • Ek
  • Bölüm
  • Üst Alma
  • İki sayı arasında
  • Eşittir
  • Büyüktür
  • Büyüktür veya eşittir
  • Küçüktür
  • Küçüktür veya eşittir
  • Eşit değildir
  • Modulus.
  • Çarpma
  • Çıkarma
  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Hesapla işlemi, başka bir sütunla ya da belirli bir değerle toplama ya da çıkarma gibi bir hesaplama gerçekleştirir.
    2. Başlatılacak sütunu seçin.
    3. Kullanılabilir hesaplamalar
    4. Şimdi Ekleme hesaplaması için ikinci sütunu seçin.
    5. Ve değişikliği uygula.
    6. Tanıtıcı kolonu güncellenir ve Steps (Adımlar) panosunda tamamlanan işlem gösterilir.
    7. İşlemlere sütunun menüsünden de erişebilirsiniz.
    8. Bu sefer iki sayı arasında seçin. Aralığı belirtin ve sonuçlar için yeni bir sütun oluşturun.
    9. Yeni sütun çizelgede görüntülenir ve yeni hesaplama işlemi Steps (Adımlar) panosunda görüntülenir.
    10. Bu kez, iki sütunu karşılaştırmak için eşittir seçeneğini belirleyin ve sonuçlar için yeni bir sütun oluşturun.
    11. Yeni sütun çizelgede görüntülenir ve yeni hesaplama işlemi Steps (Adımlar) panosunda görüntülenir.

Matematik

Matematik işlemlerini yalnızca sayısal sütunlara uygulayabilirsiniz. Bir işlemin sonucunu tutmak için yeni bir sütun oluşturabilir ya da var olan sütunun üzerine yazabilirsiniz.

Matematik > Mutlak değer
Bir sayının mutlak değerini alın.
Örnek: 4 ve -4 'ün mutlak değeri 4 'tür.

Math > Arc cosine
Bir açının ark kosinüsünü alın.

Math > Ceiling
Sayının tavanı olarak da bilinen, daha büyük bir değerin en yakın tamsayısını alın.
Örnekler: 2.31 tavanı 3 'tür. -2.31 tavanı -2 'dir.

Math > Exponent
Sütun değerinin gücüne yükseltilmiş bir sayı alın.

Math > Floor
Sayının tabanı olarak da bilinen, daha küçük bir değerin en yakın tamsayısını alın.
Örnek: 2.31 ' in zemini 2 'dir. -2.31 ' in zemini -3 'tür.

Math > Round
Sütun değerine en yakın tamsayıyı alın. Kolon değeri bir tamsayı ise, değeri döndürin.

Math > Square root
Sütun değerinin kare kökünü alın.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Bir sütundaki değerlere bir Matematik işlemi uygulayın. Sonuçlar için yeni bir sütun oluşturun ya da var olan sütunun üzerine yazın.
    2. Kullanılabilir Matematik işlemleri
    3. Sütunun değerlerine Mutlak değeri uygulayın.
    4. Sonuçlar için yeni sütun oluşturun.
    5. Yeni kolon çizelgeye eklenir ve Adımlar panosunda Matematik işlemi görüntülenir.
    6. İşleme sütunun menüsünden de erişebilirsiniz.
    7. ANGLE sütununun değerlerine Yuvarlama Uygulayın.
    8. Sonuçlar için yeni bir sütun oluşturun.
    9. Yeni kolon çizelgeye eklenir ve yeni Matematik işlemi Adımlar panosunda görüntülenir.

Organize Et

Toplama
Bir ya da daha fazla sütunun değerlerine özet hesaplamaları uygulayın. Her toplama yeni bir sütun oluşturur. İsteğe bağlı olarak, yeni sütunu grubun bir özelliğini (örneğin, bir bölümü ya da bir tanıtıcıyı) tanımlayan başka bir sütuna göre gruplamak için Sütunlara göre grupla seçeneğini belirleyin. Birden çok sütuna göre gruplayabilirsiniz. Birden çok toplamayı tek bir işlemde birleştirebilirsiniz.

Kullanılabilir toplama işlemleri, veri tipine bağlıdır.

Sayısal veri:

  • Benzersiz değerleri say
  • En Az
  • Maksimum
  • Toplam
  • Standart sapma
  • Ortalama

Dizgi verileri:

  • Satır değerlerini birleştir
  • Benzersiz değerleri say
  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Toplama işlemi, bir ya da daha fazla sütunun değerlerine özet hesaplamaları uygular. Her toplama yeni bir sütun oluşturur.
    2. Kullanılabilir toplamalar, verilerin sayısal mı, yoksa dizgi verisi mi olduğuna bağlıdır.
    3. Kullanılabilir işleçler sütunun veri tipine bağlıdır. Sayısal veriler için kullanılabilecek işleçler.
    4. UniqueCarrier metin sütunu seçiliyken, dize verileri için kullanılabilir işleçleri görebilirsiniz.
    5. UniqueCarrier sütununda kaç benzersiz değer olduğunu sayacağız. Bu toplama veri kümesinde kaç havayolu olduğunu gösterir.
    6. Yeni Havayolları sütununda 22 havayolu var. Diğer sütunlar silinir.
    7. Adımlar panosunda Toplama işlemi görüntülenir.
    8. Sayısal veriler üzerinde bir toplama göstermek için baştan başlayalım.
    9. Varış gecikmelerinin ortalamasını (ortalama değeri) gösterir.
    10. Tüm geliş gecikmelerinin ortalama değeri yeni MeanArrGecikme sütununda bulunur. Diğer sütunlar silinir.
    11. Ayrıca, toplanan sütunu, grubun bir özelliğini tanımlayan başka bir sütuna göre gruplayabilirsiniz.
    12. Havayolu şirketine göre varış gecikmelerinin ortalamasını görebilmek için seçime göre bir Grup ekleyerek Toplama adımını düzenleyelim.
    13. Sonuçları UniqueCarrier sütununa göre gruplayın.
    14. Ortalama varış gecikmeleri artık havayolu şirketine göre gruplandırılmıştır.
    15. Steps (Adımlar) panosunda Aggregate (Toplama) işlemi görüntülenir.


İki ya da daha çok sütunun değerlerini birleştirin.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Birleştirme işlemi, iki ya da daha çok kolonların değerlerini bitiştirir.
    2. Bitiştirme işlemi ORGANIZE kategorisi altındadır.
    3. Birleştirilecek sütunları seçin.
    4. Birleştirilmiş değerler arasında kullanılacak bir ayırıcı seçin.
    5. Bitiştirilmiş değerler için kolon için bir ad yazın.
    6. Yeni sütun, veri kümesinde ya da özgün sütunun yanında en sağdaki sütun olarak görüntülenebilir.
    7. Özgün sütunları alıkoyup değişiklikleri uygulayın.
    8. Yeni DATE sütunu, diğer üç sütundaki bitiştirilmiş değerleri noktalı virgül ayırıcısıyla gösterir.
    9. Adımlar panosunda Concatenate işlemi görüntülenir.
    10. DATE kolonu bir Dizgi veri tipidir. Kolon tipini Tarih veri tipine dönüştürmek için Dönüştür işlemini kullanalım.
    11. DATE (Tarih) kolonunun menüsünden kolon tipi dönüştürme işlemini seçin. Tarih seçin.
    12. Bir tarih biçimi seçin ve sonuç için yeni bir sütun oluşturun.
    13. Yeni sütunu özgün sütunun yanına yerleştirin ve değişiklikleri uygulayın.
    14. Yeni sütun, dönüştürülen tarih biçimiyle görüntülenir.
    15. Adımlar panosunda Sütun tipini dönüştür işlemi görüntülenir.
    16. ISO Tarih biçimi, Dizgi veri tipi Tarih veri tipine dönüştürüldüğünde kullanılır. Örneğin, 2004; 2; 3 dizesi 2004-02-03 tarihine dönüştürülmüştür.

Koşullu değiştirme
Koşullara dayalı olarak bir sütundaki değerleri değiştirin.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Koşullara dayalı olarak bir sütundaki değerleri değiştirmek için Koşullu değiştirme işlemini kullanın.
    2. Önce, CODE dizgisi kolonundaki verilerin yerine konacak koşulları belirleyip sonuçlar için yeni bir kolon yaratalım.
    3. Dizgi verileri için kullanılabilecek koşul işleçleri.
    4. İlk koşulu ekleyin-KOşUL 1: KOşUL, C değerinin COMPLETE değeriyle değiştirilmesine eşittir.
    5. İkinci bir koşul ekleyin-KOşUL 2: KOD, TAMAMLANMADI ile değiştirdiğim değere eşittir.
    6. Koşulları karşılamayan değerlerle ne yapacağını belirtin. Buraya, boş bir dizgiyi belirtmek için iki çift tırnak işareti gireceğiz.
    7. Sonuçlar için yeni bir sütun oluşturun.
    8. Yeni kolon (STATUS), CODE kolonundaki koşullu değişiklikleri gösterir.
    9. Koşullu değiştirme işlemi Adımlar panosunda gösterilir.
    10. Daha sonra, INPUT tamsayı sütunundaki verileri değiştirmek için koşulları belirleyip sonuçlar için yeni bir sütun oluşturalım.
    11. Sayısal veriler için kullanılabilecek koşul işleçleri.
    12. İlk koşulu ekleyin-CONDITION 1: INPUT 3 değerinden küçük ya da bu değere eşit, LOW değeriyle değiştirin.
    13. İkinci bir koşul ekleyin-CONDITION 2: INPUT Değeri 4.5.6 MED değeriyle değiştirin.
    14. Üçüncü bir koşul ekleyin-CONDITION 3: INPUT, 7 değerinden büyük ya da bu değere eşit, HIGH değeriyle değiştirin.
    15. Koşulları karşılamayan değerlerle ne yapacağını belirtin.
    16. Sonuçlar için yeni bir sütun oluşturun.
    17. Yeni sütun, RATING, INPUT sütunundaki koşullu değişiklikleri gösterir.
    18. Koşullu değiştirme işlemi Adımlar panosunda gösterilir.

Birleştir
Belirtilen anahtar sütunlarındaki değerlerin karşılaştırmasına dayalı olarak iki veri kümesinden verileri birleştirin. Gerçekleştirilecek birleştirme tipini belirleyin, karşılaştırmak istediğiniz her iki veri kümesinde de kolonları (birleştirme anahtarları) seçin ve sonuç veri kümesinde bulunmasını istediğiniz kolonları seçin.

Her iki veri kümesinde birleştirme anahtarı kolonlarının uyumlu veri tipleri olması gerekir. Birleştir işlemi eklediğiniz ilk adımsa, dosyayı Data Refinery' nde açtığınızda Kolon tipini dönüştür işleminin ilk veri kümesindeki birleştirme anahtarı kolonlarının veri tipini otomatik olarak dönüştürüp dönüştürmediğini denetleyin. Ayrıca, Birleştirme işleminin Data Refinery akışında nerede olduğuna bağlı olarak, birleştirme anahtarı kolonlarının veri tiplerinin eşleştiğinden emin olmak için Kolon tipini dönüştür işlemini kullanabilirsiniz. Adımın anlık görüntüsünü görmek için Adımlar panosunda önceki bir adımı tıklatın.

Birleştirme tipleri şunlardır:

Birleştirme tipi Açıklama
Sol birleştirme Özgün veri kümesindeki tüm satırları döndürür ve yalnızca birleştirme veri kümesindeki eşleşen satırları döndürür. Birleştirme veri kümesindeki her eşleşen satır için özgün veri kümesinde bir satır döndürür.
Sağ birleştirme Birleştirme veri kümesindeki tüm satırları döndürür ve yalnızca özgün veri kümesindeki eşleşen satırları döndürür. Özgün veri kümesindeki her eşleşen satır için birleştirme veri kümesinde bir satır döndürür.
İç birleştirme Yalnızca diğer veri kümesindeki satırlarla eşleşen her veri kümesindeki satırları döndürür. Birleştirme veri kümesindeki her eşleşen satır için özgün veri kümesinde bir satır döndürür.
Tam birleştirme Her iki veri kümesindeki tüm satırları döndürür. Özgün veri kümesindeki satırları birleştirme veri kümesindeki eşleşen satırlarla harmanlar.
Yarı birleştirme Yalnızca birleştirme veri kümesindeki satırlarla eşleşen özgün veri kümesindeki satırları döndürür. Birleştirme veri kümesindeki tüm eşleşen satırlar için özgün veri kümesinde bir satır döndürür.
Birleştirmeye karşı koruma Yalnızca özgün veri kümesindeki, birleştirme veri kümesindeki satırlarla eşleşmeyen satırları döndürür.
  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. customers.csv veri kümesi, şirketinizin müşterileriyle ilgili bilgileri ve sales.csv veri kümesi, şirketinizin satış temsilcileriyle ilgili bilgileri içerir.
    2. Veri kümeleri SALESREP_ID kolonunu paylaşır.
    3. customers.csv veri kümesi, Data Refinery' de açıktır.
    4. Birleştirme işlemi, SALESREP_ID kolonundaki değerlerin karşılaştırılması temelinde bu iki veri kümesindeki verileri birleştirebilir.
    5. Yalnızca diğer veri kümesinde eşleşen her veri kümesindeki satırları döndürmek için bir iç birleştirme yapmak istiyorsunuz.
    6. Bir sütuna ilişkin kaynak veri kümesini görmek için her iki veri kümesinde de bulunan sütunlara eklemek üzere özel bir sonek ekleyebilirsiniz.
    7. customers.csv veri kümesiyle birleştirilecek sales.csv veri kümesini seçin.
    8. Birleştirme anahtarı için, süzgeç uygulanan bir listeyi görmek üzere kolon adını yazmaya başlayın. SALESREP_ID kolonu, iki veri kümesini birbirine bağlar.
    9. Daha sonra, içerilecek kolonları seçin. Yinelenen sütunlar sonekin sonuna eklendiğini görüntüler.
    10. Şimdi değişiklikleri uygulayın.
    11. Join (Birleştir) işlemi Steps (Adımlar) panosunda görüntülenir.
    12. Artık veri kümesi, customers.csv ve sales.csv veri kümelerindeki sütunlarla zenginleştirilmiştir.

Sütunu yeniden adlandır
Seçilen sütunu yeniden adlandırın.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Bir sütunu hızlı bir şekilde yeniden adlandırmak için Sütunu Yeniden Adlandır işlemini kullanın.
    2. Bir sütunu yeniden adlandırmanın en hızlı yolu, tablodaki sütunun adını düzenlemektir.
    3. Adı düzenleyin ve klavyenizde Enter tuşuna basın.
    4. Yeniden Adlandır sütun adımı, eski adı ve yeni adı gösterir.
    5. Şimdi başka bir sütunu yeniden adlandırın.
    6. Steps (Adımlar) panelinde BANKS sütununun DOGS olarak yeniden adlandırılmış olduğu gösterilir.
    7. Şimdi son sütunu yeniden adlandırın.
    8. Steps panelinde RATIOS sütununun BIRDS olarak yeniden adlandırılmış olduğu gösterilir.

Örnek
Aşağıdaki yöntemlerden birini kullanarak verilerinizin bir alt kümesini oluşturun. UI işlemlerinden örnekleme adımları yalnızca akış çalıştırıldığında geçerlidir.

  • Rasgele örnek: Altkümenin her veri kaydının seçilme olasılığı eşittir.
  • Katmanlanmış örnek: Verileri strataadı verilen bir ya da daha fazla alt gruba bölün. Daha sonra, her alt gruptan veri içeren bir rasgele örnek oluşturun.
  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Örnek işlemi, verilerinizin bir alt kümesini oluşturur.
    2. Çok miktarda veriniz olduğunda ve daha hızlı prototipleme için temsili bir örnek üzerinde çalışmak istediğinizde Örnek işlemini kullanın.
    3. Örnek işlem ORGANIZE kategorisinde.
    4. Örnek yaratmak için iki yöntemden birini seçin.
    5. Rasgele bir örnekle, her satırın örnek verilere dahil edilme olasılığı eşittir.
    6. Satır sayısına ya da veri yüzdesine göre rasgele bir örnek seçebilirsiniz.
    7. Katmanlı bir örnek rasgele bir örneğe temel alır. Rasgele bir örnekte olduğu gibi, örnekteki veri miktarını belirtirsiniz (satırlar ya da yüzde).
    8. Katmanlı bir örnekle, verileri strata adı verilen bir veya daha fazla alt gruba bölüyorsunuz. Daha sonra, her alt gruptan özelleştirilmiş veriler içeren bir rasgele örnek oluşturmanız gerekir.
    9. Yöntem için, Otomatik seçeneğini belirlerseniz, tabata için bir sütun seçersiniz.
    10. El ile seçeneğini belirlerseniz, bir ya da daha fazla tabata belirtirsiniz ve her tabakadaki satırları tanımlayan süzgeç koşullarını belirtirsiniz.
    11. Bu havayolu veri örneğinde, iki tabakal oluşturacağız. Bir strata, New York City varış havaalanlarına sahip olmak için üretimin %50 'sini tanımlar ve ikinci tabata, belirli bir uçuş mesafesine sahip olmak için kalan %50 'yi tanımlar.
    12. Bu katmanla ilgili ayrıntıları belirtin kutusuna, bu ilk katmanda belirteceğiniz koşulları temsil edecek örnek yüzdesini girin. Strata yüzdelerinin toplamı %100 olmalıdır.
    13. Dizgi verileri için kullanılabilecek işleçler.
    14. Numunenin %50 'si New York şehrinin varış noktalarına sahip olacak.
    15. İlk tabağı kaydetmek için Save düğmesini tıklatın.
    16. Strata0olarak tanımlanan ilk tabaka bir koşula sahiptir. Bu katmanda, numunenin %50 'si bu durumu karşılamalıdır.
    17. Bu tabakalaya ilişkin ayrıntıları belirtin, ikinci tabakada belirteceğiniz koşulları temsil edecek örnek yüzdesini girin.
    18. Sayısal veriler için kullanılabilecek işleçler.
    19. Numunenin %50 'si 500 'den fazla mesafeye sahip uçuşlar için olacak.
    20. İkinci tabağı kaydetmek için Save düğmesini tıklatın.
    21. Strata1olarak tanımlanan ikinci tabaka bir koşula sahiptir. Bu katmanda, numunenin %50 'si bu durumu karşılamalıdır.
    22. Birden çok tabakal kullanırsanız, Örnek işlemi dahili olarak katmanlara OR koşulu ile bir Süzgeç işlemi uygular. Verilere, koşullara ve numunenin boyutuna bağlı olarak, birden çok koşulla tek bir tabakal kullanma sonuçları, birden çok tabakal kullanmaktan farklı olabilir.
    23. Diğer Data Refinery işlemlerinden farklı olarak, Örnek işlemi veri kümesini yalnızca siz Data Refinery akışı için bir iş oluşturup çalıştırdıktan sonra değiştirir.
    24. Örnek adım, Steps (Adımlar) panosunda gösterilir.
    25. Veri kümesi 10000 satırın üzeridir.
    26. Data Refinery akışı için bir iş kaydedin ve oluşturun.
    27. Yeni varlık dosyası, Data Refinery akışının çıkışı için projeye eklenir.
    28. Çıkış dosyasını görüntüleyin.
    29. New York City havaalanları Dest sütununda 10 sıra (örneğin %50 'si), Mesafe sütununda ise 500 'den büyük değerlere sahip 17 sıra vardır.
    30. Bu sonuçlar, katmanların bir OR koşulu ile uygulanmasından ve New York City havaalanlarını içeren Dest tarafından süzülen satırların 500 'den büyük Uzaklık değerlerine sahip olduğu ilk katmanlarda belirtilen koşullar için örtüşen veriler bulunmasından kaynaklanır.
    31. Data Refinery ' deki çıkış dosyası, küçültülmüş boyutu gösterir.

Yükselen düzende sırala
Tablodaki tüm satırları seçilen sütuna göre artan düzende sıralayın.

Azalan düzende sırala
Tablodaki tüm satırları seçilen sütuna göre azalan düzende sıralayın.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Seçilen bir sütundaki satırları sıralayarak bir veri kümesindeki tüm satırları hızlı bir şekilde sıralayın.
    2. Kolonları sıralamanın en hızlı yolu, kolonun menüsünde bulunur.
    3. Satırları artan ya da azalan düzende sıralayabilirsiniz.
    4. Artan düzende sırala.
    5. Çizelgedeki tüm satırların sırası, birinci kolonun Sıralama işlemiyle güncellenir.
    6. Sıralama işlemi Steps (Adımlar) panosunda gösterilir.
    7. Azalan düzende sırala.
    8. Çizelgedeki tüm satırların sırası, ikinci kolonun Sıralama işlemiyle değiştirilir.
    9. İkinci Sıralama işlemi Adımlar panosunda gösterilir.
    10. Artan düzende sırala.
    11. Çizelgedeki tüm satırların sırası, üçüncü kolonun Sıralama işlemiyle değiştirilir.
    12. Üçüncü Sıralama işlemi, Adımlar panosunda gösterilir.

Sütunu böl
Sütunu alfasayısal olmayan karakterlere, konuma, kalıba ya da metne göre böl.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Sütunu böl işlemi, alfasayısal olmayan karakterleri, metni, kalıbı ya da konumu temel alarak bir sütunu iki ya da daha fazla sütuna böler.
    2. Başlamak için YMD sütununu YEAR, MONTH ve DAY sütunlarına bölelim.
    3. Sütunu böl işlemi ORGANIZE kategorisinde yer aldı.
    4. Önce bölünecek YMD sütununu seçin.
    5. Sekmeler, sütunu bölmek için dört seçenek sunar.
    6. DEFAULT, sütunu bölmek için sütun değerlerindeki alfasayısal olmayan karakterleri kullanır.
    7. TEXT ' de bir karakter seçin ya da sütunu bölmek için metin girin.
    8. PATTERN içinde, sütunun nerede bölüneceğini belirlemek için R sözdizimine dayalı bir düzenli ifade girersiniz.
    9. POSITION içinde, kolonun hangi konumda bölüneceğini belirtirsiniz.
    10. YMD sütununu alfasayısal olmayan bir karakter olan yıldız (*) ile bölmek istiyoruz, bu nedenle DEFAULT sekmesini seçeceğiz.
    11. YMD sütununu üç yeni sütuna ayırın: YEAR, MONTH ve DAY.
    12. Veri kümesine üç yeni sütun (YEAR, MONTH ve DAY) eklenir.
    13. Sütun bölme işlemi, Steps (Adımlar) panosunda gösterilir.
    14. Daha sonra FLIGHT sütununu iki sütuna ayırın-biri havayolu kodu için, diğeri uçuş numarası için. Havayolu kodları iki karakter olduğu için, sütunu konuma göre bölebiliriz.
    15. POSITION sekmesini tıklatın ve Konumlar kutusuna 2 yazın.
    16. FLIGHT sütununu iki yeni sütuna böl-HAVAYOLU ve FLTNMBR.
    17. İki yeni sütun, HAVAYOLU ve FLIGHTNBR, veri kümesine eklenir.
    18. Sütun bölme işlemi, Steps (Adımlar) panosunda gösterilir.

Birleştir
Aynı şemayı paylaşan iki veri kümesindeki satırları birleştir ve yinelemeleri süzgeçten geçir. Farklı sayıda kolonlara izin ver ve yinelenen değerlere izin verseçeneğini belirlerseniz, işlem bir UNION ALL komutudur.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Birleştir işlemi, aynı şemayı paylaşan iki veri kümesindeki satırları birleştirir.
    2. Bu veri kümesi dört sütun ve altı satır içerir. Soldan sağa veri tipleri şunlardır: Dizgi, Dizgi, Ondalık, Dizgi.
    3. Veri kümesi Data Refinery' ne yüklendiğinde, AUTOMATIC Convert kolon tipi işlemi PRICE kolonunu otomatik olarak Ondalık veri tipine dönüştürdü.
    4. İkinci veri kümesindeki sütunlar, bu veri kümesindeki veri tipleriyle uyumlu olmalıdır.
    5. Geçerli veri kümesiyle birleştirilecek veri kümesini seçin.
    6. Yeni veri kümesini önizlediğinizde, bunun dört sütunu da olduğunu görürsünüz. Ancak, PRICE kolonu bir String veri tipidir.
    7. Birleşim işlemini uygulamadan önce, PRICE kolonunun yeni veri kümesindeki (String) PRICE kolonuyla aynı veri tipi olması için AUTOMATIC Convert kolon tipi adımını silmeniz gerekir.
    8. PRICE kolonu artık dizgi verisi.
    9. Şimdi birleşme işlemini tekrarlayın.
    10. Yeni veri kümesi geçerli veri kümesine eklenir. Veri kümesi 12 satıra yükseltildi.
    11. Birleşim işlemi Adımlar panosunda gösterilir.
    12. Şimdi farklı sayıda sütun içeren bir veri kümesi ekleyin. Eşleşen sütunlar yine de uyumlu veri tipleri olmalıdır.
    13. Geçerli veri kümesiyle birleştirilecek veri kümesini seçin.
    14. Yeni veri kümesini önizlerken, özgün veri kümesinden bir sütun daha fazla olduğunu görürsünüz. Beşinci sütun TYPE 'dir.
    15. Farklı sayıda kolonlara izin ver seçeneğini belirleyin ve yinelenen değerlere izin verin.
    16. Birleşim işlemini uygulayın.
    17. Yeni veri kümesi geçerli veri kümesine eklenir. Veri kümesi 18 satıra yükseltildi.
    18. Veri kümesine ek kolon (TYPE) eklenir.
    19. Birleşim işlemi Adımlar panosunda gösterilir.

Birleşim işlemi için ipucu: Uyumsuz şemalarla ilgili bir hata alırsanız, otomatik Sütun tipini dönüştür işleminin ilk veri kümesinin veri tiplerini değiştirip değiştirmediğini denetleyin. Sütun tipini dönüştür adımını silin ve yeniden deneyin.

DOğAL DIL

Durdurma sözcüklerini kaldır İngilizce 'nin "the" ya da "and" gibi sık kullanılan sözcüklerini kaldırın. Atlanacak sözcükler genellikle metin analizi algoritmaları ve modelleri için çok az anlamsal değere sahiptir. Veri hacmini azaltmak ve makine öğrenimi modellerini eğitmek için kullandığınız verilerin kalitesini artırmak için durdurma sözcüklerini kaldırın.

İsteğe bağlı: Hangi sözcüklerin kaldırıldığını onaylamak için, seçilen sütuna Simgeleştir işlemini (sözcüklere göre) uygulayın ve Profil sekmesinde sözcüklerin istatistiklerini görüntüleyin. Tokenize adımını daha sonra Data Refinery akışında geri alabilirsiniz.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Durdurma sözcüklerini kaldır işlemi, İngilizce 'nin ortak sözcüklerini veri kümesinden kaldırır. Atlanacak sözcükler genellikle metin analizi algoritmaları ve modelleri için çok az anlamsal değere sahiptir. Veri hacmini azaltmak ve veri kalitesini artırmak için durdurma sözcüklerini kaldırın.
    2. Atlanacak sözcükleri kaldır işlemi şu sözcükleri kaldırır: a, a, a, and, as, be, but, by, for, from, in, into, is, it, no, not, of, on, or, then, the, the, then, these, these, to, will, with.
    3. Durdurma sözcüklerini kaldırma işlemi NATURAL LANGUAGE kategorisi altındadır.
    4. STRING kolonunu seçin.
    5. Durdurma sözcüklerini kaldırmak için Uygula düğmesini tıklatın.
    6. Durdurma sözcükleri STRING kolonundan kaldırılır.
    7. Sözcükleri kaldırma işlemi Adımlar panosunda gösterilir.

Tokenize
İngilizce metni sözcüklere, cümlelere, paragraflara, satırlara, karakterlere ya da düzenli ifadeye ayırır.

  • Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

    Video yayınının yazılı kopyası

    1. Simgeleme işlemi İngilizce metni sözcüklere, cümlelere, paragraflara, satırlara, karakterlere ya da düzenli ifadeye ayırır.
    2. Tokenize işlemi NATURAL LANGUAGE kategorisi altındadır.
    3. STRING kolonunu seçin.
    4. Kullanılabilir bölümleme seçenekleri.
    5. WORDS adıyla yeni bir sütun oluşturun.
    6. Tokenize işlemi, STRING kolonundaki sözcükleri aldı ve her sözcük için bir satır içeren yeni bir kolon (WORDS) yarattı.
    7. Tokenize işlemi Steps (Adımlar) panosunda gösterilir.

Üst konu: Verileri yeniden bulma

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more