0 / 0
Go back to the English version of the documentation
Hızlı başlangıç: Verileri iyileşir
Last updated: 09 Kas 2023
Hızlı başlangıç: Verileri iyileşir

Büyük hacimli işlenmemiş verileri hızla analitik için hazır, tüketilebilir, yüksek kaliteli bilgilere dönüştürerek veri hazırlığı süresini kurtarabilirsiniz. Data Refinery aracı hakkında bilgi alın, ardından bir video izleyin ve yeni başlayanlar için uygun ve kodlama gerektirmeyen bir öğretici program alın.

Temel iş akışınız şu görevleri içerir:

  1. Korumalı alan projenizi açın. Projelerde, verilerle çalışmak için başkalarıyla işbirliği yapabilirsiniz.
  2. Verilerinizi projeye ekleyin. Bir bağlantı aracılığıyla uzak veri kaynağından CSV dosyaları ya da verileri ekleyebilirsiniz.
  3. Data Refineryverileri açın.
  4. Verileri daraltmak için işlemleri kullanarak adımları gerçekleştirin.
  5. Verileri dönüştürmek için bir iş yaratın ve çalıştırın.

Data Refinery hakkında bilgi edinme

Bir grafik akış düzenleyicisiyle tablo verilerini temizlemek ve şekillendirmek için Data Refinery ' ni kullanın. İşlemleri, işlevleri ve mantıksal işleçleri kodlamak için etkileşimli şablonları da kullanabilirsiniz. Verileri temizlerken, yanlış, eksik, yanlış biçimlendirilmiş ya da çoğaltılmış verileri düzeltir ya da kaldırıyorsunuz. Verileri şekillendirdiğinizde, verileri süzgeçten geçirerek, sıralayarak, sütunları birleştirerek ya da kaldırarak ve işlemleri gerçekleştirerek özelleştirebilirsiniz.

Veriler üzerinde sıralı işlemler kümesi olarak bir Data Refinery akışı yaratırsınız. Data Refinery , verilerinizin profilini doğrulamak için bir grafik arabirimi ve verilerinize ilişkin bakış açısı ve öngörüler sağlayan 20 'den fazla özelleştirilebilir grafik içerir. Daraltılmış veri kümesini kaydettiğinizde, genellikle bunu okuduğunuz yerden farklı bir konuma yüklüyorsunuz. Bu şekilde, kaynak verileriniz iyileştirme sürecinden etkilenmez.

Verileri iyileştirme hakkında daha fazla bilgi edinin

Verileri iyileştirme hakkında bir video izleyin

Videoyu izleyin Verileri nasıl daraltacağınızı görmek için bu videoyu izleyin.

Bu video, bu belgedeki kavramları ve görevleri öğrenmek için görsel bir yöntem sağlar.

Verileri daraltmak için bir öğretici program deneyin

Bu öğretici programda şu görevleri tamamlayabilirsiniz:

Bu eğitmenin tamamlanması yaklaşık 30 dakika sürecektir.



  • Resimdeki videoyu kullan

    İpucu: Videoyu başlatın, daha sonra siz öğretici programda gezinirken video, resim içinde resim moduna geçer. Resimdeki resimle en iyi deneyimi elde etmek için video içindekiler tablosunu kapatın. Bu öğretici programdaki görevleri tamamlarken videoyu izleyebilmek için resimdeki modu kullanabilirsiniz. İzlemek istediğiniz her görev için zaman damgalarını tıklatın.

    Aşağıdaki canlandırmalı resim, resimdeki video resminin ve içindekiler tablosunun özelliklerinin nasıl kullanılacağını gösterir:

    Resimdeki resim ve bölümler nasıl kullanılır?

    Toplulukta yardım alma

    Bu öğretici programla ilgili yardıma gereksinim duyarsanız, Cloud Pak for Data Community tartışma forumundabir soru sorabilir ya da bir yanıt bulabilirsiniz.

    Tarayıcı pencerelerinizi ayarlayın

    Bu öğretici programı tamamlama konusunda en iyi deneyimi sağlamak için Cloud Pak for Data olanağını bir tarayıcı penceresinde açın ve bu eğitmen sayfasını iki uygulama arasında kolayca geçiş yapmak üzere başka bir tarayıcı penceresinde açık tutun. Takip edilmesini kolaylaştırmak için iki tarayıcı penceresini yan yana düzenlemeyi düşünün.

    Yan yana öğretici program ve kullanıcı arabirimi

    İpucu: Kullanıcı arabiriminde bu öğretici programı tamamlarken kılavuzlu bir turla karşılaşırsanız, Belki daha sonraseçeneğini tıklatın.

    Başa dön


  • Verileri ve Data Refinery akışını depolamak için bir projeye ihtiyacınız vardır. Kum havuzu projenizi kullanabilir ya da bir proje yaratabilirsiniz.

    1. Gezinme menüsünden Gezinme menüsü, Projeler > Tüm projeleri görüntüle seçeneklerini belirleyin

    2. Korumalı alan projenizi açın. Yeni bir proje kullanmak istiyorsanız:

      1. Yeni projeöğesini tıklatın.

      2. Boş proje yaratseçeneğini belirleyin.

      3. Proje için bir ad ve isteğe bağlı açıklama girin.

      4. Var olan bir nesne depolama hizmeti örneği seçin ya da yeni bir örnek oluşturun.

      5. Oluştur'u tıklatın.

    Denetim noktası simgesi İlerlemenizi denetleyin

    Aşağıdaki resim yeni, boş bir projeyi göstermektedir.

    Aşağıdaki resim yeni, boş bir projeyi gösteriyor.

    Daha fazla bilgi için veya bir video izlemek için bkz. Proje oluşturma.


    Başa dön


  • öğretici videoyu önizle Bu görevi önizlemek için 00:05adresinden başlayan videoyu izleyin.

    Projenize bir veri varlığı eklemek ve bir Data Refinery akışı oluşturmak için aşağıdaki adımları izleyin. Bu öğretici programda kullanacağınız veri kümesi Örneklerde bulunur.

    1. Örnekler içindeki Havayolu verilerine erişin.

    2. Projeye ekle' yi tıklatın.

    3. Listeden projenizi seçin ve Ekledüğmesini tıklatın.

    4. Veri kümesi eklendikten sonra Projeyi Görüntüle' yi tıklatın.

      Örneklerden bir projeye veri varlığı ekleme hakkında daha fazla bilgi için bkz. Not defterindeki verileri yükleme ve verilere erişme.

    5. Varlıklar sekmesinde, içeriğini önizlemek için airline-data.csv veri varlığını tıklatın.

    6. Dosyanın bir örneğini Data Refineryiçinde açmak için Verileri hazırla seçeneğini tıklatın ve Data Refinery öğesinin bir veri örneğini okuyup işlemesini bekleyin.

    7. Information (Bilgi) ve Steps (Adımlar) panolarını kapatın.

    Denetim noktası simgesi İlerlemenizi denetleyin

    Aşağıdaki resim, Data Refinery' de açık olan havayolu veri varlığını göstermektedir.

    Aşağıdaki resim, Data Refinery' de açık olan havayolu veri varlığını göstermektedir.


    Başa dön


  • öğretici videoyu önizle Bu görevi önizlemek için 00:47adresinden başlayan videoyu izleyin.

    Watson Knowledge Catalog , bir varlığın içeriğini otomatik olarak bu sütunlardaki değerlere göre profiller ve sınıflandırır. Verileri keşfetmek üzere Profil ve Görselleştirmeler sekmelerini kullanmak için bu adımları izleyin.

    İpucu: Verileri iyileştirirken verilerdeki değişiklikleri görüntülemek için Profil ve Görselleştirmeler sayfalarını kullanın.
    1. Aykırı değerleri bulmak üzere verilerin sıklık dağılımını gözden geçirmek için Profil sekmesini tıklatın.

      1. Kolonlar arasında ilerleyin ve her kolona ilişkin istatistiklere bakın. İstatistikler, her bir sütundaki çeyrekler arası aralığı, minimum, maksimum, medyan ve standart sapmayı gösterir.

      2. Ek ayrıntıları görmek için imleci bir çubuğun üzerine getirin.

      Aşağıdaki resim Profil sekmesini gösterir:
      Profil sekmesi

    2. Görselleştirmeler sekmesini tıklatın.

      1. Görselleştirmek için UniqueCarrier sütununu seçin. Önerilen grafikler simgelerinin yanında mavi bir nokta vardır.

      2. Pasta grafiğini tıklatın. Veri içindeki kalıpları, bağlantıları ve ilişkileri belirlemek için grafiklerde bulunan farklı perspektifleri kullanın.

    Denetim noktası simgesi İlerlemenizi denetleyin

    Aşağıdaki resim Görselleştirmeler sekmesini gösterir. Artık verileri iyileştirmeye hazırsınız.

    Görselleştirmeler sekmesi


    Başa dön


  • Data Refinery operasyonları

    Data Refinery , verileri daraltmak için GUI operasyonları ve kodlama işlemleriolmak üzere iki tür işlem kullanır. Bu öğretici programda her iki işlem türünü de kullanacaksınız.

    • GUI işlemleri birden çok adımdan oluşabilir. Yeni adımiçinden bir işlem seçin. Her bir sütunun taşma menüsünde (Taşma Menüsü) GUI işlemlerinin bir alt kümesi de bulunur.

      Data Refinerybir dosya açtığınızda, Kolon tipini dönüştür işlemi, dizgi olmayan veri tiplerini çıkarsanan veri tiplerine (örneğin, Tamsayı, Tarih, Boole, vb.) dönüştürmek için ilk adım olarak otomatik olarak uygulanır. Bu adımı geri alabilir ya da düzenleyebilirsiniz.

    • Kodlama işlemleri , kodlama işlemleri, işlevler ve mantıksal işleçler için etkileşimli şablonlardır. İşlemlerin çoğu etkileşimli yardıma sahip. Kodlama işlemlerini ve sözdizimi seçeneklerini görmek için komut satırı metin kutusundaki işlem adını tıklatın.

    öğretici videoyu önizle Bu görevi önizlemek için 01:16adresinden başlayan videoyu izleyin.

    Verilerin iyileştirilmesi, bir Data Refinery akışıoluşturmak için bir dizi adımdır. Bu görev boyunca ilerlemenizi izlemek için Adımlar panosunu görüntüleyin. Silmek ya da düzenlemek için bir adım seçebilirsiniz. Bir hata yaparsanız, Geri Al simgesini de Geri Al simgesitıklatabilirsiniz. Verileri daraltmak için aşağıdaki adımları izleyin:

    1. Veri sekmesine geri dönün.

    2. Yıl sütununu seçin. Taşma menüsünü (Taşma menüsü) tıklatın ve Alçalan düzende sıralaseçeneğini belirleyin.

    3. Adımlar panosunda yeni adımı görmek için Adımlar düğmesini tıklatın.

    4. Belirli bir havayolu şirketinin gecikmelerine odaklanın. Bu eğitmen United Airlines (UA) kullanıyor, ancak herhangi bir havayolu seçebilirsiniz.

      1. Yeni adım' ı tıklatın ve daha sonra, SüzgeçGUI işlemini seçin.

      2. UniqueCarrier sütununu seçin.

      3. İşleçiçin Eşittirseçeneğini belirleyin.

      4. Değeriçin, gecikme bilgilerini görmek istediğiniz havayolu dizgisini yazın. Örneğin, UA.
        Süzgeç işlemi

      5. Uygula'yı tıklatın. Sonuçları görmek için UniqueCarrier sütununa gidin.

    5. Varış ve kalkış gecikme sürelerini birlikte ekleyen yeni bir sütun oluşturun.

      1. DepDelay sütununu seçin.

      2. Sütun tipini dönüştür işleminin, değerleri sayı olan tüm sütunlardaki Dizgi veri tiplerini Tamsayı veri tiplerine dönüştürmek için ilk adım olarak otomatik olarak uygulandığını fark edin.

      3. Yeni adım' ı tıklatın ve daha sonra, HesaplaGUI işlemini seçin.

      4. İşleçiçin Eklemeseçeneğini belirleyin.

      5. Sütunseçeneğini belirleyin ve ArrDelay sütununu seçin.

      6. Sonuçlar için yeni sütun yaratseçeneğini belirleyin.

      7. Yeni sütun adıiçin TotalDelayyazın.
        İşlemi hesapla

      8. Yeni kolonu kolon listesinin sonuna ya da özgün kolonun yanına konumlandırabilirsiniz. Bu durumda, Özgün sütunun yanındaseçeneğini belirleyin.

      9. Uygula'yı tıklatın. Yeni sütun TotalDelayeklenir.

    6. Yeni TotalDelay sütununu veri kümesinin başına taşıyın:

      1. Komut satırı metin kutusunda select (seç) işlemini seçin.

      2. selectsözcüğünü tıklatın ve select (`<column>`, everything ())seçeneğini belirleyin.

      3. `<column>`öğesini tıklatın ve TotalDelay sütununu seçin. Bitirdiğinizde, komut şöyle görünmelidir:

        select(`TotalDelay`, everything())
        
      4. Uygula'yı tıklatın. TotalDelay sütunu artık ilk sütundur.

    7. Verileri dört sütuna indirin: Yıl, Ay, DayofMonthve TotalDelay. Sütunları yıl, ay ve gün gruplarına bölmek için group_by kodlama işlemini kullanın.

      1. Komut satırı metin kutusunda group_by işlemini seçin.

      2. <column>simgesini tıklatın ve Yıl sütununu seçin.

      3. Kapama ayracından önce şunu yazın: ,Month,DayofMonth. Bitirdiğinizde, komut şöyle görünmelidir:

        group_by(`Year`,Month,DayofMonth)
        
      4. Uygula'yı tıklatın.

      5. select coding operation for TotalDelay sütununu kullanın. Komut satırı metin kutusunda select (seç) işlemini seçin.
        <column>simgesini tıklatın ve TotalDelay sütununu seçin. Komut şöyle görünmelidir:

        select(`TotalDelay`)
        
      6. Uygula'yı tıklatın. Şekilli veriler artık Yıl, Ay, DayofMonthve TotalDelay sütunlarından oluşur.

        Aşağıdaki ekran görüntüsü, verilerin ilk dört satırını gösterir.
        Yıl, Ay, DayofMonthve TotalDelay sütunlarını içeren Data Refinery akışının ilk dört satırı

    8. TotalDelay sütununun değerlerinin ortalama değerini gösterin ve yeni bir AverageDelay sütunu oluşturun:

      1. Yeni adım' ı tıklatın ve daha sonra, ToplamaGUI işlemini seçin.

      2. Sütuniçin TotalDelayseçeneğini belirleyin.

      3. İşleçiçin Mean(Ortalama) seçeneğini belirleyin.

      4. Toplanmış sütunun adıiçin AverageDelayyazın.
        Toplama işlemi

      5. Uygula'yı tıklatın.

        Yeni sütun AverageDelay , tüm gecikme sürelerinin ortalamasıdır.

    Denetim noktası simgesi İlerlemenizi denetleyin

    Aşağıdaki resim, verilerin ilk dört satırını göstermektedir.

    Aşağıdaki ekran görüntüsü, verilerin ilk dört satırını gösterir.


    Başa dön


  • öğretici videoyu önizle Bu görevi önizlemek için 04:16adresinden başlayan videoyu izleyin.

    Data Refinery akışı için bir iş çalıştırdığınızda, adımlar tüm veri kümesinde çalıştırılır. Yürütme ortamını seçin ve bir kerelik ya da yinelenen bir zamanlama ekleyin. Data Refinery akışının çıkışı, projedeki veri varlıklarına eklenir. İyileştirilmiş veri kümesini yaratmak üzere bir işi çalıştırmak için aşağıdaki adımları izleyin.

    1. Data Refinery araç çubuğundan İşler simgesini tıklatın ve Kaydet ve iş oluşturseçeneğini belirleyin.
      İşi kaydet ve yarat

    2. İş için bir ad ve açıklama yazın ve Next(İleri) düğmesini tıklatın.

    3. Bir yürütme ortamı seçin ve İleridüğmesini tıklatın.

    4. (İsteğe bağlı) Bir çalıştırma zamanlamak için geçiş düğmesini tıklatın. Tarihi, saati belirtin ve işin yinelenmesini istiyorsanız, İleridüğmesini tıklatın.

    5. (İsteğe bağlı) Bu işe ilişkin bildirimleri açın ve İleridüğmesini tıklatın.

    6. Ayrıntıları gözden geçirin ve işi hemen çalıştırmak için Oluştur ve çalıştır ' ı tıklatın.
      iş yarat

    7. İş yaratıldığında, projenizdeki işi görüntülemek için bildirimde iş ayrıntıları bağlantısını tıklatın. Alternatif olarak, projedeki İşler sekmesine gidebilir ve iş adını tıklatarak açabilirsiniz.

    8. İş için Durum Tamamlandıolduğunda, projedeki Varlıklar sekmesine geri gitmek için proje gezinme izini kullanın.

    9. Data Refinery akışının airline-data_shaped.csvçıkışını görmek için Veri > Veri varlıkları bölümünü tıklatın.

    10. airline-data.csv_flow Data Refinery akışını görmek için Akışlar > Data Refinery flows bölümünü tıklatın.

    Denetim noktası simgesi İlerlemenizi denetleyin

    Aşağıdaki resim, Data Refinery akışı ve şekilli varlığa sahip Varlıklar sekmesini gösterir.

    Aşağıdaki resim, Data Refinery akışı ve şekilli varlığa sahip Varlıklar sekmesini gösterir.


    Başa dön


  • öğretici videoyu önizle Bu görevi önizlemek için 05:26adresinden başlayan videoyu izleyin.

    Data Refinery akışını düzenleyerek veri kümesini daha da daraltmak için aşağıdaki adımları izleyin:

    1. Akışı Data Refineryiçinde açmak için airline-data.csv_flow öğesini tıklatın.

    2. AverageDelay sütununu azalan düzende sıralayın.

      1. AverageDelay sütununu seçin.

      2. Kolon Taşma menüsünü (Taşma menüsü) tıklatın ve Alçalan düzende sıralaseçeneğini belirleyin.

    3. Akış ayarları simgesini Akış ayarları simgesitıklatın.

    4. Hedef veri kümesi panosunu tıklatın.

    5. Özellikleri düzenleöğesini tıklatın.

      1. Hedef özellikleri biçimlendir iletişim kutusunda veri varlığı adını airline-data_sorted_shaped.csvolarak değiştirin.
        değiştirilen çıkış dosyası adı

      2. Akış ayarlarına geri dönmek için Kaydet düğmesini tıklatın.

    6. Ayarları kaydetmek için Apply (Uygula) düğmesini tıklatın.

    7. Data Refinery araç çubuğundan İşler simgesini tıklatın ve İşleri kaydet ve görüntüleseçeneğini belirleyin.
      İşleri kaydet ve görüntüle

    8. Havayolu verilerine ilişkin işi seçin ve Görüntüledüğmesini tıklatın.

    9. İş penceresi araç çubuğundan İşi çalıştır simgesini tıklatın.
      İşleri çalıştır simgesi

    Denetim noktası simgesi İlerlemenizi denetleyin

    Aşağıdaki resimde tamamlanan iş ayrıntıları gösterilmektedir.

    Aşağıdaki resim tamamlanan iş ayrıntılarını gösterir.


    Başa dön


  • öğretici videoyu önizle Bu görevi önizlemek için 06:40adresinden başlayan videoyu izleyin.

    Şimdi üç veri varlığını, özgün, ilk iyileştirilmiş veri kümesini ve ikinci iyileştirilmiş veri kümesini görüntülemek için aşağıdaki adımları izleyin:

    1. İş tamamlandığında, proje sayfasına gidin.

    2. Varlıklar sekmesinitıklatın.

    3. Veri varlıkları bölümünde, karşıya yüklediğiniz özgün veri kümesini ve iki Data Refinery akışının çıkışını görürsünüz.

      • airline-data_sorted_shaped.csv
      • airline-data_csv_shaped
      • airline-data.csv
    4. Ortalama gecikmeyi sıralanmamış olarak görmek için havayolu-data_csv_şekilli veri varlığını tıklatın. Varlıklar sekmesine geri gidin.

    5. Ortalama gecikmenin azalan düzende sıralandığını görmek için airline-data_sorted_shaped.csv veri varlığını tıklatın. Varlıklar sekmesine geri gidin.

    6. Akışlar > Data Refinery akışları bölümünü tıklatın, Data Refinery akışını gösterir: airline-data.csv_flow.

    Denetim noktası simgesi İlerlemenizi denetleyin

    Aşağıdaki resim, tüm varlıkların görüntülendiği Varlıklar sekmesini gösterir.

    Aşağıdaki resim, tüm varlıkların görüntülendiği Varlıklar sekmesini gösterir.


    Başa dön

Sonraki adımlar

Artık veriler kullanılmaya hazır. Örneğin, siz ya da diğer kullanıcılar aşağıdaki görevlerden herhangi birini gerçekleştirebilirsiniz:

Ek kaynaklar

  • Diğer videolarıgörüntüleyin.

  • Uygulamalı deneyim elde etmek için Örnekler içinde örnek veri kümelerini, projeleri, modelleri, bilgi istemlerini ve dizüstü bilgisayarları bulun:

    Verileri analiz etmeye ve modeller oluşturmaya başlamak için projenize ekleyebileceğiniz Not defteri simgesi Not defterleri .

    Dizüstü bilgisayarlar, veri kümeleri, bilgi istemleri ve diğer varlıkları içeren içe aktarabileceğiniz Proje simgesi Projeler .

    Modelleri iyileştirmek, çözümlemek ve oluşturmak için projenize ekleyebileceğiniz Veri kümesi simgesi Veri kümeleri .

    Bir temel model istemek için Bilgi İstemi Laboratuvarı 'nda kullanabileceğiniz Bilgi istemi simgesi Bilgi İstemleri .

    Bilgi İstemi Laboratuvarı 'nda kullanabileceğiniz Model simgesi Foundation modelleri .

Üst konu: Hızlı başlangıç eğitmenleri

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more