Translation not up to date
Watson Natural Language Processing, 20 'den fazla dilde önceden eğitilmiş modeller sağlar. Bunlar, özel olarak ayrılmış bir uzman ekibi tarafından küratördür ve her belirli dilde kalite için değerlendirilir. Bu önceden eğitilmiş modeller, lisans veya fikri mülkiyet ihlali konusunda endişelenmenize gerek kalmadan üretim ortamlarında kullanılabilir.
Model yükleme ve çalıştırma
Bir modeli yüklemek için öncelikle adını bilmeniz gerekir. Model adları, model tipini (sınıflandırma veya varlık çıkarma gibi), algoritma tipini (BERT veya SVM gibi), dil kodunu ve tip sisteminin ayrıntılarını kodlayan standart bir kuralı izler.
Gereksinimlerinize uyan modeli bulmak için görev kataloğunu kullanın. Bkz. Watson NLP görev kataloğu.
Belirli bir blok sınıfı için beklenen girişi (örneğin, Varlık Söz Etmeleri modeli için), help()
blok sınıfı run()
yöntemini kullanarak bulabilirsiniz:
import watson_nlp
help(watson_nlp.blocks.keywords.TextRank.run)
Watson Natural Language Processing, bloklar ve iş akışları aracılığıyla doğal dil işlevselliğini kaplar. Her blok ya da iş akışı aşağıdaki işlevleri destekler:
load()
: model yüklemerun()
: giriş bağımsız değişkenlerinde modeli çalıştırtrain()
: modeli kendi verilerinizde eğitin (tüm bloklar ve iş akışları desteği eğitimi değil)save()
: kendi verileriniz üzerinde eğitilen modeli kaydedin
Bloklar
İki tip blok vardır:
İş akışları , bir ardışık düzende, giriş belgesinde bir blok daha çalıştırıyor.
Doğrudan giriş belgesinde çalışan bloklar
Giriş belgesinde doğrudan çalışan bir blok örneği, tokenizasyon, lemmatizasyon, konuşma etiketleme ya da bağımlılık ayrıştırması gibi doğal dil işleme işlemlerini gerçekleştiren Sözdizimi bloğudur.
Örnek: Metin parçacığı üzerinde sözdizimi çözümlemesi çalıştırma:
import watson_nlp
# Load the syntax model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Run the syntax model and print the result
syntax_prediction = syntax_model.run('Welcome to IBM!')
print(syntax_prediction)
Diğer bloklara bağlı olan bloklar
Diğer bloklara bağlı olan bloklar doğrudan giriş belgesine uygulanamaz. Bunlar, önceki bir ya da daha çok bloğun çıkışına uygulanır. Örneğin, Keyword Extraction öbeği Syntax ve Noun Phrases öbeğine bağlıdır.
Bu bloklar yüklenebilir, ancak yalnızca giriş belgesinde belirli bir sırayla çalıştırılabilir. Örneğin:
import watson_nlp
text = "Anna went to school at University of California Santa Cruz. \
Anna joined the university in 2015."
# Load Syntax, Noun Phrases and Keywords models for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
noun_phrases_model = watson_nlp.load('noun-phrases_rbr_en_stock')
keywords_model = watson_nlp.load('keywords_text-rank_en_stock')
# Run the Syntax and Noun Phrases models
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))
noun_phrases = noun_phrases_model.run(text)
# Run the keywords model
keywords = keywords_model.run(syntax_prediction, noun_phrases, limit=2)
print(keywords)
İş akışları
İş akışları, tüm gerekli blokların iş akışı ardışık düzeninin bir parçası olarak zincirlendiği bir ham belgeden son bloğa kadar önceden tanımlanmış uçtan uca ardışık düzenlerdir. Örneğin, Çalıştırma Zamanı 22.2 ' de sunulan Varlık Söz Etmeleri bloğu, sözdizimi analizi sonuçlarını gerektirir; bu nedenle uçtan uca işlem şu olur: giriş metni-> Sözdizimi analizi-> Varlık Söz Etmeleri-> Varlık Söz Etmeleri sonuçları. Çalıştırma Zamanı 23.1ile başlayarak Varlık Söz Etmeleri iş akışını çağırabilirsiniz. Şu örneğe bakın:
import watson_nlp
# Load the workflow model
mentions_workflow = watson_nlp.load('entity-mentions_transformer-workflow_multilingual_slate.153m.distilled')
# Run the entity extraction workflow on the input text
mentions_workflow.run('IBM announced new advances in quantum computing', language_code="en")