0 / 0
Go back to the English version of the documentation
Wyodrębnianie jednostek
Last updated: 30 paź 2023
Wyodrębnianie jednostek

Modele wyodrębniania jednostek Watson Natural Language Processing Entity wyodrębniają jednostki z tekstu wejściowego.

Szczegółowe informacje na temat dostępnych typów wyodrębniania można znaleźć w następujących sekcjach:

Ekstrakcja oparta na uczeniu maszynowym dla jednostek ogólnych

Modele wyodrębniania oparte na uczeniu maszynowym są trenowane na podstawie danych oznaczonych etykietami dla bardziej złożonych typów jednostek, takich jak osoba, organizacja i lokalizacja.

Możliwości

Modele jednostek wyodrębniają jednostki z tekstu wejściowego. Rozpoznawane są następujące typy jednostek:

  • Data
  • Czas trwania
  • Udogodnienia
  • Cecha geograficzna
  • Nazwa stanowiska
  • Lokalizacja
  • Pomiar
  • money
  • Porządkowy
  • Organization (organizacja)
  • Osoba
  • Czas
Możliwości wyodrębniania opartego na uczeniu maszynowym na podstawie przykładu
Możliwości Przykłady
Wyodrębnia jednostki z tekstu wejściowego. IBM's CEO Arvind Krishna is based in the US -> IBM\Organization , CEO\JobTitle, Arvind Krishna\Person, US\Location

Dostępne przepływy pracy i bloki różnią się w zależności od używanego środowiska wykonawczego.

Bloki i przepływy pracy do obsługi obiektów ogólnych z odpowiadającymi im środowiskami czasowymi
Nazwa bloku lub przepływu pracy Dostępne w środowisku wykonawczym
entity-mentions_transformer-workflow_multilingual_slate.153m.distilled Środowisko wykonawcze 23.1
entity-mentions_transformer-workflow_multilingual_slate.153m.distilled-cpu Środowisko wykonawcze 23.1
entity-mentions_bert_multi_stock Środowisko wykonawcze 22.2

Przepływy pracy oparte na uczeniu maszynowym dla jednostek ogólnych w środowisku wykonawczym 23.1

Nazwy przepływów pracy

  • entity-mentions_transformer-workflow_multilingual_slate.153m.distilled: ten przepływ pracy może być używany zarówno dla procesorów, jak i procesorów GPU.
  • entity-mentions_transformer-workflow_multilingual_slate.153m.distilled-cpu: ten przepływ pracy jest zoptymalizowany dla środowisk wykonawczych opartych na procesorze.

Obsługiwane języki

Wyodrębnianie jednostek jest dostępne w następujących językach.

Listę kodów języków i odpowiadających im języków zawiera sekcja Kody języków:

ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pt, ro, ru, sk, sv, tr, zh-cn

Przykład kodu

import watson_nlp
# Load the workflow model
entities_workflow = watson_nlp.load('entity-mentions_transformer-workflow_multilingual_slate.153m.distilled')
# Run the entity extraction workflow on the input text
entities = entities_workflow.run('IBM\'s CEO Arvind Krishna is based in the US', language_code="en")
print(entities.get_mention_pairs())

Dane wyjściowe przykładowego kodu:

[('IBM', 'Organization'), ('CEO', 'JobTitle'), ('Arvind Krishna', 'Person'), ('US', 'Location')]

Bloki oparte na uczeniu maszynowym dla jednostek ogólnych w środowisku wykonawczym 22.2

Nazwy bloków entity-mentions_bert_multi_stock

Obsługiwane języki

Wyodrębnianie jednostek jest dostępne w następujących językach. Listę kodów języków i odpowiadających im języków zawiera sekcja Kody języków.

ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pt, ro, ru, sk, sv, tr, zh-cn

Zależności od innych bloków

Przed uruchomieniem bloku wyodrębniania jednostek należy uruchomić następujący blok:

  • syntax_izumo_<language>_stock

Przykład kodu

import watson_nlp

# Load Syntax Model for English, and the multilingual BERT Entity model 
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
bert_entity_model = watson_nlp.load('entity-mentions_bert_multi_stock')

# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM\'s CEO Arvind Krishna is based in the US')

# Run the entity mention model on the result of syntax model
bert_entity_mentions = bert_entity_model.run(syntax_prediction)
print(bert_entity_mentions.get_mention_pairs())

Dane wyjściowe przykładowego kodu:

[('IBM', 'Organization'), ('CEO', 'JobTitle'), ('Arvind Krishna', 'Person'), ('US', 'Location')]

Ekstrakcja oparta na uczeniu maszynowym dla jednostek PII

Nazwy bloków entity-mentions_bilstm_en_pii

Bloki do obsługi jednostek PII (Personal Identifiable Information) z odpowiadającymi im środowiskami czasowymi
Nazwa bloku Dostępne w środowisku wykonawczym
entity-mentions_bilstm_en_pii Środowisko wykonawcze 22.2, środowisko wykonawcze 23.1

Model wyodrębniania oparty na uczeniu maszynowym entity-mentions_bilstm_en_pii jest wytrenowany na podstawie danych oznaczonych etykietami dla typów person (osoba) i location(lokalizacja).

Możliwości

Blok entity-mentions_bilstm_en_pii rozpoznaje następujące typy jednostek:

Jednostki wyodrębnione przez blok entity-mentions_bilstm_en_pii
Nazwa typu jednostki Opis Obsługiwane języki
Lokalizacja Wszystkie regiony geopolitycznie, kontynenty, kraje i nazwy ulic, stany, prowincje, miasta, miasta lub wyspy. pl
Osoba Każda istota, żywa, nieżywa, fikcyjna lub prawdziwa. pl

Zależności od innych bloków

Przed uruchomieniem bloku entity-mentions_bilstm_en_pii należy uruchomić następujący blok:

  • syntax_izumo_en_stock

Przykład kodu

import os

import watson_nlp

# Load Syntax and a Entity Mention BiLSTM model for English

syntax_model = watson_nlp.load('syntax_izumo_en_stock')

entity_model = watson_nlp.load('entity-mentions_bilstm_en_pii')

text = 'Denver is the capital of Colorado. The total estimated government spending in Colorado in fiscal year 2016 was $36.0 billion. IBM office is located in downtown Denver. Michael Hancock is the mayor of Denver.'

# Run the syntax model on the input text

syntax_prediction = syntax_model.run(text)

# Run the entity mention model on the result of the syntax analysis

entity_mentions = entity_model.run(syntax_prediction)

print(entity_mentions)

Dane wyjściowe przykładowego kodu:

{
  "mentions": [
    {
      "span": {
        "begin": 0,
        "end": 6,
        "text": "Denver"
      },
      "type": "Location",
      "producer_id": {
        "name": "BiLSTM Entity Mentions",
        "version": "1.0.0"
      },
      "confidence": 0.6885626912117004,
      "mention_type": "MENTT_UNSET",
      "mention_class": "MENTC_UNSET",
      "role": ""
    },
    {
      "span": {
        "begin": 25,
        "end": 33,
        "text": "Colorado"
      },
      "type": "Location",
      "producer_id": {
        "name": "BiLSTM Entity Mentions",
        "version": "1.0.0"
      },
      "confidence": 0.8509215116500854,
      "mention_type": "MENTT_UNSET",
      "mention_class": "MENTC_UNSET",
      "role": ""
    },
    {
      "span": {
        "begin": 78,
        "end": 86,
        "text": "Colorado"
      },
      "type": "Location",
      "producer_id": {
        "name": "BiLSTM Entity Mentions",
        "version": "1.0.0"
      },
      "confidence": 0.9928259253501892,
      "mention_type": "MENTT_UNSET",
      "mention_class": "MENTC_UNSET",
      "role": ""
    },
    {
      "span": {
        "begin": 151,
        "end": 166,
        "text": "downtown Denver"
      },
      "type": "Location",
      "producer_id": {
        "name": "BiLSTM Entity Mentions",
        "version": "1.0.0"
      },
      "confidence": 0.48378944396972656,
      "mention_type": "MENTT_UNSET",
      "mention_class": "MENTC_UNSET",
      "role": ""
    },
    {
      "span": {
        "begin": 168,
        "end": 183,
        "text": "Michael Hancock"
      },
      "type": "Person",
      "producer_id": {
        "name": "BiLSTM Entity Mentions",
        "version": "1.0.0"
      },
      "confidence": 0.9972871541976929,
      "mention_type": "MENTT_UNSET",
      "mention_class": "MENTC_UNSET",
      "role": ""
    }
  ],
  "producer_id": {
    "name": "BiLSTM Entity Mentions",
    "version": "1.0.0"
  }
}

Wyodrębnianie oparte na regułach dla obiektów ogólnych

Model oparty na regułach entity-mentions_rbr_xx_stock identyfikuje składniowo zwykłe jednostki.

Nazwa bloku entity-mentions_rbr_xx_stock

Możliwości

Wyodrębnianie oparte na regułach obsługuje składniowo zwykłe typy jednostek. Blok jednostki wyodrębnia jednostki z tekstu wejściowego. Rozpoznawane są następujące typy jednostek:

  • PhoneNumber
  • EmailAddress
  • Liczba
  • Procent
  • Adres IP
  • HashTag
  • TwitterHandle
  • URLDate
Możliwości wyodrębniania opartego na regułach na podstawie przykładu
Możliwości Przykłady
Wyodrębnia składniowo zwykłe typy jednostek z tekstu wejściowego. My email is [email protected] -> [email protected]\EmailAddress

Obsługiwane języki

Wyodrębnianie jednostek jest dostępne w następujących językach. Listę kodów języków i odpowiadających im języków zawiera sekcja Kody języków.

ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pt, ro, ru, sk, sv, tr, zh-cn, zh-tw

Zależności od innych bloków

Brak

Przykład kodu

import watson_nlp

# Load a rule-based Entity Mention model for English
rbr_entity_model = watson_nlp.load('entity-mentions_rbr_en_stock')

# Run the entity model on the input text
rbr_entity_mentions = rbr_entity_model.run('My email is [email protected]')
print(rbr_entity_mentions)

Dane wyjściowe przykładowego kodu:

{
  "mentions": [
    {
      "span": {
        "begin": 12,
        "end": 27,
        "text": "[email protected]"
      },
      "type": "EmailAddress",
      "producer_id": {
        "name": "RBR mentions",
        "version": "0.0.1"
      },
      "confidence": 0.8,
      "mention_type": "MENTT_UNSET",
      "mention_class": "MENTC_UNSET",
      "role": ""
    }
  ],
  "producer_id": {
    "name": "RBR mentions",
    "version": "0.0.1"
  }
}

Ekstrakcja oparta na regułach dla jednostek PII

Model oparty na regułach entity-mentions_rbr_multi_pii obsługuje większość typów, identyfikując wspólne formaty jednostek PII i wykonując możliwe sumy kontrolne lub sprawdzenia poprawności odpowiednio dla każdego typu obiektu. Na przykład kandydaci na numer karty kredytowej są sprawdzani przy użyciu algorytmu Luhna.

Nazwa bloku entity-mentions_rbr_multi_pii

Możliwości

Blok jednostki entity-mentions_rbr_multi_pii rozpoznaje następujące typy jednostek:

Jednostki wyodrębnione przez blok entity-mentions_rbr_multi_pii
Nazwa typu jednostki Opis Obsługiwane języki
BankAccountNumber.CreditCardNumber.Amex Numer karty kredytowej dla kart typu AMEX (15 cyfr). Sprawdzany przez algorytm Luhna. Wszystkie
BankAccountNumber.CreditCardNumber.Master Numer karty kredytowej dla typów kart Master (16 cyfr). Sprawdzany przez algorytm Luhna. Wszystkie
BankAccountNumber.CreditCardNumber.Other Numer karty kredytowej dla pozostałych kategorii innych typów. Sprawdzany przez algorytm Luhna. Wszystkie
BankAccountNumber.CreditCardNumber.Visa Numer karty kredytowej dla kart typu VISA (od 16 do 19 cyfr). Sprawdzany przez algorytm Luhna. Wszystkie
EmailAddress Adresy e-mail, na przykład: [email protected] ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sv, tr, zh-cn
Adres IP Adresy IPv4 i IPv6 , na przykład 10.142.250.123 ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sv, tr, zh-cn
PhoneNumber Dowolny konkretny numer telefonu, na przykład 0511-123-456 ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sv, tr, zh-cn

Niektóre nazwy typów jednostek PII są specyficzne dla danego kraju. _ w następujących typach jednostek jest obiektem zastępczym dla kodu kraju.

  • BankAccountNumber.BBAN._ : są to bardziej zmienne numery krajowych rachunków bankowych, a ekstrakcja jest w większości przypadków specyficzna dla języka bez ogólnego algorytmu sumy kontrolnej.
  • BankAccountNumber.IBAN._ : wysoce standaryzowane IBAN są obsługiwane w sposób niezależny od języka i z algorytmem sumy kontrolnej.
  • NationalNumber.NationalID._: te krajowe identyfikatory nie mają (opublikowanego) algorytmu sumy kontrolnej i są wyodrębniane w zależności od języka.
  • NationalNumber.Passport._ : sumy kontrolne są implementowane tylko w krajach, w których istnieje algorytm sumy kontrolnej. Są to wyodrębnione języki z dodatkowymi ograniczeniami kontekstowymi.
  • NationalNumber.TaxID._ : te identyfikatory nie mają (opublikowanego) algorytmu sumy kontrolnej i są wyodrębniane w zależności od języka.

W poniższej tabeli wymieniono typy jednostek dostępne dla poszczególnych języków oraz kody krajów, których należy użyć.

Typy jednostek PII specyficzne dla danego kraju
Kraj Nazwa typu jednostki Opis Obsługiwane języki
Austria BankAccountNumber.BBAN.AT Podstawowy numer rachunku bankowego de
BankAccountNumber.IBAN.AT Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.Passport.AT Numer paszportu de
NationalNumber.TaxID.AT NIP de
Belgia BankAccountNumber.BBAN.BE Podstawowy numer rachunku bankowego fr, nl
BankAccountNumber.IBAN.BE Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.BE Krajowy numer identyfikacyjny fr, nl
NationalNumber.Passport.BE Numer paszportu fr, nl
Bułgaria BankAccountNumber.BBAN.BG Podstawowy numer rachunku bankowego bg
BankAccountNumber.IBAN.BG Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.BG Krajowy numer identyfikacyjny bg
Kanada NationalNumber.SocialInsuranceNumber.CA Numer ubezpieczenia społecznego. Zaimplementowano algorytm sumy kontrolnej. en, fr
Chorwacja BankAccountNumber.BBAN.HR Podstawowy numer rachunku bankowego godz.
BankAccountNumber.IBAN.HR Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.HR Krajowy numer identyfikacyjny godz.
NationalNumber.TaxID.HR NIP godz.
Cypr BankAccountNumber.BBAN.CY Podstawowy numer rachunku bankowego el
BankAccountNumber.IBAN.CY Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.TaxID.CY NIP el
Czechy BankAccountNumber.BBAN.CZ Podstawowy numer rachunku bankowego cs
BankAccountNumber.IBAN.CZ Międzynarodowy numer rachunku bankowego cs
NationalNumber.NationalID.CZ Krajowy numer identyfikacyjny cs
NationalNumber.TaxID.CZ NIP cs
Dania BankAccountNumber.BBAN.DK Podstawowy numer rachunku bankowego da
BankAccountNumber.IBAN.DK Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.DK Krajowy numer identyfikacyjny da
Estonia BankAccountNumber.BBAN.EE Podstawowy numer rachunku bankowego ET
BankAccountNumber.IBAN.EE Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.EE Krajowy numer identyfikacyjny ET
Finlandia BankAccountNumber.BBAN.FI Podstawowy numer rachunku bankowego fi
BankAccountNumber.IBAN.FI Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.FI Krajowy numer identyfikacyjny fi
NationalNumber.Passport.FI Numer paszportu fi
Francja BankAccountNumber.BBAN.FR Podstawowy numer rachunku bankowego fr
BankAccountNumber.IBAN.FR Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.Passport.FR Numer paszportu fr
NationalNumber.SocialInsuranceNumber.FR Numer ubezpieczenia społecznego. Zaimplementowano algorytm sumy kontrolnej. fr
Niemcy BankAccountNumber.BBAN.DE Podstawowy numer aAccount banku de
BankAccountNumber.IBAN.DE Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.Passport.DE Numer paszportu de
NationalNumber.SocialInsuranceNumber.DE Numer ubezpieczenia społecznego. Zaimplementowano algorytm sumy kontrolnej. de
Grecja BankAccountNumber.BBAN.GR Podstawowy numer rachunku bankowego el
BankAccountNumber.IBAN.GR Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.Passport.GR Numer paszportu el
NationalNumber.TaxID.GR NIP el
NationalNumber.NationalID.GR Krajowy numer identyfikacyjny el
Węgry BankAccountNumber.BBAN.HU Podstawowy numer rachunku bankowego hu
BankAccountNumber.IBAN.HU Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.HU Krajowy numer identyfikacyjny hu
NationalNumber.TaxID.HU NIP hu
Islandia BankAccountNumber.BBAN.IS Podstawowy numer rachunku bankowego ma wartość
BankAccountNumber.IBAN.IS Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.IS Krajowy numer identyfikacyjny ma wartość
Polska BankAccountNumber.BBAN.IE Podstawowy numer rachunku bankowego pl
BankAccountNumber.IBAN.IE Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.IE Krajowy numer identyfikacyjny pl
NationalNumber.Passport.IE Numer paszportu pl
NationalNumber.TaxID.IE NIP pl
Włochy BankAccountNumber.BBAN.IT Podstawowy numer rachunku bankowego infrastruktura
BankAccountNumber.IBAN.IT Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.IT Krajowy numer identyfikacyjny infrastruktura
NationalNumber.Passport.IT Numer paszportu infrastruktura
Łotwa BankAccountNumber.BBAN.LV Podstawowy numer rachunku bankowego LV
BankAccountNumber.IBAN.LV Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.LV Krajowy numer identyfikacyjny LV
Liechtenstein BankAccountNumber.BBAN.LI Podstawowy numer rachunku bankowego de
BankAccountNumber.IBAN.LI Międzynarodowy numer rachunku bankowego wszystkie
Litwa BankAccountNumber.BBAN.LT Podstawowy numer rachunku bankowego Lt
BankAccountNumber.IBAN.LT Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.LT Krajowy numer identyfikacyjny Lt
Luksemburgia BankAccountNumber.BBAN.LU Podstawowy numer rachunku bankowego de, fr
BankAccountNumber.IBAN.LU Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.TaxID.LU NIP de, fr
Malta BankAccountNumber.BBAN.MT Podstawowy numer rachunku bankowego MT
BankAccountNumber.IBAN.MT Międzynarodowy numer rachunku bankowego wszystkie
Holandia BankAccountNumber.BBAN.NL Podstawowy numer rachunku bankowego nl
BankAccountNumber.IBAN.NL Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.NL Krajowy numer identyfikacyjny nl
NationalNumber.Passport.NL Numer paszportu nl
Norwegia BankAccountNumber.BBAN.NO Podstawowy numer rachunku bankowego nie
BankAccountNumber.IBAN.NO Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.NO Krajowy numer identyfikacyjny nie
NationalNumber.NationalID.NO.Old Stary krajowy numer identyfikacyjny nie
NationalNumber.Passport.NO Numer paszportu nie
Polska BankAccountNumber.BBAN.PL Podstawowy numer rachunku bankowego pl
BankAccountNumber.IBAN.PL Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.PL Krajowy numer identyfikacyjny pl
NationalNumber.Passport.PL Numer paszportu pl
NationalNumber.TaxID.PL NIP pl
Portugalia BankAccountNumber.IBAN.PT Międzynarodowy numer rachunku bankowego wszystkie
BankAccountNumber.BBAN.PT Podstawowy numer rachunku bankowego pt
NationalNumber.NationalID.PT Krajowy numer identyfikacyjny pt
NationalNumber.NationalID.PT.Old Krajowy numer identyfikacyjny, przestarzały format pt
NationalNumber.TaxID.PT NIP pt
Rumunia BankAccountNumber.BBAN.RO Podstawowy numer rachunku bankowego ro
BankAccountNumber.IBAN.RO Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.NationalID.RO Krajowy numer identyfikacyjny ro
NationalNumber.TaxID.RO NIP ro
Słowacja BankAccountNumber.IBAN.SK Międzynarodowy numer rachunku bankowego wszystkie
BankAccountNumber.BBAN.SK Podstawowy numer rachunku bankowego sk
NationalNumber.TaxID.SK NIP sk
NationalNumber.NationalID.SK Krajowy numer identyfikacyjny sk
Słowenia BankAccountNumber.IBAN.SI Międzynarodowy numer rachunku bankowego wszystkie
Hiszpania BankAccountNumber.IBAN.ES Międzynarodowy numer rachunku bankowego wszystkie
BankAccountNumber.BBAN.ES Podstawowy numer rachunku bankowego es
NationalNumber.NationalID.ES Krajowy numer identyfikacyjny es
NationalNumber.Passport.ES Numer paszportu es
NationalNumber.TaxID.ES NIP es
Szwecja BankAccountNumber.IBAN.SE Międzynarodowy numer rachunku bankowego wszystkie
BankAccountNumber.BBAN.SE Podstawowy numer rachunku bankowego pl
NationalNumber.NationalID.SE Krajowy numer identyfikacyjny pl
NationalNumber.Passport.SE Numer paszportu pl
Szwajcaria BankAccountNumber.IBAN.CH Międzynarodowy numer rachunku bankowego wszystkie
BankAccountNumber.BBAN.CH Podstawowy numer rachunku bankowego de, fr, it
NationalNumber.NationalID.CH Krajowy numer identyfikacyjny de, fr, it
NationalNumber.Passport.CH Numer paszportu de, fr, it
NationalNumber.NationalID.CH.Old Krajowy numer identyfikacyjny, przestarzały format de, fr, it
Zjednoczone Królestwo Wielkiej Brytanii i Irlandii Północnej BankAccountNumber.IBAN.GB Międzynarodowy numer rachunku bankowego wszystkie
NationalNumber.SocialSecurityNumber.GB.NHS Numer krajowej służby zdrowia wszystkie
NationalNumber.SocialSecurityNumber.GB.NINO Numer krajowego ubezpieczenia społecznego wszystkie
NationalNumber.NationalID.GB.Old Krajowy numer identyfikacyjny, przestarzały format wszystkie
NationalNumber.Passport.GB Numer paszportu. Algorytm sumy kontrolnej nie jest zaimplementowany i dlatego ma dodatkowe ograniczenia kontekstu. wszystkie
< NationalNumber.SocialSecurityNumber.US Numer ubezpieczenia społecznego. Algorytm sumy kontrolnej nie jest zaimplementowany i dlatego ma dodatkowe ograniczenia kontekstu. pl
NationalNumber.Passport.US Numer paszportu. Algorytm sumy kontrolnej nie jest zaimplementowany i dlatego ma dodatkowe ograniczenia kontekstu. pl

Zależności od innych bloków

Brak

Przykład kodu

import watson_nlp

# Load the RBR PII model. Note that this is a multilingual model supporting multiple languages.
rbr_entity_model = watson_nlp.load('entity-mentions_rbr_multi_pii')

# Run the RBR model. Note that language code of the input text is passed as a parameter to the run method.
rbr_entity_mentions = rbr_entity_model.run('Please find my credit card number here: 378282246310005. Thanks for the payment.', language_code='en')
print(rbr_entity_mentions)

Dane wyjściowe przykładowego kodu:

{
  "mentions": [
    {
      "span": {
        "begin": 40,
        "end": 55,
        "text": "378282246310005"
      },
      "type": "BankAccountNumber.CreditCardNumber.Amex",
      "producer_id": {
        "name": "RBR mentions",
        "version": "0.0.1"
      },
      "confidence": 0.8,
      "mention_type": "MENTT_UNSET",
      "mention_class": "MENTC_UNSET",
      "role": ""
    }
  ],
  "producer_id": {
    "name": "RBR mentions",
    "version": "0.0.1"
  }
}

Temat nadrzędny: Watson Katalog zadań przetwarzania języka naturalnego

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more