0 / 0
Go back to the English version of the documentation
Konfigurowanie ewaluacji godziwości dla bias pośrednich w systemie Watson OpenScale
Last updated: 15 cze 2023
Konfigurowanie ewaluacji godziwości dla bias pośrednich w systemie Watson OpenScale

W pewnych warunkach można skonfigurować wartościowanie opcji Watson OpenScale w celu rozważenia zarówno pośrednich, jak i bezpośrednich, a także bezpośrednich bias dla wdrożenia modelu.

Pośrednie bias występuje, gdy jedna funkcja w zestawie danych może być używana do stanowania w innym. Na przykład w zestawie danych, w którym rasa nie jest znana, funkcja, taka jak kod pocztowy, często może być ściśle śledzona w wyścigu. Ocena opcji kodu pocztowego dla bias jest sposobem na wykrywanie pośrednich bias. W innym przykładzie historia zakupów klienta może być ściśle zgodna z płcią. W związku z tym nawet model predykcyjny, który nie zawiera żadnych typowych zabezpieczonych atrybutów, takich jak rasa, wiek lub płeć, może wskazywać na tendencyjną liczbę wyników.

Watson OpenScale analizuje bias pośredni, gdy spełnione są następujące warunki:

  • Aby znaleźć korelacje, zestaw danych musi być wystarczająco duży (więcej niż 4000 rekordów).
  • Dane uczących muszą zawierać pola meta. Model należy trenować w podzbiorze pól danych. Te dodatkowe pola, metapola, służą do określania pośrednich danych bias. (Dołącz metapola, ale nie używaj ich w szkoleniu modelowym).
  • Rejestrowanie ładunku musi zawierać metapola i być uruchamiane przed skonfigurowanym monitorem fairness. Tej metody należy użyć do przesłania metadanych do usługi Watson OpenScale . Rejestrowanie ładunku dla bias pośrednich wymaga dwóch typów danych wejściowych: 1) funkcji szkoleniowych z wartościami i 2) metapola z wartościami.
  • Podczas konfigurowania monitora fairness należy wybrać dodatkowe pola do monitorowania.

Typowy przepływ pracy dla bias pośrednich

Można jednak określić, że modele pośrednie dla modeli preprodukcyjnych i modeli produkcyjnych są wymagane w przypadku modeli wymagających różnych kolumn. Dane testowe używane do oceny modeli przedprodukcyjnych i danych zwrotnych, które są używane do oceny modeli preprodukcyjnych lub produkcyjnych, różnią się w zależności od użycia metakolumn. Metakolumny są wymagane w przypadku danych testowych do wstępnego produkcji i nie mogą być uwzględnione w danych dotyczących informacji zwrotnych, które są używane w przypadku modeli przedprodukcyjnych lub produkcyjnych. Typowy przepływ pracy może obejmować następujące kroki:

  1. Tworzenie danych uczących, które zawierają zarówno kolumny opcji, jak i metakolumny. Metakolumny zawierają dane, które nie są używane do uczenia modelu.
  2. W systemie Watson OpenScaleskonfiguruj monitor fairness z metakolumnami.
  3. Podczas preprodukcji prześlij dane testowe, które zawierają zarówno kolumny elementów, jak i metakolumny. Te dane testowe muszą zostać przesłane za pomocą opcji Importuj dane testowe .
  4. Podczas przedprodukcji użytkownik może współużywać różnych wersji modelu podczas korzystania z pośrednich miar bias, aby zapewnić, że ostateczny model jest wolny od bias.
  5. Po wysłaniu modelu do produkcji dane sprzężenia zwrotnego nie powinny mieć żadnej z metakolumn, tylko kolumny elementów, które zostały użyte do uczenia modelu.

Przykładowy plik ładunku JSON z metapolami

Poniższy przykładowy plik przedstawia ładunek JSON z polami i wartościami, które są używane do uczenia modelu. Uwzględnione są również pola meta i wartości używane do analizy pośredniej bias. Pola meta nie są używane do uczenia modelu, zamiast tego są zarezerwowane dla innej analizy, która próbuje skorelować je z biasami w modelu. Chociaż pola meta mogą być dowolnymi rodzajami danych, są to zwykle atrybuty chronione, takie jak płeć, rasa lub wiek.

[request_data = {
    "fields": ["AGE", "SEX", "BP", "CHOLESTEROL", "NA", "K"],
    "values": [[28, "F", "LOW", "HIGH", 0.61, 0.026]]
  }

response_data = {
    "fields": ["AGE", "SEX", "BP", "CHOLESTEROL", "NA", "K", "probability", "prediction", "DRUG"],
    "values": [[28, "F", "LOW", "HIGH", 0.61, 0.026, [0.82, 0.07, 0.0, 0.05, 0.03], 0.0, "drugY"]]
  }

request_data = <put your data here>
response_data = <put your data here>

records = [PayloadRecord(request=request_data, response=response_data, response_time=18), 
                PayloadRecord(request=request_data, response=response_data, response_time=12)]

subscription.payload_logging.store(records=records)

Metawartości muszą być w formacie tablicy tablic:

"meta": {
"fields": ["age", "race", "sex"],
"values": [
[32, "Black", "Male"]
]
}

Konfigurowanie usługi Watson OpenScale w celu pośredniego bias

Po ustawieniu monitora fairness wybierz pola, które mają być monitorowane. Uwzględnij zarówno funkcje szkoleniowe, jak i pola, które są wykluczone ze szkolenia modelowego. Jeśli zostanie wybrane pole wykluczone ze szkolenia modelowego, opcja Watson OpenScale znajdzie korelacje między wartościami w tym polu a wartościami w składach szkoleniowych. Opcje skorelowane są używane jako serwery proxy dla pól, które zostały wykluczone ze szkolenia modelowego.

Pośrednie wyświetlacze bias

Niektóre pola to cechy szkoleniowe. Inne pola, które nie są elementami szkoleniowym, są identyfikowane jako pola meta. W przypadku wybranych pól meta Watson OpenScale sprawdza pośrednie bias.

Więcej inform.

Temat nadrzędny: Konfigurowanie ocen modelu

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more