Translation not up to date
Ten glosariusz zawiera terminy i definicje dotyczące usługi Cloud Pak for Data as a Service.
A B C D E F G H I J L M N O P Q R S T U V W
A
odpowiedzialność
Oczekiwanie, że organizacje lub osoby fizyczne zapewnią prawidłowe funkcjonowanie w całym cyklu życia systemów AI, które projektują, rozwijają, działają lub wdrażają, zgodnie z ich rolami i obowiązującymi ramami regulacyjnymi. Obejmuje to określenie, kto jest odpowiedzialny za błąd w AI, który może wymagać od ekspertów prawnych określenia odpowiedzialności indywidualnie dla każdego przypadku.
Aktywna nauka
Model uczenia maszynowego, w którym system żąda bardziej oznaczonych danych tylko wtedy, gdy jest on potrzebny.
aktywne metadane
Metadane, które są automatycznie aktualizowane na podstawie analizy według procesów uczenia maszynowego. Na przykład profilowanie i analiza jakości danych automatycznie aktualizują metadane dla zasobów danych.
aktywne środowisko wykonawcze
Instancja środowiska działającego w celu udostępnienia zasobów obliczeniowych dla zasobów analitycznych.
sztuczna inteligencja.
Patrz sztuczna inteligencja.
Etyka ptasiej grypy
Multidyscyplinarne pole, które bada, jak zoptymalizować korzystny wpływ AI przy jednoczesnym ograniczeniu ryzyka i niekorzystnych wyników. Przykładami zagadnień etyki w sztuce sztucznej są: odpowiedzialność i prywatność danych, rzetelność, wytłumaczalność, solidność, przejrzystość, zrównoważony rozwój środowiska, integracja, agencja moralna, wyrównanie wartości, odpowiedzialność, zaufanie i niewłaściwe wykorzystanie technologii.
Zarządzanie AI
Działanie organizacji, która polega na udzielaniu, ocenie, monitorowaniu, monitorowaniu i podejmowania działań naprawczych przez personel, procesy i systemy w całym cyklu życia AI, w celu zapewnienia, że system AI działa zgodnie z oczekiwaniami organizacji, jak oczekują jej zainteresowane strony, oraz zgodnie z wymaganiami odpowiednich przepisów.
Bezpieczeństwo AI
Pole badawcze mające na celu zapewnienie funkcjonowania systemów sztucznej inteligencji w sposób korzystny dla ludzkości i nieumyślne spowodowanie szkody, zajęcie się takimi kwestiami jak niezawodność, uczciwość, przejrzystość i dostosowanie systemów sztucznej inteligencji do wartości ludzkich.
System AI
Patrz sztuczny system wywiadowczy.
algorytm
Formuła stosowana do danych w celu określenia optymalnych sposobów rozwiązywania problemów analitycznych.
bezpieczeństwa
Nauka o badaniu danych w celu znajdowania konkretnych wzorców w danych i wyciągania wniosków na podstawie tych wzorców.
sztuczna inteligencja (AI)
Emulacja naturalnej inteligencji przez maszynę.
system sztucznej inteligencji (system sztucznej inteligencji)
System, który może wprowadzać predykcje, rekomendacje lub decyzje, które mają wpływ na środowisko fizyczne lub wirtualne, a których dane wyjściowe lub zachowania nie muszą być wcześniej określone przez jego programistę lub użytkownika. Systemy AI są zazwyczaj szkolone z dużymi ilościami danych ustrukturyzowanych lub nieustrukturyzowanych i mogą być zaprojektowane do działania z różnym poziomem autonomii lub braku, w celu osiągnięcia celów zdefiniowanych przez człowieka.
zasób
Element w projekcie lub katalogu, który zawiera metadane dotyczące danych lub analizy danych.
Eksperyment AutoAI
Zautomatyzowany proces szkoleniowy, który uwzględnia szereg definicji i parametrów szkolenia w celu utworzenia zestawu z rankingowanymi potokami jako kandydaci na model.
B
wdrożenie wsadowe
Metoda wdrażania modeli, które przetwarza dane wejściowe ze zbioru, połączenia danych lub połączonych danych w zasobniku pamięci masowej, a następnie zapisuje dane wyjściowe w wybranym miejscu docelowym.
Odchylenie
Systematyczny błąd w systemie AI, który został zaprojektowany, celowo lub nie, w sposób, który może generować nieuczciwe decyzje. Bias może być obecny zarówno w systemie AI, jak i w danych wykorzystywanych do uczenia i testowania go. Bias AI może pojawić się w systemie sztucznej inteligencji w wyniku oczekiwań kulturowych; ograniczeń technicznych; lub nieprzewidzianych kontekstów wdrażania. Patrz także fairness (fairness).
wykrywanie bias
Proces obliczania wartości godziwej na metryki w celu wykrycia, kiedy modele AI osiągają nieuczciwe wyniki w oparciu o określone atrybuty.
Klasyfikacja binarna
Model klasyfikacji z dwiema klasami. Predykcje to wybór binarny jednej z dwóch klas.
Termin biznesowy
Słowo lub fraza, która definiuje pojęcie biznesowe w standardowy sposób dla przedsiębiorstwa. Terminy mogą być używane do wzbogacania metadanych zasobów danych oraz do definiowania kryteriów reguł ochrony danych.
słownik biznesowy
Zestaw artefaktów zarządzania, takich jak terminy biznesowe i klasy danych, które opisują i wzbogacają zasoby danych.
C
kartoteka
Repozytorium zasobów współużytkowanych dla organizacji. Zasoby aplikacyjne w katalogach mogą być zarządzane przez reguły ochrony danych i wzbogacane przez inne artefakty zarządzania, takie jak klasyfikacje, klasy danych i warunki biznesowe. Katalogi mogą przechowywać dane ustrukturyzowane i nieustrukturyzowane, odwołania do danych w zewnętrznych źródłach danych oraz inne zasoby analityczne, takie jak modele uczenia maszynowego.
kategoria
W produkcie Watson Knowledge Catalogjest to grupowy obszar roboczy służący do organizowania artefaktów zarządzania i zarządzania nimi.
klasyfikacja
W produkcie Watson Knowledge Catalogartefakt zarządzania, który opisuje poziom wrażliwości danych w zasobie danych.
oczyszczanie
Aby upewnić się, że wszystkie wartości w zestawie danych są spójne i poprawnie zapisane.
Współpracownik
Członek grupy osób, które pracują razem w kierunku wspólnego celu.
problem kombinatorski
Problem, który jest trudny do rozwiązania, ponieważ wymaga wielu decyzji dotyczących zbyt wielu kombinacji możliwych wyborów. W niektórych przykładach znajdują się informacje o grupowaniu, porządkowaniu lub przypisaniu obiektów.
zasoby obliczeniowe
Zasoby sprzętowe i programowe zdefiniowane przez definicję środowiska do uruchamiania zasobów analitycznych.
macierz pomyłek
Pomiar wydajności, który określa dokładność między dodatnimi i ujemnymi przewidywanymi wynikami modelu w porównaniu z dodatnimi i ujemnymi wynikami rzeczywistymi.
dane połączone
Zestaw danych, do którego dostęp jest uzyskiwany za pośrednictwem połączenia z zewnętrznym źródłem danych.
połączenie
Informacje wymagane do nawiązania połączenia z bazą danych. Rzeczywiste informacje są różne w zależności od systemu DBMS i metody połączenia.
ograniczenia
W sekcji Decision Optimizationwarunek, który musi być spełniony przez rozwiązanie problemu.
ciągła nauka
Automatyzacja zadań związanych z monitorowaniem wydajności modelu, przekwalifikowanie z nowymi danymi i ponowne wdrażanie w celu zapewnienia jakości predykcji.
Podstawowe wdrożenie ML
Proces pobierania wdrożenia w formacie Core ML do użycia w aplikacjach iOS .
kuracja
- Umożliwia wybieranie, gromadzenie, konserwowanie i konserwowanie treści istotnych dla konkretnego tematu. Curation ustanawia, utrzymuje i dodaje wartości do danych; przekształca dane w zaufane informacje i wiedzę.
- Aby utworzyć zasób danych i przygotować go do opublikowania w katalogu. Kuracja może obejmować wzbogacenie zasobu danych, przypisując artefakty zarządzania, takie jak terminy biznesowe, klasyfikacje i klasy danych, a także analizując jakość danych w zasobie danych.
D
zasób danych
Zasób, który wskazuje na dane, na przykład do przesłanego pliku. Połączenia i połączone zasoby danych są również uznawane za zasoby danych.
klasa danych
Artefakt zarządzania, który kategoryzuje kolumny w zestawach danych relacyjnych w zależności od typu danych i sposobu użycia danych.
integracja danych
Połączenie procesów technicznych i biznesowych, które są używane do łączenia danych z różnych źródeł w istotne i wartościowe informacje.
jezioro danych
Wielkoformatowe repozytorium danych pamięci masowej, w którym przechowywane są surowe dane w dowolnym formacie w architekturze płaskiej. Jeziora danych przechowują dane ustrukturyzowane i nieustrukturyzowane, jak również dane binarne w celu przetwarzania i analizy.
lakehouse danych
Ujednolicona architektura pamięci masowej i przetwarzania danych, która łączy w sobie elastyczność jeziora danych z ustrukturyzowaną optymalizacją zapytań i wydajności hurtowni danych, co umożliwia skalowalną i wydajną analizę danych dla aplikacji AI i aplikacji analitycznych.
eksploracja danych
Proces wyciągania ze źródła danych newralgicznych informacji biznesowych, korelowania ich ze sobą oraz odkrywania powiązań, wzorców i trendów. Patrz także analiza predykcyjna.
model danych
Wizualizacja elementów danych, ich relacji i ich atrybutów.
produkt danych
Kolekcja zoptymalizowanych zasobów danych lub danych powiązanych z danymi, które są pakowane w celu ponownego użycia i dystrybucji z dostępem kontrolowanym. Produkty danych zawierają dane, jak również modele, panele kontrolne i inne typy zasobów obliczeniowych. W przeciwieństwie do zasobów danych w katalogach zarządzania, produkty danych są zarządzane jako produkty z wieloma celami w celu zapewnienia wartości biznesowej.
reguła ochrony danych
Artefakt zarządzania, który określa, jakie dane mają być sterowane i w jaki sposób można go kontrolować. Reguła ochrony danych zawiera kryteria i działanie.
analiza jakości danych
Analiza danych pod kątem dokładności wymiarów jakościowych, kompletności, spójności, terminowości, niepowtarzalności i ważności.
definicja jakości danych
Definicja jakości danych opisuje ocenę reguły lub warunek dla reguł jakości danych.
reguła jakości danych
Podczas analizy jakości danych reguła jakości danych oceniająca dane dotyczące tego, czy spełnione są określone warunki, a także identyfikuje rekordy, które nie spełniają warunków jako naruszenia reguł.
data science
Analiza i wizualizacja ustrukturyzowanych i nieustrukturyzowanych danych do odkrywania spostrzeżeń i wiedzy.
zbiór danych
Kolekcja danych, zwykle w postaci wierszy (rekordów) i kolumn (pól) i zawartych w pliku lub tabeli bazy danych.
źródło danych
Repozytorium, kolejka lub kanał informacyjny do odczytu danych, takich jak baza danych Db2 .
tabela danych
Kolekcja danych, zwykle w postaci wierszy (rekordów) i kolumn (pól) i zawartych w tabeli.
hurtownia danych
Duże, scentralizowane repozytorium danych zbieranych z różnych źródeł, które jest wykorzystywane do raportowania i analizy danych. W pierwszej kolejności przechowywane są dane ustrukturyzowane i częściowo ustrukturyzowane, co umożliwia firmom podejmowanie świadomych decyzji.
Model Decision Optimization
Model nakazowy, który można rozwiązać przy użyciu optymalizacji, aby zapewnić najlepsze rozwiązanie problemu Decision Optimization .
Zmienna decyzyjna
Jeden z zestawów zmiennych reprezentujących decyzje, które mają zostać podjęte, których wartości są określane przez mechanizm optymalizacji, przy jednoczesnym zapewnieniu, że wszystkie ograniczenia są spełnione, a cel zoptymalizowany.
wdrożenie
Model lub pakiet aplikacji, który jest dostępny do użycia.
miejsce wdrożenia
Obszar roboczy, w którym wdrażane są modele i wdrożeń, jest zarządzany.
DevOps
Metodologia oprogramowania, która integruje rozwój aplikacji i operacje IT, dzięki czemu zespoły mogą szybciej dostarczać kod do produkcji i iterować w sposób ciągły w oparciu o opinie rynkowe.
DOcplex
Interfejs API Python przeznaczony do modelowania i rozwiązywania problemów związanych z Decision Optimization .
E
Adres URL punktu końcowego
Adres miejsca docelowego sieci, który identyfikuje zasoby, takie jak usługi i obiekty. Na przykład adres URL punktu końcowego jest używany do identyfikowania położenia wdrożenia modelu lub funkcji, gdy użytkownik wysyła dane ładunku do wdrożenia.
programowo
Zasoby obliczeniowe dla działających zadań.
środowisko wykonawcze środowiska
Tworzenie instancji szablonu środowiska w celu uruchamiania zasobów analitycznych.
szablon środowiska
Definicja, która określa zasoby sprzętu i oprogramowania umożliwiające tworzenie instancji środowiska wykonawczego środowiska.
Wyjaśnienie
- Zdolność użytkowników ludzkich do śledzenia, kontrolowania i rozumienia predykcji, które są wykonywane w aplikacjach, które używają systemów AI.
- Zdolność systemu AI do dostarczania spostrzeżeń, których ludzie mogą wykorzystać do zrozumienia przyczyn przewidywań systemu.
F
uczciwość
W systemie sztucznej inteligencji, sprawiedliwego traktowania osób lub grup osób. Wybór specyficznego pojęcia kapitału własnego dla systemu AI zależy od kontekstu, w jakim jest on używany. Patrz także bias (bias).
opcja
Właściwość lub charakterystyka elementu w zestawie danych, na przykład kolumna w arkuszu kalkulacyjnym. W niektórych przypadkach funkcje są projektowane jako kombinacje innych funkcji w zestawie danych.
inżynieria elementów
Proces wyboru, transformowania i tworzenia nowych funkcji z danych surowych w celu poprawy wydajności i przewidywania mocy modeli uczenia maszynowego.
wybór funkcji
Identyfikowanie kolumn danych, które najlepiej obsługują dokładną predykcję lub wynik w modelu uczenia maszynowego.
składnica składników
Scentralizowane repozytorium lub system, który zarządza i organizował funkcje, zapewniając skalowalny i wydajny sposób przechowywania, pobierania i współużytkowania danych dotyczących elementów w rurociągach i aplikacjach uczenia maszynowego.
transformacja opcji
W programie AutoAI: faza tworzenia potoku, która stosuje algorytmy do transformacji i optymalizacji danych uczących w celu uzyskania najlepszego wyniku dla typu modelu.
uczenie stowarzyszone
Szkolenie wspólnego modelu uczenia maszynowego, które korzysta z wielu źródeł danych, które nie są przenoszone, łączone ani współużytkowane. Rezultatem jest lepszy model bez kompromisów w zakresie bezpieczeństwa danych.
przepływ
Kolekcja węzłów, które definiują zestaw kroków przetwarzania danych lub szkolenia modelu.
G
Wykres Gantta
Graficzna reprezentacja osi czasu projektu i czasu trwania, w której dane harmonogramu są wyświetlane jako paski poziome w skali czasu.
artefakt zarządzania
Elementy zarządzania, które wzbogacają lub kontrolują zasoby danych. Artefakty zarządzania obejmują terminy biznesowe, klasyfikacje, klasy danych, strategie, reguły i zestawy danych odniesienia.
reguła zarządzania
Artefakt zarządzania udostępniający naturalny opis kryteriów, które są używane do określania, czy zasoby danych są zgodne z celami biznesowymi.
przepływ pracy zarządzania
Proces oparty na czynności, który umożliwia sterowanie tworzeniem, modyfikowaniem i usuwaniem artefaktów zarządzania.
katalog zarządzany
Katalog, w którym włączono wymuszanie reguł ochrony danych.
Procesor graficzny
Patrz: jednostka przetwarzania grafiki.
graficzny program budujący
Narzędzie służące do tworzenia zasobów analitycznych poprzez wizualne kodowanie. Kanwa jest to obszar, na którym można umieścić obiekty lub węzły, które mogą być połączone w celu utworzenia przepływu.
jednostka przetwarzania grafiki (GPU)
Wyspecjalizowany procesor przeznaczony do szybkiego manipulowania i zmieniania pamięci w celu przyspieszenia tworzenia obrazów w buforze ramki przeznaczonym do wyprowadzania danych na ekran. GPUs są intensywnie wykorzystywane w procesie uczenia maszynowego ze względu na ich możliwości przetwarzania równoległego.
H
zestaw wstrzymany
Zestaw oznakowanego danych, który został celowo wstrzymany zarówno z zestawów szkoleń, jak i zestawów walidacyjnych, służąc jako bezstronna ocena wydajności modelu końcowego w przypadku danych nieobserwowanych.
nadzór nad człowiekiem
Zaangażowanie ludzi w przegląd decyzji wyświadczonych przez system AI, umożliwienie autonomii człowieka i odpowiedzialności za podejmowanie decyzji.
hiperparametr
W uczeniu maszynowym jest to parametr, którego wartość jest ustawiana przed szkoleniem jako sposób na zwiększenie dokładności modelu.
I
obraz
Pakiet oprogramowania, który zawiera zestaw bibliotek.
w trybie ciągłym
- Dostarczanie danych do systemu w celu utworzenia bazy wiedzy.
- Aby w sposób ciągły dodać dużą ilość danych w czasie rzeczywistym do bazy danych.
wgląd
Dokładne lub głębokie zrozumienie czegoś. Produkt Insights wykorzystuje analizy kognitywne w celu udostępniania bieżących obrazów stanu oraz predykcji zachowań klientów i postaw.
Terminy wyszukiwania
Cel lub cel wyrażony przez dane wejściowe klienta w rozmowie sieciowej, takie jak udzielenie odpowiedzi na pytanie lub przetwarzanie płatności za fakturę.
J
zadanie
Wydzielona wykonywalna jednostka pracy.
Notatnik Jupyter
Patrz notatnik.
L
etykietowane dane
Dane surowe, które są przypisywane etykietom w celu dodania kontekstu lub znaczenia, dzięki czemu mogą być używane do uczenia modeli uczenia maszynowego. Na przykład wartości liczbowe mogą być oznaczane jako kody pocztowe lub wieki w celu udostępnienia kontekstu dla wejść i wyjść modelu.
duży model języka
Model językowy z dużą liczbą parametrów, przeszkolony na dużej ilości tekstu.
pochodzenie
- Historia przepływu danych przez zasoby.
- Historia zdarzeń wykonanych dla zasobu.
model logiczny
Logiczna reprezentacja obiektów danych, które są powiązane z domeną biznesową.
M
uczenie maszynowe (ML)
Oddział sztucznej inteligencji (AI) i informatyki, który koncentruje się na wykorzystaniu danych i algorytmów do naśladowania sposobu, w jaki ludzie uczą się, stopniowo poprawiając dokładność modeli AI.
struktura uczenia maszynowego
Biblioteki i środowisko wykonawcze do szkolenia i wdrażania modelu.
Model uczenia maszynowego
Model AI, który jest przeszkolony w zakresie zestawu danych w celu opracowania algorytmów, które mogą być używane do analizy i uczenia się z nowych danych.
Maska
Aby zastąpić poufne wartości danych w kolumnie zestawu danych. Metody maskowania różnią się w zakresie użyteczności i prywatności danych przed udostępnieniem podobnie sformatowanych wartości zastępczych, które zachowują spójność referencyjną w celu udostępnienia tej samej wartości zastępczej dla całej kolumny.
przepływ maskujący
Przepływ, który tworzy trwale maskowane kopie danych.
dane główne
- W przypadku modelu szkolenia, dane odniesienia, które pozostają takie same dla kilku zadań w tym samym modelu, ale które mogą zostać zmienione, jeśli to konieczne.
- W polu Match 360-skonsolidowany widok danych z różnych źródeł.
programowanie matematyczne (matematyczne programowanie)
Dziedzina matematyki, czyli badania operacyjne, używane do modelowania i rozwiązywania problemów Decision Optimization . Obejmuje to liniową, całkowitą, mieszaną liczbę całkowitą i programowanie nieliniowe.
import metadanych
Metoda importowania metadanych powiązanych z zasobami danych, w tym metadanych procesu, które opisują pochodzenie zasobów danych i metadanych technicznych, które opisują strukturę zasobów danych.
niedopasowanie
Rozbieżność między celami lub zachowaniami, które system AI jest zoptymalizowany w celu osiągnięcia i prawdziwego, często złożonego, celów swoich użytkowników lub projektantów.
ML
Patrz: machine learning.
MLOps
- Praktyka współpracy pomiędzy danymi naukowcami i specjalistami ds. operacji w celu wspomagania zarządzania cyklem życia uczenia maszynowego (lub głębokiego uczenia się). MLOps ma na celu zwiększenie automatyzacji i poprawę jakości produkcji ML przy jednoczesnym skupieniu się na wymogach biznesowych i regulacyjnych. Obejmuje on projektowanie modeli, szkolenia, walidację, wdrażanie, monitorowanie i zarządzanie oraz wykorzystuje metody takie jak CI/CD.
- Metodologia, która wykorzystuje model uczenia maszynowego od rozwoju do produkcji.
usługowym
- W kontekście uczenia maszynowego: zestaw funkcji i algorytmów, które zostały przeszkolone i przetestowane w zestawie danych w celu udostępnienia predykcji lub decyzji.
- W sekcji Decision Optimization: matematyczne sformułowanie problemu, który można rozwiązać za pomocą mechanizmów optymalizacji CPLEX z wykorzystaniem różnych zestawów danych.
formułowanie modelu
W sekcji Decision Optimization: matematyczna formuła modelu wyrażona jako lista zmiennych decyzyjnych, jedna lub większa liczba funkcji obiektywnych, które mają być zmaksymalizowane lub zminimalizowane, a także niektóre ograniczenia, które muszą być spełnione.
ModelOps
Metodologia zarządzania pełnym cyklem życia modelu AI, w tym szkolenia, wdrażanie, ocenianie, ocenianie, przekwalifikowanie i aktualizowanie.
OP
Patrz programowanie matematyczne.
N
język naturalny
Składnia modelowania, która przypomina naturalny język ludzki (w języku angielskim) do formułowania modeli.
przetwarzanie języka naturalnego (NLP)
Dziedzina sztucznej inteligencji i językoznawstwa, która bada problemy związane z przetwarzaniem i manipulowaniem językiem naturalnym, którego celem jest zwiększenie zdolności komputerowej do rozumienia języków ludzkich.
biblioteka przetwarzania języka naturalnego
Biblioteka udostępniający podstawowe funkcje przetwarzania języka naturalnego na potrzeby analizy składni oraz wstępnie wyszkolonych modeli w celu wykonywania wielu różnych zadań przetwarzania tekstu.
sieć neuronowa
Model matematyczny do przewidywania lub klasyfikowania obserwacji za pomocą złożonego schematu matematycznego, symulującego abstrakcyjną wersję komórek mózgowych. Sieć neuronowa jest przeszkolona poprzez prezentowanie jej przy dużej liczbie obserwowanych przypadków, po jednym w danym momencie i umożliwiając jej wielokrotne aktualizowanie, aż do momentu, gdy dowie się, że zadanie to się nie uczy.
NLP
Patrz: przetwarzanie języka naturalnego.
węzeł
Graficzna reprezentacja operacji danych w strumieniu lub przepływie. Różne typy węzłów mają różne kształty, aby wskazać typ operacji, którą wykonują.
notatnik
Interaktywny dokument zawierający kod wykonywalny, tekst opisujący ten kod oraz wyniki działania dowolnego kodu, który jest uruchamiany.
jądro notatnika
Część edytora notatnika, która wykonuje kod i zwraca wyniki obliczeniowe.
O
obfuscate
Aby zastąpić dane w kolumnie o podobnie sformatowanych wartościach, które są zgodne z oryginalnym formatem. Forma maskowania.
Pamięć obiektowa
Metoda przechowywania danych, zwykle używana w chmurze, w której dane są przechowywane jako jednostki dyskretne, lub obiekty w puli pamięci masowej lub w repozytorium, w którym nie jest używana hierarchia plików, ale składuje wszystkie obiekty na tym samym poziomie.
funkcja obiektywna
W decyzji Opmizacja i badania operacyjne, wyrażenie do optymalizacji (to jest, aby zminimalizować lub maksymalizować) przy jednoczesnym spełnieniu innych ograniczeń problemu.
jednostrzałowa nauka
Model głębokiego uczenia się, oparty na założeniu, że większość uczenia się człowieka odbywa się po otrzymaniu tylko jednego lub dwóch przykładów. Model ten jest podobny do nienadzorowanego uczenia się.
wdrożenie online
Metoda uzyskiwania dostępu do modelu lub wdrożenia kodu Python za pośrednictwem punktu końcowego interfejsu API jako usługi Web Service w celu wygenerowania predykcji w trybie z połączeniem w czasie rzeczywistym.
ontologia
Jawna specyfikacja formalna reprezentacji obiektów, pojęć i innych encji, które mogą istnieć w pewnym obszarze zainteresowania, a także relacji między nimi.
zasób operacyjny
Zasób, który uruchamia kod w narzędziu lub zadaniu.
Model OPL
Wzór sformułowania wyrażony w języku modelowania OPL.
Optymalne rozwiązanie
W badaniach operacji, rozwiązanie problemu, który optymalizuje funkcję obiektywną (liniową lub kwadratową) i spełnia wszystkie inne ograniczenia problemu.
wdrożenia
Proces znajdowania najodpowiedniejszego rozwiązania precyzyjnie zdefiniowanego problemu przy jednoczesnym przestrzeganiu narzuconych ograniczeń i ograniczeń. Na przykład określenie sposobu przydzielania zasobów lub sposobu znajdowania najlepszych elementów lub kombinacji z dużego zestawu alternatyw.
koordynacja
Proces tworzenia przepływu end-to-end, który może szkolić, uruchamiać, wdrażać, testować i oceniać model uczenia maszynowego, a także wykorzystuje automatyzację do koordynowania systemu, często przy użyciu mikrousług.
P
populacji
Konfigurowalna część modelu, która jest wewnętrzna dla modelu i której wartości są szacowane lub uczone na podstawie danych. Parametry to aspekty modelu, które są korygowane podczas procesu uczenia, aby pomóc modelowi dokładnie przewidzieć dane wyjściowe. Wydajność i predykcyjna moc modelu zależą w dużej mierze od wartości tych parametrów.
Podmiot
W programie Federated Learning: jednostka, która udostępnia dane na potrzeby szkolenia wspólnego modelu. Dane nie są przenoszone ani łączone, ale każda ze stron uzyskuje korzyści ze szkolenia stowarzyszonego.
ładunek
Dane, które są przekazywane do wdrożenia w celu uzyskania wyniku, predykcji lub rozwiązania.
Rejestrowanie ładunku
Przechwytywanie danych ładunku i danych wyjściowych wdrożenia w celu monitorowania bieżącego stanu zdrowia AI w aplikacjach biznesowych.
Model fizyczny
Definicja struktur fizycznych i relacji danych.
Potok
- W produkcie Watson Pipelines: kompleksowy przepływ zasobów od utworzenia do wdrożenia.
- W programie AutoAI: model kandydujący.
Leaderboard rurociągu
W polu AutoAI: tabela, która przedstawia listę automatycznie wygenerowanych modeli kandydujących, jako rurociągów, uporządkowane według podanych kryteriów.
symbol zastępczy
Pole lub zmienna, które mają zostać zastąpione wartością.
automatyzacja
- Strategia lub reguła śledzona przez agenta w celu określenia następnego działania w oparciu o bieżący stan.
- Zestaw reguł, które chronią dane przez kontrolowanie dostępu do zasobów danych lub anonimizowanie poufnych danych w obrębie zasobów danych.
- Artefakt zarządzania, który składa się z jednej lub większej liczby reguł ochrony danych i reguł zarządzania.
analizy predykcyjne
Proces biznesowy i zestaw powiązanych technologii, które dotyczą przewidywania przyszłych możliwości i trendów. Analizy predykcyjne dotyczą tak różnorodnych dyscyplin jak prawdopodobieństwo, statystyka, uczenie maszynowe, a także sztuczna inteligencja do problemów biznesowych, aby znaleźć najlepsze działanie dla konkretnej sytuacji. Patrz także eksploracja danych.
model wstępnie przeszkolony
Model AI, który wcześniej został przeszkolony w przypadku dużego zestawu danych w celu wykonania określonego zadania. Modele wstępnie wyszkolone są używane zamiast budowania modelu od podstaw.
kategoria podstawowa
W polu Watson Knowledge Catalog(Katalog wiedzy o usłudze Watson) znajduje się kategoria zawierająca artefakt zarządzania. Kategoria jest podobna do folderu lub katalogu, który organizuje artefakty zarządzania użytkownikami.
prywatność
Zapewnienie, że informacje o osobie są chronione przed nieuprawnionym dostępem i niewłaściwym użyciem.
profil
Wygenerowane metadane i statystyki dotyczące tekstowej treści danych.
projekt
Grupowy obszar roboczy przeznaczony do pracy z danymi i innymi zasobami.
publikować
Aby skopiować zasób aplikacyjny do katalogu.
Python
Język programowania używany w naukach o danych i sztucznej inteligencji.
Model Python DOcplex
Formułę modelu wyrażoną w języku Python.
Funkcja Python
Funkcja, która zawiera kod Python w celu obsługi modelu w środowisku produkcyjnym.
Q
reguła jakości
Jeden lub więcej warunków wymaganych dla rekordu danych w celu spełnienia standardów jakości. Podczas analizy jakości danych rekordy danych są sprawdzane pod kątem tych warunków.
R
R
Rozszerzalny język skryptowy używany w naukach o danych i sztukach AI, który oferuje szeroką gamę funkcji i technik analitycznych, statystycznych i graficznych.
odczyt
Kopiowanie danych do aplikacji w celu manipulowania nimi lub ich analizowania.
Redaguj
Aby zastąpić wszystkie wartości danych w kolumnie z tym samym łańcuchem, należy ukryć wartości wrażliwe, format danych i wszelkie relacje między wartościami. Forma maskowania ..
Zestaw danych odniesienia
Artefakt zarządzania, który definiuje wartości dla konkretnych typów kolumn.
Sprecyzuj
Aby wyczyścić i ukształtować dane.
uczenie wzmacniania
Technika uczenia maszynowego, w której agent dowiaduje się o podejmowaniu kolejnych decyzji w środowisku, aby zmaksymalizować sygnał nagrody. Inspirowane przez proces uczenia się prób i błędów, agenci współdziałają ze środowiskiem, otrzymują informację zwrotną i dostosowują swoje działania w celu osiągnięcia optymalnych strategii.
nagroda
Sygnał używany do kierowania agenta, zwykle jest to agent do nauki wzmocnienia, który dostarcza informacji zwrotnych na temat dobroci decyzji.
reguła
W produkcie Watson Knowledge Catalogartefakt zarządzania, który zawiera informacje, kryteria lub logikę do analizowania lub zabezpieczania danych. Niektóre reguły są wymuszane, a niektóre mają charakter informacyjny.
środowisko wykonawcze
Predefiniowana lub niestandardowa konfiguracja sprzętu i oprogramowania używana do uruchamiania narzędzi lub zadań, takich jak notebooki.
S
ocenianie
- W uczeniu maszynowym proces pomiaru zaufania do przewidywanego wyniku.
- Proces obliczania, w jaki sposób atrybuty dla tożsamości przychodzącej są zgodne z atrybutami istniejącego obiektu.
skrypt
Plik, który zawiera skrypty Python lub R do obsługi modelu w środowisku produkcyjnym.
kategoria dodatkowa
Opcjonalna kategoria, która odwołuje się do artefaktu zarządzania.
samodzielna uwaga
Mechanizm alarmowy, który wykorzystuje informacje z danych wejściowych w celu określenia, które części danych wejściowych mają być aktywne podczas generowania danych wyjściowych.
samo-nadzorowana nauka
Metoda uczenia maszynowego, w której model dowiaduje się z danych bez etykiet poprzez maskowanie tokenów w sekwencji wejściowej, a następnie próbuje je przewidzieć. Przykładem jest "Lubię ________ kiełki".
wrażliwe dane
Dane, które zawierają informacje, które nie powinny być widoczne dla wszystkich użytkowników. Na przykład informacje pozwalające na identyfikację osoby lub inne informacje, które są ograniczone przez przepisy dotyczące ochrony prywatności.
kształt
Dostosowywanie danych poprzez filtrowanie, sortowanie, usuwanie kolumn; łączenie tabel; wykonywanie operacji, które obejmują obliczenia, grupy danych, hierarchie i inne.
małe dane
Dane, które są dostępne i zrozumiałe dla ludzi. Patrz także structured data (dane strukturalne).
Opcja przekazywania przetwarzania na serwer SQL (SQL pushback)
W programie SPSS Modeler: proces wykonywania wielu operacji przygotowywania danych i eksploracji danych bezpośrednio w bazie danych za pośrednictwem kodu SQL.
dane strukturalne
Dane znajdujące się w polach stałych w rekordzie lub pliku. Relacyjne bazy danych i arkusze kalkulacyjne są przykładami ustrukturyzowanych danych. Patrz także: dane nieustrukturyzowane, małe dane.
informacje o strukturze
Elementy zapisane w zasobach ustrukturyzowanych, takie jak indeksy mechanizmu wyszukiwania, bazy danych lub bazy wiedzy.
PODSTAW
Aby zastąpić dane w kolumnie wartościami, które nie są zgodne z oryginalnym formatem, ale zachowuj spójność referencyjną.
superwęzeł
Węzeł programu SPSS Modeler , który kurczy strumień danych poprzez obudowę kilku węzłów w jeden.
nadzorowane nauki
Metoda uczenia maszynowego, w której model jest przeszkolony w oparciu o etykietowany zbiór danych w celu przewidywania nowych danych.
T
klasyfikacja tekstu
Model, który automatycznie identyfikuje i klasyfikuje tekst do określonych kategorii.
szeregi czasowe
Zbiór wartości zmiennej w punktach okresowych w czasie.
model przeszkolony
Model wyszkolony z rzeczywistymi danymi i gotowy do wdrożenia w celu przewidywania wyników po przedstawieniu z nowymi danymi.
szkolenia
Początkowy etap budowania modelu, w którym znajduje się podzbiór danych źródłowych. Model dowiaduje się na przykład ze znanych danych. Model może być następnie testowany pod kątem dalszego, innego podzbioru, dla którego wynik jest już znany.
Dane uczące
Zestaw dokumentów z adnotacjami, które mogą być używane do uczenia modeli uczenia maszynowego.
Zbiór uczący
Zestaw oznakowanych danych, które służą do uczenia modelu uczenia maszynowego przez ujawnienie go na przykładach i odpowiadających im etykietach, umożliwiając modelowi poznanie wzorców i przewidywanie predykcji.
Transfer learning
Strategia uczenia maszynowego, w której wyszkolony model jest stosowany do zupełnie nowego problemu.
przezroczystość
Dzielenie się odpowiednimi informacjami z interesariuszami na temat tego, w jaki sposób system AI został zaprojektowany i rozwinięty. Przykładami tych informacji są dane zbierane, sposób ich użycia i przechowywania oraz kto ma do niego dostęp, a wyniki testów na dokładność, solidność i bias.
Badanie
Zaproponowana przez Alana Turinga w 1950 roku, test zdolności maszyny do eksponowania inteligentnego zachowania równoważnego lub nie do odróżnienia od tego, co człowieka.
U
problem nieograniczony
Problem Decision Optimization , w którym istnieje nieskończona liczba rozwiązań, a cel może przyjmować wartości do nieskończoności. Problemy nieograniczone są często spowodowane brakiem ograniczeń w formułowaniu modelu.
Dane nieustrukturyzowane
Wszystkie dane przechowywane w formacie nieustrukturyzowanym, a nie w polach stałych. Dane w dokumencie edytora tekstu są przykładem nieustrukturyzowanych danych. Patrz także structured data (dane strukturalne).
informacje nieustrukturyzowane
Dane, które nie są zawarte w stałej lokalizacji, takie jak dokument tekstowy w języku naturalnym.
uczenie nienadzorowane
Metoda uczenia maszynowego, w której model nie jest udostępniany z etykietami danych i musi znajdować wzorce lub strukturę w danych na własną odpowiedzialność.
V
Zestaw weryfikacyjny
Osobny zestaw danych z etykietami, który jest używany do oceny wydajności i możliwości uogólnienia modelu uczenia maszynowego podczas procesu uczenia, wspomagając strojenie hiperparametrów i selekcję modelu.
agent wirtualny
Wstępnie wyszkolony czat, który może przetwarzać język naturalny w celu reagowania i wykonywania prostych transakcji biznesowych lub kierowania bardziej skomplikowanych żądań do osoby z wiedzą specjalistyczną w zakresie tematyki.
wizualizacja
Wykres, wykres, wykres, tabela, mapa lub dowolna inna wizualna reprezentacja danych.
W
waga
Współczynnik dla węzła, który transformuje dane wejściowe w warstwie sieci. Waga jest parametrem, który model AI uczy się poprzez szkolenia, dostosowując swoją wartość do zmniejszenia błędów w predykatach modelu.