Translation not up to date
Ten glosariusz zawiera terminy i definicje dotyczące watsonx.ai.
A B C D E F G H I J L M N O P R S T U V W Z
A
odpowiedzialność
Oczekiwanie, że organizacje lub osoby fizyczne zapewnią prawidłowe funkcjonowanie w całym cyklu życia systemów AI, które projektują, rozwijają, działają lub wdrażają, zgodnie z ich rolami i obowiązującymi ramami regulacyjnymi. Obejmuje to określenie, kto jest odpowiedzialny za błąd w AI, który może wymagać od ekspertów prawnych określenia odpowiedzialności indywidualnie dla każdego przypadku.
Aktywna nauka
Model uczenia maszynowego, w którym system żąda bardziej oznaczonych danych tylko wtedy, gdy jest on potrzebny.
aktywne środowisko wykonawcze
Instancja środowiska działającego w celu udostępnienia zasobów obliczeniowych dla zasobów analitycznych.
sztuczna inteligencja.
Patrz sztuczna inteligencja.
Etyka ptasiej grypy
Multidyscyplinarne pole, które bada, jak zoptymalizować korzystny wpływ AI przy jednoczesnym ograniczeniu ryzyka i niekorzystnych wyników. Przykładami zagadnień etyki w sztuce sztucznej są: odpowiedzialność i prywatność danych, rzetelność, wytłumaczalność, solidność, przejrzystość, zrównoważony rozwój środowiska, integracja, agencja moralna, wyrównanie wartości, odpowiedzialność, zaufanie i niewłaściwe wykorzystanie technologii.
Zarządzanie AI
Działanie organizacji, która polega na udzielaniu, ocenie, monitorowaniu, monitorowaniu i podejmowania działań naprawczych przez personel, procesy i systemy w całym cyklu życia AI, w celu zapewnienia, że system AI działa zgodnie z oczekiwaniami organizacji, jak oczekują jej zainteresowane strony, oraz zgodnie z wymaganiami odpowiednich przepisów.
Bezpieczeństwo AI
Pole badawcze mające na celu zapewnienie funkcjonowania systemów sztucznej inteligencji w sposób korzystny dla ludzkości i nieumyślne spowodowanie szkody, zajęcie się takimi kwestiami jak niezawodność, uczciwość, przejrzystość i dostosowanie systemów sztucznej inteligencji do wartości ludzkich.
System AI
Patrz sztuczny system wywiadowczy.
algorytm
Formuła stosowana do danych w celu określenia optymalnych sposobów rozwiązywania problemów analitycznych.
bezpieczeństwa
Nauka o badaniu danych w celu znajdowania konkretnych wzorców w danych i wyciągania wniosków na podstawie tych wzorców.
odpowiednie zaufanie
W systemie sztucznej inteligencji jest to ilość zaufania, która jest skalibrowana do jego dokładności, niezawodności i wiarygodności.
sztuczna inteligencja (AI)
Emulacja naturalnej inteligencji przez maszynę.
system sztucznej inteligencji (system sztucznej inteligencji)
System, który może wprowadzać predykcje, rekomendacje lub decyzje, które mają wpływ na środowisko fizyczne lub wirtualne, a których dane wyjściowe lub zachowania nie muszą być wcześniej określone przez jego programistę lub użytkownika. Systemy AI są zazwyczaj szkolone z dużymi ilościami danych ustrukturyzowanych lub nieustrukturyzowanych i mogą być zaprojektowane do działania z różnym poziomem autonomii lub braku, w celu osiągnięcia celów zdefiniowanych przez człowieka.
zasób
Element, który zawiera informacje o danych, inne cenne informacje lub kod, który działa z danymi. Patrz także zasób danych.
Eksperyment AutoAI
Zautomatyzowany proces szkoleniowy, który uwzględnia szereg definicji i parametrów szkolenia w celu utworzenia zestawu z rankingowanymi potokami jako kandydaci na model.
B
wdrożenie wsadowe
Metoda wdrażania modeli, które przetwarza dane wejściowe ze zbioru, połączenia danych lub połączonych danych w zasobniku pamięci masowej, a następnie zapisuje dane wyjściowe w wybranym miejscu docelowym.
Odchylenie
Systematyczny błąd w systemie AI, który został zaprojektowany, celowo lub nie, w sposób, który może generować nieuczciwe decyzje. Bias może być obecny zarówno w systemie AI, jak i w danych wykorzystywanych do uczenia i testowania go. Bias AI może pojawić się w systemie sztucznej inteligencji w wyniku oczekiwań kulturowych; ograniczeń technicznych; lub nieprzewidzianych kontekstów wdrażania. Patrz także fairness (fairness).
wykrywanie bias
Proces obliczania wartości godziwej na metryki w celu wykrycia, kiedy modele AI osiągają nieuczciwe wyniki w oparciu o określone atrybuty.
Klasyfikacja binarna
Model klasyfikacji z dwiema klasami. Predykcje to wybór binarny jednej z dwóch klas.
C
model klasyfikacji
Model predykcyjny, który prognozuje dane w różnych kategoriach. Klasyfikacje mogą być binarne, z dwiema klasami danych lub z wieloma klasami, gdy istnieje więcej niż 2 kategorie.
oczyszczanie
Aby upewnić się, że wszystkie wartości w zestawie danych są spójne i poprawnie zapisane.
lingwistyka obliczeniowa
Interdyscyplinarne pole, które bada podejścia do modelowania computacyjnie języki naturalne.
Zasób obliczeniowy
Zasoby sprzętowe i programowe, które są definiowane przez szablon środowiska do uruchamiania zasobów w narzędziach.
macierz pomyłek
Pomiar wydajności, który określa dokładność między dodatnimi i ujemnymi przewidywanymi wynikami modelu w porównaniu z dodatnimi i ujemnymi wynikami rzeczywistymi.
połączony zasób danych
Wskaźnik do danych, do których dostęp jest uzyskiwany za pośrednictwem połączenia z zewnętrznym źródłem danych.
połączony zasób folderu
Wskaźnik do folderu w IBM Cloud Object Storage.
połączenie
Informacje wymagane do nawiązania połączenia z bazą danych. Rzeczywiste informacje są różne w zależności od systemu DBMS i metody połączenia.
zasób połączenia
Zasób, który zawiera informacje umożliwiające nawiązanie połączenia ze źródłem danych.
ograniczenia
- W bazach danych: relacja między tabelami.
- W sekcji Decision Optimizationwarunek, który musi być spełniony przez rozwiązanie problemu.
ciągła nauka
Automatyzacja zadań związanych z monitorowaniem wydajności modelu, przekwalifikowanie z nowymi danymi i ponowne wdrażanie w celu zapewnienia jakości predykcji.
Podstawowe wdrożenie ML
Proces pobierania wdrożenia w formacie Core ML do użycia w aplikacjach iOS .
korpus
Kolekcja dokumentów źródłowych, które są używane do uczenia modelu uczenia maszynowego.
walidacja krzyżowa
Technika testowania, jak model uogólnia się w przypadku braku próbnika wyholowania. Walidacja krzyżowa dzieli dane treningowe na pewną liczbę podzbiorów, a następnie buduje tę samą liczbę modeli, z których każdy podzbiór jest wstrzymany z kolei. Każdy z tych modeli jest testowany na próbce holdout, a średnia dokładność modeli na tych próbkach wstrzymanych jest wykorzystywana do szacowania dokładności modelu w przypadku zastosowania do nowych danych.
kuracja
Umożliwia wybieranie, gromadzenie, konserwowanie i konserwowanie treści istotnych dla konkretnego tematu. Curation ustanawia, utrzymuje i dodaje wartości do danych; przekształca dane w zaufane informacje i wiedzę.
D
zasób danych
Zasób, który wskazuje na dane, na przykład do przesłanego pliku. Połączenia i połączone zasoby danych są również uznawane za zasoby danych. Patrz także zasób.
data science
Analiza i wizualizacja ustrukturyzowanych i nieustrukturyzowanych danych do odkrywania spostrzeżeń i wiedzy.
zbiór danych
Kolekcja danych, zwykle w postaci wierszy (rekordów) i kolumn (pól) i zawartych w pliku lub tabeli bazy danych.
źródło danych
Repozytorium, kolejka lub kanał informacyjny do odczytu danych, takich jak baza danych Db2 .
tabela danych
Kolekcja danych, zwykle w postaci wierszy (rekordów) i kolumn (pól) i zawartych w tabeli.
hurtownia danych
Duże, scentralizowane repozytorium danych zbieranych z różnych źródeł, które jest wykorzystywane do raportowania i analizy danych. W pierwszej kolejności przechowywane są dane ustrukturyzowane i częściowo ustrukturyzowane, co umożliwia firmom podejmowanie świadomych decyzji.
granica decyzyjna
Podział punktów danych w obszarze na odrębne grupy lub klasyfikacje.
Model tylko dekodera
Model generujący dane wyjściowe w postaci tekstu w słowie według wnioskowania z sekwencji wejściowej. Modele dekodera są używane tylko dla zadań, takich jak generowanie tekstu i odpowiadanie na pytania.
wdrożenie
Model lub pakiet aplikacji, który jest dostępny do użycia.
miejsce wdrożenia
Obszar roboczy, w którym wdrażane są modele i wdrożeń, jest zarządzany.
deterministyczne
Opisuje charakterystyczne dla systemów obliczeniowych, kiedy ich wyjścia są w pełni określone przez ich wejścia.
DevOps
Metodologia oprogramowania, która integruje rozwój aplikacji i operacje IT, dzięki czemu zespoły mogą szybciej dostarczać kod do produkcji i iterować w sposób ciągły w oparciu o opinie rynkowe.
sztuczna inteligencja
Klasa algorytmu, która skupia się na znalezieniu granicy oddzielający różne klasy w danych.
DOcplex
Interfejs API Python przeznaczony do modelowania i rozwiązywania problemów związanych z Decision Optimization .
E
osadzanie
Numeryczna reprezentacja jednostki informacji, np. wyrazu lub zdania, jako wektor liczb o rzeczywistej wartości. Uwidacznia się, niskowymiarowe reprezentacje danych wielowymiarowych. Patrz także: kodowanie, reprezentacja.
pojawienie się
Właściwość modeli fundamentowych, w których model wykazuje zachowania, które nie były wyraźnie wyszkolone.
działanie pojawiające się
Zachowanie, które zostało wystawione przez model fundamentów, który nie został jawnie zbudowany.
Enkoder-model dekodera
Model zarówno dla rozumienia tekstu wejściowego, jak i generowania tekstu wyjściowego w oparciu o tekst wejściowy. Modele kodera-dekodera są wykorzystywane do zadań, takich jak streszczanie lub tłumaczenie.
model tylko enkodera
Model, który rozpoznaje tekst wejściowy na poziomie zdania, przekształcając sekwencje wejściowe w wektory reprezentacyjne o nazwie embeddings. Do zadań takich jak klasyfikowanie informacji zwrotnych klientów i wyodrębnianie informacji z dużych dokumentów używane są tylko modele kodera.
kodowanie
Reprezentacja jednostki informacji, takiej jak znak lub słowo, jako zbiór liczb. Patrz także: osadzanie, kodowanie pozycyjne.
Adres URL punktu końcowego
Adres miejsca docelowego sieci, który identyfikuje zasoby, takie jak usługi i obiekty. Na przykład adres URL punktu końcowego jest używany do identyfikowania położenia wdrożenia modelu lub funkcji, gdy użytkownik wysyła dane ładunku do wdrożenia.
programowo
Zasoby obliczeniowe dla działających zadań.
środowisko wykonawcze środowiska
Tworzenie instancji szablonu środowiska w celu uruchamiania zasobów analitycznych.
szablon środowiska
Definicja, która określa zasoby sprzętu i oprogramowania umożliwiające tworzenie instancji środowiska wykonawczego środowiska.
opcja exogenous
Funkcja, która może mieć wpływ na model predykcyjny, ale nie może mieć wpływu na zwrot. Na przykład, temperatury mogą wpływać na przewidywaną sprzedaż lodów, ale sprzedaż lodów nie może wpływać na temperatury.
eksperyment
Modelowy proces szkoleniowy, który uwzględnia serię definicji szkoleń i parametrów w celu określenia najdokładniejszej konfiguracji modelu.
Wyjaśnienie
- Zdolność użytkowników ludzkich do śledzenia, kontrolowania i rozumienia predykcji, które są wykonywane w aplikacjach, które używają systemów AI.
- Zdolność systemu AI do dostarczania spostrzeżeń, których ludzie mogą wykorzystać do zrozumienia przyczyn przewidywań systemu.
F
uczciwość
W systemie sztucznej inteligencji, sprawiedliwego traktowania osób lub grup osób. Wybór specyficznego pojęcia kapitału własnego dla systemu AI zależy od kontekstu, w jakim jest on używany. Patrz także bias (bias).
opcja
Właściwość lub charakterystyka elementu w zestawie danych, na przykład kolumna w arkuszu kalkulacyjnym. W niektórych przypadkach funkcje są projektowane jako kombinacje innych funkcji w zestawie danych.
inżynieria elementów
Proces wyboru, transformowania i tworzenia nowych funkcji z danych surowych w celu poprawy wydajności i przewidywania mocy modeli uczenia maszynowego.
Grupa składników
Zestaw kolumn danego zasobu danych wraz z metadanymi, które są używane do uczenia maszynowego.
wybór funkcji
Identyfikowanie kolumn danych, które najlepiej obsługują dokładną predykcję lub wynik w modelu uczenia maszynowego.
składnica składników
Scentralizowane repozytorium lub system, który zarządza i organizował funkcje, zapewniając skalowalny i wydajny sposób przechowywania, pobierania i współużytkowania danych dotyczących elementów w rurociągach i aplikacjach uczenia maszynowego.
transformacja opcji
W programie AutoAI: faza tworzenia potoku, która stosuje algorytmy do transformacji i optymalizacji danych uczących w celu uzyskania najlepszego wyniku dla typu modelu.
uczenie stowarzyszone
Szkolenie wspólnego modelu uczenia maszynowego, które korzysta z wielu źródeł danych, które nie są przenoszone, łączone ani współużytkowane. Rezultatem jest lepszy model bez kompromisów w zakresie bezpieczeństwa danych.
nieliczne, podpowiadane
Technika podpowiedzi, w której do modelu udostępniono niewielką liczbę przykładów w celu zademonstrowania sposobu zakończenia zadania.
precyzyjne strojenie
Proces adaptacji wstępnie wytrenowanego modelu do wykonania określonego zadania poprzez prowadzenie dodatkowego szkolenia. Dostrajanie może obejmować (1) aktualizowanie istniejących parametrów modelu, znanych jako pełne dostrajanie lub (2) aktualizowanie podzbioru istniejących parametrów modelu lub dodanie nowych parametrów do modelu i szkolenie ich przy jednoczesnym zamrożeniu istniejących parametrów modelu, określanych jako wydajny dostrajanie parametrów.
przepływ
Kolekcja węzłów, które definiują zestaw kroków przetwarzania danych lub szkolenia modelu.
model foundation
Model AI, który może być dostosowany do szerokiej gamy dalszych zadań. Modele fundamentowe są zwykle wielkoskalowymi modelami generacyjnymi, które są wyszkolone na danych bez etykiet za pomocą nadzoru nad sobą. Modele fundamentowe mogą obejmować miliardy parametrów w skali dużej skali.
G
Wykres Gantta
Graficzna reprezentacja osi czasu projektu i czasu trwania, w której dane harmonogramu są wyświetlane jako paski poziome w skali czasu.
ogólna AI
Klasa algorytmów AI, które mogą generować różne typy treści, w tym tekst, kod źródłowy, obraz, dźwięk i dane syntetyczne.
zmienność generatywna
Cecha modeli generatywnych do tworzenia zróżnicowanych wyjść, nawet wtedy, gdy wejście do modelu jest utrzymywane na stałym poziomie. Patrz także probabilistic.
Procesor graficzny
Patrz: jednostka przetwarzania grafiki.
graficzny program budujący
Narzędzie służące do tworzenia zasobów analitycznych poprzez wizualne kodowanie. Kanwa jest to obszar, na którym można umieścić obiekty lub węzły, które mogą być połączone w celu utworzenia przepływu.
jednostka przetwarzania grafiki (GPU)
Wyspecjalizowany procesor przeznaczony do szybkiego manipulowania i zmieniania pamięci w celu przyspieszenia tworzenia obrazów w buforze ramki przeznaczonym do wyprowadzania danych na ekran. GPUs są intensywnie wykorzystywane w procesie uczenia maszynowego ze względu na ich możliwości przetwarzania równoległego.
H
halucynacja
Odpowiedź z modelu fundacji, która zawiera treść poza tematem, powtarzającą się, niepoprawną lub przetworzoną. Halucynacje dotyczące szczegółów fabulacji mogą się zdarzyć, gdy model zostanie poproszony o wygenerowanie tekstu, ale model nie ma wystarczającej ilości tekstu pokrewnego, aby wygenerować wynik zawierający poprawne szczegóły.
zestaw wstrzymany
Zestaw oznakowanego danych, który został celowo wstrzymany zarówno z zestawów szkoleń, jak i zestawów walidacyjnych, służąc jako bezstronna ocena wydajności modelu końcowego w przypadku danych nieobserwowanych.
homogenizacja
Tendencja w badaniach uczenia maszynowego, w których niewielka liczba głębokich architektur sieci neuronowych, takich jak transformator, osiąga najnowocześniejsze wyniki w wielu różnych zadaniach.
HPO
Patrz: optymalizacja hiperparametrów.
nadzór nad człowiekiem
Zaangażowanie ludzi w przegląd decyzji wyświadczonych przez system AI, umożliwienie autonomii człowieka i odpowiedzialności za podejmowanie decyzji.
hiperparametr
W uczeniu maszynowym jest to parametr, którego wartość jest ustawiana przed szkoleniem jako sposób na zwiększenie dokładności modelu.
Optymalizacja hiperparametrów (HPO)
Proces ustawiania wartości hiperparametrów w ustawieniach, które udostępniają najbardziej dokładny model.
I
obraz
Pakiet oprogramowania, który zawiera zestaw bibliotek.
nauka przyrostowa
Proces szkolenia modelu przy użyciu danych, które są stale aktualizowane bez zapominania o danych uzyskanych z poprzednich zadań. Technika ta służy do uczenia modelu z partiami danych pochodzących z dużego źródła danych uczących.
wnioskowanie
Proces wykorzystywania przeszkolonego modelu uczenia maszynowego do tworzenia predykcji dla nowych danych.
w trybie ciągłym
- Aby w sposób ciągły dodać dużą ilość danych w czasie rzeczywistym do bazy danych.
- Dostarczanie danych do systemu w celu utworzenia bazy wiedzy.
wgląd
Dokładne lub głębokie zrozumienie czegoś. Produkt Insights wykorzystuje analizy kognitywne w celu udostępniania bieżących obrazów stanu oraz predykcji zachowań klientów i postaw.
inteligentna AI
Systemy sztucznej inteligencji, które mogą zrozumieć, nauczyć się, dostosowywać i wdrażać wiedzę, demonstrując zdolności, takie jak podejmowanie decyzji, rozwiązywanie problemów i zrozumienie złożonych koncepcji, takich jak inteligencja ludzka.
Terminy wyszukiwania
Cel lub cel wyrażony przez dane wejściowe klienta w rozmowie sieciowej, takie jak udzielenie odpowiedzi na pytanie lub przetwarzanie płatności za fakturę.
J
zadanie
Wydzielona wykonywalna jednostka pracy.
Notatnik Jupyter
Patrz notatnik.
L
etykieta
Klasa lub kategoria przypisana do punktu danych w nadzorowanym learning.Labels może być pochodną danych, ale często są stosowane przez etykietniki lub adnotatory.
etykietowane dane
Dane surowe, które są przypisywane etykietom w celu dodania kontekstu lub znaczenia, dzięki czemu mogą być używane do uczenia modeli uczenia maszynowego. Na przykład wartości liczbowe mogą być oznaczane jako kody pocztowe lub wieki w celu udostępnienia kontekstu dla wejść i wyjść modelu.
duży model języka
Model językowy z dużą liczbą parametrów, przeszkolony na dużej ilości tekstu.
przestrzeń utajona
N-wymiarowa przestrzeń matematyczna, w której osadzone są instancje danych. Dwuwymiarowa przestrzeń utajona osadza dane w postaci punktów w płaszczyźnie 2D (patrz także: przestrzeń reprezentacyjna). Patrz także: przestrzeń reprezentacyjna.
LoRA
Patrz low-rank Adaptacjaadaptacja na niskim
adaptacja niskotonowa (LoRA)
Technika, która redukuje wymagania obliczeniowe dużych modeli językowych poprzez wykorzystanie struktury o niskiej rangi w ich matrycach wagowych, co prowadzi do bardziej wydajnych i skalowalnych procesów uczenia i wnioskowania, a także sposobu dostrajania modeli fundamentowych.
M
uczenie maszynowe (ML)
Oddział sztucznej inteligencji (AI) i informatyki, który koncentruje się na wykorzystaniu danych i algorytmów do naśladowania sposobu, w jaki ludzie uczą się, stopniowo poprawiając dokładność modeli AI.
struktura uczenia maszynowego
Biblioteki i środowisko wykonawcze do szkolenia i wdrażania modelu.
Model uczenia maszynowego
Model AI, który jest przeszkolony w zakresie zestawu danych w celu opracowania algorytmów, które mogą być używane do analizy i uczenia się z nowych danych.
model psychiczny
Indywidualne zrozumienie tego, jak działa system i jak ich działania wpływają na wyniki systemowe. Gdy te oczekiwania nie są zgodne z rzeczywistymi możliwościami systemu, może prowadzić do frustracji, porzucenia lub niewłaściwego użytkowania.
niedopasowanie
Rozbieżność między celami lub zachowaniami, które system AI jest zoptymalizowany w celu osiągnięcia i prawdziwego, często złożonego, celów swoich użytkowników lub projektantów.
ML
Patrz: machine learning.
MLOps
- Metodologia, która wykorzystuje model uczenia maszynowego od rozwoju do produkcji.
- Praktyka współpracy pomiędzy danymi naukowcami i specjalistami ds. operacji w celu wspomagania zarządzania cyklem życia uczenia maszynowego (lub głębokiego uczenia się). MLOps ma na celu zwiększenie automatyzacji i poprawę jakości produkcji ML przy jednoczesnym skupieniu się na wymogach biznesowych i regulacyjnych. Obejmuje on projektowanie modeli, szkolenia, walidację, wdrażanie, monitorowanie i zarządzanie oraz wykorzystuje metody takie jak CI/CD.
usługowym
- W kontekście uczenia maszynowego: zestaw funkcji i algorytmów, które zostały przeszkolone i przetestowane w zestawie danych w celu udostępnienia predykcji lub decyzji.
- W sekcji Decision Optimization: matematyczne sformułowanie problemu, który można rozwiązać za pomocą mechanizmów optymalizacji CPLEX z wykorzystaniem różnych zestawów danych.
ModelOps
Metodologia zarządzania pełnym cyklem życia modelu AI, w tym szkolenia, wdrażanie, ocenianie, ocenianie, przekwalifikowanie i aktualizowanie.
grupa monitorowana
Klasa danych, które są monitorowane w celu określenia, czy wyniki z modelu predykcyjnego różnią się znacząco od wyników grupy odwołań. Grupy są często monitorowane w oparciu o cechy, które obejmują rasę, płeć lub wiek.
wieloklasowy model klasyfikacji
Zadanie klasyfikacji z więcej niż dwiema klasami. Na przykład, gdy binarny model klasyfikacji prognozuje wartości tak lub nie, model wieloklasowy prognozuje tak, nie, nie, może lub nie ma zastosowania.
wielowarianowe szeregi czasowe
Eksperyment szeregów czasowych, który zawiera dwie lub więcej zmiennych zmiennych. Na przykład: model szeregów czasowych prognozowania zużycia energii elektrycznej przez trzech klientów.
N
przetwarzanie języka naturalnego (NLP)
Dziedzina sztucznej inteligencji i językoznawstwa, która bada problemy związane z przetwarzaniem i manipulowaniem językiem naturalnym, którego celem jest zwiększenie zdolności komputerowej do rozumienia języków ludzkich.
biblioteka przetwarzania języka naturalnego
Biblioteka udostępniający podstawowe funkcje przetwarzania języka naturalnego na potrzeby analizy składni oraz wstępnie wyszkolonych modeli w celu wykonywania wielu różnych zadań przetwarzania tekstu.
sieć neuronowa
Model matematyczny do przewidywania lub klasyfikowania obserwacji za pomocą złożonego schematu matematycznego, symulującego abstrakcyjną wersję komórek mózgowych. Sieć neuronowa jest przeszkolona poprzez prezentowanie jej przy dużej liczbie obserwowanych przypadków, po jednym w danym momencie i umożliwiając jej wielokrotne aktualizowanie, aż do momentu, gdy dowie się, że zadanie to się nie uczy.
NLP
Patrz: przetwarzanie języka naturalnego.
węzeł
W przepływie SPSS Modeler jest to graficzna reprezentacja operacji danych.
notatnik
Interaktywny dokument zawierający kod wykonywalny, tekst opisujący ten kod oraz wyniki działania dowolnego kodu, który jest uruchamiany.
jądro notatnika
Część edytora notatnika, która wykonuje kod i zwraca wyniki obliczeniowe.
O
Pamięć obiektowa
Metoda przechowywania danych, zwykle używana w chmurze, w której dane są przechowywane jako jednostki dyskretne, lub obiekty w puli pamięci masowej lub w repozytorium, w którym nie jest używana hierarchia plików, ale składuje wszystkie obiekty na tym samym poziomie.
jednostrzałowa nauka
Model głębokiego uczenia się, oparty na założeniu, że większość uczenia się człowieka odbywa się po otrzymaniu tylko jednego lub dwóch przykładów. Model ten jest podobny do nienadzorowanego uczenia się.
monitowanie jednorazowe
Technika podpowiedzi, w której jeden przykład jest udostępniany modelowi w celu zademonstrowania sposobu zakończenia zadania.
wdrożenie online
Metoda uzyskiwania dostępu do modelu lub wdrożenia kodu Python za pośrednictwem punktu końcowego interfejsu API jako usługi Web Service w celu wygenerowania predykcji w trybie z połączeniem w czasie rzeczywistym.
ontologia
Jawna, formalna specyfikacja reprezentacji obiektów, pojęć i innych elementów mogących istnieć w danym obszarze zainteresowań oraz relacji między nimi.
zasób operacyjny
Zasób, który uruchamia kod w narzędziu lub zadaniu.
wdrożenia
Proces znajdowania najodpowiedniejszego rozwiązania precyzyjnie zdefiniowanego problemu przy jednoczesnym przestrzeganiu narzuconych ograniczeń i ograniczeń. Na przykład określenie sposobu przydzielania zasobów lub sposobu znajdowania najlepszych elementów lub kombinacji z dużego zestawu alternatyw.
Język programowania optymalizacji
Język modelowania do wyrażania formuł modelowych problemów optymalizacyjnych w formacie, który może zostać rozwiązany przez mechanizmy optymalizacji CPLEX, takie jak IBM CPLEX.
zoptymalizowany pomiar
Metryka używana do pomiaru wydajności modelu. Na przykład dokładność jest typową metryką używaną do pomiaru wydajności binarnego modelu klasyfikacji.
koordynacja
Proces tworzenia przepływu end-to-end, który może szkolić, uruchamiać, wdrażać, testować i oceniać model uczenia maszynowego, a także wykorzystuje automatyzację do koordynowania systemu, często przy użyciu mikrousług.
nadrealność
Akceptacja przez użytkownika nieprawidłowej rekomendacji dokonanej przez model AI. Patrz także relicja, niedocenianie.
P
populacji
- Waga o rzeczywistej wartości od 0.0 do 1.0 wskazująca na siłę połączenia między dwoma neuronami w sieci neuronowej.
- Konfigurowalna część modelu, która jest wewnętrzna dla modelu i której wartości są szacowane lub uczone na podstawie danych. Parametry to aspekty modelu, które są korygowane podczas procesu uczenia, aby pomóc modelowi dokładnie przewidzieć dane wyjściowe. Wydajność i predykcyjna moc modelu zależą w dużej mierze od wartości tych parametrów.
Podmiot
W programie Federated Learning: jednostka, która udostępnia dane na potrzeby szkolenia wspólnego modelu. Dane nie są przenoszone ani łączone, ale każda ze stron uzyskuje korzyści ze szkolenia stowarzyszonego.
ładunek
Dane, które są przekazywane do wdrożenia w celu uzyskania wyniku, predykcji lub rozwiązania.
Rejestrowanie ładunku
Przechwytywanie danych ładunku i danych wyjściowych wdrożenia w celu monitorowania bieżącego stanu zdrowia AI w aplikacjach biznesowych.
Potok
- W produkcie Watson Pipelines: kompleksowy przepływ zasobów od utworzenia do wdrożenia.
- W programie AutoAI: model kandydujący.
Leaderboard rurociągu
W polu AutoAI: tabela, która przedstawia listę automatycznie wygenerowanych modeli kandydujących, jako rurociągów, uporządkowane według podanych kryteriów.
automatyzacja
Strategia lub reguła śledzona przez agenta w celu określenia następnego działania w oparciu o bieżący stan.
kodowanie pozycyjne
Kodowanie uporządkowanej sekwencji danych, która zawiera informacje pozycyjne, takie jak kodowanie słów w zdaniu, które zawiera pozycję każdego słowa w zdaniu. Patrz także: kodowanie.
analizy predykcyjne
Proces biznesowy i zestaw powiązanych technologii, które dotyczą przewidywania przyszłych możliwości i trendów. Analizy predykcyjne dotyczą tak różnorodnych dyscyplin jak prawdopodobieństwo, statystyka, uczenie maszynowe, a także sztuczna inteligencja do problemów biznesowych, aby znaleźć najlepsze działanie dla konkretnej sytuacji.
model wstępnie przeszkolony
Model AI, który wcześniej został przeszkolony w przypadku dużego zestawu danych w celu wykonania określonego zadania. Modele wstępnie wyszkolone są używane zamiast budowania modelu od podstaw.
wstępne szkolenie
Proces uczenia modelu uczenia maszynowego na dużym zbiorze danych przed dostrajaniem go dla określonego zadania.
prywatność
Zapewnienie, że informacje o osobie są chronione przed nieuprawnionym dostępem i niewłaściwym użyciem.
Prawdopodobieństwa
Cecha charakterystyczna jest przypadkowość; niedeterministyczna. Modele probabilistyczne nie generują tych samych danych wyjściowych z tych samych danych wejściowych. Patrz także: zmienność generacyjna.
projekt
Grupowy obszar roboczy przeznaczony do pracy z danymi i innymi zasobami.
pytanie
- Dane, takie jak tekst lub obraz, które przygotowują, instruują lub warunują dane wyjściowe modelu fundacji.
- Komponent czynności wskazujący, że aby przejść do ekranu danych wyjściowych, użytkownik musi wprowadzić dane w polu.
inżynieria pytań
Proces projektowania zapytań w języku naturalnym dla modelu języka w celu wykonania określonego zadania.
strojenie pytań
Wydajny, tani sposób adaptacji wstępnie wyszkolonego modelu do nowych zadań bez przekwalifikowania modelu lub aktualizacji jego wag. Strojenie pytań obejmuje uczenie się niewielkiej liczby nowych parametrów, które są dopisane do pytania modelu, a jednocześnie zamrażanie istniejących parametrów modelu.
pytanie
Proces dostarczania danych wejściowych do modelu fundacji w celu wywołania go w celu wygenerowania danych wyjściowych.
przycinanie
Proces upraszczania, kurczenia się lub przycinania drzewa decyzyjnego lub sieci neuronowej. Jest to realizowane przez usunięcie mniej ważnych węzłów lub warstw, zmniejszenie złożoności, aby zapobiec nadmiernej instalacji i poprawić uogólnienie modelu przy zachowaniu jego mocy predykcyjnej.
Python
Język programowania używany w naukach o danych i sztucznej inteligencji.
Funkcja Python
Funkcja, która zawiera kod Python w celu obsługi modelu w środowisku produkcyjnym.
R
R
Rozszerzalny język skryptowy używany w naukach o danych i sztukach AI, który oferuje szeroką gamę funkcji i technik analitycznych, statystycznych i graficznych.
RAG
Wartość startowa generatora liczb losowych
Numer służący do inicjowania generatora liczb pseudorandoma. Losowe nasiona umożliwiają odtwarzalność procesów polegających na generowaniu liczb losowych.
Grupa odniesienia
Grupa, która jest zidentyfikowana jako najbardziej prawdopodobna, aby otrzymać wynik pozytywny w modelu predykcyjnym. Wyniki mogą być porównywane z grupą monitorowaną w celu wyszukania potencjalnych bias w wynikach.
Sprecyzuj
Aby wyczyścić i ukształtować dane.
Model regresji
Model, który odnosi się do zmiennej zależnej do jednej lub większej liczby zmiennych niezależnych.
uczenie wzmacniania
Technika uczenia maszynowego, w której agent dowiaduje się o podejmowaniu kolejnych decyzji w środowisku, aby zmaksymalizować sygnał nagrody. Inspirowane przez proces uczenia się prób i błędów, agenci współdziałają ze środowiskiem, otrzymują informację zwrotną i dostosowują swoje działania w celu osiągnięcia optymalnych strategii.
wzmocnienie procesu uczenia się w oparciu o opinie człowieka (RLHF)
Metoda wyrównywania odpowiedzi modelu uczącego się języka do instrukcji podanych w pytaniu. RLHF wymaga, aby adnotatory ludzkie były w rankingu wielu wyjść z modelu. Te rankingi są następnie wykorzystywane do szkolenia modelu nagrody za pomocą wzmocnienia uczenia się. Model nagrody jest następnie używany do precyzyjnego dostrajania danych wyjściowych dużego modelu językowego.
relicja
W systemach AI: akceptacja przez użytkownika rekomendacji przez model AI lub generowanych przez niego danych wyjściowych. Patrz także nadrealność, niedocenianie.
reprezentacja
Kodowanie jednostki informacji, często jako wektor liczb o rzeczywistej wartości. Patrz także embedding (osadzanie).
przestrzeń reprezentacyjna
N-wymiarowa przestrzeń matematyczna, w której osadzone są instancje danych. Dwuwymiarowa przestrzeń utajona osadza dane w postaci punktów w płaszczyźnie 2D (patrz także: ukryta przestrzeń). Patrz także spacja ukryta.
odtwarzanie rozszerzonej generacji (RAG)
Technika, w której duży model języka jest rozszerzany ze znajomością ze źródeł zewnętrznych w celu wygenerowania tekstu. W kroku pobierania odpowiednie dokumenty pochodzące z zewnętrznego źródła są identyfikowane na podstawie zapytania użytkownika. W kroku generowania fragmenty tych dokumentów są zawarte w zachęcie LLM w celu wygenerowania odpowiedzi uziemionej w pobranych dokumentach.
nagroda
Sygnał używany do kierowania agenta, zwykle jest to agent do nauki wzmocnienia, który dostarcza informacji zwrotnych na temat dobroci decyzji
RLHF
Patrz wzmocnienie uczenia się w oparciu o opinie użytkowników.
środowisko wykonawcze
Predefiniowana lub niestandardowa konfiguracja sprzętu i oprogramowania używana do uruchamiania narzędzi lub zadań, takich jak notebooki.
S
ocenianie
- W uczeniu maszynowym proces pomiaru zaufania do przewidywanego wyniku.
- Proces obliczania, w jaki sposób atrybuty dla tożsamości przychodzącej są zgodne z atrybutami istniejącego obiektu.
skrypt
Plik, który zawiera skrypty Python lub R do obsługi modelu w środowisku produkcyjnym.
samodzielna uwaga
Mechanizm alarmowy, który wykorzystuje informacje z danych wejściowych w celu określenia, które części danych wejściowych mają być aktywne podczas generowania danych wyjściowych.
samo-nadzorowana nauka
Metoda uczenia maszynowego, w której model dowiaduje się z danych bez etykiet poprzez maskowanie tokenów w sekwencji wejściowej, a następnie próbuje je przewidzieć. Przykładem jest "Lubię ________ kiełki".
sentymencja
Zdolność do posiadania subiektywnych doświadczeń i uczuć, czyli świadomości. Polega ona na zdolności do postrzegania, rozumowania i doświadczenia doznań, takich jak ból i przyjemność.
kształt
Dostosowywanie danych poprzez filtrowanie, sortowanie, usuwanie kolumn; łączenie tabel; wykonywanie operacji, które obejmują obliczenia, grupy danych, hierarchie i inne.
małe dane
Dane, które są dostępne i zrozumiałe dla ludzi. Patrz także structured data (dane strukturalne).
Opcja przekazywania przetwarzania na serwer SQL (SQL pushback)
W programie SPSS Modeler: proces wykonywania wielu operacji przygotowywania danych i eksploracji danych bezpośrednio w bazie danych za pośrednictwem kodu SQL.
dane strukturalne
Dane znajdujące się w polach stałych w rekordzie lub pliku. Relacyjne bazy danych i arkusze kalkulacyjne są przykładami ustrukturyzowanych danych. Patrz także: dane nieustrukturyzowane, małe dane.
informacje o strukturze
Elementy zapisane w zasobach ustrukturyzowanych, takie jak indeksy mechanizmu wyszukiwania, bazy danych lub bazy wiedzy.
nadzorowane nauki
Metoda uczenia maszynowego, w której model jest przeszkolony w oparciu o etykietowany zbiór danych w celu przewidywania nowych danych.
T
Temperatura
Parametr w modelu generatywnym, który określa wielkość wariantu procesu generowania. Wyższe temperatury powodują większą zmienność w wynikach modelu.
klasyfikacja tekstu
Model, który automatycznie identyfikuje i klasyfikuje tekst do określonych kategorii.
szeregi czasowe
Zbiór wartości zmiennej w punktach okresowych w czasie.
Model szeregów czasowych
Model śledzający i predyktorów danych w czasie.
znacznik
Dyskretna jednostka znaczenia lub analizy w tekście, np. słowo lub podsłowo.
tokenizacja
Proces używany w przetwarzaniu języka naturalnego w celu podzielenia łańcucha tekstu na mniejsze jednostki, takie jak słowa lub podsłowa.
model przeszkolony
Model wyszkolony z rzeczywistymi danymi i gotowy do wdrożenia w celu przewidywania wyników po przedstawieniu z nowymi danymi.
szkolenia
Początkowy etap budowania modelu, w którym znajduje się podzbiór danych źródłowych. Model dowiaduje się na przykład ze znanych danych. Model może być następnie testowany pod kątem dalszego, innego podzbioru, dla którego wynik jest już znany.
Dane uczące
Zestaw dokumentów z adnotacjami, które mogą być używane do uczenia modeli uczenia maszynowego.
Zbiór uczący
Zestaw oznakowanych danych, które służą do uczenia modelu uczenia maszynowego przez ujawnienie go na przykładach i odpowiadających im etykietach, umożliwiając modelowi poznanie wzorców i przewidywanie predykcji.
Transfer learning
Strategia uczenia maszynowego, w której wyszkolony model jest stosowany do zupełnie nowego problemu.
transformator
Architektura sieci neuronowej, która używa kodowania pozycyjnego i mechanizmu samoobsługi w celu przewidywania następnego znacznika w sekwencji tokenów.
przezroczystość
Dzielenie się odpowiednimi informacjami z interesariuszami na temat tego, w jaki sposób system AI został zaprojektowany i rozwinięty. Przykładami tych informacji są dane zbierane, sposób ich użycia i przechowywania oraz kto ma do niego dostęp, a wyniki testów na dokładność, solidność i bias.
wzorcowanie zaufania
Proces oceny i dostosowania zaufania do systemu AI w oparciu o takie czynniki, jak jego dokładność, wiarygodność i wiarygodność.
Badanie
Zaproponowana przez Alana Turinga w 1950 roku, test zdolności maszyny do eksponowania inteligentnego zachowania równoważnego lub nie do odróżnienia od tego, co człowieka.
U
niedocenianie
Odrzucenie przez użytkownika poprawnych rekomendacji dokonanych przez model AI. Patrz także overreliance, reliance.
szeregi czasowe jednej zmiennej
Eksperyment szeregów czasowych, który zawiera tylko jedną zmienną zmieniającą się. Na przykład: model szeregów czasowych prognozowania temperatury ma pojedynczą kolumnę predykcji temperatury.
Dane nieustrukturyzowane
Wszystkie dane przechowywane w formacie nieustrukturyzowanym, a nie w polach stałych. Dane w dokumencie edytora tekstu są przykładem nieustrukturyzowanych danych. Patrz także structured data (dane strukturalne).
informacje nieustrukturyzowane
Dane, które nie są zawarte w stałej lokalizacji, takie jak dokument tekstowy w języku naturalnym.
uczenie nienadzorowane
- Model głębokiego uczenia, który pozwala na użycie surowych, bez etykiet danych do uczenia systemu z niewielkim nakładem na ludzki wysiłek.
- Metoda uczenia maszynowego, w której model nie jest udostępniany z etykietami danych i musi znajdować wzorce lub strukturę w danych na własną odpowiedzialność.
V
zestaw sprawdzania
Osobny zestaw danych z etykietami, który jest używany do oceny wydajności i możliwości uogólnienia modelu uczenia maszynowego podczas procesu uczenia, wspomagając strojenie hiperparametrów i selekcję modelu.
wektor
Jednowymiarowa, uporządkowana lista liczb, takich jak [ 1, 2, 5] lub [0.7, 0.2, -1.0].
wizualizacja
Wykres, wykres, wykres, tabela, mapa lub dowolna inna wizualna reprezentacja danych.
W
waga
Współczynnik dla węzła, który transformuje dane wejściowe w warstwie sieci. Waga jest parametrem, który model AI uczy się poprzez szkolenia, dostosowując swoją wartość do zmniejszenia błędów w predykatach modelu.
Z
zero-shot prompt
Technika podpowiedzi, w której model kończy zadanie bez podawania konkretnego przykładu.