0 / 0
영어 버전 문서로 돌아가기
용어집
마지막 업데이트 날짜: 2024년 12월 05일
용어집

이 용어집은 watsonx.ai 및 watsonx.governance에 대한 용어 및 정의를 제공합니다.

이 용어집에서는 다음과 같은 상호 참조가 사용됩니다.

  • 참조하십시오는 선호하지 않는 용어에서 선호하는 용어까지 또는 약어에서 상세한 설명이 있는 양식까지 포괄합니다.
  • 도 참조하십시오는 관련되거나 대조적인 용어를 포괄합니다.

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | R | S | T | U | V | W | Z

A

단축키

고성능 컴퓨팅에서 CPU에서 계산 로드의 일부를 차지하여 시스템의 효율성을 높이는 데 사용되는 특수화된 회로입니다. 예를 들어, 딥 러닝에서 GPU 가속 컴퓨팅은 종종 기본 애플리케이션이 CPU에서 실행되는 동안 GPU에 컴퓨팅 워크로드의 일부를 오프로드하는 데 사용됩니다. 그래픽 처리 장치도 참조하십시오.

신뢰성

조직 또는 개인이 자신의 역할 및 적용 가능한 규정 프레임워크에 따라 설계, 개발, 운영 또는 배치하는 AI 시스템의 적절한 기능을 라이프사이클 전체에서 보장할 것이라고 예상합니다. 여기에는 법률 전문가가 사례별로 책임을 판별해야 할 수 있는 AI 실수에 대한 책임이 있는 사람을 판별하는 것이 포함됩니다.

활성화 함수

다른 뉴런으로부터 들어오는 활성화 세트가 제공된 경우 신경 장치의 출력을 정의하는 함수입니다.

액티브 러닝

시스템이 필요한 경우에만 더 많은 레이블이 지정된 데이터를 요청하는 기계 학습 모델입니다.

활성 메타데이터

기계 학습 프로세스의 분석을 기반으로 자동으로 업데이트되는 메타데이터입니다. 예를 들어, 프로파일링 및 데이터 품질 분석은 데이터 자산의 메타데이터를 자동으로 업데이트합니다.

활성 런타임(active runtime)

코드를 실행하는 에셋에 컴퓨팅 리소스를 제공하기 위해 실행 중인 환경의 인스턴스입니다.

에이전트

특정 목표를 달성하기 위해 일반적으로 강화 학습을 사용하여 최적의 조치 또는 의사결정을 학습하기 위해 환경과 상호작용하는 알고리즘 또는 프로그램입니다.

Agentic AI

프롬프트를 여러 태스크로 분해하고 적절한 gen AI 에이전트에 태스크를 지정하며 사용자 개입 없이 응답을 합성할 수 있는 생성 AI 플로우입니다.

인공지능

인공 지능을 참조하십시오.

AI 액셀러레이터

더 빠르고 에너지 효율적인 컴퓨팅을 위해 딥 러닝, 머신 러닝, 신경망과 같은 AI 관련 작업을 효율적으로 실행하도록 설계된 특화된 실리콘 하드웨어입니다. 코어의 전용 유닛, 다중 모듈 칩의 개별 칩렛 또는 별도의 카드일 수 있습니다.

AI 윤리

위험과 불리한 결과를 줄이면서 AI의 유익한 영향을 최적화하는 방법을 연구하는 여러 전문 분야입니다. AI 윤리 문제의 예로는 데이터 책임 및 개인정보 보호, 공정성, 설명 가능성, 견고성, 투명성, 환경 지속 가능성, 포함, 도덕적 기관, 가치 조정, 책임, 신뢰 및 기술 오용이 있습니다.

AI 거버넌스

AI 라이프사이클 전반에 걸쳐 올바른 조치를 지시, 평가, 모니터링 및 수행하고, AI 시스템이 조직의 의도대로, 이해 당사자가 예상하는 대로, 그리고 관련 규정에 필요한 대로 운영되고 있음을 보장하기 위해 기업의 지시사항, 직원, 프로세스 및 시스템을 통해 조직을 통제하는 조직의 행위입니다.

AI 안전

인공지능 시스템이 인간에게 유익하고 부주의하게 해를 끼치지 않는 방식으로 작동하도록 보장하는 것을 목표로 하는 연구 분야는 신뢰성, 공정성, 투명성, AI 시스템과 인간의 가치의 일치와 같은 문제를 다루고 있다.

AI 서비스

생성형 AI 사용 사례의 로직을 포함하고 애플리케이션에서 추론할 수 있는 엔드포인트를 제공하는 배포 가능한 코드 단위입니다.

AI 시스템

인공 지능 시스템을 참조하십시오.

알고리즘

분석 문제를 해결하기 위한 최적의 방법을 판별하기 위해 데이터에 적용되는 공식입니다.

능률화

데이터에서 의미 있는 패턴을 찾고 해당 패턴을 기반으로 결론을 도출하기 위해 데이터를 연구하는 학문입니다.

적절한 신뢰

AI 시스템에서 정확도, 신뢰성 및 신뢰성에 맞게 조정되는 신뢰의 양입니다.

인공 지능 (AI, artificial intelligence)

예측, 권장사항 또는 의사결정을 작성하기 위해 모델 양식으로 지식을 획득, 처리, 작성 및 적용하는 기능입니다.

인공 지능 시스템 (AI system, AI system)

실제 또는 가상 환경에 영향을 미치는 예측, 권장사항 또는 의사결정을 작성할 수 있고 개발자 또는 사용자가 출력 또는 동작을 미리 판별할 필요가 없는 시스템입니다. AI 시스템은 일반적으로 대량의 구조화되거나 구조화되지 않은 데이터로 훈련되며 사용자 정의 목표를 달성하기 위해 다양한 레벨의 자율로 작동하거나 전혀 작동하지 않도록 설계될 수 있습니다.

자산

데이터, 기타 중요한 정보 또는 데이터에 대해 작업하는 코드에 대한 정보를 포함하는 항목입니다. 데이터 자산도 참조하십시오.

주의 메커니즘

출력을 생성할 때 모델이 초점을 맞추는 입력 파트를 판별하는 딥 러닝 모델의 메커니즘입니다.

AutoAI 실험

일련의 훈련 정의와 매개변수를 고려하여 모델 후보로 순위가 지정된 파이프라인 세트를 작성하는 자동화된 훈련 프로세스입니다.

B

일괄처리 배치(batch deployment)

스토리지 버킷의 파일, 데이터 연결 또는 연결된 데이터에서 입력 데이터를 처리하는 모델을 배치한 후 선택된 대상에 출력을 기록하는 방법입니다.

편향

불공정한 의사결정을 생성할 수 있는 방식으로 의도적으로 또는 의도적으로 설계되지 않은 AI 시스템의 체계적인 오류입니다. 바이어스는 AI 시스템과 이를 훈련하고 테스트하는 데 사용되는 데이터 모두에 존재할 수 있습니다. AI 편향성은 문화적 기대, 기술적 제한 또는 예기치 않은 배치 컨텍스트의 결과로 AI 시스템에서 나타날 수 있습니다. 공정성도 참조하십시오.

편향 발견

AI 모델에서 특정 속성을 기반으로 불공정한 결과를 전달할 때 메트릭의 공정성을 계산하는 프로세스입니다.

편향성 완화

훈련 데이터를 큐레이션하고 공정성 기술을 적용하여 AI 모델의 편향성을 줄입니다.

2진 분류

두 개의 클래스가 있는 분류 모델. 예측은 두 클래스 중 하나의 2진 선택사항입니다.

C

분류 모델

개별 범주의 데이터를 예측하는 예측 모델입니다. 분류는 두 개의 데이터 클래스가 있는 2진또는 세 개 이상의 카테고리가 있는 경우 다중 클래스일 수 있습니다.

정리

데이터 세트의 모든 값이 일관되고 올바르게 기록되도록 하는 작업입니다.

CNN

콘볼루션 신경망 (convolutional neural network)을 참조하십시오.

인지 강제 기능

경험적 추론을 중단하고 개인이 분석적 사고에 참여하도록 하기 위해 의사결정 순간에 적용되는 개입입니다. 예를 들어, 체크리스트, 진단 제한시간 초과 또는 사용자에게 대안을 배제하도록 요청하는 것입니다.

계산 언어

자연어를 계산적으로 모델링하기 위한 접근 방식을 탐색하는 여러 전문 분야 협력 필드입니다.

계산 자원

도구에서 자산을 실행하기 위해 환경 템플리트에서 정의하는 하드웨어 및 소프트웨어 자원입니다.

혼동 행렬

모델의 긍정적 및 부정적 예측 결과와 긍정적 및 부정적 실제 결과 사이의 정확도를 판별하는 성능 측정입니다.

연결된 데이터 자산(connected data asset)

외부 데이터 소스에 대한 연결을 통해 액세스되는 데이터에 대한 포인터입니다.

연결된 폴더 자산

IBM Cloud Object Storage의 폴더에 대한 포인터입니다.

연결

데이터베이스에 연결하는 데 필요한 정보입니다. 필요한 실제 정보는 DBMS및 연결 방법에 따라 다릅니다.

연결 자산(connection asset)

데이터 소스에 연결할 수 있도록 하는 정보가 포함된 자산입니다.

제한조건

  • 데이터베이스에서 테이블 간의 관계입니다.
  • Decision Optimization에서 문제점의 솔루션으로 충족되어야 하는 조건입니다.

지속적인 학습

모델 성능 모니터링, 새 데이터로 재훈련 및 재배치 태스크를 자동화하여 예측 품질을 보장합니다.

콘볼루션 신경망 (CNN)

이미지 데이터를 처리하기 위해 콘볼루션 계층을 사용하는 컴퓨터 비전 태스크에서 일반적으로 사용되는 신경망의 클래스입니다.

Core ML 배치(Core ML deployment)

iOS 앱에서 사용하기 위해 Core ML 형식으로 배치를 다운로드하는 프로세스입니다.

모음

기계 학습 모델을 훈련시키는 데 사용하는 소스 문서 콜렉션입니다.

CPLEX 모델

CPLEX 엔진으로 해결되도록 공식화되는 Decision Optimization 모델입니다.

CPO 모델

Decision Optimization CP Optimizer (CPO) 엔진으로 해결되도록 공식화된 제약조건 계획법 모델입니다.

교차 검증

홀드아웃 테스트 샘플이 없는 경우 모델이 얼마나 잘 일반화되는지 테스트하는 기술입니다. 교차 검증은 훈련 데이터를 다수의 서브세트로 나눈 후 동일한 수의 모델을 작성하며 각 서브세트는 차례로 유지됩니다. 이러한 각 모델은 검증용 표본에서 검정되며 이러한 검증용 표본에 대한 모델의 평균 정확도는 새 데이터에 적용될 때 모델의 정확도를 추정하는 데 사용됩니다.

큐레이트

특정 주제와 관련된 컨텐츠를 선택, 수집, 보존 및 유지보수합니다. 관리에서는 값을 설정하고 유지보수하며 데이터에 추가하고, 데이터를 신뢰할 수 있는 정보와 지식으로 변환합니다.

D

데이터 자산

데이터(예: 업로드된 파일)를 가리키는 자산입니다. 연결 및 연결된 데이터 자산도 데이터 자산으로 간주됩니다. 자산도 참조하십시오.

데이터 대치

데이터 세트에서 누락된 값을 추정된 값 또는 명시적 값으로 대체하는 것입니다.

데이터 레이크

플랫 아키텍처의 모든 형식으로 원시 데이터를 저장하는 대규모 데이터 스토리지 저장소입니다. 데이터 레이크는 처리 및 분석을 위해 2진 데이터뿐만 아니라 구조화된 데이터 및 구조화되지 않은 데이터를 보유합니다.

데이터 레이크하우스

데이터 레이크의 유연성을 데이터 웨어하우스의 구조화된 조회 및 성능 최적화와 결합하여 AI및 분석 애플리케이션에 대한 확장 가능하고 효율적인 데이터 분석을 가능하게 하는 통합 데이터 스토리지 및 처리 아키텍처입니다.

데이터 마이닝

데이터 소스에서 중요한 비즈니스 정보를 수집하고, 정보를 상관시키고, 연관, 패턴 및 추세를 파악하는 프로세스입니다. 예측 분석도 참조하십시오.

Data Refinery 플로우

새 데이터 자산을 생성하기 위해 데이터를 정리하고 쉐이핑하는 일련의 단계입니다.

데이터 사이언스

인사이트와 지식을 발견하기 위한 구조화된 데이터와 구조화되지 않은 데이터의 분석 및 시각화입니다.

데이터 세트

일반적으로 행(레코드) 및 열(필드) 양식으로 되어 있으며 파일 또는 데이터베이스 테이블에 포함된 데이터 콜렉션입니다.

데이터 소스

데이터베이스와 같은 데이터를 읽기 위한 저장소, 큐 또는 피드입니다.

데이터 테이블

일반적으로 행(레코드) 및 열(필드) 양식으로 되어 있으며 테이블에 포함된 데이터 콜렉션입니다.

데이터 웨어하우스

보고 및 데이터 분석에 사용되는 다양한 소스에서 수집된 데이터의 중앙 집중식 대형 저장소입니다. 기본적으로 구조화된 데이터와 반구조화된 데이터를 저장하여 비즈니스에서 정보에 입각한 의사결정을 내릴 수 있도록 합니다.

DDL

분산 딥 러닝을 참조하십시오.

의사결정 경계

공간에 있는 데이터 점을 개별 그룹 또는 분류로 나누는 것입니다.

디코더 전용 모델

입력 시퀀스에서 추론하여 단어별로 출력 텍스트 단어를 생성하는 모델입니다. 디코더 전용 모델은 텍스트 생성 및 질문 응답과 같은 태스크에 사용됩니다.

딥러닝

일련의 계산을 통해 입력 데이터 (첫 번째 계층) 를 변환하여 출력 (최종 계층) 을 생성하기 위해 계층 구조 계층으로 구성된 상호 연결된 노드의 다중 계층을 사용하는 계산 모델입니다. 심화 학습은 인간 두뇌의 구조와 기능에 의해 영감을 받습니다. 분산 딥 러닝도 참조하십시오.

깊은 신경망

데이터의 보다 복잡한 표시를 허용하는 다중 은닉층이 있는 신경망입니다.

심층 추론

시스템이 데이터에서 인사이트를 생성하여 상식, 상황 변화, 계획, 의사 결정 등 인식과 분류를 넘어서는 인지 작업을 지원하는 머신 러닝의 한 종류입니다.

배치

사용할 수 있는 모델 또는 애플리케이션 패키지입니다.

배치 영역

모델이 배치되고 배치가 관리되는 작업공간입니다.

deterministic

출력이 입력에 의해 완전히 판별될 때 컴퓨팅 시스템의 특성을 설명합니다.

차별적 AI

데이터에서 서로 다른 클래스를 구분하는 경계를 찾는 데 초점을 맞추는 알고리즘의 클래스입니다.

분산 딥 러닝 (DDL)

분산 컴퓨팅 방법을 활용하는 딥 러닝 교육에 대한 접근 방식입니다. DDL 환경에서 계산 워크로드는 중앙 처리 장치와 그래픽 처리 장치 간에 분배됩니다. 딥 러닝도 참조하십시오.

DOcplex

Decision Optimization 문제점을 모델링하고 해결하기 위한 Python API입니다.

E

임베딩

실제 값 숫자의 벡터인 정보 단위 (예: 단어 또는 문장) 의 숫자 표시입니다. 임베드는 고차원 데이터의 저차원 표현을 학습합니다. 인코딩, 표시도 참조하십시오.

출현

모델이 명시적으로 훈련되지 않은 동작을 나타내는 기초 모델의 특성입니다.

긴급 동작

명시적으로 구성되지 않은 foundation model 나타나는 동작입니다.

인코더-디코더 모델

입력 텍스트를 이해하고 입력 텍스트를 기반으로 출력 텍스트를 생성하기 위한 모델입니다. 인코더-디코더 모델은 요약 또는 변환과 같은 태스크에 사용됩니다.

인코더 전용 모델

입력 시퀀스를 임베드라고 하는 표현 벡터로 변환하여 문장 레벨에서 입력 텍스트를 이해하는 모델입니다. 인코더 전용 모델은 고객 피드백 분류 및 대형 문서에서 정보 추출과 같은 태스크에 사용됩니다.

인코딩

문자 또는 단어와 같은 정보 단위를 숫자 세트로 표시한 것입니다. 임베드, 위치 인코딩도 참조하십시오.

엔드포인트 URL

서비스 및 오브젝트와 같은 리소스를 식별하는 네트워크 대상 주소입니다. 예를 들어, 엔드포인트 URL은 사용자가 배치에 페이로드 데이터를 전송할 때 모델 또는 함수 배치의 위치를 식별하는 데 사용됩니다.

환경

작업을 실행하기 위한 계산 자원입니다.

환경 런타임(environment runtime)

에셋을 실행하기 위한 환경 템플릿의 인스턴스화입니다.

환경 템플리트

환경 런타임 인스턴스를 생성하기 위한 하드웨어 및 소프트웨어 리소스를 지정하는 정의입니다.

외부 기능

예측 모델에 영향을 줄 수 있지만 리턴 시 영향을 받을 수 없는 기능입니다. 예를 들어, 온도는 예상되는 아이스크림 판매에 영향을 줄 수 있지만, 아이스크림 판매는 온도에 영향을 줄 수 없습니다.

실험

가장 정확한 모델 구성을 판별하기 위해 일련의 훈련 정의 및 매개변수를 고려하는 모델 훈련 프로세스입니다.

설명가능성

  • 사용자가 AI 시스템을 사용하는 애플리케이션에서 작성한 예측을 추적, 감사 및 이해할 수 있는 기능입니다.
  • 인간이 시스템 예측의 원인을 이해하는 데 사용할 수 있는 인사이트를 제공하는 AI 시스템의 기능입니다.

F

공정

AI 시스템에서 개인 또는 개인 그룹의 공정한 처리입니다. AI 시스템에 대한 특정 지분 개념의 선택은 사용되는 컨텍스트에 따라 다릅니다. 바이어스 (bias)도 참조하십시오.

기능

데이터 세트 내에 있는 항목의 특성 또는 특성입니다 (예: 스프레드시트의 열). 일부 경우에, 특징들은 데이터 세트 내의 다른 특징들의 조합으로서 조작된다.

기능 엔지니어링

기계 학습 모델의 성능 및 예측력을 향상시키기 위해 원시 데이터에서 새 기능을 선택, 변환 및 작성하는 프로세스입니다.

기능 그룹

기계 학습에 사용되는 메타데이터와 함께 특정 데이터 자산의 열 세트입니다.

기능 선택

기계 학습 모델에서 정확한 예측 또는 점수를 가장 잘 지원하는 데이터 열을 식별합니다.

기능 저장소

기능을 관리하고 구성하여 기계 학습 파이프라인 및 애플리케이션에서 기능 데이터를 저장, 검색 및 공유하는 확장 가능하고 효율적인 방법을 제공하는 중앙 집중식 저장소 또는 시스템입니다.

기능 변환(feature transformation)

AutoAI에서 훈련 데이터를 변환하고 최적화하는 알고리즘을 적용하여 모델 유형에 대한 최상의 결과를 얻는 파이프라인 작성 단계입니다.

페더레이티드 학습

이동, 결합 또는 공유되지 않는 여러 데이터 소스를 사용하는 공통 기계 학습 모델의 훈련입니다. 결과는 데이터 보안을 손상시키지 않으면서 더 잘 훈련된 모델입니다.

몇 번의 프롬프트

태스크를 완료하는 방법을 설명하기 위해 적은 수의 예제가 모델에 제공되는 프롬프트 기술입니다.

세부 조정

추가 훈련을 수행하여 특정 태스크를 수행하도록 사전 훈련된 모델을 적용하는 프로세스입니다. 미세 조정에는 (1) 전체 미세 조정으로 알려진 모델의 기존 매개변수를 갱신하거나 (2) 모델의 기존 매개변수의 서브세트를 갱신하거나 모델에 새 매개변수를 추가하고 매개변수 효율적인 미세 조정으로 알려진 모델의 기존 매개변수를 동결하는 동안 이를 훈련하는 것이 포함될 수 있습니다.

플로우

데이터를 처리하거나 모델을 훈련하는 일련의 단계를 정의하는 노드의 콜렉션입니다.

foundation model

광범위한 다운스트림 태스크에 적용할 수 있는 AI 모델입니다. 기초 모델은 일반적으로 자체 감독을 사용하여 레이블이 없는 데이터에 대해 훈련되는 대규모 생성 모델입니다. 대형 스케일 모델로서, 기초 모델은 수십억 개의 매개변수를 포함할 수 있습니다.

G

갠트 차트

스케줄 데이터가 시간 스케일을 따라 가로 막대로 표시되는 프로젝트 타임라인 및 기간의 그래픽 표시입니다.

Gen AI

생성 AI를 참조하십시오.

생성 AI (gen AI)

텍스트, 소스 코드, 이미지, 오디오 및 합성 데이터를 포함하여 다양한 유형의 컨텐츠를 생성할 수 있는 AI 알고리즘 클래스입니다.

생성 변동

모델에 대한 입력이 일정하게 유지되는 경우에도 다양한 출력을 생성하는 생성 모델의 특성입니다. 확률적 (probabilistic)도 참조하십시오.

GPU

그래픽 처리 장치를 참조하십시오.

그래프 형식 빌더

시각적 코딩을 통해 흐름 자산을 생성하는 도구입니다. 캔버스는 플로우를 작성하기 위해 연결할 수 있는 오브젝트 또는 노드를 배치할 영역입니다.

GPU(Graphics Processing Unit)

표시장치에 출력하기 위한 프레임 버퍼에서 이미지 작성을 가속화하기 위해 메모리를 빠르게 조작하고 변경하도록 설계된 특수화된 프로세서입니다. GPU는 병렬 처리 기능으로 인해 기계 학습에서 과도하게 활용됩니다. 가속기도 참조하십시오.

접지

결과의 정확성을 향상시키기 위해 정보가 있는 대형 언어 모델을 제공합니다.

H

환각

주제에서 벗어나거나 반복적이거나 부정확하거나 조작된 콘텐츠가 포함된 foundation model 응답입니다. 세부사항을 조작하는 환각은 모델이 텍스트를 생성하도록 프롬프트될 때 발생할 수 있지만, 모델에는 올바른 세부사항을 포함하는 결과를 생성하기 위해 그릴 수 있는 충분한 관련 텍스트가 없습니다.

HAP 발견 (HAP 발견)

  • 사용자가 제출한 프롬프트와 AI 모델이 생성한 응답 모두에서 증오, 남용 및 욕설을 발견하고 필터링하는 기능입니다.

HAP 검출기 (HAP 검출기)

  • 혐오 발언, 욕설, 욕설 등 잠재적으로 유해한 콘텐츠를 foundation model 출력 및 입력에서 제거하는 문장 분류기입니다.

홀드아웃 세트

훈련 및 유효성 검증 세트 모두에서 의도적으로 보류되는 레이블 지정된 데이터 세트로, 보이지 않는 데이터에 대한 최종 모델의 성능을 편향되지 않게 평가하는 역할을 합니다.

균질화

변환기와 같은 소수의 딥 신경망 아키텍처가 다양한 태스크에서 최신 결과를 달성하는 머신 러닝 연구의 추세입니다.

HPO

하이퍼 매개변수 최적화를 참조하십시오.

인간의 감독

AI 시스템에서 제공하는 의사결정을 검토하는 데 인간이 관여하여 인간의 자율성과 의사결정의 책임을 보장합니다.

하이퍼매개변수

기계 학습에서 모델 정확도를 높이기 위해 훈련 전에 값이 설정되는 매개변수입니다.

하이퍼 매개변수 최적화(HPO, hyperparameter optimization)

하이퍼 매개변수 값을 가장 정확한 모델을 제공하는 설정으로 지정하는 프로세스입니다.

I

이미지

라이브러리 세트가 포함된 소프트웨어 패키지입니다.

증분 학습

이전 태스크에서 얻은 데이터를 잊지 않고 지속적으로 업데이트되는 데이터를 사용하여 모델을 훈련하는 프로세스입니다. 이 기술은 대형 훈련 데이터 소스의 데이터 배치를 사용하여 모델을 훈련하는 데 사용됩니다.

추론

예측을 수행하거나 태스크를 해결하기 위해 훈련된 AI 모델을 통해 라이브 데이터를 실행하는 프로세스입니다.

수집하다

  • 대량의 실시간 데이터를 데이터베이스에 지속적으로 추가하는 작업입니다.
  • 지식 기반을 작성하기 위해 시스템에 데이터를 공급하는 것입니다.

인사이트

어떤 것에 대한 정확하거나 깊은 이해. 코그너티브 분석을 사용하여 고객 행동 및 태도에 대한 현재 스냅샷과 예측을 제공하는 인사이트를 얻을 수 있습니다.

지능형 AI

지식을 이해하고, 학습하고, 적응하고, 구현할 수 있으며, 의사결정, 문제 해결, 복잡한 개념 이해와 같은 능력을 증명하는 인공 지능 시스템은 인간의 지능과 매우 유사합니다.

의도

고객이 챗봇에 입력하여 표현하는 목적 또는 목표입니다 (예: 질문에 응답하거나 청구서 지불 처리).

J

작업

별도로 실행 가능한 작업(work) 단위.

K

지식 기반 데이터베이스

말뭉치를 참조하십시오.

L

레이블

감독되는 learning.Labels 의 데이터 점에 지정된 클래스 또는 카테고리입니다. 레이블은 데이터에서 파생될 수 있지만 종종 사람 레이블러 또는 어노테이터에 의해 적용됩니다.

레이블된 데이터

머신 러닝 모델을 훈련하는 데 사용할 수 있도록 컨텍스트 또는 의미를 추가하기 위해 레이블이 지정된 원시 데이터입니다. 예를 들어, 숫자 값은 모델 입력 및 출력에 대한 컨텍스트를 제공하기 위해 우편번호 또는 연령으로 레이블이 지정될 수 있습니다.

LLM (Large Language Model)

대량의 텍스트에 대해 훈련된 많은 수의 매개변수가 있는 언어 모델입니다.

잠재 공간

데이터 인스턴스가 임베드되는 n차원 수학적 공간입니다. 2차원 잠재 공간은 데이터를 2D 평면 내의 점으로 임베드합니다 (표현 공간 참조). 표시 공간 (Representational Space)도 참조하십시오.

LLM

대형 언어 모델을 참조하십시오.

M

기계 학습(ML, machine learning)

AI 모델의 정확도를 점진적으로 개선하면서 인간이 학습하는 방식을 모방하기 위해 데이터 및 알고리즘을 사용하는 데 중점을 두는 인공지능 (AI) 및 컴퓨터 과학의 분기입니다.

기계 학습 프레임워크(machine learning framework)

모델을 훈련하고 배치하기 위한 라이브러리 및 런타임입니다.

기계 학습 모델(machine learning model)

새 데이터를 분석하고 학습하는 데 사용할 수 있는 알고리즘을 개발하기 위해 데이터 세트에서 훈련되는 AI 모델입니다.

정신적 모델

시스템이 작동하는 방법 및 해당 조치가 시스템 결과에 미치는 영향에 대한 개인의 이해입니다. 이러한 기대가 시스템의 실제 기능과 일치하지 않으면 좌절, 포기 또는 오용으로 이어질 수 있습니다.

정렬 오류

AI 시스템이 달성하도록 최적화된 목표 또는 동작과 인간 사용자 또는 디자이너의 실제적이고 종종 복잡한 목표 간의 불일치

ML

기계 학습을 참조하십시오.

MLOps

  • 개발에서 프로덕션까지 기계 학습 모델을 사용하는 방법입니다.
  • 프로덕션 머신 러닝 (또는 딥 러닝) 라이프사이클을 관리하는 데 도움이 되는 데이터 과학자와 운영 전문가 간 협업을 위한 사례입니다. MLOps는 비즈니스 및 규정 요구사항에 초점을 맞추면서 자동화를 강화하고 프로덕션 ML의 품질을 개선할 것으로 보고 있습니다. 여기에는 모델 개발, 훈련, 유효성 검증, 배치, 모니터링 및 관리가 포함되며 CI/CD와 같은 방법을 사용합니다.

모델

  • 기계 학습 컨텍스트에서 예측 또는 의사결정을 제공하기 위해 데이터 세트에 대해 훈련되고 테스트된 함수 및 알고리즘 세트입니다.
  • Decision Optimization에서 다른 데이터 세트를 사용하는 CPLEX 최적화 엔진으로 해결할 수 있는 문제점의 수학 공식입니다.

ModelOps

훈련, 개발, 스코어링, 평가, 재훈련 및 업데이트를 포함하여 AI 모델의 전체 라이프사이클을 관리하기 위한 방법입니다.

모니터 대상 그룹

예측 모델의 결과가 참조 그룹의 결과와 상당히 다른지 판별하기 위해 모니터되는 데이터 클래스입니다. 그룹은 일반적으로 인종, 성별 또는 나이를 포함하는 특성을 기반으로 모니터됩니다.

다중 클래스 분류 모델

세 개 이상의 클래스가 있는 분류 태스크입니다. 예를 들어, 2진 분류 모델이 예 또는 아니오 값을 예측하는 경우 다중 클래스 모델은 예, 아니오, 가능 또는 적용 불가능을 예측합니다.

다중 모달 모델

텍스트, 이미지 및 오디오와 같은 여러 유형의 데이터를 처리하고 데이터 간에 변환할 수 있는 생성 AI 모델입니다. 예를 들어, 다중 모달 모델은 텍스트 입력을 사용하여 이미지 출력을 생성할 수 있습니다.

다변량 시계열

둘 이상의 변경 변수를 포함하는 시계열 실험입니다. 예를 들어, 세 클라이언트의 전기 사용량을 예측하는 시계열 모델이 있습니다.

N

자연어 처리(NLP, natural language processing)

컴퓨터에서 자연어를 이해하는 기능을 향상시키기 위해 자연어 처리 및 조작과 관련된 고유한 문제점을 연구하는 인공 지능과 언어학의 분야입니다.

자연어 처리 라이브러리

구문 분석을 위한 기본 자연어 처리 기능과 다양한 텍스트 처리 태스크를 위한 즉시 사용 가능한 사전 훈련된 모델을 제공하는 라이브러리입니다.

신경망

뇌세포의 추상 버전을 시뮬레이션하는 복잡한 수학 체계를 사용하여 케이스를 예측하거나 분류하기 위한 수학적 모델입니다. 신경망은 많은 수의 관찰된 케이스를 한 번에 하나씩 제공하고 태스크를 학습할 때까지 반복적으로 업데이트할 수 있도록 하여 훈련됩니다.

NLP

자연어 처리를 참조하십시오.

노드

SPSS Modeler 플로우에서 데이터 조작의 그래픽 표시입니다.

노트북

실행 코드, 해당 코드에 대한 설명 텍스트 및 실행된 코드의 결과가 포함된 대화식 문서입니다.

노트북 커널

코드를 실행하고 계산 결과를 리턴하는 노트북 편집기의 일부입니다.

O

오브젝트 스토리지

일반적으로 클라우드에서 사용되며, 데이터가 파일 계층 구조를 사용하지 않지만 모든 오브젝트를 동일한 레벨에 저장하는 스토리지 풀 또는 저장소에 개별 단위 또는 오브젝트로 저장되는 데이터 저장 방법입니다.

원샷 학습

대부분의 사용자 학습이 하나 또는 두 개의 예제를 수신할 때 발생한다는 전제를 기반으로 하는 딥 러닝에 대한 모델입니다. 이 모델은 자율 학습과 유사합니다.

원샷 프롬프트

태스크를 완료하는 방법을 설명하기 위해 모델에 단일 예제가 제공되는 프롬프트 기술입니다.

온라인 배치(online deployment)

실시간으로 예측을 온라인으로 생성하기 위해 웹 서비스로 API 엔드포인트를 통해 모델 또는 Python 코드 배치에 액세스하는 방법입니다.

온톨로지

일부 관심 영역에 존재할 수 있는 오브젝트, 개념 및 기타 엔티티의 표현과 이들 간의 관계에 대한 명시적인 공식 사양입니다.

운영 자산(operational asset)

도구 또는 작업에서 코드를 실행하는 자산입니다.

최적화

부과된 제한조건 및 제한사항을 준수하면서 정확하게 정의된 문제점에 대한 가장 적절한 솔루션을 찾는 프로세스입니다. 예를 들어, 자원을 할당하는 방법 또는 대형 대체 세트에서 최상의 요소 또는 조합을 찾는 방법을 판별합니다.

최적화 프로그래밍 언어

최적화 문제점의 모델 공식을 IBM CPLEX와 같은 CPLEX 최적화 엔진으로 해결할 수 있는 형식으로 표현하기 위한 모델링 언어입니다.

최적화된 메트릭

모델의 성능을 측정하는 데 사용되는 메트릭입니다. 예를 들어, 정확도는 2진 분류 모델의 성능을 측정하는 데 사용되는 일반적인 메트릭입니다.

오케스트레이션

기계 학습 모델을 훈련, 실행, 배치, 테스트 및 평가할 수 있고 자동화를 사용하여 종종 마이크로서비스를 사용하여 시스템을 조정하는 엔드-투-엔드 플로우를 작성하는 프로세스입니다.

지나친 의존

AI 모델에서 작성된 올바르지 않은 권장사항에 대한 사용자의 수락입니다. 의존성, 언더의존성도 참조하십시오.

P

매개변수

  • 모델 내부에 있으며 값이 데이터에서 추정되거나 학습되는 모델의 구성 가능한 파트입니다. 매개변수는 모델이 출력을 정확하게 예측하는 데 도움이 되도록 훈련 프로세스 중에 조정되는 모델의 측면입니다. 모델의 성능 및 예측력은 이러한 매개변수의 값에 따라 크게 달라집니다.
  • 신경망 네트워크에서 두 뉴런 간의 연결 강도를 표시하는 0.0 과 1.0 사이의 실제 값 가중치입니다.

상대방

연합 학습에서 공통 모델 훈련을 위해 데이터를 제공하는 엔티티입니다. 데이터가 이동되거나 결합되지 않지만 각 당사자가 연합 훈련의 혜택을 받습니다.

페이로드

점수, 예측 또는 솔루션을 다시 얻기 위해 배치에 전달되는 데이터입니다.

페이로드 로깅

비즈니스 애플리케이션에서 AI의 상태를 지속적으로 모니터링하기 위해 페이로드 데이터와 배치 출력을 캡처합니다.

파이프라인

  • Watson Pipelines 생성부터 배포까지 자산의 엔드투엔드 흐름을 관리합니다.
  • AutoAI, 후보 모델입니다.

파이프라인 리더보드(pipeline leaderboard)

AutoAI, 지정된 기준에 따라 자동으로 생성된 후보 모델 목록을 파이프라인으로 표시하고 순위를 매긴 표입니다.

정책

에이전트가 현재 상태를 기반으로 다음 조치를 판별하기 위해 따르는 전략 또는 규칙입니다.

위치 인코딩

문장 내에서 각 단어의 위치를 포함하는 문장의 단어 인코딩과 같은 위치 정보를 포함하는 정렬된 데이터 시퀀스의 인코딩입니다. 인코딩도 참조하십시오.

예측 분석

미래 가능성 및 추세 예측과 관계가 있는 비즈니스 프로세스 및 관련 기술 세트입니다. 예측 분석은 확률, 통계, 기계 학습 및 인공 지능과 같은 다양한 원칙을 비즈니스 문제에 적용하여 특정 상황에 가장 적합한 조치를 찾습니다. 데이터 마이닝도 참조하십시오.

사전 훈련된 모델

특정 태스크를 수행하기 위해 이전에 대형 데이터 세트에서 훈련된 AI 모델입니다. 처음부터 모델을 빌드하는 대신 사전 훈련된 모델이 사용됩니다.

사전 훈련

특정 태스크에 대해 기계 학습 모델을 미세 조정하기 전에 대형 데이터 세트에서 기계 학습 모델을 훈련시키는 프로세스입니다.

프라이버시

개인에 대한 정보가 무단 액세스 및 부적절한 사용으로부터 보호되도록 보장합니다.

확률적

임의성 (randomness) 이 적용되는 특성입니다. 비결정적 (non-deterministic) 입니다. 확률적 모델은 동일한 입력이 제공된 경우 동일한 출력을 생성하지 않습니다. 생성 변동도 참조하십시오.

프로젝트

데이터 및 기타 자산에 대해 작업하기 위한 협업 작업공간입니다.

프롬프트

  • foundation model 출력을 준비하거나 지시하거나 조건을 지정하는 텍스트 또는 이미지와 같은 데이터입니다.
  • 출력 화면으로 전이하기 전에 먼저 필드에 사용자 입력이 필요함을 표시하는 조치의 컴포넌트.

프롬프트 엔지니어링

자연어를 디자인하는 프로세스는 특정 태스크를 수행하기 위해 언어 모델에 대한 프롬프트를 표시합니다.

메시지 표시

foundation model 입력을 제공하여 산출물을 생성하도록 유도하는 프로세스입니다.

프롬프트 튜닝

모델을 재훈련하거나 가중치를 업데이트하지 않고 사전 훈련된 모델을 새 태스크에 적용하는 효율적이고 저렴한 방법입니다. 프롬프트 튜닝에는 모델의 기존 매개변수를 고정하는 동안 모델의 프롬프트에 추가되는 소수의 새 매개변수를 학습하는 것이 포함됩니다.

프룬

의사결정 트리 또는 신경망을 단순화, 축소 또는 트리밍하는 프로세스입니다. 이는 덜 중요한 노드 또는 계층을 제거하여 과적합을 방지하고 예측력을 유지하면서 모델 일반화를 개선하기 위해 복잡도를 줄이는 방식으로 수행됩니다.

Python

데이터 과학 및 AI에서 사용되는 프로그래밍 언어입니다.

Python 함수

프로덕션에서 모델을 지원하기 위해 Python 코드를 포함하는 함수입니다.

Q

양자화

foundation model 가중치를 압축하여 추론 속도를 높이고 GPU 메모리 필요량을 줄이는 방법입니다.

R

R

다양한 분석, 통계 및 그래픽 기능과 기술을 제공하는 데이터 과학 및 AI에서 사용되는 확장 가능한 스크립팅 언어입니다.

RAG

검색 기능 보강 생성을 참조하십시오.

난수 시드

의사 난수 생성기를 초기화하는 데 사용되는 숫자입니다. 랜덤 시드를 사용하면 난수 생성에 의존하는 프로세스에 대해 재현성을 사용할 수 있습니다.

참조 그룹

예측 모델에서 긍정적 결과를 수신할 가능성이 가장 높은 것으로 식별되는 그룹입니다. 결과를 모니터된 그룹과 비교하여 결과에서 잠재적 편향성을 찾을 수 있습니다.

세분화

데이터를 정리하고 쉐이핑하는 것입니다.

회귀 모형

종속변수를 하나 이상의 독립변수와 관련시키는 모델입니다.

강화 학습

보상 신호를 최대화하기 위해 에이전트가 환경에서 순차적 의사결정을 수행하도록 학습하는 기계 학습 기술입니다. 시험 및 오류 학습에서 영감을 얻은 에이전트는 환경과 상호작용하고, 피드백을 받고, 최적의 정책을 달성하기 위해 조치를 조정합니다.

인간의 피드백에 대한 강화 학습 (RLHF)

프롬프트에 제공된 지시사항에 대한 언어 학습 모델의 응답을 맞추는 방법입니다. RLHF에는 사람 어노테이터가 모델에서 여러 출력의 순위를 지정해야 합니다. 그런 다음 이러한 순위는 강화 학습을 사용하여 보상 모델을 훈련하는 데 사용됩니다. 그런 다음 보상 모델을 사용하여 대형 언어 모델의 출력을 미세 조정합니다.

의존

AI 시스템에서 AI 모델에 의해 작성된 권장사항 또는 AI 모델에 의해 생성된 출력에 대한 사용자의 수락입니다. 과의존성, 과의존성도 참조하십시오.

표현

정보 단위의 인코딩으로, 종종 실제 값 숫자의 벡터로 사용됩니다. 임베드도 참조하십시오.

구상공간

데이터 인스턴스가 임베드되는 n차원 수학적 공간입니다. 2차원 잠재 공간은 데이터를 2D 평면 내의 점으로 임베드합니다 (잠재 공간도 참조). 잠재 공간도 참조하십시오.

순위 재조정

특정 쿼리에 대한 답변 가능성이 가장 높은 문서 구절부터 가장 낮은 문서 구절까지 순위를 매기는 생성형 AI 프로세스입니다.

RAG (Retrieval Augmented Generation)

텍스트를 생성하기 위해 외부 소스의 지식으로 대형 언어 모델을 보강하는 기술입니다. 검색 단계에서 외부 소스의 관련 문서는 사용자 조회에서 식별됩니다. 생성 단계에서는 검색된 문서에 기반한 응답을 생성하기 위해 해당 문서의 일부가 LLM 프롬프트에 포함됩니다.

리워드

결정의 선함에 대한 피드백을 제공하는 에이전트 (일반적으로 강화 학습 에이전트) 를 안내하는 데 사용되는 신호입니다.

RLHF

인간의 피드백에 대한 학습 강화를 참조하십시오.

런타임 환경

노트북과 같은 도구 또는 작업을 실행하는 데 사용되는 사전 정의되거나 사용자 정의된 하드웨어 및 소프트웨어 구성입니다.

S

스코어링

  • 기계 학습에서는 예측된 결과의 신뢰도를 측정하는 프로세스입니다.
  • 수신 ID에 대한 속성이 기존 엔티티의 속성과 얼마나 밀접하게 일치하는지를 계산하는 프로세스입니다.

스크립트

프로덕션에서 모델을 지원하기 위해 Python 또는 R 스크립트를 포함하는 파일입니다.

자기 주의

입력 데이터 자체의 정보를 사용하여 출력을 생성할 때 초점을 맞출 입력 파트를 판별하는 주의 메커니즘입니다.

자율 학습

입력 시퀀스에서 토큰을 마스킹한 후 이를 예측하려고 시도하여 레이블이 지정되지 않은 데이터에서 모델이 학습하는 기계 학습 훈련 방법입니다. 예를 들어, "나는 ________ 새싹을 좋아한다" 입니다.

감정 분석

영화 리뷰가 긍정적인지 부정적인지 여부를 판별하는 것과 같이 텍스트로 표현되는 감정 또는 감정을 검사합니다.

쉐이프

열을 필터링, 정렬 및 제거하고 테이블을 결합하고 계산, 데이터 그룹화, 계층 구조 등을 포함하는 오퍼레이션을 수행하여 데이터를 사용자 정의하는 것입니다.

스몰데이터

사람이 액세스할 수 있고 이해할 수 있는 데이터입니다. 구조화된 데이터 (structured data)도 참조하십시오.

SQL 푸시백

SPSS Modeler에서 SQL 코드를 통해 데이터베이스에서 직접 여러 데이터 준비 및 마이닝 오퍼레이션을 작업을 수행하는 프로세스입니다.

구조화된 데이터

레코드 또는 파일 내의 고정 필드에 있는 데이터입니다. 관계형 데이터베이스와 스프레드시트가 구조화된 데이터의 예입니다. 구조화되지 않은 데이터, 작은 데이터도 참조하십시오.

정형화된 정보

검색 엔진 색인, 데이터베이스 또는 지식 기반과 같은 구조화된 자원에 저장된 항목입니다.

지도형 학습

새 데이터를 예측하기 위해 레이블이 지정된 데이터 세트에서 모델이 훈련되는 기계 학습 훈련 방법입니다.

T

온도

생성 프로세스에서 변동의 양을 지정하는 생성 모델의 매개변수입니다. 온도가 높을수록 모델의 출력에 더 큰 변동이 발생합니다.

텍스트 분류

텍스트를 자동으로 식별하고 지정된 범주로 분류하는 모델입니다.

텍스트 추출

고도로 구조화된 정보를 보다 간단한 텍스트 형식으로 변환하여 대규모 언어 모델에 입력으로 사용할 수 있는 생성형 AI 방식입니다.

시계열

주기적인 시점의 변수 값 세트입니다.

시계열 모델

시간 경과에 따라 데이터를 추적하고 예측하는 모델입니다.

토큰

단어 또는 하위 단어와 같은 텍스트에서 의미 또는 분석의 이산 단위입니다.

토큰화

텍스트 문자열을 더 작은 단위 (예: 단어 또는 하위 단어) 로 분할하기 위해 자연어 처리에서 사용되는 프로세스입니다.

훈련된 모델

실제 데이터로 훈련되고 새 데이터가 제공될 때 결과를 예측하기 위해 배치할 준비가 된 모델입니다.

교육

소스 데이터의 서브세트를 포함하는 모델 빌드의 초기 단계입니다. 모델은 알려진 데이터에서 예제를 통해 학습합니다. 이후 결과가 이미 알려진 추가적인 다른 서브세트에 대해 모델을 테스트할 수 있습니다.

훈련 데이터

머신러닝 모델을 학습하는 데 사용되는 데이터 모음입니다.

훈련 세트

기계 학습 모델을 예제 및 해당 레이블에 노출하여 모델이 패턴을 학습하고 예측할 수 있도록 하여 기계 학습 모델을 훈련시키는 데 사용되는 레이블 지정된 데이터 세트입니다.

전이 학습

훈련된 모델이 완전히 새로운 문제점에 적용되는 기계 학습 전략입니다.

변압기

일련의 토큰에서 다음 토큰을 예측하기 위해 위치 인코딩 및 자체 주의 메커니즘을 사용하는 신경망 아키텍처입니다.

트랜스퍼런시

AI 시스템이 설계되고 개발된 방법에 대해 이해 당사자 (stakeholder) 와 적절한 정보를 공유합니다. 이 정보의 예로는 수집되는 데이터, 데이터를 사용하고 저장하는 방법, 데이터에 액세스할 수 있는 사용자, 정확성, 견고성 및 편향성에 대한 테스트 결과가 있습니다.

신뢰 교정

정확성, 신뢰성 및 신뢰성과 같은 요소를 기반으로 AI 시스템에 대한 신뢰를 평가하고 조정하는 프로세스입니다.

튜링 테스트

1950년에 Alan Turing이 제안한 것으로, 인간과 동등하거나 구별할 수 없는 지능적인 행동을 보여주는 기계의 능력에 대한 시험입니다.

U

의존

AI 모델에서 작성된 올바른 권장사항에 대한 사용자의 거부입니다. 과의존성, 의존성도 참조하십시오.

일변량 시계열

변경되는 변수가 하나만 포함된 시계열 실험입니다. 예를 들어, 온도를 예측하는 시계열 모델에는 온도의 단일 예측 열이 있습니다.

구조화되지 않은 데이터

고정 필드가 아니라 구조화되지 않은 형식으로 저장된 모든 데이터입니다. 워드 프로세싱 문서의 데이터가 구조화되지 않은 데이터의 예입니다. 구조화된 데이터 (structured data)도 참조하십시오.

비정형 정보

고정 위치에 포함되지 않은 데이터입니다 (예: 자연어 텍스트 문서).

비지도형 학습

  • 레이블이 없는 원시 데이터가 사용자 개입 없이 시스템을 훈련하는 데 사용될 수 있도록 하는 딥 러닝 모델입니다.
  • 모델에 레이블 지정된 데이터가 제공되지 않으며 자체적으로 데이터에서 패턴 또는 구조를 찾아야 하는 기계 학습 훈련 방법입니다.

V

유효성 검증 세트

훈련 프로세스 중에 기계 학습 모델의 성능 및 일반화 기능을 평가하여 하이퍼 매개변수 튜닝 및 모델 선택을 지원하는 데 사용되는 별도의 레이블 지정된 데이터 세트입니다.

벡터

[1, 2, 5] 또는 [0.7, 0.2, -1.0] 과 같은 1차원의 정렬된 숫자 목록입니다.

벡터 데이터베이스

벡터 저장소를 참조하십시오.

vector index

벡터 저장소에서 문서의 벡터화된 임베드를 검색하는 색인입니다.

벡터 저장소

문서의 벡터화된 임베드를 저장하는 저장소입니다.

자연어 처리기

생성 AI에서 튜닝 및 추론 중에 데이터를 형식화하는 템플리트입니다.

가상 에이전트

자연어를 처리하여 응답하고 간단한 비즈니스 트랜잭션을 완료하거나 주제별 전문 지식이 있는 사용자에게 더 복잡한 요청을 라우트할 수 있는 사전 훈련된 대화 봇입니다.

시각화

그래프, 차트, 플롯, 테이블, 맵 또는 기타 데이터의 시각적 표시입니다.

W

가중치

네트워크 계층 내에서 입력 데이터를 변환하는 노드의 계수입니다. 가중치는 AI 모델이 훈련을 통해 학습하고 모델의 예측에서 오류를 줄이기 위해 해당 값을 조정하는 매개변수입니다.

Z

제로 샷 프롬프트

모델이 방법에 대한 특정 예제를 제공하지 않고 태스크를 완료하는 프롬프트 기술입니다.

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기