0 / 0
영어 버전 문서로 돌아가기
용어집
마지막 업데이트 날짜: 2024년 12월 11일
용어집

이 용어집에서는 Cloud Pak for Data as a Service에 대한 용어 및 정의를 제공합니다.

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | O | P | R | S | T | U | V | W

A

단축키

고성능 컴퓨팅에서는 CPU의 연산 부하를 일부 처리하여 시스템의 효율성을 높이는 데 사용되는 특수 회로입니다. 예를 들어, 딥 러닝에서는 주 애플리케이션이 CPU에서 실행되는 동안 컴퓨팅 워크로드의 일부를 GPU로 오프로드하기 위해 GPU 가속 컴퓨팅을 사용하는 경우가 많습니다. 그래픽 처리 장치도 참조하세요.

신뢰성

조직 또는 개인이 자신의 역할 및 적용 가능한 규정 프레임워크에 따라 설계, 개발, 운영 또는 배치하는 AI 시스템의 적절한 기능을 라이프사이클 전체에서 보장할 것이라고 예상합니다. 여기에는 법률 전문가가 사례별로 책임을 판별해야 할 수 있는 AI 실수에 대한 책임이 있는 사람을 판별하는 것이 포함됩니다.

활성화 함수

다른 뉴런으로부터 들어오는 일련의 활성화가 주어졌을 때 신경 유닛의 출력을 정의하는 함수입니다

액티브 러닝

시스템이 필요한 경우에만 더 많은 레이블이 지정된 데이터를 요청하는 기계 학습 모델입니다.

활성 메타데이터

기계 학습 프로세스의 분석을 기반으로 자동으로 업데이트되는 메타데이터입니다. 예를 들어, 프로파일링 및 데이터 품질 분석은 데이터 자산의 메타데이터를 자동으로 업데이트합니다.

활성 런타임(active runtime)

코드를 실행하는 에셋에 컴퓨팅 리소스를 제공하기 위해 실행 중인 환경의 인스턴스입니다.

에이전트

특정 목표를 달성하기 위해 일반적으로 강화 학습을 사용하여 환경과 상호 작용하여 최적의 행동이나 결정을 학습하는 알고리즘 또는 프로그램입니다.

AI

인공 지능을 참조하십시오.

AI 가속기

더 빠르고 에너지 효율적인 컴퓨팅을 위해 딥 러닝, 머신 러닝, 신경망과 같은 AI 관련 작업을 효율적으로 실행하도록 설계된 특수 실리콘 하드웨어입니다. 코어의 전용 유닛, 멀티 모듈 칩의 별도 칩렛 또는 별도의 카드가 될 수 있습니다.

AI 윤리

위험과 불리한 결과를 줄이면서 AI의 유익한 영향을 최적화하는 방법을 연구하는 여러 전문 분야입니다. AI 윤리 문제의 예로는 데이터 책임 및 개인정보 보호, 공정성, 설명 가능성, 견고성, 투명성, 환경 지속 가능성, 포함, 도덕적 기관, 가치 조정, 책임, 신뢰 및 기술 오용이 있습니다.

AI 거버넌스

AI 라이프사이클 전반에 걸쳐 올바른 조치를 지시, 평가, 모니터링 및 수행하고, AI 시스템이 조직의 의도대로, 이해 당사자가 예상하는 대로, 그리고 관련 규정에 필요한 대로 운영되고 있음을 보장하기 위해 기업의 지시사항, 직원, 프로세스 및 시스템을 통해 조직을 통제하는 조직의 행위입니다.

AI 안전

인공지능 시스템이 인간에게 유익하고 부주의하게 해를 끼치지 않는 방식으로 작동하도록 보장하는 것을 목표로 하는 연구 분야는 신뢰성, 공정성, 투명성, AI 시스템과 인간의 가치의 일치와 같은 문제를 다루고 있다.

AI 시스템

인공 지능 시스템을 참조하십시오.

알고리즘

분석 문제를 해결하기 위한 최적의 방법을 판별하기 위해 데이터에 적용되는 공식입니다.

능률화

데이터에서 의미 있는 패턴을 찾고 해당 패턴을 기반으로 결론을 도출하기 위해 데이터를 연구하는 학문입니다.

인공 지능 (AI, artificial intelligence)

예측, 추천 또는 결정을 내리기 위해 모델 형태로 지식을 획득, 처리, 생성 및 적용하는 기능입니다.

인공 지능 시스템 (AI system, AI system)

실제 또는 가상 환경에 영향을 미치는 예측, 권장사항 또는 의사결정을 작성할 수 있고 개발자 또는 사용자가 출력 또는 동작을 미리 판별할 필요가 없는 시스템입니다. AI 시스템은 일반적으로 대량의 구조화되거나 구조화되지 않은 데이터로 훈련되며 사용자 정의 목표를 달성하기 위해 다양한 레벨의 자율로 작동하거나 전혀 작동하지 않도록 설계될 수 있습니다.

자산

데이터 또는 데이터 분석에 대한 메타데이터를 포함하는 프로젝트 또는 카탈로그의 항목입니다.

속성 구성 규칙

마스터 데이터 엔티티의 속성 값이 멤버 레코드에서 선택되는 방식을 결정하는 일련의 규칙 중 하나입니다. 규칙도 참조하세요.

AutoAI 실험

일련의 훈련 정의와 매개변수를 고려하여 모델 후보로 순위가 지정된 파이프라인 세트를 작성하는 자동화된 훈련 프로세스입니다.

B

일괄처리 배치(batch deployment)

스토리지 버킷의 파일, 데이터 연결 또는 연결된 데이터에서 입력 데이터를 처리하는 모델을 배치한 후 선택된 대상에 출력을 기록하는 방법입니다.

편향

불공정한 의사결정을 생성할 수 있는 방식으로 의도적으로 또는 의도적으로 설계되지 않은 AI 시스템의 체계적인 오류입니다. 바이어스는 AI 시스템과 이를 훈련하고 테스트하는 데 사용되는 데이터 모두에 존재할 수 있습니다. AI 편향성은 문화적 기대, 기술적 제한 또는 예기치 않은 배치 컨텍스트의 결과로 AI 시스템에서 나타날 수 있습니다. 공정성도 참조하십시오.

편향 발견

AI 모델에서 특정 속성을 기반으로 불공정한 결과를 전달할 때 메트릭의 공정성을 계산하는 프로세스입니다.

편향성 완화

학습 데이터를 큐레이팅하고 공정성 기술을 적용하여 AI 모델의 편향성을 줄입니다.

2진 분류

두 개의 클래스가 있는 분류 모델. 예측은 두 클래스 중 하나의 2진 선택사항입니다.

비즈니스 용어

엔터프라이즈의 표준 방식으로 비즈니스 개념을 정의하는 단어 또는 구문입니다. 용어를 사용하여 데이터 자산의 메타데이터를 강화하고 데이터 보호 규칙의 기준을 정의할 수 있습니다.

비즈니스 어휘

데이터 자산을 설명하고 강화하는 통제 아티팩트 세트 (예: 비즈니스 용어 및 데이터 클래스) 입니다.

C

카탈로그

조직 공유에 대한 자산의 저장소입니다. 카탈로그의 자산은 데이터 보호 규칙에 따라 관리되고 분류, 데이터 클래스 및 비즈니스 용어와 같은 다른 거버넌스 아티팩트로 강화될 수 있습니다. 카탈로그는 구조화된 데이터와 구조화되지 않은 데이터, 외부 데이터 소스의 데이터에 대한 참조, 기계 학습 모델과 같은 기타 분석 자산을 저장할 수 있습니다.

카테고리

데이터 거버넌스의 경우, 거버넌스 아티팩트를 정리하고 관리하기 위한 협업 작업 공간입니다.

분류

데이터 거버넌스의 경우, 데이터 자산에 있는 데이터의 민감도 수준을 설명하는 거버넌스 아티팩트입니다.

정리

데이터 세트의 모든 값이 일관되고 올바르게 기록되도록 하는 작업입니다.

협업자

공동의 목표를 위해 함께 작업하는 사용자 그룹의 구성원입니다.

조합 문제점(combinatorial problem)

가능한 선택사항의 조합이 너무 많이 포함되어 여러 가지 의사결정을 내려야 하므로 해결하기 어려운 문제점입니다. 몇 가지 예로는 그룹화 찾기, 순서 지정 또는 오브젝트 지정이 있습니다.

자원 계산

분석 자산을 실행하기 위해 환경 정의에 정의된 하드웨어 및 소프트웨어 리소스입니다.

혼동 행렬

모델의 긍정적 및 부정적 예측 결과와 긍정적 및 부정적 실제 결과 사이의 정확도를 판별하는 성능 측정입니다.

연결된 데이터

외부 데이터 소스에 대한 연결을 통해 액세스되는 데이터 세트입니다.

연결

데이터베이스에 연결하는 데 필요한 정보입니다. 필요한 실제 정보는 DBMS및 연결 방법에 따라 다릅니다.

제한조건

Decision Optimization에서 문제점의 솔루션으로 충족되어야 하는 조건입니다.

지속적인 학습

모델 성능 모니터링, 새 데이터로 재훈련 및 재배치 태스크를 자동화하여 예측 품질을 보장합니다.

Core ML 배치(Core ML deployment)

iOS 앱에서 사용하기 위해 Core ML 형식으로 배치를 다운로드하는 프로세스입니다.

모음

기계 학습 모델을 훈련시키는 데 사용하는 소스 문서 콜렉션입니다.

CPLEX 모델

CPLEX 엔진으로 해결하도록 공식화된 Decision Optimization 모델입니다.

CPO 모델

' Decision Optimization CPO(CP Optimizer) 엔진으로 풀 수 있도록 공식화된 제약 조건 프로그래밍 모델입니다.

큐레이트

  • 특정 주제와 관련된 컨텐츠를 선택, 수집, 보존 및 유지보수합니다. 관리에서는 값을 설정하고 유지보수하며 데이터에 추가하고, 데이터를 신뢰할 수 있는 정보와 지식으로 변환합니다.
  • 데이터 자산을 작성하고 카탈로그에 공개할 준비를 하는 작업입니다. 큐레이션에는 비즈니스 용어, 분류 및 데이터 클래스와 같은 거버넌스 아티팩트를 지정하고 데이터 자산의 데이터 품질을 분석하여 데이터 자산을 강화하는 작업이 포함될 수 있습니다.

D

데이터 자산

데이터(예: 업로드된 파일)를 가리키는 자산입니다. 연결 및 연결된 데이터 자산도 데이터 자산으로 간주됩니다.

데이터 클래스

데이터의 유형과 데이터가 사용되는 방법에 따라 관계형 데이터 세트의 열을 분류하는 거버넌스 아티팩트입니다.

데이터 거버넌스

데이터 품질, 데이터 보안 및 규정 준수를 유지하기 위해 데이터를 추적하고 제어하는 프로세스입니다.

데이터 통합

서로 다른 소스의 데이터를 의미 있고 중요한 정보로 결합하는 데 사용되는 기술 및 비즈니스 프로세스의 조합입니다.

데이터 레이크

플랫 아키텍처의 모든 형식으로 원시 데이터를 저장하는 대규모 데이터 스토리지 저장소입니다. 데이터 레이크는 처리 및 분석을 위해 2진 데이터뿐만 아니라 구조화된 데이터 및 구조화되지 않은 데이터를 보유합니다.

데이터 레이크하우스

데이터 레이크의 유연성을 데이터 웨어하우스의 구조화된 조회 및 성능 최적화와 결합하여 AI및 분석 애플리케이션에 대한 확장 가능하고 효율적인 데이터 분석을 가능하게 하는 통합 데이터 스토리지 및 처리 아키텍처입니다.

데이터 마이닝

데이터 소스에서 중요한 비즈니스 정보를 수집하고, 정보를 상관시키고, 연관, 패턴 및 추세를 파악하는 프로세스입니다. 예측 분석도 참조하십시오.

데이터 모델

데이터 요소, 해당 관계 및 해당 속성의 시각화입니다.

데이터 파이프라인

일련의 데이터 처리 및 변환 단계.

데이터 프라이버시

무단 액세스 및 부적절한 사용으로부터 데이터를 보호합니다.

데이터 제품

액세스가 제어되는 재사용 및 분배를 위해 패키지된 최적화된 데이터 또는 데이터 관련 자산의 콜렉션입니다. 데이터 제품에는 모델, 대시보드 및 기타 계산 자산 유형뿐만 아니라 데이터도 포함되어 있습니다. 통제 카탈로그의 데이터 자산과 달리 데이터 제품은 비즈니스 가치를 제공하기 위해 여러 용도의 제품으로 관리됩니다.

데이터 보호 규칙

제어할 데이터와 제어 방법을 지정하는 거버넌스 아티팩트입니다. 데이터 보호 규칙에는 기준 및 조치가 포함됩니다. 규칙도 참조하세요.

데이터 품질 분석

품질 차원 정확성, 완전성, 일관성, 적시성, 고유성 및 유효성에 대한 데이터 분석입니다.

데이터 품질 정의

데이터 품질 정의는 데이터 품질 규칙에 대한 규칙 평가 또는 조건을 설명합니다.

데이터 품질 규칙

데이터 품질 분석 중에 특정 조건이 충족되는지 여부에 대한 데이터를 평가하고 조건을 충족하지 않는 레코드를 규칙 위반으로 식별하는 데이터 품질 규칙입니다. 규칙도 참조하세요.

Data Refinery 플로우

데이터 소스, 해당 데이터 소스를 세분화하고 쉐이핑하는 하나 이상의 오퍼레이션 체인 및 데이터가 이동하는 대상입니다.

데이터 사이언스

인사이트와 지식을 발견하기 위한 구조화된 데이터와 구조화되지 않은 데이터의 분석 및 시각화입니다.

데이터 세트

일반적으로 행(레코드) 및 열(필드) 양식으로 되어 있으며 파일 또는 데이터베이스 테이블에 포함된 데이터 콜렉션입니다.

데이터 소스

데이터베이스와 같은 데이터를 읽기 위한 리포지토리, 대기열 또는 피드입니다.

DataStage 플로우

데이터를 추출, 변환 및 로드하는 일련의 정렬된 단계를 기반으로 하는 자산입니다.

데이터 테이블

일반적으로 행(레코드) 및 열(필드) 양식으로 되어 있으며 테이블에 포함된 데이터 콜렉션입니다.

데이터 웨어하우스

보고 및 데이터 분석에 사용되는 다양한 소스에서 수집된 데이터의 중앙 집중식 대형 저장소입니다. 기본적으로 구조화된 데이터와 반구조화된 데이터를 저장하여 비즈니스에서 정보에 입각한 의사결정을 내릴 수 있도록 합니다.

Decision Optimization 실험

해결 중인 동일한 문제점과 관련된 다양한 모델 공식 또는 데이터 세트를 나타내는 시나리오 그룹이 포함된 자산입니다.

Decision Optimization 모델(Decision Optimization model)

Decision Optimization 문제점에 대한 최상의 솔루션을 제공하기 위해 최적화를 통해 해결할 수 있는 규범 모델입니다.

의사결정 변수

모든 제한조건이 충족되고 목표가 최적화되도록 보장하면서 최적화 엔진으로 값이 판별되는 의사결정을 나타내는 변수 세트 중 하나입니다.

딥러닝

계층적 계층으로 구성된 여러 계층의 상호 연결된 노드를 사용하여 일련의 계산을 통해 입력 데이터(첫 번째 계층)를 변환하여 출력(최종 계층)을 생성하는 계산 모델입니다. 딥러닝은 인간 두뇌의 구조와 기능에서 영감을 받았습니다.

딥 러닝 실험(deep learning experiment)

신경망으로 연결된 하나 이상의 모델 학습 정의의 논리적 그룹화를 기반으로 하는 모델 학습 프로세스입니다.

심층 신경망

여러 개의 숨겨진 레이어가 있는 신경망으로, 데이터를 더 복잡하게 표현할 수 있습니다.

배치

사용할 수 있는 모델 또는 애플리케이션 패키지입니다.

배치 영역

모델이 배치되고 배치가 관리되는 작업공간입니다.

DOcplex

Decision Optimization 문제점을 모델링하고 해결하기 위한 Python API입니다.

E

엔드포인트 URL

서비스 및 오브젝트와 같은 리소스를 식별하는 네트워크 대상 주소입니다. 예를 들어, 엔드포인트 URL은 사용자가 배치에 페이로드 데이터를 전송할 때 모델 또는 함수 배치의 위치를 식별하는 데 사용됩니다.

환경

작업을 실행하기 위한 계산 자원입니다.

환경 런타임(environment runtime)

에셋을 실행하기 위한 환경 템플릿의 인스턴스화입니다.

환경 템플리트

환경 런타임 인스턴스를 생성하기 위한 하드웨어 및 소프트웨어 리소스를 지정하는 정의입니다.

설명가능성

  • 사용자가 AI 시스템을 사용하는 애플리케이션에서 작성한 예측을 추적, 감사 및 이해할 수 있는 기능입니다.
  • 인간이 시스템 예측의 원인을 이해하는 데 사용할 수 있는 인사이트를 제공하는 AI 시스템의 기능입니다.

F

공정

AI 시스템에서 개인 또는 개인 그룹의 공정한 처리입니다. AI 시스템에 대한 특정 지분 개념의 선택은 사용되는 컨텍스트에 따라 다릅니다. 바이어스 (bias)도 참조하십시오.

기능

데이터 세트 내에 있는 항목의 특성 또는 특성입니다 (예: 스프레드시트의 열). 일부 경우에, 특징들은 데이터 세트 내의 다른 특징들의 조합으로서 조작된다.

기능 엔지니어링

기계 학습 모델의 성능 및 예측력을 향상시키기 위해 원시 데이터에서 새 기능을 선택, 변환 및 작성하는 프로세스입니다.

기능 선택

기계 학습 모델에서 정확한 예측 또는 점수를 가장 잘 지원하는 데이터 열을 식별합니다.

기능 저장소

기능을 관리하고 구성하여 기계 학습 파이프라인 및 애플리케이션에서 기능 데이터를 저장, 검색 및 공유하는 확장 가능하고 효율적인 방법을 제공하는 중앙 집중식 저장소 또는 시스템입니다.

기능 변환(feature transformation)

AutoAI에서 훈련 데이터를 변환하고 최적화하는 알고리즘을 적용하여 모델 유형에 대한 최상의 결과를 얻는 파이프라인 작성 단계입니다.

페더레이티드 학습

이동, 결합 또는 공유되지 않는 여러 데이터 소스를 사용하는 공통 기계 학습 모델의 훈련입니다. 결과는 데이터 보안을 손상시키지 않으면서 더 잘 훈련된 모델입니다.

플로우

데이터를 처리하거나 모델을 훈련하는 일련의 단계를 정의하는 노드의 콜렉션입니다.

기초 모델

다양한 다운스트림 작업에 적용할 수 있는 AI 모델입니다. 기초 모델은 일반적으로 자체 감독을 사용하여 레이블이 지정되지 않은 데이터에 대해 학습되는 대규모 생성 모델입니다. 대규모 모델인 기초 모델에는 수십억 개의 매개 변수가 포함될 수 있습니다.

G

갠트 차트(Gantt chart)

스케줄 데이터가 시간 스케일을 따라 가로 막대로 표시되는 프로젝트 타임라인 및 기간의 그래픽 표시입니다.

Gen AI

제너레이티브 AI를 참조하세요.

제너레이티브 AI(생성 AI)

텍스트, 소스 코드, 이미지, 오디오, 합성 데이터 등 다양한 유형의 콘텐츠를 제작할 수 있는 AI 알고리즘 클래스입니다.

거버넌스 아티팩트

데이터 자산을 강화하거나 제어하는 거버넌스 항목입니다. 거버넌스 아티팩트에는 비즈니스 용어, 분류, 데이터 클래스, 정책, 규칙 및 참조 데이터 세트가 포함됩니다.

거버넌스 규칙

데이터 자산이 비즈니스 목표를 준수하는지 여부를 판별하는 데 사용되는 기준에 대한 자연어 설명을 제공하는 통제 아티팩트입니다. 규칙도 참조하세요.

통제 워크플로우

통제 아티팩트의 작성, 수정 및 삭제를 제어하는 태스크 기반 프로세스입니다.

관리 카탈로그

데이터 보호 규칙의 적용이 사용으로 설정된 카탈로그입니다.

GPU

그래픽 처리 장치를 참조하십시오.

그래프 형식 빌더

시각적 코딩을 통해 흐름 자산을 생성하는 도구입니다. 캔버스는 플로우를 작성하기 위해 연결할 수 있는 오브젝트 또는 노드를 배치할 영역입니다.

GPU(Graphics Processing Unit)

표시장치에 출력하기 위한 프레임 버퍼에서 이미지 작성을 가속화하기 위해 메모리를 빠르게 조작하고 변경하도록 설계된 특수화된 프로세서입니다. GPU는 병렬 처리 기능으로 인해 기계 학습에서 과도하게 활용됩니다. 액셀러레이터도 참조하세요.

접지

결과의 정확성을 높이기 위해 대규모 언어 모델에 정보를 제공합니다.

H

HAP 감지(HAP 탐지)

  • 사용자가 제출한 메시지와 AI 모델에 의해 생성된 응답에서 혐오, 욕설, 비속어를 감지하고 필터링하는 기능입니다.

HAP 탐지기(HAP 탐지기)

  • 혐오 발언, 욕설, 욕설 등 잠재적으로 유해한 콘텐츠를 기초 모델 출력 및 입력에서 제거하는 문장 분류기입니다.

홀드아웃 세트

훈련 및 유효성 검증 세트 모두에서 의도적으로 보류되는 레이블 지정된 데이터 세트로, 보이지 않는 데이터에 대한 최종 모델의 성능을 편향되지 않게 평가하는 역할을 합니다.

인간의 감독

AI 시스템에서 제공하는 의사결정을 검토하는 데 인간이 관여하여 인간의 자율성과 의사결정의 책임을 보장합니다.

하이퍼매개변수

기계 학습에서 모델 정확도를 높이기 위해 훈련 전에 값이 설정되는 매개변수입니다.

I

이미지

라이브러리 세트가 포함된 소프트웨어 패키지입니다.

추론

학습된 AI 모델을 통해 라이브 데이터를 실행하여 예측을 하거나 작업을 해결하는 프로세스입니다.

수집하다

  • 지식 기반을 작성하기 위해 시스템에 데이터를 공급하는 것입니다.
  • 대량의 실시간 데이터를 데이터베이스에 지속적으로 추가하는 작업입니다.

인사이트

어떤 것에 대한 정확하거나 깊은 이해. 코그너티브 분석을 사용하여 고객 행동 및 태도에 대한 현재 스냅샷과 예측을 제공하는 인사이트를 얻을 수 있습니다.

의도

고객이 챗봇에 입력하여 표현하는 목적 또는 목표입니다 (예: 질문에 응답하거나 청구서 지불 처리).

J

작업

별도로 실행 가능한 작업(work) 단위.

K

지식 기반 데이터베이스

말뭉치 참조.

L

레이블된 데이터

머신 러닝 모델을 훈련하는 데 사용할 수 있도록 컨텍스트 또는 의미를 추가하기 위해 레이블이 지정된 원시 데이터입니다. 예를 들어, 숫자 값은 모델 입력 및 출력에 대한 컨텍스트를 제공하기 위해 우편번호 또는 연령으로 레이블이 지정될 수 있습니다.

대규모 언어 모델(LLM)

대량의 텍스트에 대해 훈련된 많은 수의 매개변수가 있는 언어 모델입니다.

계보

  • 자산을 통한 데이터 플로우의 히스토리입니다.
  • 자산에 대해 수행된 이벤트의 히스토리입니다.

LLM

대형 언어 모델을 참조하세요.

논리 모델

비즈니스 도메인과 관련된 데이터 오브젝트의 논리적 표시입니다.

M

기계 학습(ML, machine learning)

AI 모델의 정확도를 점진적으로 개선하면서 인간이 학습하는 방식을 모방하기 위해 데이터 및 알고리즘을 사용하는 데 중점을 두는 인공지능 (AI) 및 컴퓨터 과학의 분기입니다.

기계 학습 프레임워크(machine learning framework)

모델을 훈련하고 배치하기 위한 라이브러리 및 런타임입니다.

기계 학습 모델(machine learning model)

새 데이터를 분석하고 학습하는 데 사용할 수 있는 알고리즘을 개발하기 위해 데이터 세트에서 훈련되는 AI 모델입니다.

마스크

데이터 세트의 열에서 민감한 데이터 값을 대체합니다. 마스킹 메소드는 참조 무결성을 유지하는 유사하게 형식화된 대체 값을 제공하는 것부터 전체 컬럼에 대해 동일한 대체 값을 제공하는 것까지 데이터 유틸리티 및 개인정보 보호에 있어서 다양합니다.

마스킹 플로우

영구적으로 마스크된 데이터 사본을 생성하는 플로우입니다.

마스터 데이터

  • 모델 훈련의 경우 동일한 모델의 여러 작업에 대해 동일하게 유지되지만 필요한 경우 변경할 수 있는 참조 데이터입니다.
  • Match 360에서 서로 다른 소스의 데이터에 대한 통합된 보기입니다.

마스터 데이터 엔티티

매칭 알고리즘이 사람이나 조직과 같은 동일한 실제 실체를 나타내는 것으로 판단한 기록의 구성입니다. 각 엔티티에는 매칭 알고리즘이 서로 연결한 하나 또는 여러 개의 멤버 레코드가 포함되어 있습니다.

수학적 프로그래밍(MP, mathematical programming)

Decision Optimization 문제점을 모델링하고 해결하는 데 사용되는 수학 또는 운영 연구 분야입니다. 여기에는 선형, 정수, 혼합 정수 및 비선형 프로그래밍이 포함됩니다.

메타데이터 가져오기(metadata import)

데이터 자산의 구조를 설명하는 기술 메타데이터 및 데이터 자산의 계보를 설명하는 프로세스 메타데이터를 포함하여 데이터 자산과 연관된 메타데이터를 가져오는 방법입니다.

정렬 오류

AI 시스템이 달성하도록 최적화된 목표 또는 동작과 인간 사용자 또는 디자이너의 실제적이고 종종 복잡한 목표 간의 불일치

ML

기계 학습을 참조하십시오.

MLOps

  • 프로덕션 머신 러닝 (또는 딥 러닝) 라이프사이클을 관리하는 데 도움이 되는 데이터 과학자와 운영 전문가 간 협업을 위한 사례입니다. MLOps는 비즈니스 및 규정 요구사항에 초점을 맞추면서 자동화를 강화하고 프로덕션 ML의 품질을 개선할 것으로 보고 있습니다. 여기에는 모델 개발, 훈련, 유효성 검증, 배치, 모니터링 및 관리가 포함되며 CI/CD와 같은 방법을 사용합니다.
  • 개발에서 프로덕션까지 기계 학습 모델을 사용하는 방법입니다.

모델

  • 기계 학습 컨텍스트에서 예측 또는 의사결정을 제공하기 위해 데이터 세트에 대해 훈련되고 테스트된 함수 및 알고리즘 세트입니다.
  • Decision Optimization에서 다른 데이터 세트를 사용하는 CPLEX 최적화 엔진으로 해결할 수 있는 문제점의 수학 공식입니다.

모델 공식

Decision Optimization에서 의사결정 변수 목록으로 표시되는 모델의 수학 공식, 최대화하거나 최소화할 하나 이상의 목적 함수 및 충족되어야 하는 일부 제한조건입니다.

ModelOps

훈련, 개발, 스코어링, 평가, 재훈련 및 업데이트를 포함하여 AI 모델의 전체 라이프사이클을 관리하기 위한 방법입니다.

MP

수리 계획법을 참조하십시오.

N

자연어(natural language)

모델을 공식화하는 자연어(영어)와 유사한 모델링 구문입니다.

자연어 처리(NLP, natural language processing)

컴퓨터에서 자연어를 이해하는 기능을 향상시키기 위해 자연어 처리 및 조작과 관련된 고유한 문제점을 연구하는 인공 지능과 언어학의 분야입니다.

자연어 처리 라이브러리

구문 분석을 위한 기본 자연어 처리 기능과 다양한 텍스트 처리 태스크를 위한 즉시 사용 가능한 사전 훈련된 모델을 제공하는 라이브러리입니다.

신경망

뇌세포의 추상 버전을 시뮬레이션하는 복잡한 수학 체계를 사용하여 케이스를 예측하거나 분류하기 위한 수학적 모델입니다. 신경망은 많은 수의 관찰된 케이스를 한 번에 하나씩 제공하고 태스크를 학습할 때까지 반복적으로 업데이트할 수 있도록 하여 훈련됩니다.

NLP

자연어 처리를 참조하십시오.

노드

스트림 또는 플로우에서 데이터 오퍼레이션의 그래픽 표시입니다. 노드 유형마다 수행하는 오퍼레이션 유형을 표시하는 모양이 다릅니다.

노트북

실행 코드, 해당 코드에 대한 설명 텍스트 및 실행된 코드의 결과가 포함된 대화식 문서입니다.

노트북 커널

코드를 실행하고 계산 결과를 리턴하는 노트북 편집기의 일부입니다.

O

난독 처리하다

열의 데이터를 원래 형식과 일치하는 유사하게 형식화된 값으로 대체합니다. 마스킹의 양식입니다.

목적 함수

의사결정 최적화 및 운영 연구에서 문제점의 다른 제한조건을 충족하면서 최적화(즉, 최소화 또는 최대화)하는 표현식입니다.

오브젝트 스토리지

일반적으로 클라우드에서 사용되며, 데이터가 파일 계층 구조를 사용하지 않지만 모든 오브젝트를 동일한 레벨에 저장하는 스토리지 풀 또는 저장소에 개별 단위 또는 오브젝트로 저장되는 데이터 저장 방법입니다.

온라인 배치(online deployment)

실시간으로 예측을 온라인으로 생성하기 위해 웹 서비스로 API 엔드포인트를 통해 모델 또는 Python 코드 배치에 액세스하는 방법입니다.

온톨로지

일부 관심 영역에 존재할 수 있는 오브젝트, 개념 및 기타 엔티티의 표현과 이들 간의 관계에 대한 명시적인 공식 사양입니다.

운영 자산(operational asset)

도구 또는 작업에서 코드를 실행하는 자산입니다.

OPL 모델

OPL 모델링 언어로 표현된 모델 공식입니다.

최적 솔루션

운영 연구에서 목적 함수(선형 또는 이차)를 최적화하고 문제점의 기타 모든 제한조건을 충족하는 문제점에 대한 솔루션입니다.

최적화

부과된 제한조건 및 제한사항을 준수하면서 정확하게 정의된 문제점에 대한 가장 적절한 솔루션을 찾는 프로세스입니다. 예를 들어, 자원을 할당하는 방법 또는 대형 대체 세트에서 최상의 요소 또는 조합을 찾는 방법을 판별합니다.

오케스트레이션

기계 학습 모델을 훈련, 실행, 배치, 테스트 및 평가할 수 있고 자동화를 사용하여 종종 마이크로서비스를 사용하여 시스템을 조정하는 엔드-투-엔드 플로우를 작성하는 프로세스입니다.

P

쌍 검토

데이터 스튜어드 사용자가 레코드를 비교하여 일치 여부를 확인하는 프로세스입니다. 쌍 검토 결과는 매칭 알고리즘에 어떤 레코드를 마스터 데이터 엔티티에 매칭할지 결정하는 방법을 학습시킵니다.

매개변수

모델 내부에 있으며 값이 데이터에서 추정되거나 학습되는 모델의 구성 가능한 파트입니다. 매개변수는 모델이 출력을 정확하게 예측하는 데 도움이 되도록 훈련 프로세스 중에 조정되는 모델의 측면입니다. 모델의 성능 및 예측력은 이러한 매개변수의 값에 따라 크게 달라집니다.

상대방

연합 학습에서 공통 모델 훈련을 위해 데이터를 제공하는 엔티티입니다. 데이터가 이동되거나 결합되지 않지만 각 당사자가 연합 훈련의 혜택을 받습니다.

페이로드(payload)

점수, 예측 또는 솔루션을 다시 얻기 위해 배치에 전달되는 데이터입니다.

페이로드 로깅

비즈니스 애플리케이션에서 AI의 상태를 지속적으로 모니터링하기 위해 페이로드 데이터와 배치 출력을 캡처합니다.

실제 모델

데이터의 물리적 구조 및 관계에 대한 정의입니다.

파이프라인

  • Watson Pipelines 생성부터 배포까지 자산의 엔드투엔드 흐름을 관리합니다.
  • AutoAI, 후보 모델입니다.

파이프라인 리더보드(pipeline leaderboard)

AutoAI, 지정된 기준에 따라 자동으로 생성된 후보 모델 목록을 파이프라인으로 표시하고 순위를 매긴 표입니다.

플레이스홀더

값으로 대치될 필드 또는 변수입니다.

정책

  • 에이전트가 현재 상태를 기반으로 다음 조치를 판별하기 위해 따르는 전략 또는 규칙입니다.
  • 데이터 자산에 대한 액세스를 제어하거나 데이터 자산 내의 민감한 데이터를 익명화하여 데이터를 보호하는 규칙 세트입니다.
  • 하나 이상의 데이터 보호 및 통제 규칙으로 구성된 통제 아티팩트입니다.

예측 분석

미래 가능성 및 추세 예측과 관계가 있는 비즈니스 프로세스 및 관련 기술 세트입니다. 예측 분석은 확률, 통계, 기계 학습 및 인공 지능과 같은 다양한 원칙을 비즈니스 문제에 적용하여 특정 상황에 가장 적합한 조치를 찾습니다. 데이터 마이닝도 참조하십시오.

사전 훈련된 모델

특정 태스크를 수행하기 위해 이전에 대형 데이터 세트에서 훈련된 AI 모델입니다. 처음부터 모델을 빌드하는 대신 사전 훈련된 모델이 사용됩니다.

1차 카테고리

데이터 거버넌스의 경우, 거버넌스 아티팩트를 포함하는 카테고리입니다. 카테고리는 사용자의 통제 아티팩트를 구성하는 폴더 또는 디렉토리와 유사합니다.

프라이버시

개인에 대한 정보가 무단 액세스 및 부적절한 사용으로부터 보호되도록 보장합니다.

올바르지 않은 경우

생성된 메타데이터 및 데이터의 텍스트 컨텐츠에 대한 통계입니다.

프로젝트

데이터 및 기타 자산에 대해 작업하기 위한 협업 작업공간입니다.

프룬

의사 결정 트리 또는 신경망을 단순화, 축소 또는 트리밍하는 프로세스입니다. 이는 덜 중요한 노드나 레이어를 제거하여 복잡성을 줄여 과적합을 방지하고 예측력을 유지하면서 모델 일반화를 개선하는 방식으로 이루어집니다.

제공

자산을 카탈로그로 복사하는 것입니다.

Python

데이터 과학 및 AI에서 사용되는 프로그래밍 언어입니다.

Python DOcplex 모델(Python DOcplex model)

Python에으로 표현된 모델 공식입니다.

Python 함수

프로덕션에서 모델을 지원하기 위해 Python 코드를 포함하는 함수입니다.

Q

품질 규칙

품질 표준을 충족하기 위해 데이터 레코드에 필요한 하나 이상의 조건입니다. 데이터 품질 분석 중에 이러한 조건에 대해 데이터 레코드를 검사합니다. 규칙도 참조하세요.

양자화

기초 모델 가중치를 압축하여 추론 속도를 높이고 GPU 메모리 필요량을 줄이는 방법입니다.

R

R

다양한 분석, 통계 및 그래픽 기능과 기술을 제공하는 데이터 과학 및 AI에서 사용되는 확장 가능한 스크립팅 언어입니다.

읽기

데이터를 조작하거나 분석하기 위해 애플리케이션으로 데이터를 복사하는 것입니다.

수정하다

열의 모든 데이터 값을 동일한 문자열로 대체하여 민감한 값, 데이터 형식 및 값 사이의 관계를 숨깁니다. 마스킹의 한 형태입니다.

참조 데이터 세트

특정 유형의 열에 대한 값을 정의하는 통제 아티팩트입니다.

세분화

데이터를 정리하고 쉐이핑하는 것입니다.

강화 학습

보상 신호를 최대화하기 위해 에이전트가 환경에서 순차적 의사결정을 수행하도록 학습하는 기계 학습 기술입니다. 시험 및 오류 학습에서 영감을 얻은 에이전트는 환경과 상호작용하고, 피드백을 받고, 최적의 정책을 달성하기 위해 조치를 조정합니다.

리워드

에이전트(일반적으로 강화 학습 에이전트)를 안내하는 데 사용되는 신호로, 결정의 타당성에 대한 피드백을 제공합니다

규칙

데이터를 분석하거나 보호하기 위한 정보, 기준 또는 논리가 포함된 아티팩트입니다. 데이터 보호 규칙, 데이터 품질 규칙, 거버넌스 규칙, 품질 규칙, 속성 구성 규칙도 참조하세요.

런타임 환경

노트북과 같은 도구 또는 작업을 실행하는 데 사용되는 사전 정의되거나 사용자 정의된 하드웨어 및 소프트웨어 구성입니다.

S

스코어링

  • 기계 학습에서는 예측된 결과의 신뢰도를 측정하는 프로세스입니다.
  • 수신 ID에 대한 속성이 기존 엔티티의 속성과 얼마나 밀접하게 일치하는지를 계산하는 프로세스입니다.

스크립트

프로덕션에서 모델을 지원하기 위해 Python 또는 R 스크립트를 포함하는 파일입니다.

2차 범주

통제 아티팩트를 참조하는 선택적 카테고리입니다.

자기 주의

입력 데이터 자체의 정보를 사용하여 출력을 생성할 때 초점을 맞출 입력 파트를 판별하는 주의 메커니즘입니다.

자율 학습

입력 시퀀스에서 토큰을 마스킹한 후 이를 예측하려고 시도하여 레이블이 지정되지 않은 데이터에서 모델이 학습하는 기계 학습 훈련 방법입니다. 예를 들어, "나는 ________ 새싹을 좋아한다" 입니다.

의미 검색

언어 및 문맥 분석을 통합한 키워드 검색입니다. 시맨틱 검색에서는 하나 이상의 지정자를 사용하여 쿼리의 의도를 지정합니다. 예를 들어, '부시'라는 사람을 지정할 수 있으며, 이러한 쿼리는 정원에서 자라는 덤불의 종류에 대한 결과가 아니라 부시라는 사람에 대한 결과만 반환합니다.

중요한 데이터

무단 액세스 또는 공개로부터 보호해야 하는 정보가 포함된 데이터입니다. 민감한 데이터의 범주에는 보호 대상인 건강 정보, 개인 식별 정보, 영업 비밀 또는 재무 결과가 포함될 수 있습니다.

감정 분석

영화 리뷰가 긍정적인지 부정적인지 판단하는 등 텍스트에 표현된 감정이나 정서를 검사합니다.

쉐이프

열을 필터링, 정렬 및 제거하고 테이블을 결합하고 계산, 데이터 그룹화, 계층 구조 등을 포함하는 오퍼레이션을 수행하여 데이터를 사용자 정의하는 것입니다.

스몰데이터

사람이 액세스할 수 있고 이해할 수 있는 데이터입니다. 구조화된 데이터 (structured data)도 참조하십시오.

SQL 푸시백

SPSS Modeler에서 SQL 코드를 통해 데이터베이스에서 직접 여러 데이터 준비 및 마이닝 오퍼레이션을 작업을 수행하는 프로세스입니다.

구조화된 데이터

레코드 또는 파일 내의 고정 필드에 있는 데이터입니다. 관계형 데이터베이스와 스프레드시트가 구조화된 데이터의 예입니다. 구조화되지 않은 데이터, 작은 데이터도 참조하십시오.

정형화된 정보

검색 엔진 색인, 데이터베이스 또는 지식 기반과 같은 구조화된 자원에 저장된 항목입니다.

대체

열의 데이터를 원래 형식과 일치하지 않지만 참조 무결성을 유지하는 값으로 대체합니다.

SuperNode

여러 노드를 하나로 캡슐화하여 데이터 스트림을 축소하는 SPSS Modeler 노드입니다.

지도형 학습

새 데이터를 예측하기 위해 레이블이 지정된 데이터 세트에서 모델이 훈련되는 기계 학습 훈련 방법입니다.

T

텍스트 분류

텍스트를 자동으로 식별하고 지정된 범주로 분류하는 모델입니다.

시계열

주기적인 시점의 변수 값 세트입니다.

훈련된 모델

실제 데이터로 훈련되고 새 데이터가 제공될 때 결과를 예측하기 위해 배치할 준비가 된 모델입니다.

교육

소스 데이터의 서브세트를 포함하는 모델 빌드의 초기 단계입니다. 모델은 알려진 데이터에서 예제를 통해 학습합니다. 이후 결과가 이미 알려진 추가적인 다른 서브세트에 대해 모델을 테스트할 수 있습니다.

훈련 데이터

머신러닝 모델을 학습하는 데 사용되는 데이터 모음입니다.

훈련 세트

기계 학습 모델을 예제 및 해당 레이블에 노출하여 모델이 패턴을 학습하고 예측할 수 있도록 하여 기계 학습 모델을 훈련시키는 데 사용되는 레이블 지정된 데이터 세트입니다.

전이 학습

훈련된 모델이 완전히 새로운 문제점에 적용되는 기계 학습 전략입니다.

변압기

위치 인코딩과 자기 주의 메커니즘을 사용하여 토큰 시퀀스의 다음 토큰을 예측하는 신경망 아키텍처입니다.

트랜스퍼런시

AI 시스템이 설계되고 개발된 방법에 대해 이해 당사자 (stakeholder) 와 적절한 정보를 공유합니다. 이 정보의 예로는 수집되는 데이터, 데이터를 사용하고 저장하는 방법, 데이터에 액세스할 수 있는 사용자, 정확성, 견고성 및 편향성에 대한 테스트 결과가 있습니다.

튜링 테스트

1950년에 Alan Turing이 제안한 것으로, 인간과 동등하거나 구별할 수 없는 지능적인 행동을 보여주는 기계의 능력에 대한 시험입니다.

U

제한 없는 문제점(unbounded problem)

무한한 수의 솔루션이 존재하고 목표가 값을 무한대로 사용할 수 있는 Decision Optimization 문제점입니다. 무한 문제점은 종종 모델 공식에서 제약조건이 누락되어 발생합니다.

구조화되지 않은 데이터

고정 필드가 아니라 구조화되지 않은 형식으로 저장된 모든 데이터입니다. 워드 프로세싱 문서의 데이터가 구조화되지 않은 데이터의 예입니다. 구조화된 데이터 (structured data)도 참조하십시오.

비정형 정보

고정 위치에 포함되지 않은 데이터입니다 (예: 자연어 텍스트 문서).

자율 학련

모델에 레이블 지정된 데이터가 제공되지 않으며 자체적으로 데이터에서 패턴 또는 구조를 찾아야 하는 기계 학습 훈련 방법입니다.

V

유효성 검증 세트

훈련 프로세스 중에 기계 학습 모델의 성능 및 일반화 기능을 평가하여 하이퍼 매개변수 튜닝 및 모델 선택을 지원하는 데 사용되는 별도의 레이블 지정된 데이터 세트입니다.

시각화

그래프, 차트, 플롯, 테이블, 맵 또는 기타 데이터의 시각적 표시입니다.

W

가중치

네트워크 계층 내에서 입력 데이터를 변환하는 노드의 계수입니다. 가중치는 AI 모델이 훈련을 통해 학습하고 모델의 예측에서 오류를 줄이기 위해 해당 값을 조정하는 매개변수입니다.

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기