고성능 컴퓨팅에서 CPU에서 계산 로드의 일부를 차지하여 시스템의 효율성을 높이는 데 사용되는 특수화된 회로입니다. 예를 들어, 딥 러닝에서 GPU 가속 컴퓨팅은 종종 기본 애플리케이션이 CPU에서 실행되는 동안 GPU에 컴퓨팅 워크로드의 일부를 오프로드하는 데 사용됩니다. 그래픽 처리 장치도 참조하십시오.
신뢰성
Copy link to section
조직 또는 개인이 자신의 역할 및 적용 가능한 규정 프레임워크에 따라 설계, 개발, 운영 또는 배치하는 AI 시스템의 적절한 기능을 라이프사이클 전체에서 보장할 것이라고 예상합니다. 여기에는 법률 전문가가 사례별로 책임을 판별해야 할 수 있는 AI 실수에 대한 책임이 있는 사람을 판별하는 것이 포함됩니다.
활성화 함수
Copy link to section
다른 뉴런으로부터 들어오는 활성화 세트가 제공된 경우 신경 장치의 출력을 정의하는 함수입니다.
액티브 러닝
Copy link to section
시스템이 필요한 경우에만 더 많은 레이블이 지정된 데이터를 요청하는 기계 학습 모델입니다.
활성 메타데이터
Copy link to section
기계 학습 프로세스의 분석을 기반으로 자동으로 업데이트되는 메타데이터입니다. 예를 들어, 프로파일링 및 데이터 품질 분석은 데이터 자산의 메타데이터를 자동으로 업데이트합니다.
활성 런타임(active runtime)
Copy link to section
코드를 실행하는 에셋에 컴퓨팅 리소스를 제공하기 위해 실행 중인 환경의 인스턴스입니다.
에이전트
Copy link to section
특정 목표를 달성하기 위해 일반적으로 강화 학습을 사용하여 최적의 조치 또는 의사결정을 학습하기 위해 환경과 상호작용하는 알고리즘 또는 프로그램입니다.
Agentic AI
Copy link to section
프롬프트를 여러 태스크로 분해하고 적절한 gen AI 에이전트에 태스크를 지정하며 사용자 개입 없이 응답을 합성할 수 있는 생성 AI 플로우입니다.
더 빠르고 에너지 효율적인 컴퓨팅을 위해 딥 러닝, 머신 러닝, 신경망과 같은 AI 관련 작업을 효율적으로 실행하도록 설계된 특화된 실리콘 하드웨어입니다. 코어의 전용 유닛, 다중 모듈 칩의 개별 칩렛 또는 별도의 카드일 수 있습니다.
AI 윤리
Copy link to section
위험과 불리한 결과를 줄이면서 AI의 유익한 영향을 최적화하는 방법을 연구하는 여러 전문 분야입니다. AI 윤리 문제의 예로는 데이터 책임 및 개인정보 보호, 공정성, 설명 가능성, 견고성, 투명성, 환경 지속 가능성, 포함, 도덕적 기관, 가치 조정, 책임, 신뢰 및 기술 오용이 있습니다.
AI 거버넌스
Copy link to section
AI 라이프사이클 전반에 걸쳐 올바른 조치를 지시, 평가, 모니터링 및 수행하고, AI 시스템이 조직의 의도대로, 이해 당사자가 예상하는 대로, 그리고 관련 규정에 필요한 대로 운영되고 있음을 보장하기 위해 기업의 지시사항, 직원, 프로세스 및 시스템을 통해 조직을 통제하는 조직의 행위입니다.
AI 안전
Copy link to section
인공지능 시스템이 인간에게 유익하고 부주의하게 해를 끼치지 않는 방식으로 작동하도록 보장하는 것을 목표로 하는 연구 분야는 신뢰성, 공정성, 투명성, AI 시스템과 인간의 가치의 일치와 같은 문제를 다루고 있다.
AI 서비스
Copy link to section
생성형 AI 사용 사례의 로직을 포함하고 애플리케이션에서 추론할 수 있는 엔드포인트를 제공하는 배포 가능한 코드 단위입니다.
데이터에서 의미 있는 패턴을 찾고 해당 패턴을 기반으로 결론을 도출하기 위해 데이터를 연구하는 학문입니다.
적절한 신뢰
Copy link to section
AI 시스템에서 정확도, 신뢰성 및 신뢰성에 맞게 조정되는 신뢰의 양입니다.
인공 지능 (AI, artificial intelligence)
Copy link to section
예측, 권장사항 또는 의사결정을 작성하기 위해 모델 양식으로 지식을 획득, 처리, 작성 및 적용하는 기능입니다.
인공 지능 시스템 (AI system, AI system)
Copy link to section
실제 또는 가상 환경에 영향을 미치는 예측, 권장사항 또는 의사결정을 작성할 수 있고 개발자 또는 사용자가 출력 또는 동작을 미리 판별할 필요가 없는 시스템입니다. AI 시스템은 일반적으로 대량의 구조화되거나 구조화되지 않은 데이터로 훈련되며 사용자 정의 목표를 달성하기 위해 다양한 레벨의 자율로 작동하거나 전혀 작동하지 않도록 설계될 수 있습니다.
자산
Copy link to section
데이터, 기타 중요한 정보 또는 데이터에 대해 작업하는 코드에 대한 정보를 포함하는 항목입니다. 데이터 자산도 참조하십시오.
주의 메커니즘
Copy link to section
출력을 생성할 때 모델이 초점을 맞추는 입력 파트를 판별하는 딥 러닝 모델의 메커니즘입니다.
AutoAI 실험
Copy link to section
일련의 훈련 정의와 매개변수를 고려하여 모델 후보로 순위가 지정된 파이프라인 세트를 작성하는 자동화된 훈련 프로세스입니다.
B
Copy link to section
일괄처리 배치(batch deployment)
Copy link to section
스토리지 버킷의 파일, 데이터 연결 또는 연결된 데이터에서 입력 데이터를 처리하는 모델을 배치한 후 선택된 대상에 출력을 기록하는 방법입니다.
편향
Copy link to section
불공정한 의사결정을 생성할 수 있는 방식으로 의도적으로 또는 의도적으로 설계되지 않은 AI 시스템의 체계적인 오류입니다. 바이어스는 AI 시스템과 이를 훈련하고 테스트하는 데 사용되는 데이터 모두에 존재할 수 있습니다. AI 편향성은 문화적 기대, 기술적 제한 또는 예기치 않은 배치 컨텍스트의 결과로 AI 시스템에서 나타날 수 있습니다. 공정성도 참조하십시오.
편향 발견
Copy link to section
AI 모델에서 특정 속성을 기반으로 불공정한 결과를 전달할 때 메트릭의 공정성을 계산하는 프로세스입니다.
편향성 완화
Copy link to section
훈련 데이터를 큐레이션하고 공정성 기술을 적용하여 AI 모델의 편향성을 줄입니다.
2진 분류
Copy link to section
두 개의 클래스가 있는 분류 모델. 예측은 두 클래스 중 하나의 2진 선택사항입니다.
C
Copy link to section
분류 모델
Copy link to section
개별 범주의 데이터를 예측하는 예측 모델입니다. 분류는 두 개의 데이터 클래스가 있는 2진또는 세 개 이상의 카테고리가 있는 경우 다중 클래스일 수 있습니다.
홀드아웃 테스트 샘플이 없는 경우 모델이 얼마나 잘 일반화되는지 테스트하는 기술입니다. 교차 검증은 훈련 데이터를 다수의 서브세트로 나눈 후 동일한 수의 모델을 작성하며 각 서브세트는 차례로 유지됩니다. 이러한 각 모델은 검증용 표본에서 검정되며 이러한 검증용 표본에 대한 모델의 평균 정확도는 새 데이터에 적용될 때 모델의 정확도를 추정하는 데 사용됩니다.
큐레이트
Copy link to section
특정 주제와 관련된 컨텐츠를 선택, 수집, 보존 및 유지보수합니다. 관리에서는 값을 설정하고 유지보수하며 데이터에 추가하고, 데이터를 신뢰할 수 있는 정보와 지식으로 변환합니다.
D
Copy link to section
데이터 자산
Copy link to section
데이터(예: 업로드된 파일)를 가리키는 자산입니다. 연결 및 연결된 데이터 자산도 데이터 자산으로 간주됩니다. 자산도 참조하십시오.
데이터 대치
Copy link to section
데이터 세트에서 누락된 값을 추정된 값 또는 명시적 값으로 대체하는 것입니다.
데이터 레이크
Copy link to section
플랫 아키텍처의 모든 형식으로 원시 데이터를 저장하는 대규모 데이터 스토리지 저장소입니다. 데이터 레이크는 처리 및 분석을 위해 2진 데이터뿐만 아니라 구조화된 데이터 및 구조화되지 않은 데이터를 보유합니다.
데이터 레이크하우스
Copy link to section
데이터 레이크의 유연성을 데이터 웨어하우스의 구조화된 조회 및 성능 최적화와 결합하여 AI및 분석 애플리케이션에 대한 확장 가능하고 효율적인 데이터 분석을 가능하게 하는 통합 데이터 스토리지 및 처리 아키텍처입니다.
데이터 마이닝
Copy link to section
데이터 소스에서 중요한 비즈니스 정보를 수집하고, 정보를 상관시키고,
연관, 패턴 및 추세를 파악하는 프로세스입니다. 예측 분석도 참조하십시오.
Data Refinery 플로우
Copy link to section
새 데이터 자산을 생성하기 위해 데이터를 정리하고 쉐이핑하는 일련의 단계입니다.
데이터 사이언스
Copy link to section
인사이트와 지식을 발견하기 위한 구조화된 데이터와 구조화되지 않은 데이터의 분석 및 시각화입니다.
데이터 세트
Copy link to section
일반적으로 행(레코드) 및 열(필드) 양식으로 되어 있으며 파일 또는 데이터베이스 테이블에 포함된 데이터 콜렉션입니다.
데이터 소스
Copy link to section
데이터베이스와 같은 데이터를 읽기 위한 저장소, 큐 또는 피드입니다.
데이터 테이블
Copy link to section
일반적으로 행(레코드) 및 열(필드) 양식으로 되어 있으며 테이블에 포함된 데이터 콜렉션입니다.
데이터 웨어하우스
Copy link to section
보고 및 데이터 분석에 사용되는 다양한 소스에서 수집된 데이터의 중앙 집중식 대형 저장소입니다. 기본적으로 구조화된 데이터와 반구조화된 데이터를 저장하여 비즈니스에서 정보에 입각한 의사결정을 내릴 수 있도록 합니다.
입력 시퀀스에서 추론하여 단어별로 출력 텍스트 단어를 생성하는 모델입니다. 디코더 전용 모델은 텍스트 생성 및 질문 응답과 같은 태스크에 사용됩니다.
딥러닝
Copy link to section
일련의 계산을 통해 입력 데이터 (첫 번째 계층) 를 변환하여 출력 (최종 계층) 을 생성하기 위해 계층 구조 계층으로 구성된 상호 연결된 노드의 다중 계층을 사용하는 계산 모델입니다. 심화 학습은 인간 두뇌의 구조와 기능에 의해 영감을 받습니다. 분산 딥 러닝도 참조하십시오.
깊은 신경망
Copy link to section
데이터의 보다 복잡한 표시를 허용하는 다중 은닉층이 있는 신경망입니다.
심층 추론
Copy link to section
시스템이 데이터에서 인사이트를 생성하여 상식, 상황 변화, 계획, 의사 결정 등 인식과 분류를 넘어서는 인지 작업을 지원하는 머신 러닝의 한 종류입니다.
배치
Copy link to section
사용할 수 있는 모델 또는 애플리케이션 패키지입니다.
배치 영역
Copy link to section
모델이 배치되고 배치가 관리되는 작업공간입니다.
deterministic
Copy link to section
출력이 입력에 의해 완전히 판별될 때 컴퓨팅 시스템의 특성을 설명합니다.
차별적 AI
Copy link to section
데이터에서 서로 다른 클래스를 구분하는 경계를 찾는 데 초점을 맞추는 알고리즘의 클래스입니다.
분산 딥 러닝 (DDL)
Copy link to section
분산 컴퓨팅 방법을 활용하는 딥 러닝 교육에 대한 접근 방식입니다. DDL 환경에서 계산 워크로드는 중앙 처리 장치와 그래픽 처리 장치 간에 분배됩니다. 딥 러닝도 참조하십시오.
DOcplex
Copy link to section
Decision Optimization 문제점을 모델링하고 해결하기 위한 Python API입니다.
E
Copy link to section
임베딩
Copy link to section
실제 값 숫자의 벡터인 정보 단위 (예: 단어 또는 문장) 의 숫자 표시입니다. 임베드는 고차원 데이터의 저차원 표현을 학습합니다. 인코딩, 표시도 참조하십시오.
출현
Copy link to section
모델이 명시적으로 훈련되지 않은 동작을 나타내는 기초 모델의 특성입니다.
긴급 동작
Copy link to section
명시적으로 구성되지 않은 foundation model 나타나는 동작입니다.
인코더-디코더 모델
Copy link to section
입력 텍스트를 이해하고 입력 텍스트를 기반으로 출력 텍스트를 생성하기 위한 모델입니다. 인코더-디코더 모델은 요약 또는 변환과 같은 태스크에 사용됩니다.
인코더 전용 모델
Copy link to section
입력 시퀀스를 임베드라고 하는 표현 벡터로 변환하여 문장 레벨에서 입력 텍스트를 이해하는 모델입니다. 인코더 전용 모델은 고객 피드백 분류 및 대형 문서에서 정보 추출과 같은 태스크에 사용됩니다.
인코딩
Copy link to section
문자 또는 단어와 같은 정보 단위를 숫자 세트로 표시한 것입니다. 임베드, 위치 인코딩도 참조하십시오.
엔드포인트 URL
Copy link to section
서비스 및 오브젝트와 같은 리소스를 식별하는 네트워크 대상 주소입니다. 예를 들어, 엔드포인트 URL은 사용자가 배치에 페이로드 데이터를 전송할 때 모델 또는 함수 배치의 위치를 식별하는 데 사용됩니다.
환경
Copy link to section
작업을 실행하기 위한 계산 자원입니다.
환경 런타임(environment runtime)
Copy link to section
에셋을 실행하기 위한 환경 템플릿의 인스턴스화입니다.
환경 템플리트
Copy link to section
환경 런타임 인스턴스를 생성하기 위한 하드웨어 및 소프트웨어 리소스를 지정하는 정의입니다.
외부 기능
Copy link to section
예측 모델에 영향을 줄 수 있지만 리턴 시 영향을 받을 수 없는 기능입니다. 예를 들어, 온도는 예상되는 아이스크림 판매에 영향을 줄 수 있지만, 아이스크림 판매는 온도에 영향을 줄 수 없습니다.
실험
Copy link to section
가장 정확한 모델 구성을 판별하기 위해 일련의 훈련 정의 및 매개변수를 고려하는 모델 훈련 프로세스입니다.
설명가능성
Copy link to section
사용자가 AI 시스템을 사용하는 애플리케이션에서 작성한 예측을 추적, 감사 및 이해할 수 있는 기능입니다.
인간이 시스템 예측의 원인을 이해하는 데 사용할 수 있는 인사이트를 제공하는 AI 시스템의 기능입니다.
F
Copy link to section
공정
Copy link to section
AI 시스템에서 개인 또는 개인 그룹의 공정한 처리입니다. AI 시스템에 대한 특정 지분 개념의 선택은 사용되는 컨텍스트에 따라 다릅니다. 바이어스 (bias)도 참조하십시오.
기능
Copy link to section
데이터 세트 내에 있는 항목의 특성 또는 특성입니다 (예: 스프레드시트의 열). 일부 경우에, 특징들은 데이터 세트 내의 다른 특징들의 조합으로서 조작된다.
기능 엔지니어링
Copy link to section
기계 학습 모델의 성능 및 예측력을 향상시키기 위해 원시 데이터에서 새 기능을 선택, 변환 및 작성하는 프로세스입니다.
기능 그룹
Copy link to section
기계 학습에 사용되는 메타데이터와 함께 특정 데이터 자산의 열 세트입니다.
기능 선택
Copy link to section
기계 학습 모델에서 정확한 예측 또는 점수를 가장 잘 지원하는 데이터 열을 식별합니다.
기능 저장소
Copy link to section
기능을 관리하고 구성하여 기계 학습 파이프라인 및 애플리케이션에서 기능 데이터를 저장, 검색 및 공유하는 확장 가능하고 효율적인 방법을 제공하는 중앙 집중식 저장소 또는 시스템입니다.
기능 변환(feature transformation)
Copy link to section
AutoAI에서 훈련 데이터를 변환하고 최적화하는 알고리즘을 적용하여 모델 유형에 대한 최상의 결과를 얻는 파이프라인 작성 단계입니다.
페더레이티드 학습
Copy link to section
이동, 결합 또는 공유되지 않는 여러 데이터 소스를 사용하는 공통 기계 학습 모델의 훈련입니다. 결과는 데이터 보안을 손상시키지 않으면서 더 잘 훈련된 모델입니다.
몇 번의 프롬프트
Copy link to section
태스크를 완료하는 방법을 설명하기 위해 적은 수의 예제가 모델에 제공되는 프롬프트 기술입니다.
세부 조정
Copy link to section
추가 훈련을 수행하여 특정 태스크를 수행하도록 사전 훈련된 모델을 적용하는 프로세스입니다. 미세 조정에는 (1) 전체 미세 조정으로 알려진 모델의 기존 매개변수를 갱신하거나 (2) 모델의 기존 매개변수의 서브세트를 갱신하거나 모델에 새 매개변수를 추가하고 매개변수 효율적인 미세 조정으로 알려진 모델의 기존 매개변수를 동결하는 동안 이를 훈련하는 것이 포함될 수 있습니다.
플로우
Copy link to section
데이터를 처리하거나 모델을 훈련하는 일련의 단계를 정의하는 노드의 콜렉션입니다.
foundation model
Copy link to section
광범위한 다운스트림 태스크에 적용할 수 있는 AI 모델입니다. 기초 모델은 일반적으로 자체 감독을 사용하여 레이블이 없는 데이터에 대해 훈련되는 대규모 생성 모델입니다. 대형 스케일 모델로서, 기초 모델은 수십억 개의 매개변수를 포함할 수 있습니다.
G
Copy link to section
갠트 차트
Copy link to section
스케줄 데이터가 시간 스케일을 따라 가로 막대로 표시되는 프로젝트 타임라인 및 기간의 그래픽 표시입니다.
시각적 코딩을 통해 흐름 자산을 생성하는 도구입니다. 캔버스는 플로우를 작성하기 위해 연결할 수 있는 오브젝트 또는 노드를 배치할 영역입니다.
GPU(Graphics Processing Unit)
Copy link to section
표시장치에 출력하기 위한 프레임 버퍼에서 이미지 작성을 가속화하기 위해 메모리를 빠르게 조작하고 변경하도록 설계된 특수화된 프로세서입니다. GPU는 병렬 처리 기능으로 인해 기계 학습에서 과도하게 활용됩니다. 가속기도 참조하십시오.
접지
Copy link to section
결과의 정확성을 향상시키기 위해 정보가 있는 대형 언어 모델을 제공합니다.
H
Copy link to section
환각
Copy link to section
주제에서 벗어나거나 반복적이거나 부정확하거나 조작된 콘텐츠가 포함된 foundation model 응답입니다. 세부사항을 조작하는 환각은 모델이 텍스트를 생성하도록 프롬프트될 때 발생할 수 있지만, 모델에는 올바른 세부사항을 포함하는 결과를 생성하기 위해 그릴 수 있는 충분한 관련 텍스트가 없습니다.
HAP 발견 (HAP 발견)
Copy link to section
사용자가 제출한 프롬프트와 AI 모델이 생성한 응답 모두에서 증오, 남용 및 욕설을 발견하고 필터링하는 기능입니다.
HAP 검출기 (HAP 검출기)
Copy link to section
혐오 발언, 욕설, 욕설 등 잠재적으로 유해한 콘텐츠를 foundation model 출력 및 입력에서 제거하는 문장 분류기입니다.
홀드아웃 세트
Copy link to section
훈련 및 유효성 검증 세트 모두에서 의도적으로 보류되는 레이블 지정된 데이터 세트로, 보이지 않는 데이터에 대한 최종 모델의 성능을 편향되지 않게 평가하는 역할을 합니다.
균질화
Copy link to section
변환기와 같은 소수의 딥 신경망 아키텍처가 다양한 태스크에서 최신 결과를 달성하는 머신 러닝 연구의 추세입니다.
프로덕션 머신 러닝 (또는 딥 러닝) 라이프사이클을 관리하는 데 도움이 되는 데이터 과학자와 운영 전문가 간 협업을 위한 사례입니다. MLOps는 비즈니스 및 규정 요구사항에 초점을 맞추면서 자동화를 강화하고 프로덕션 ML의 품질을 개선할 것으로 보고 있습니다. 여기에는 모델 개발, 훈련, 유효성 검증, 배치, 모니터링 및 관리가 포함되며 CI/CD와 같은 방법을 사용합니다.
모델
Copy link to section
기계 학습 컨텍스트에서 예측 또는 의사결정을 제공하기 위해 데이터 세트에 대해 훈련되고 테스트된 함수 및 알고리즘 세트입니다.
Decision Optimization에서 다른 데이터 세트를 사용하는 CPLEX 최적화 엔진으로 해결할 수 있는 문제점의 수학 공식입니다.
ModelOps
Copy link to section
훈련, 개발, 스코어링, 평가, 재훈련 및 업데이트를 포함하여 AI 모델의 전체 라이프사이클을 관리하기 위한 방법입니다.
모니터 대상 그룹
Copy link to section
예측 모델의 결과가 참조 그룹의 결과와 상당히 다른지 판별하기 위해 모니터되는 데이터 클래스입니다. 그룹은 일반적으로 인종, 성별 또는 나이를 포함하는 특성을 기반으로 모니터됩니다.
다중 클래스 분류 모델
Copy link to section
세 개 이상의 클래스가 있는 분류 태스크입니다. 예를 들어, 2진 분류 모델이 예 또는 아니오 값을 예측하는 경우 다중 클래스 모델은 예, 아니오, 가능 또는 적용 불가능을 예측합니다.
다중 모달 모델
Copy link to section
텍스트, 이미지 및 오디오와 같은 여러 유형의 데이터를 처리하고 데이터 간에 변환할 수 있는 생성 AI 모델입니다. 예를 들어, 다중 모달 모델은 텍스트 입력을 사용하여 이미지 출력을 생성할 수 있습니다.
다변량 시계열
Copy link to section
둘 이상의 변경 변수를 포함하는 시계열 실험입니다. 예를 들어, 세 클라이언트의 전기 사용량을 예측하는 시계열 모델이 있습니다.
N
Copy link to section
자연어 처리(NLP, natural language processing)
Copy link to section
컴퓨터에서 자연어를 이해하는 기능을 향상시키기 위해 자연어 처리 및 조작과 관련된 고유한 문제점을 연구하는 인공 지능과 언어학의 분야입니다.
자연어 처리 라이브러리
Copy link to section
구문 분석을 위한 기본 자연어 처리 기능과 다양한 텍스트 처리 태스크를 위한 즉시 사용 가능한 사전 훈련된 모델을 제공하는 라이브러리입니다.
신경망
Copy link to section
뇌세포의 추상 버전을 시뮬레이션하는 복잡한 수학 체계를 사용하여 케이스를 예측하거나 분류하기 위한 수학적 모델입니다. 신경망은 많은 수의 관찰된 케이스를 한 번에 하나씩 제공하고 태스크를 학습할 때까지 반복적으로 업데이트할 수 있도록 하여 훈련됩니다.
의사 난수 생성기를 초기화하는 데 사용되는 숫자입니다. 랜덤 시드를 사용하면 난수 생성에 의존하는 프로세스에 대해 재현성을 사용할 수 있습니다.
참조 그룹
Copy link to section
예측 모델에서 긍정적 결과를 수신할 가능성이 가장 높은 것으로 식별되는 그룹입니다. 결과를 모니터된 그룹과 비교하여 결과에서 잠재적 편향성을 찾을 수 있습니다.
세분화
Copy link to section
데이터를 정리하고 쉐이핑하는 것입니다.
회귀 모형
Copy link to section
종속변수를 하나 이상의 독립변수와 관련시키는 모델입니다.
강화 학습
Copy link to section
보상 신호를 최대화하기 위해 에이전트가 환경에서 순차적 의사결정을 수행하도록 학습하는 기계 학습 기술입니다. 시험 및 오류 학습에서 영감을 얻은 에이전트는 환경과 상호작용하고, 피드백을 받고, 최적의 정책을 달성하기 위해 조치를 조정합니다.
인간의 피드백에 대한 강화 학습 (RLHF)
Copy link to section
프롬프트에 제공된 지시사항에 대한 언어 학습 모델의 응답을 맞추는 방법입니다. RLHF에는 사람 어노테이터가 모델에서 여러 출력의 순위를 지정해야 합니다. 그런 다음 이러한 순위는 강화 학습을 사용하여 보상 모델을 훈련하는 데 사용됩니다. 그런 다음 보상 모델을 사용하여 대형 언어 모델의 출력을 미세 조정합니다.
의존
Copy link to section
AI 시스템에서 AI 모델에 의해 작성된 권장사항 또는 AI 모델에 의해 생성된 출력에 대한 사용자의 수락입니다. 과의존성, 과의존성도 참조하십시오.
SPSS Modeler에서 SQL 코드를 통해 데이터베이스에서 직접 여러 데이터 준비 및 마이닝 오퍼레이션을 작업을 수행하는 프로세스입니다.
구조화된 데이터
Copy link to section
레코드 또는 파일 내의 고정 필드에 있는 데이터입니다. 관계형 데이터베이스와 스프레드시트가 구조화된 데이터의 예입니다. 구조화되지 않은 데이터, 작은 데이터도 참조하십시오.
정형화된 정보
Copy link to section
검색 엔진 색인, 데이터베이스 또는 지식 기반과 같은 구조화된 자원에 저장된 항목입니다.
지도형 학습
Copy link to section
새 데이터를 예측하기 위해 레이블이 지정된 데이터 세트에서 모델이 훈련되는 기계 학습 훈련 방법입니다.
T
Copy link to section
온도
Copy link to section
생성 프로세스에서 변동의 양을 지정하는 생성 모델의 매개변수입니다. 온도가 높을수록 모델의 출력에 더 큰 변동이 발생합니다.
텍스트 분류
Copy link to section
텍스트를 자동으로 식별하고 지정된 범주로 분류하는 모델입니다.
텍스트 추출
Copy link to section
고도로 구조화된 정보를 보다 간단한 텍스트 형식으로 변환하여 대규모 언어 모델에 입력으로 사용할 수 있는 생성형 AI 방식입니다.
시계열
Copy link to section
주기적인 시점의 변수 값 세트입니다.
시계열 모델
Copy link to section
시간 경과에 따라 데이터를 추적하고 예측하는 모델입니다.
토큰
Copy link to section
단어 또는 하위 단어와 같은 텍스트에서 의미 또는 분석의 이산 단위입니다.
토큰화
Copy link to section
텍스트 문자열을 더 작은 단위 (예: 단어 또는 하위 단어) 로 분할하기 위해 자연어 처리에서 사용되는 프로세스입니다.
훈련된 모델
Copy link to section
실제 데이터로 훈련되고 새 데이터가 제공될 때 결과를 예측하기 위해 배치할 준비가 된 모델입니다.
교육
Copy link to section
소스 데이터의 서브세트를 포함하는 모델 빌드의 초기 단계입니다. 모델은 알려진 데이터에서 예제를 통해 학습합니다. 이후 결과가 이미 알려진 추가적인 다른 서브세트에 대해 모델을 테스트할 수 있습니다.
훈련 데이터
Copy link to section
머신러닝 모델을 학습하는 데 사용되는 데이터 모음입니다.
훈련 세트
Copy link to section
기계 학습 모델을 예제 및 해당 레이블에 노출하여 모델이 패턴을 학습하고 예측할 수 있도록 하여 기계 학습 모델을 훈련시키는 데 사용되는 레이블 지정된 데이터 세트입니다.
전이 학습
Copy link to section
훈련된 모델이 완전히 새로운 문제점에 적용되는 기계 학습 전략입니다.
변압기
Copy link to section
일련의 토큰에서 다음 토큰을 예측하기 위해 위치 인코딩 및 자체 주의 메커니즘을 사용하는 신경망 아키텍처입니다.
트랜스퍼런시
Copy link to section
AI 시스템이 설계되고 개발된 방법에 대해 이해 당사자 (stakeholder) 와 적절한 정보를 공유합니다. 이 정보의 예로는 수집되는 데이터, 데이터를 사용하고 저장하는 방법, 데이터에 액세스할 수 있는 사용자, 정확성, 견고성 및 편향성에 대한 테스트 결과가 있습니다.
신뢰 교정
Copy link to section
정확성, 신뢰성 및 신뢰성과 같은 요소를 기반으로 AI 시스템에 대한 신뢰를 평가하고 조정하는 프로세스입니다.
튜링 테스트
Copy link to section
1950년에 Alan Turing이 제안한 것으로, 인간과 동등하거나 구별할 수 없는 지능적인 행동을 보여주는 기계의 능력에 대한 시험입니다.
U
Copy link to section
의존
Copy link to section
AI 모델에서 작성된 올바른 권장사항에 대한 사용자의 거부입니다. 과의존성, 의존성도 참조하십시오.
일변량 시계열
Copy link to section
변경되는 변수가 하나만 포함된 시계열 실험입니다. 예를 들어, 온도를 예측하는 시계열 모델에는 온도의 단일 예측 열이 있습니다.
구조화되지 않은 데이터
Copy link to section
고정 필드가 아니라 구조화되지 않은 형식으로 저장된 모든 데이터입니다. 워드 프로세싱 문서의 데이터가 구조화되지 않은 데이터의 예입니다. 구조화된 데이터 (structured data)도 참조하십시오.
비정형 정보
Copy link to section
고정 위치에 포함되지 않은 데이터입니다 (예: 자연어 텍스트 문서).
비지도형 학습
Copy link to section
레이블이 없는 원시 데이터가 사용자 개입 없이 시스템을 훈련하는 데 사용될 수 있도록 하는 딥 러닝 모델입니다.
모델에 레이블 지정된 데이터가 제공되지 않으며 자체적으로 데이터에서 패턴 또는 구조를 찾아야 하는 기계 학습 훈련 방법입니다.
V
Copy link to section
유효성 검증 세트
Copy link to section
훈련 프로세스 중에 기계 학습 모델의 성능 및 일반화 기능을 평가하여 하이퍼 매개변수 튜닝 및 모델 선택을 지원하는 데 사용되는 별도의 레이블 지정된 데이터 세트입니다.
벡터
Copy link to section
[1, 2, 5] 또는 [0.7, 0.2, -1.0] 과 같은 1차원의 정렬된 숫자 목록입니다.