IBM watsonx.ai에서 기본 모델을 사용하여 생성적 AI 솔루션을 개발할 수 있습니다. 입력 텍스트에서 콘텐츠를 생성, 분류, 요약 또는 추출하는 프롬프트를 만들 수 있습니다. IBM 모델 또는 오픈 소스 모델 중에서 선택하세요. 기본 모델을 튜닝하여 프롬프트 출력을 사용자 정의하거나 추론 성능을 최적화할 수 있습니다.
기본 모델은 수십억 개의 매개변수가 있고 테라바이트 단위의 데이터에 대해 훈련되는 대형 AI 모델입니다. 기초 모델은 텍스트, 코드 또는 이미지 생성, 분류, 대화 등을 포함한 다양한 태스크를 수행할 수 있습니다. 대형 언어 모델은 텍스트 및 코드와 관련된 태스크를 수행할 수 있는 기초 모델의 서브세트입니다. Watsonx.ai 에는 사용자가 시도할 수 있도록 배치된 다양한 대형 언어 모델이 있습니다. 세부사항은 지원되는 기초 모델을 참조하십시오.
기본 모델 아키텍처
기초 모델은 AI 시스템에 대한 근본적으로 다른 모델 아키텍처 및 목적을 나타냅니다. 다음 다이어그램은 기존 AI 모델과 기본 모델 간의 차이점을 설명합니다.
다이어그램에 표시된 대로 기존 AI 모델은 특정 태스크를 전문으로 합니다. 대부분의 기존 AI 모델은 기계 학습을 사용하여 빌드되며, 이를 위해서는 다루고자 하는 특정 태스크를 포함하는 크고 구조화되고 레이블이 잘 지정된 데이터 세트가 필요합니다. 종종 이러한 데이터 세트는 도메인 지식이 있는 사용자가 필요하고 시간이 걸리는 작업인 수동으로 소싱, 큐레이션 및 레이블 지정되어야 합니다. 훈련된 후에는 기존 AI 모델이 단일 태스크를 잘 수행할 수 있습니다. 기존 AI 모델은 훈련 데이터의 패턴에서 학습하는 내용을 사용하여 알 수 없는 데이터의 결과를 예측합니다. AutoAI 및 Jupyter 노트북과 같은 도구를 사용하여 특정 유스 케이스에 대한 기계 학습 모델을 작성한 후 배치할 수 있습니다.
대조적으로 기본 모델은 크고 다양하며 레이블이 없는 데이터 세트에 대해 훈련되며 여러 다른 태스크에 사용할 수 있습니다. 기초 모델은 자연어 번역 작업에서 가장 가능성이 높은 다음 단어를 계산하여 텍스트를 생성하는 데 처음 사용되었습니다. 그러나 모델 제공자는 올바른 입력으로 프롬프트될 때 기초 모델이 다양한 다른 태스크를 잘 수행할 수 있음을 학습하고 있습니다. 사용자 고유의 기본 모델을 작성하는 대신 기존의 배치된 모델 및 엔지니어 프롬프트를 사용하여 필요한 결과를 생성합니다.
기본 모델에 대한 작업 방법
기초 모델의 가능성과 적용이 이제 막 발견되기 시작했습니다. watsonx.ai 의 기본 모델을 사용하여 유스 케이스를 탐색하고 유효성 검증하여 기존 프로세스를 자동화, 단순화 및 가속화하거나 새로운 방식으로 가치를 제공합니다.
다음 방법으로 기본 모델과 상호작용할 수 있습니다.
- Prompt Lab 사용하여 프롬프트 및 추론 배포된 파운데이션 모델을 직접 엔지니어링하세요
- 추론은 Python 라이브러리 또는 watsonx.ai API를 사용하여 프로그래밍 방식으로 파운데이션 모델을 배포합니다
- ' Tuning Studio'을 사용하여 특정 스타일이나 형식으로 출력을 반환하도록 파운데이션 모델을 조정합니다