기초 모델을 사용하여 생성 AI 솔루션 개발
IBM watsonx.ai에서 기본 모델을 사용하여 생성적 AI 솔루션을 개발할 수 있습니다. 입력 콘텐츠에서 콘텐츠를 생성, 분류, 요약 또는 추출하는 프롬프트를 만들 수 있습니다. IBM 모델 또는 오픈 소스 모델 중에서 선택하세요. 기본 모델을 튜닝하여 프롬프트 출력을 사용자 정의하거나 추론 성능을 최적화할 수 있습니다.
제너레이티브 AI 기능
watsonx.ai 을 사용하면 다음과 같은 기능과 리소스가 포함된 제너레이티브 AI 솔루션을 만들 수 있습니다.
- 프롬프트
- 기초 모델에 응답을 생성하도록 지시하는 프롬프트를 작성합니다. 문서 및 기타 미디어와 채팅하고, 프롬프트 재사용을 위한 변수를 포함하고, 유해한 콘텐츠를 제거하고, 기타 프롬프트 및 모델 설정을 제어할 수 있습니다.
- 빌딩 프롬프트를 참조하세요.
- 에이전트 AI
- 파운데이션 모델이 사용자와의 상호 작용 흐름을 제어하는 에이전트로 작동하도록 워크플로우를 구축합니다.
- Chat API로 상담원 중심 워크플로우 구축하기를 참조하세요.
- 검색-기능 보강된 생성
- 문서에 있는 사실에 근거하여 모델을 구축하는 RAG 패턴을 만드세요. RAG 패턴을 사용자 지정하여 문서에서 텍스트를 추출하고, 벡터 인덱스를 만들고, 검색된 콘텐츠의 순위를 다시 매길 수 있습니다. 데이터와 사용 사례에 따라 최적화된 생산 품질의 RAG 패턴 검색을 자동화할 수 있습니다.
- 검색 증강 생성을 참조하세요.
- 예측
- 과거 시계열 데이터를 기반으로 미래 값을 예측합니다.
- 미래 가치 예측을 참조하세요.
- 기초 모델
- Watsonx.ai 에는 다양한 파운데이션 모델을 사용해 볼 수 있습니다. 그렇지 않으면 주문형 배포 모델을 선택하거나 사용자 지정 모델을 가져와 배포할 수 있습니다.
- 지원되는 파운데이션 모델을 참조하세요.
- 모델 튜닝
- 더 작은 기초 모델을 조정하여 동일한 모델 제품군의 대형 모델과 비슷한 결과를 얻을 수 있습니다.
- 파운데이션 모델 조정하기를 참조하세요.
- 평가
- 사용 사례에 맞는 정량적 지표와 사용자 지정 가능한 기준을 사용하여 생성 AI 자산을 평가하고 비교하세요.
- AI 모델 평가하기를 참조하세요.
제너레이티브 AI 솔루션 계획에 대한 팁은 AI 솔루션 계획하기를 참조하세요.
업무 방식
생성형 AI 솔루션의 코드를 작성할 수 있습니다. 작업 및 API 목록은 생성형 AI 솔루션 코딩하기를 참조하세요.
UI의 도구를 사용하여 노코드 또는 로우코드 환경에서 작업할 수 있습니다:
기본 모델 아키텍처
기본 모델은 수십억 개의 매개변수가 있고 테라바이트 단위의 데이터에 대해 훈련되는 대형 AI 모델입니다. 기초 모델은 텍스트, 코드 또는 이미지 생성, 분류, 대화 등을 포함한 다양한 태스크를 수행할 수 있습니다. 대규모 언어 모델은 텍스트 및 코드와 관련된 작업을 수행할 수 있는 기초 모델의 하위 집합입니다.
기초 모델은 AI 시스템에 대한 근본적으로 다른 모델 아키텍처 및 목적을 나타냅니다. 다음 다이어그램은 기존 머신러닝 AI 모델과 제너레이티브 AI를 위한 기초 모델의 차이점을 보여줍니다.
다이어그램에 표시된 대로 기존 AI 모델은 특정 태스크를 전문으로 합니다. 대부분의 기존 AI 모델은 기계 학습을 사용하여 빌드되며, 이를 위해서는 다루고자 하는 특정 태스크를 포함하는 크고 구조화되고 레이블이 잘 지정된 데이터 세트가 필요합니다. 이러한 데이터 세트는 종종 수작업으로 소싱, 큐레이션 및 레이블을 지정해야 하는데, 이 작업은 도메인 지식을 갖춘 사람이 필요하고 시간이 오래 걸리는 작업입니다. 훈련된 후에는 기존 AI 모델이 단일 태스크를 잘 수행할 수 있습니다. 기존 AI 모델은 훈련 데이터의 패턴에서 학습하는 내용을 사용하여 알 수 없는 데이터의 결과를 예측합니다. AutoAI 및 Jupyter 노트북과 같은 도구를 사용하여 특정 유스 케이스에 대한 기계 학습 모델을 작성한 후 배치할 수 있습니다.
반면, 기초 모델은 레이블이 지정되지 않은 대규모의 다양한 데이터 세트에 대해 학습되며 다양한 작업에 사용할 수 있습니다. 기초 모델은 자연어 번역 작업에서 가장 가능성이 높은 다음 단어를 계산하여 텍스트를 생성하는 데 처음 사용되었습니다. 그러나 모델 제공자는 올바른 입력으로 프롬프트될 때 기초 모델이 다양한 다른 태스크를 잘 수행할 수 있음을 학습하고 있습니다. 사용자 고유의 기본 모델을 작성하는 대신 기존의 배치된 모델 및 엔지니어 프롬프트를 사용하여 필요한 결과를 생성합니다.