시각적 도구와 프로젝트에서 AI 서비스 배포
복잡한 사용 사례(예: 검색 증강 생성(RAG) 또는 에이전트 AI)를 위한 생성적 또는 에이전트 AI 애플리케이션을 구축하기 위해 시각적 도구를 사용할 때, 애플리케이션은 AI 서비스로 배포됩니다. AI 서비스는 생성적 AI 애플리케이션의 논리를 캡처하는 배포 가능한 코드 단위입니다. 예를 들어, 기초 문서를 가지고 대화하는 챗봇용 AI 서비스는 벡터화된 문서 색인에서 콘텐츠를 검색하는 로직과 기초 모델을 이용한 추론을 관리하여 응답을 생성할 수 있습니다. 온라인 배포는 실시간 추론을 위한 엔드포인트를 제공합니다. 온라인 배포로 AI 서비스를 배포한 후, 공간에 제공된 테스트 인터페이스에서 테스트하거나 엔드포인트에 액세스하여 배포를 생산 단계로 전환할 수 있습니다.
AI 서비스를 제공하는 시각적 도구
다음 도구 중 하나를 사용하여 애플리케이션을 구축하면, 해당 애플리케이션은 AI 서비스로 배포됩니다
- 에이전트 랩: 에이전트 랩을 사용하면 watsonx.ai 에서 에이전트 AI 솔루션을 구축하고 배포할 수 있습니다. 에이전트 랩에서 구축한 에이전트 AI 솔루션은 AI 서비스로 배포됩니다.
- Prompt LabPrompt Lab 를 사용하면 검색 증강 생성(RAG)과 같은 복잡한 사용 사례에 대한 생성적 AI 솔루션을 구축하고 배포할 수 있습니다. 에이전트 랩에서 구축한 복잡한 사용 사례에 대한 생성적 AI 솔루션은 AI 서비스로 배포됩니다.
- AutoAI (RAG용 ): AutoAI 를 사용하여 RAG 기반의 생성적 AI 실험을 구축하고, AI 서비스로서 가장 우수한 성능을 발휘하는 파이프라인을 배치할 수 있습니다.
배치 방법
요구 사항에 따라 다음 접근 방식 중 하나를 사용하여 지원되는 시각적 도구를 통해 애플리케이션을 AI 서비스로 배포할 수 있습니다
- 직접 배포(빠른 경로 ): 솔루션이 완성되었고 더 이상 변경하고 싶지 않은 경우 이 옵션을 사용하십시오. 빠른 경로를 사용하여 배포하도록 선택하면 온라인 배포가 자동으로 생성됩니다.
- 배포 노트북 : 배치 배포를 만드는 등 코드를 추가하거나 변경하여 솔루션을 맞춤화하려는 경우에 이 옵션을 사용합니다.
시각적 도구 외에도, 프로그래밍 방식으로 AI 서비스 자산을 생성한 경우, 프로젝트에서 직접 수동으로 애플리케이션을 AI 서비스로 배포할 수 있습니다.
AI 서비스는 사용 사례에 대한 논리를 포착하고, 배포 가능한 코드 단위인 생성 기능을 포함합니다. 배포는 다른 응용 프로그램에서 액세스할 수 있는 REST API 엔드포인트로 노출됩니다. 추론을 위해 배포된 AI 서비스를 사용하기 위해 REST API 엔드포인트에 요청을 보낼 수 있습니다. 배포된 AI 서비스가 요청을 처리하고 응답을 반환합니다.
도구 배포
빠른 경로를 사용하여 시각적 도구에서 직접 배포하거나 배포 노트북에 작업을 저장하여 솔루션을 AI 서비스로 배포하십시오.
빠른 경로로 배포
watsonx.ai 에서 지원되는 시각적 도구를 사용하여 애플리케이션을 구축한 경우, 해당 도구에서 직접 솔루션을 배포할 수 있습니다. 도구에서 직접 배포하면 솔루션을 AI 서비스로 배포하는 빠른 경로를 제공하고 온라인 배포를 자동으로 생성합니다. 배포는 생성된 후에는 변경할 수 없으므로 배포하기 전에 솔루션이 완전히 구축되었는지 확인해야 합니다.
Prompt Lab 의 RAG와 같은 복잡한 솔루션을 배포하거나 에이전트 랩의 에이전트를 배포하려면 다음 단계를 따르십시오
- 작업 공간에서 배포를 클릭합니다.
- 배포 세부 사항을 입력하고, 배포 공간을 선택하거나 생성한 다음, 생성을 클릭합니다.
AutoAI, 에서 RAG 패턴을 적용하려면 다음 단계를 따르십시오
- AutoAI 의 실험 빌더에서 가장 성능이 좋은 파이프라인을 선택하고 다른 이름으로 저장을 클릭합니다.
- 목표를 검색 및 생성 으로 선택하고 AI 서비스 자산 유형을 선택합니다.
- AI 서비스를 배포 공간으로 승격하고 배포하는 옵션을 활성화합니다.
- 기존 배포 공간을 선택하거나 새로운 공간을 만들고, [만들기 및 배포]를 클릭합니다.
이 절차는 온라인 배포를 자동으로 생성합니다. 배포가 생성되고 대상 공간에서 열리므로 배포를 테스트하거나 추론을 위해 엔드포인트에 액세스할 수 있습니다.
자동 생성된 노트북에서 배포
시각적 도구로 애플리케이션을 구축한 후 배포 전에 애플리케이션의 논리를 사용자 정의하려는 경우, 배포 노트북에 작업을 저장할 수 있습니다. AutoAI AutoAI 예를 들어, 벡터화된 데이터베이스에 새로운 문서를 추가하고 싶다면, 벡터화된 데이터베이스에 새로운 문서를 추가하고, 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를 벡터화된 데이터베이스에 추가된 문서를
배포 노트북에는 AI 서비스를 테스트, 홍보, 배포하는 코드가 포함되어 있습니다. 애플리케이션을 배포하려면, 배포용 노트북에 작업을 저장해야 합니다. 표준 노트북을 사용하여 AI 서비스 자산을 배포할 수 없습니다.
배포용 노트북에 솔루션을 저장하려면:
- 저장 아이콘을 클릭하세요
드롭다운 메뉴에서 '다른 이름으로 저장'을 선택하세요.
- 작업 저장 대화 상자에서 배포 노트북을 선택합니다.
- 세부 사항 정의 섹션 에서 배포 노트북의 이름과 설명(선택 사항)을 입력합니다.
- 저장 을 클릭하십시오.
배포용 노트북에 작업을 저장하면, watsonx.ai 가 자동으로 AI 서비스를 테스트, 승격, 배포하는 코드가 포함된 노트북을 생성합니다. AI 서비스의 온라인 배포를 생성하려면 배포 노트북에서 셀을 실행하십시오.
프로젝트에서 배포하기
온라인 배포 또는 일괄 배포를 생성하여 애플리케이션을 AI 서비스로 배포하십시오. 온라인 배포는 고가용성과 실시간 업데이트가 필요한 애플리케이션에 적합하며, 배치 배포는 복잡한 업데이트나 예정된 다운타임이 허용되는 경우에 이상적입니다.
온라인 배포 만들기
배포 가능한 AI 서비스 자산으로 프로젝트에 AI 자산을 저장한 경우, 다음 단계를 따라 AI 서비스를 홍보하고 온라인 배포를 생성하십시오
- 프로젝트 또는 배포 공간의 자산 탭 에서 AI 서비스 배포를 선택합니다.
- 배포 공간을 선택하거나 생성합니다.
- 배포 유형으로 온라인을 선택합니다.
- 배포 이름을 입력하고, 선택 사항으로 서빙 이름, 설명, 태그를 입력합니다.
- 작성을 클릭하십시오.
일괄 배포 만들기
배치 가능한 AI 서비스 자산으로 프로젝트에 AI 자산을 저장한 경우, 다음 단계를 따라 AI 서비스를 홍보하고 배치 배포를 생성하십시오
- 배치 공간에서 자산 탭 으로 이동합니다.
- 자산 목록에서 AI 서비스 자산을 선택하고 메뉴 아이콘을 클릭한 다음, 배포를 선택합니다.
- 배포 유형으로 일괄을 선택합니다.
- 배포 이름을 입력하고, 선택 사항으로 서빙 이름, 설명, 태그를 입력합니다.
- 하드웨어 사양을 선택하세요:
- 초소형 : 1 CPU와 4GB RAM
- 소형 : CPU 2개, RAM 8GB
- 중간 : 4 CPU와 16 GB RAM
- 대용량 : 8 CPU 및 32 GB RAM
- 초대형 : 16 CPU 및 64 GB RAM
- 작성을 클릭하십시오.
다음 단계
상위 주제: AI 서비스 배포