0 / 0

카탈로그 판매 예측

마지막 업데이트 날짜: 2025년 2월 12일
카탈로그 판매 예측

이 자습서에서는 10년간의 판매 데이터를 기반으로 남성 의류 라인의 월별 매출을 예측하고자 하는 카탈로그 회사의 예를 제공합니다.

예측 대역폭 활용도 자습서에서는 전문가 모델러가 시계열에 가장 적합한 모델을 결정하는 방법을 배웠습니다. 이제 모델을 선택할 때 사용할 수 있는 두 가지 방법인 지수 평활과 ARIMA에 대해 자세히 살펴보겠습니다.

적절한 모델을 결정할 때 도움을 받기 위해 먼저 시계열을 작성하는 것이 좋습니다. 시계열에 대한 시각적 조사는 종종 선택에 도움이 되는 강력한 안내서가 될 수 있습니다. 특히, 스스로 다음 사항을 질문해야 합니다.
  • 계열에 전체 추세가 있습니까? 있으면 추세가 상수로 표시됩니까? 아니면 시간 경과에 따라 사라지는 것으로 표시됩니까?
  • 계열에 계절성이 표시됩니까? 표시되는 경우, 계절적 변동이 시간 경과와 함께 증가합니까? 아니면 연속된 기간 동안 상수로 표시됩니까?

튜토리얼 미리보기

비디오 보기 비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 동영상에 나오는 사용자 인터페이스와 약간의 차이가 있을 수 있습니다. 이 비디오는 글로 된 튜토리얼의 보조 자료로 제작되었습니다. 이 비디오는 이 문서에 있는 개념과 작업을 시각적으로 배울 수 있는 방법을 제공합니다.

튜토리얼을 사용해 보세요

이 학습서에서는 다음 태스크를 완료합니다.

모델러 흐름 및 데이터 세트 샘플

이 튜토리얼에서는 샘플 프로젝트의 카탈로그 판매 예측 플로우를 사용합니다. 사용된 데이터 파일은 catalog_seasfac.csv. 다음 이미지는 샘플 모델러의 흐름을 보여줍니다.

그림 1. 모델러 흐름 샘플
모델러 흐름 샘플
다음 이미지는 샘플 데이터 집합을 보여줍니다.
그림 2. 샘플 데이터 세트
샘플 데이터 세트

작업 1: 샘플 프로젝트 열기

샘플 프로젝트에는 여러 데이터 세트와 샘플 모델러 흐름이 포함되어 있습니다. 샘플 프로젝트가 아직 없다면, 튜토리얼 항목을 참고하여 샘플 프로젝트를 만드십시오. 그런 다음 다음 단계에 따라 샘플 프로젝트를 엽니다:

  1. watsonx탐색 메뉴 ( 탐색 메뉴 )에서 프로젝트(Projects) > 모든 프로젝트 보기(View all Projects)를 선택합니다.
  2. SPSS Modeler 프로젝트를 클릭합니다.
  3. 자산 탭을 클릭하면 데이터 세트와 모델러 흐름을 볼 수 있습니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 프로젝트 자산 탭을 보여줍니다. 이제 이 튜토리얼과 관련된 샘플 모델러 플로우로 작업할 준비가 되었습니다.

샘플 프로젝트

맨 위로 돌아가기

작업 2: 데이터 자산 및 유형 노드 살펴보기

카탈로그 판매 예측에는 여러 노드가 포함됩니다. 데이터 자산유형 노드를 검토하려면 다음 단계를 따르세요:

  1. 자산 탭에서 카탈로그 판매 예측 모델러 흐름을 열고 캔버스가 로드될 때까지 기다립니다.
  2. catalog_seasfac.csv 노드를 더블클릭합니다. 이 노드는 프로젝트의 catalog_seasfac.csv 파일을 가리키는 데이터 에셋 노드입니다.
  3. 파일 형식 속성을 검토합니다.
  4. 선택 사항입니다: 데이터 미리 보기를 클릭하여 전체 데이터 집합을 확인합니다.
  5. 유형 노드를 두 번 클릭합니다.
    1. 값 읽기를 클릭합니다.
    2. 남성 필드의 경우 역할이 Target으로 설정되어 있는지 확인합니다.
    3. 다른 모든 필드의 역할이 없음으로 설정되어 있는지 확인합니다.
    4. 저장 을 클릭하십시오.
  6. 선택 사항입니다: 데이터 미리 보기를 클릭하여 필터링된 데이터 집합을 확인합니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 Type 노드를 보여줍니다. 이제 데이터를 시각화할 준비가 되었습니다.

유형 노드

맨 위로 돌아가기

작업 3: 데이터 시각화

시간 플롯 노드를 사용하여 데이터를 시각화하려면 다음 단계를 따르세요:

  1. 시간 플롯 노드를 추가합니다:
    1. 노드 팔레트에서 그래프 섹션을 펼칩니다.
    2. 시간 플롯 노드를 캔버스로 드래그합니다.
    3. 유형 노드를 새 시간 플롯 노드에 연결합니다.
  2. 시간 플롯 노드를 두 번 클릭하여 해당 속성을 설정합니다.
    1. 시리즈 섹션에서 열 추가를 클릭합니다.
    2. 남성 필드를 선택합니다.
    3. 확인을 클릭하십시오.
    4. 사용자 지정 X축 필드 레이블 사용을 선택합니다.
    5. X축 레이블에서 날짜를 선택합니다.
    6. 정규화 옵션의 선택을 취소합니다.
    7. 저장 을 클릭하십시오.
  3. ' '[남성] v 위로 마우스를 가져갑니다. 날짜 노드를 선택하고 실행 아이콘 실행 아이콘 을 클릭합니다.
  4. 출력 및 모델 창에서 ' [men] v라는 이름의 결과를 클릭합니다. 날짜 입력하면 그래프를 볼 수 있습니다.

    계열은 일반 상향 추세를 표시합니다. 즉, 계열 값은 시간이 지나면서 증가하는 추세가 있습니다. 상향 추세는 일정한 것으로 보이며 선형 추세를 나타냅니다.

    계열 또한 그래프의 세로선에 의해 표시된 대로 매년 12월에 높아지는 뚜렷한 계절 패턴을 보입니다. 계절 변동은 상향 계열 추세와 함께 증가하는 것으로 보이며 이는 가법 계절성보다 승법 계절성을 제안합니다.

    이제 계열의 공정특성 변수를 식별했으므로 모델링을 시도할 준비가 되었습니다. 지수평활 방법은 추세, 계절성 또는 모두를 나타내는 계열의 시계열 분석에 유용합니다. 앞서 살펴본 바와 같이 이 데이터는 두 가지 특성을 모두 나타냅니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 그래프를 보여줍니다. 이제 모델을 구축할 준비가 되었습니다.

시간 도표 그래프

맨 위로 돌아가기

작업 4: 모델 구축

최적 맞춤 지수평활 모델 작성은 모델 유형(모델에 추세, 계절성 또는 둘 다를 포함시켜야 하는지 여부)을 판별하고 선택된 모델에 대한 최적 맞춤 매개변수를 얻는 것과 연관됩니다.

시간 경과에 따른 남성 의류 판매 도표에서는 선형 추세 구성요소 및 승법 계절성 구성요소 둘 다 있는 모델을 제안합니다. 이는 Winters 모델을 암시합니다. 먼저 단순 모델(추세 및 계절성 없음)을 살펴본 다음 홀트 모델(선형 추세는 포함하지만 계절성은 없음)을 살펴봅니다. 이는 모델이 데이터에 적합하지 않음을 식별하는 방법 및 성공적인 모델 빌드의 필수 기술에 대해 연습할 수 있게 해줍니다.

간단한 지수 평활 모델을 구축하려면 다음 단계를 따르세요:

  1. 남성(시계열 ) 노드를 두 번 클릭하여 해당 속성을 확인합니다.
  2. 관찰 및 시간 간격 섹션을 펼치고 이러한 속성을 설정합니다:
    1. 시간/날짜가 날짜로 설정되어 있는지 확인합니다.
    2. 시간 간격이 월로 설정되어 있는지 확인합니다.
  3. 빌드 옵션 - 일반 섹션을 확장하고 이러한 속성을 설정합니다:
    1. 메서드가 지수 평활화로 설정되어 있는지 확인합니다.
    2. 모델 유형이 단순으로 설정되어 있는지 확인합니다.
  4. 저장 을 클릭하십시오.
  5. 모두 실행( 실행 아이콘 )을 클릭하십시오.
  6. 출력 및 모델 창에서 ' 이라는 이름의 출력 결과인 [men $TS-men] v의 시간 플롯을 클릭합니다. 날짜 입력하면 그래프를 볼 수 있습니다.
    men 도표는 실제 데이터를 표시하는 반면 $TS-men은 시계열 모델을 나타냅니다.
    그림 3. 단순 지수평활 모델
    단순 지수평활 모델

    단순 모델은 실제로 무겁다고도 할 수 있는 점진적인 상향 추세를 나타내나 계절성은 고려하지 않습니다. 이 모델을 거부하는 것이 안전합니다.

    이제 홀트의 선형 모델을 사용해 보세요. 이 모델은 적어도 단순 모델보다는 추세를 더 잘 모델링할 수 있지만 계절성을 포착할 가능성은 낮습니다.

  7. 남성(시계열 ) 노드를 두 번 클릭하고 이러한 속성을 설정합니다:
    1. 빌드 옵션 - 일반 섹션을 펼칩니다.
    2. 모델 유형을 홀트 선형 추세로 설정합니다.
    3. 저장 을 클릭하십시오.
  8. 모두 실행( 실행 아이콘 )을 클릭하십시오.
  9. 출력 및 모델 창에서 ' 이라는 이름의 출력 결과인 [men $TS-men] v의 시간 플롯을 클릭합니다. 날짜 입력하면 그래프를 볼 수 있습니다.

    Holt 모델은 단순한 모델보다 더 부드러운 상향 추세를 보이지만, 계절성을 고려하지 않고 있기 때문에 이를 무시할 수 있습니다.

    그림 4. Holt 선형 추세 모델
    Holt 선형 추세 모델

    초기의 시간 경과에 따른 남성 의류 판매 도표에서 선형 추세 및 승법 계절성을 통합한 모델을 제안했음을 기억할 것입니다. 따라서 더 적합한 후보는 Winters 모델일 수 있습니다.

  10. 남성(시계열 ) 노드를 두 번 클릭하고 이러한 속성을 설정합니다:
    1. 빌드 옵션 - 일반 섹션을 펼칩니다.
    2. 모델 유형을 윈터스의 승수로 설정합니다.
    3. 저장 을 클릭하십시오.
  11. 모두 실행( 실행 아이콘 )을 클릭하십시오.
  12. 출력 및 모델 창에서 ' 이라는 이름의 출력 결과인 [men $TS-men] v의 시간 플롯을 클릭합니다. 날짜 입력하면 그래프를 볼 수 있습니다.

    더 나아 보입니다. 모델은 데이터의 추세 및 계절성을 모두 반영합니다. 데이터 세트는 10년 간의 기간을 포함하고 각 연도의 12월에 발생하는 계절 정점을 포함합니다. 예측 결과에 있는 10개의 정점은 실제 데이터의 10개의 연간 정점과 잘 일치됩니다.

    그러나 이 결과는 지수평활 프로시저의 제한사항을 강조하기도 합니다. 위와 아래 스파이크를 모두 살펴보면, 설명되지 않은 중요한 구조가 있습니다.

    주로 계절 변동이 있는 장기 추세를 모델링하는 데 관심이 있는 경우 지수평활은 좋은 선택이 될 수 있습니다. 이와 같이 더 복잡한 구조를 모델링하려면 ARIMA 절차를 사용하는 것을 고려해야 합니다.

    그림 5. Winters의 승법 모델
    Winters의 승법 모델

체크포인트 아이콘 진행 상황 확인

다음 이미지는 플로우를 보여줍니다. 이제 ARIMA 모델을 구축할 준비가 되었습니다.

출력 및 모델 창

맨 위로 돌아가기

작업 5: ARIMA 모델 구축

ARIMA 프로시저를 통해 시계열의 미세 조정된 모델링에 적합한 ARIMA(Autoregressive Integrated Moving-Average) 모델을 작성할 수 있습니다.

ARIMA 모델은 지수평활 모델을 수행하는 모델링 추세 및 계절 성분에 대해 보다 정교한 방법을 제공하며 모델의 예측변수를 포함할 수 있는 혜택을 추가했습니다.

예측 모델을 개발하려는 카탈로그 회사의 예를 계속 이어서, 이 회사가 남성 의류의 월별 판매량 데이터를 수집하고 판매량 변화를 설명하는 데 사용할 수 있는 몇 가지 시리즈를 수집하는 방법을 살펴보았습니다. 가능한 예측변수에는 우편으로 발송된 카탈로그의 수, 카탈로그의 페이지 수, 주문할 수 있는 개통된 전화 회선 수, 인쇄 광고에 사용된 금액 및 고객 서비스 담당자의 수 등이 있습니다.

이러한 예측변수 중 어느 것이 예측에 유용합니까? 예측변수가 있는 모델이 예측변수가 없는 모델보다 실제로 더 낫습니까? ARIMA 절차를 사용하여 예측자가 있는 예측 모델을 만들고 예측자가 없는 지수 평활 모델에 비해 예측 능력에 유의미한 차이가 있는지 확인할 수 있습니다.

ARIMA 방법을 사용하면 자동 회귀, 차분, 이동 평균의 순서를 지정하고 이러한 구성 요소에 대한 계절별 대응을 지정하여 모델을 미세 조정할 수 있습니다. 이러한 구성 요소에 대한 최적의 값을 수동으로 결정하는 것은 많은 시행착오를 수반하는 시간이 많이 소요되는 프로세스이므로 이 예제에서는 전문가 모델러가 ARIMA 모델을 선택하도록 지정합니다.

다음으로, 데이터 집합의 다른 변수 중 일부를 예측 변수로 처리하여 더 나은 모델을 구축합니다. 예측변수로 포함하는 데 가장 유용한 것으로 보이는 것은 우편으로 발송된 카탈로그의 수(mail), 카탈로그의 페이지 수(page), 주문할 수 있는 개통된 전화 회선 수(phone), 인쇄 광고에 사용된 금액(print) 및 고객 서비스 담당자(service) 수입니다.

다음 단계에 따라 ARIMA 모델을 구축하세요:

  1. 유형 노드를 두 번 클릭하여 해당 속성을 설정합니다.
    1. 메일, 페이지, 전화, 인쇄서비스 필드에 대한 역할이 입력으로 설정되어 있는지 확인합니다.
    2. 남성의 역할이 Target 으로 설정되어 있는지 확인합니다.
    3. 나머지 모든 필드의 역할을 없음으로 설정합니다.
    4. 저장 을 클릭하십시오.
  2. 남성(시계열 ) 노드를 두 번 클릭하고 이러한 속성을 설정합니다:
    1. 빌드 옵션 - 일반 섹션을 펼칩니다.
    2. 메서드를 전문가 모델러로 설정합니다.
    3. 모델 유형을 ARIMA 모델 전용으로 설정합니다.
    4. 전문 모델러가 계절별 모델을 고려합니다 옵션을 선택합니다.
      그림 6. 아리마 모델만 선택
      아리마 모델만 선택
    5. 저장 을 클릭하십시오.
  3. 모두 실행( 실행 아이콘 )을 클릭하십시오.
  4. 출력 및 모델 창에서 남자라는 이름의 모델을 클릭하여 모델 세부 정보를 확인합니다.
    1. 모델 페이지의 대상 열에서 남성을 클릭합니다.
    2. 모델 정보 페이지를 클릭합니다. 자동 모델 생성기가 다섯 개의 지정된 예측변수 중 두 개만 모델에 중요한 것으로 선택한 방법에 주목하십시오.
      그림 7. Expert Modeler에서 두 개의 예측변수 선택
      Expert Modeler에서 두 개의 예측변수 선택
    3. 두 개의 모델 창을 닫습니다.
  5. 출력 및 모델 창에서 ' 이라는 이름의 출력 결과인 [men $TS-men] v의 시간 플롯을 클릭합니다. 날짜 입력하면 그래프를 볼 수 있습니다.

    이 모델은 큰 아래쪽 말뚝표시를 캡처하고 이를 지금까지의 최적 맞춤으로 작성하여 이전 모델을 개선했습니다.

    그림 8. 예측변수가 지정된 ARIMA 모델
    예측변수가 지정된 ARIMA 모델

    그런 다음 모델을 더욱 세분화할 수 있지만 이 시점에서의 개선은 미미할 가능성이 높습니다. 예측 변수가 있는 ARIMA 모델이 더 바람직하다는 것을 확인했으므로 이 모델을 사용하여 내년도 매출을 예측하세요.

  6. 그래프 창을 닫습니다.
  7. 남성(시계열 ) 노드를 두 번 클릭하고 이러한 속성을 설정합니다:
    1. 모델 옵션 섹션을 펼칩니다.
    2. 레코드를 향후로 확장 옵션을 선택하고 값을 ' 12'로 설정합니다.
    3. 입력의 미래 값 계산 옵션을 선택하십시오.
    4. 저장 을 클릭하십시오.
  8. 모두 실행( 실행 아이콘 )을 클릭하십시오.
  9. 출력 및 모델 창에서 ' 이라는 이름의 출력 결과인 [men $TS-men] v의 시간 플롯을 클릭합니다. 날짜 입력하면 그래프를 볼 수 있습니다.

    이 예측은 양호한 것으로 보입니다. 예상대로 12월 정점을 찍은 후 정상적인 매출 수준으로 돌아섰고, 하반기에는 전반적으로 전년도보다 나은 매출로 꾸준한 상승 추세를 보이고 있습니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 ARIMA 모델을 사용한 그래프입니다.

시간 도표 그래프

맨 위로 돌아가기

요약

상향 추세뿐만 아니라 계절 및 기타 변형을 통합하여 복잡한 시계열을 성공적으로 모델링했습니다. 또한 시행착오를 통해 정확한 모델에 더 가깝게 접근할 수 있으며 이를 통해 향후 판매를 예측할 수 있습니다.

실제로는 실제 판매 데이터가 업데이트될 때마다(예: 매월 또는 분기마다) 모델을 다시 적용하고 업데이트된 예측을 생성해야 합니다.

다음 단계

이제 다른 SPSS® Modeler 튜토리얼을 시도해 볼 준비가 되었습니다.