0 / 0
영어 버전 문서로 돌아가기
Data Refinery에서 데이터 시각화
마지막 업데이트 날짜: 2024년 10월 07일
Data Refinery에서 데이터 시각화

그래픽으로 정보를 시각화하여 데이터에 대한 통찰력을 제공합니다. 데이터를 시각화하고 변경사항을 확인하는 동안 Data Refinery 플로우에 단계를 추가할 수 있습니다. 시각화를 사용하여 다른 퍼스펙티브에서 데이터를 탐색하면 해당 데이터 내에서 패턴, 연결 및 관계를 식별하고 많은 양의 정보를 신속하게 이해할 수 있습니다.

또한 SPSS Modeler 플로우에서 이러한 동일한 차트를 사용하여 데이터를 시각화할 수도 있습니다. 노드 팔레트의 그래프 섹션에서 사용 가능한 차트 노드를 사용하십시오. 차트 노드를 두 번 클릭하여 특성 분할 창을 여십시오. 그런 다음 차트 작성기 실행을 클릭하여 차트 빌더를 열고 노드와 연관시킬 하나 이상의 차트 정의를 작성하십시오.

차트 예시

데이터를 시각화하려면 다음을 수행하십시오.

  1. Data Refinery에서 시각화 탭을 클릭하십시오.
  2. 차트로 시작하거나 열을 선택하십시오.
  • 사용 가능한 차트를 클릭하십시오. 그런 다음, 페이지의 왼쪽에 열리는 세부 사항 분할창에 열을 추가하십시오.
  • 작업하려는 열을 선택하십시오. 제안된 차트는 챠트 이름 옆에 점으로 표시됩니다. 데이터를 시각화할 차트를 클릭하십시오.
중요: 사용 가능한 차트 유형은 선택한 열에 따라 관련성이 가장 높은 순서부터 가장 낮은 순서로 정렬됩니다. 차트 유형에 지원되는 데이터 유형을 가진 열이 데이터 세트에 없는 경우 해당 차트는 사용할 수 없습니다. 차트에 대해 열의 데이터 유형이 지원되지 않는 경우 해당 열은 해당 차트의 선택에 사용할 수 없습니다. 차트 이름 옆에 있는 용량은 데이터에 가장 적합한 차트를 제안합니다.

차트

다음 차트가 포함됩니다.

  • 3D 차트는 3D 효과를 만들기 위해 각 열을 직육면체로 그려서 3-D 좌표계로 데이터를 표시합니다.

  • 막대 도표는 데이터 범주를 나란히 표시하고 비교하는 데 유용합니다. 막대는 임의의 순서일 수 있습니다. 또한 높음에서 낮음 또는 낮음에서 높음으로 배열할 수도 있습니다.

  • 상자 도표는 많은 그룹 또는 데이터 세트 간의 분포를 비교합니다. 데이터 그룹의 변동을 표시합니다. 데이터의 분산과 왜곡 및 이상치입니다.

  • 거품형 도표에서는 그룹의 각 범주를 하나의 거품 모양으로 표시합니다.

  • 캔들스틱 차트는 유가증권, 파생 상품 또는 통화의 가격 변동을 표시하는 재무 차트 유형입니다.

  • 원 채우기 도표에서는 계층 구조 데이터를 중첩 영역 세트로 표시합니다.

  • 사용자 정의 차트는 JSON 입력을 기반으로 차트를 렌더링하는 기능을 제공합니다.

  • 이중 Y축 도표에서는 두 개의 Y축 변수를 사용하여 데이터 사이의 관계를 표시합니다.

  • 오차 막대는 값에서 오차 또는 불확실성을 나타냅니다. 이는 값이 얼마나 정밀한지 또는 그 반대인지, 값이 원래 값에서 얼마나 멀리 떨어져 있는지를 알 수 있게 합니다.

  • 평가 차트는 2진 분류자의 품질을 측정하는 조합 차트입니다. 입력에 대해서는 실제(대상) 값, 예측 값, 신뢰성(0 또는 1)의 입력용 세 열이 필요합니다. 차단(Cutoff) 차트의 슬라이더를 이동하여 다른 차트를 동적으로 업데이트하십시오. ROC 및 기타 차트는 분류자의 표준 측정입니다.

  • 히트맵 차트는 활동 레벨이나 밀도를 전달하기 위해 색으로 데이터를 표시합니다. 일반적으로 낮은 값은 시원한 색으로 표시되고 높은 값은 따뜻한 색으로 표시됩니다.

  • 히스토그램 차트는 데이터의 빈도 분포를 보여줍니다.

  • 선형 차트는 다른 열의 각 값에 대해 한 열에 대한 요약 통계를 계산한 다음 값을 연결하는 선을 그려 시간 경과에 따른 데이터의 추세를 보여줍니다.

  • 지도 차트는 지리적 위치 데이터를 보여주므로 여러 지역에 걸쳐 값을 비교하고 카테고리를 표시합니다.

  • 수학 곡선 차트는 사용자가 입력하는 방정식을 기반으로 곡선 그룹을 표시합니다. 이 차트의 데이터 세트는 사용하지 마십시오. 대신 이를 사용하여 다른 차트(예: 산점도 차트)의 데이터 세트와 결과를 비교합니다.

  • 멀티 차트는 막대, 선, 원형 및 분산형 플롯 차트의 최대 네 가지 조합을 표시합니다. 다른 데이터로 동일한 유형의 차트를 두 번 이상 표시할 수 있습니다. 예를 들어, 서로 다른 열의 데이터를 사용하는 두 개의 원형 차트입니다.

  • 다중 계열 차트는 직선 또는 막대로 연결되는 일련의 점으로 여러 데이터 세트 또는 여러 열의 데이터를 표시합니다.

  • 평행 좌표 차트는 데이터 행(프로파일이라고 함)을 표시하고 비교하여 유사성을 찾습니다. 각 행은 선이며 행의 각 열 값은 해당 선에 대한 포인트로 표시됩니다.

  • 원형 차트는 비율을 보여줍니다. 일련의 각 값은 원의 비례 슬라이스로 표시됩니다. 원은 값의 총계를 나타냅니다.

  • 인구 피라미드 도표에서는 범주 전체에서 변수의 빈도 분포를 보여줍니다. 일반적으로 인구 데이터 변화를 보여주는 데 사용합니다.

  • Q-Q(Quantile-quantile) 플롯 차트는 분위수(Quantile)를 플로팅하여 예상 분포 값을 관측 값과 비교합니다.

  • 레이터 차트는 축(반경)으로 표시되는 3개 이상의 정량 변수를 단일 방사형 그림으로 통합합니다. 데이터는 각 축에 표시되고 선을 연결하여 인접한 축에 결합됩니다. 레이더 차트는 상관 관계를 표시하고 분류된 데이터를 비교하는 데 유용합니다.

  • 관계 도표는 데이터 열과 다른 데이터 열의 관련 정도를 보여주며 다양한 선 유형을 사용하여 해당 관계의 강도를 보여줍니다.

  • 산점행렬도 차트는 열을 서로 맵핑하고 산포된 점과 상관관계를 표시합니다. 여러 열을 비교하고 서로의 상관관계가 얼마나 강력한지 알려는 경우에 사용하십시오.

  • 산점도는 두 열의 값을 표시하고 비교하여 상관관계(한 변수가 다른 변수에 영향을 주는 정도)를 보여줍니다.

  • 선버스트 차트는 계층이 있는 원형 차트와 유사하며 다른 카테고리의 다른 비율이 여러 레벨로 한 번에 표시됩니다.

  • 테마 강 차트는 시간에 따른 변경사항을 표시하는 특수한 플로우 그래프를 사용합니다.

  • 시간 도표에서는 연속된 시간 간격으로 데이터 포인트를 표시합니다.

  • t-SNE 도표는 고차원 데이터 세트를 시각화합니다. 이 도표는 고차원 데이터를 둘 이상의 차원에 있는 공간에 삽입하는 데 유용하며, 산점도로 시각화할 수 있습니다.

  • 트리 차트는 데이터를 다른 분기로 카테고리화하여 분리해서 계층 구조로 표시합니다. 다른 카테고리 아래에 있는 다른 데이터 세트를 정렬할 때 사용하십시오. 트리 차트는 루트 노드, 멤버 사이의 관계 및 연결을 보여주는 분기라고 하는 선 연결, 하위 노드가 포함되지 않은 리프 노드로 구성됩니다.

  • 나무 지도 도표에서는 계층 구조 데이터를 중첩 영역 세트로 표시합니다. 이를 사용하여 그룹과 그룹에 중첩된 단일 요소 간의 크기를 비교합니다.

  • 단어 클라우드 도표는 각 단어의 크기를 빈도에 비례하도록 설정하여 텍스트에 나타나는 단어의 빈도를 표시합니다.

조치

다음 조치를 수행할 수 있습니다.

  • 시작하기: 시각화 및 세부 사항 분할창을 지우고 시각화를 위한 시작 페이지로 리턴합니다.

  • 필드 값 또는 필드 레이블 표시 여부를 지정하십시오. 이 옵션은 레이블 정의 시 SPSS Modeler에만 적용됩니다. 예를 들어, "성별" 필드가 있고 값이 0인 레이블을 여성으로 정의한 경우 값 1의 레이블을 표시합니다. 레이블이 정의되지 않은 경우 값이 표시됩니다.

  • 시각화 다운로드:

    • 차트 이미지 다운로드: 현재 차트의 이미지가 포함된 PNG 파일을 다운로드합니다.

    • 차트 세부사항 다운로드: 현재 차트에 대한 세부사항이 포함된 JSON 파일을 다운로드합니다.

  • 모든 차트에 적용되는 글로벌 환경 설정 설정

차트 조치

사용 가능한 차트 조치는 차트에 따라 다릅니다. 차트 조치는 다음과 같습니다.

  • 확대/축소

  • 복원: 차트를 보통 크기로 봅니다.

  • 데이터 선택: 차트에서 선택한 데이터를 데이터 탭에서 강조표시합니다.

  • 선택 취소: 데이터 탭에서 데이터 강조표시를 지웁니다.

자세한 정보

데이터 시각화 - 올바른 차트 유형 선택 방법

상위 주제: 데이터 정제

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기