0 / 0
영어 버전 문서로 돌아가기
Data Refinery의 대화식 코드 템플리트
마지막 업데이트 날짜: 2024년 10월 04일
Data Refinery의 대화식 코드 템플리트

Data Refinery는 오퍼레이션, 함수 및 논리 연산자를 코딩하기 위한 대화식 템플리트를 제공합니다. 페이지 맨 위의 명령행 텍스트 상자에 있는 템플리트에 액세스하십시오. 이 템플리트에는 구문 옵션으로 사용자를 돕는 대화식 지원이 포함되어 있습니다.

중요: 지원은 사용자 인터페이스의 조작 및 기능에 대한 것입니다. 오픈 소스 라이브러리에서 다른 오퍼레이션이나 함수를 삽입하면 Data Refinery 플로우가 실패할 수 있습니다. 명령행 도움말을 참조하여 템플리트의 오퍼레이션 또는 함수 목록을 사용해야 합니다. 필요에 따라 추가로 구문을 사용자 정의하려면 템플리트의 예제를 사용하십시오.

조작

배열

배열 (`<column>`)
지정된 컬럼별로 행을 오름차순으로 정렬합니다.

정렬 (desc (`<column>`))
지정된 열을 기준으로 내림차순으로 행을 정렬합니다.

정렬 (`<column>`, `<column>`)
행을 지정된 각 연속 열별로 오름차순으로 정렬하여 이전 정렬의 순서를 그대로 유지합니다.

count ()
그룹별 데이터 총계입니다.

count (`<column>`)
지정된 컬럼으로 데이터를 그룹화하고 고유 값 (문자열 값의 경우) 이 있는 행 수를 리턴하거나 각 그룹의 총계 (숫자 값의 경우) 를 리턴합니다.

count (`<column>`, wt= `<column>`)
지정된 열별로 데이터를 그룹화하고 고유 값 (문자열 값의 경우) 이 있는 행 수를 리턴하거나 지정된 가중치 열에서 각 그룹 (숫자 값의 경우) 에 대한 총계를 리턴합니다.

count (`<column>`, wt=<func>(`<column>`))
지정된 열로 데이터를 그룹화하고 지정된 가중치 열에 적용된 함수의 결과를 리턴합니다.

count (`<column>`, wt=<func>(`<column>`), sort = <logical>)
지정된 열로 데이터를 그룹화하고 지정된 가중치 열에 적용된 함수의 결과를 정렬되거나 정렬되지 않은 상태로 리턴합니다.

구별

distinct ()
모든 컬럼 또는 지정된 컬럼을 기반으로 구별되는 고유 행을 유지합니다.

필터

filter (`<column>` <logicalOperator> provide_value)
지정된 조건을 충족하는 행을 유지하고 다른 모든 행을 필터링합니다.
부울 열 유형의 경우 provide_value는 대문자 TRUE 또는 FALSE여야 합니다.

filter (`<column>` == <logical>)
논리 값 TRUE 또는 FALSE를 기반으로 지정된 필터 조건을 충족하는 행을 유지합니다.

filter (<func>(`<column>`) <logicalOperator> provide_value)
지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다. 조건은 연산자의 왼쪽에 있는 열에 함수를 적용할 수 있습니다.

filter (`<column>` <logicalOperator> <func(column)>)
지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다. 조건은 연산자의 오른쪽에 있는 열에 함수를 적용할 수 있습니다.

filter (<logicalfunc(column)>)
지정된 조건을 충족하는 행을 유지하고 다른 모든 행을 필터링합니다. 조건은 논리 함수를 열에 적용할 수 있습니다.

filter (`<column>` <logicalOperator> provide_value <andor> `<column>` <logicalOperator> provide_value)
지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다.

group_by

group_by (`<column>`)
지정된 컬럼을 기반으로 데이터를 그룹화합니다.

group_by (desc (`<column>`))
지정된 컬럼을 기반으로 내림차순으로 데이터를 그룹화합니다.

mutate

mutate (provide_new_column = `<column>`)
새 열을 추가하고 기존 열을 유지합니다.

mutate (provide_new_column = <func(column)>)
함수를 열에 적용하는 지정된 표현식을 사용하여 새 열을 추가합니다. 기존 열 유지

mutate (provide_new_column = case_when (`<column>` <operator> provide_value_or_column_to_compare~provide_value_or_column_to_replace, `<column>` <operator> provide_value_or_column_to_compare~provide_value_or_column_to_replace, TRUE~provide_default_value_or_column))
지정된 조건식을 사용하여 새 열을 추가합니다.

mutate (provide_new_column = `<column>` <operator> `<column>`)
기존 열로 계산을 수행하는 지정된 표현식을 사용하여 새 열을 추가합니다. 기존 열 유지

mutate (provide_new_column = coalesce (`<column>`, `<column>`))
지정된 표현식을 사용하여 새 열의 누락된 값을 다른 지정된 열의 값으로 대체하는 새 열을 추가합니다. 다른 열을 지정하는 대신 값, 열의 함수 또는 값에 대한 함수를 지정할 수 있습니다. 기존 열 유지

mutate (provide_new_column = if_else (`<column>` <logicalOperator> provide_value, provide_value_for_true, provide_value_for_false))
지정된 조건식을 사용하여 새 열을 추가합니다. 기존 열 유지

mutate (provide_new_column = `<column>`, provide_new_column = `<column>`)
여러 개의 새 열을 추가하고 기존 열을 유지합니다.

mutate (provide_new_column = n ())
그룹의 값을 계산합니다. 그룹화가 이미 group_by를 사용하여 수행되었는지 확인합니다. 기존 열 유지

mutate_all

mute_all (funs (<func>))
지정된 함수를 모든 열에 적용하고 해당 열의 기존 값을 겹쳐씁니다. 누락된 값을 제거할지 여부를 지정하십시오.

mute_all (funs (. <operator> provide_value))
지정된 연산자를 모든 열에 적용하고 해당 열의 기존 값을 겹쳐쓰십시오.

mute_all (funs ("provide_value" =. <operator> provide_value))
지정된 연산자를 모든 열에 적용하고 결과를 보유할 새 열을 작성하십시오. 지정된 값으로 끝나는 새 열 이름을 지정하십시오.

mutate_at

mute_at (vars (`<column>`), funs (<func>))
지정된 열에 함수를 적용합니다.

mutate_if

mute_if (<predicateFunc>, <func>)
지정된 조건을 충족하는 열에 함수를 적용합니다.

mute_if (<predicateFunc>, funs (. <operator> provide_value))
지정된 조건을 충족하는 컬럼에 지정된 연산자를 적용하십시오.

mute_if (<predicateFunc>, funs (<func>))
지정된 조건을 충족하는 열에 함수를 적용합니다. 누락된 값을 제거할지 여부를 지정하십시오.

이름 바꾸기

rename (provide_new_column = `<column>`)
지정된 컬럼의 이름을 바꾸십시오.

sample_frac

sample_frac (provide_number_between_0_and_1, weight= `<column>`, replace=<logical>)
데이터의 백분율을 기반으로 무작위 샘플을 생성하십시오. 가중치는 선택사항이고 행이 선택될 가능성을 비율로 나타냅니다. 숫자 열을 제공하십시오. 대체는 선택사항이고 해당 기본값은 FALSE입니다.

sample_n

sample_n (provide_number_of_rows, weight = `<column>`, replace=<logical>)
행 수에 따라 무작위 데이터 샘플을 생성합니다. 가중치는 선택사항이고 행이 선택될 가능성을 비율로 나타냅니다. 숫자 열을 제공하십시오. 대체는 선택사항이고 해당 기본값은 FALSE입니다.

선택

select (`<column>`)
지정된 컬럼을 유지합니다.

select (-`<column>`)
지정된 컬럼을 제거합니다.

select (starts_with ("provide_text_value"))
지정된 값으로 시작하는 이름으로 열을 유지합니다.

select (ends_with ("provide_text_value"))
열에 지정된 값으로 끝나는 이름을 유지하십시오.

select (contains ("provide_text_value"))
지정된 값을 포함하는 이름으로 열을 유지합니다.

select (matches ("provide_text_value"))
지정된 값과 일치하는 이름으로 열을 유지합니다. 지정된 값은 텍스트 또는 정규식일 수 있습니다.

select (`<column>`: `<column>`)
열을 지정된 범위로 유지합니다. 한 열에서 다른 열로 범위를 지정하십시오.

select (`<column>`, all ())
모든 컬럼을 보존하지만 지정된 컬럼을 첫 번째 컬럼으로 만듭니다.

select (`<column>`, `<column>`)
지정된 컬럼을 유지합니다.

select_if

select_if(<predicateFunc>) 지정된 조건을 충족하는 열을 보관합니다. 지원되는 함수는 다음과 같습니다.

  • 이(가) 다음 포함
  • ends_with
  • 일치
  • num_range
  • starts_with

요약

요약 (provide_new_column = <func>(`<column>`))
지정된 열에 집계 함수를 적용하여 여러 열 값을 단일 값으로 줄이십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.

summarize_all

summarize_all (<func>)
모든 컬럼에 집계 함수를 적용하여 여러 컬럼 값을 단일 값으로 줄이십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.

summarize_all (funs (<func>))
여러 집계 함수를 모든 컬럼에 적용하여 여러 컬럼 값을 단일 값으로 줄이십시오. 결과를 보유할 새 열을 작성하십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.

summarize_if

summarize_if(<predicate_conditions>,...)
지정된 조건을 충족하는 열에 집계 함수를 적용하여 다중 열 값을 단일 값으로 줄이십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오. 지원되는 함수는 다음과 같습니다.

  • 최대
  • 평균
  • 표준 편차
  • 합계

집계하다

tally ()
행 수 (문자열 컬럼의 경우) 를 계산하거나 그룹별로 데이터 총계 (숫자 값의 경우) 를 계산합니다. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.

tally (wt = `<column>`)
가중 열에 대해 그룹별로 행 수 (문자열 열의 경우) 또는 데이터 총계 (숫자 열의 경우) 를 계산합니다.

tally (wt=<func>(`<column>`), sort = <logical>)
지정된 가중치 열에 함수를 적용하고 결과를 그룹별로 정렬하거나 정렬하지 않고 리턴합니다.

top_n

top_n (provide_value)
각 그룹에서 맨 위 또는 맨 아래 N개행 (값 기준) 을 선택하십시오. 상위 N행을 선택하려면 양의 정수를 지정하십시오. 하위 N행을 선택하려면 음의 정수를 지정하십시오.

top_n (provide_value, `<column>`)
지정된 열을 기반으로 각 그룹에서 맨 위 또는 맨 아래 N개행 (값 기준) 을 선택하십시오. 상위 N행을 선택하려면 양의 정수를 지정하십시오. 하위 N행을 선택하려면 음의 정수를 지정하십시오.

중복 행이 계수에 영향을 주는 경우 top_n() 조작을 사용하기 전에 중복 제거 GUI 조작을 사용하십시오.

transmute

transmute (<new_or_existing_column> = `<column>`)
지정된 표현식을 사용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.

transmute (<new_or_existing_column> = <func(column)>)
지정된 열에 함수를 적용하여 새 열을 추가하거나 기존 열을 겹쳐씁니다. 표현식에 언급된 열만 유지하십시오.

transmute (<new_or_existing_column> = `<column>` <operator> `<column>`)
지정된 열에 연산자를 적용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.

transmute (<new_or_existing_column> = `<column>`, <new_or_existing_column> = `<column>`)
여러 개의 새 열을 추가합니다. 표현식에 언급된 열만 유지하십시오.

transmute (<new_or_existing_column> = if_else (provide_value, provide_value_for_true, provide_value_for_false))
지정된 조건식을 사용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.

그룹 해제

ungroup ()
데이터를 그룹 해제합니다.

함수

통합

  • 평균
  • n
  • sd
  • 합계

논리

  • is.na

수치형

  • abs
  • 통합
  • 지수
  • floor 함수

텍스트

  • c
  • 통합
  • 붙여넣기
  • tolower
  • toupper

유형

  • as.character
  • as.double
  • as.integer
  • as.logical

논리 연산자

  • <
  • <=
  • >=
  • >
  • 사이
  • !=
  • ==
  • %in%

상위 주제: 데이터 정제

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기