본 문서의 가장 정확하고 최신 버전은 영어(원본) 버전을 참조하십시오. IBM은 자동으로 기계 번역된 컨텐츠를 사용하여 발생하는 피해 또는 손실에 대해 책임을 지지 않습니다.
Data Refinery의 대화식 코드 템플리트
마지막 업데이트 날짜: 2024년 10월 04일
Data Refinery의 대화식 코드 템플리트
Data Refinery는 오퍼레이션, 함수 및 논리 연산자를 코딩하기 위한 대화식 템플리트를 제공합니다. 페이지 맨 위의 명령행 텍스트 상자에 있는 템플리트에 액세스하십시오. 이 템플리트에는 구문 옵션으로 사용자를 돕는 대화식 지원이 포함되어 있습니다.
중요: 지원은 사용자 인터페이스의 조작 및 기능에 대한 것입니다. 오픈 소스 라이브러리에서 다른 오퍼레이션이나 함수를 삽입하면 Data Refinery 플로우가 실패할 수 있습니다. 명령행 도움말을 참조하여 템플리트의 오퍼레이션 또는 함수 목록을 사용해야 합니다. 필요에 따라 추가로 구문을 사용자 정의하려면 템플리트의 예제를 사용하십시오.
정렬 (desc (`<column>`)) 지정된 열을 기준으로 내림차순으로 행을 정렬합니다.
정렬 (`<column>`, `<column>`) 행을 지정된 각 연속 열별로 오름차순으로 정렬하여 이전 정렬의 순서를 그대로 유지합니다.
수
Copy link to section
count () 그룹별 데이터 총계입니다.
count (`<column>`) 지정된 컬럼으로 데이터를 그룹화하고 고유 값 (문자열 값의 경우) 이 있는 행 수를 리턴하거나 각 그룹의 총계 (숫자 값의 경우) 를 리턴합니다.
count (`<column>`, wt= `<column>`) 지정된 열별로 데이터를 그룹화하고 고유 값 (문자열 값의 경우) 이 있는 행 수를 리턴하거나 지정된 가중치 열에서 각 그룹 (숫자 값의 경우) 에 대한 총계를 리턴합니다.
count (`<column>`, wt=<func>(`<column>`)) 지정된 열로 데이터를 그룹화하고 지정된 가중치 열에 적용된 함수의 결과를 리턴합니다.
count (`<column>`, wt=<func>(`<column>`), sort = <logical>) 지정된 열로 데이터를 그룹화하고 지정된 가중치 열에 적용된 함수의 결과를 정렬되거나 정렬되지 않은 상태로 리턴합니다.
구별
Copy link to section
distinct () 모든 컬럼 또는 지정된 컬럼을 기반으로 구별되는 고유 행을 유지합니다.
필터
Copy link to section
filter (`<column>` <logicalOperator> provide_value) 지정된 조건을 충족하는 행을 유지하고 다른 모든 행을 필터링합니다. 부울 열 유형의 경우 provide_value는 대문자 TRUE 또는 FALSE여야 합니다.
filter (`<column>` == <logical>) 논리 값 TRUE 또는 FALSE를 기반으로 지정된 필터 조건을 충족하는 행을 유지합니다.
filter (<func>(`<column>`) <logicalOperator> provide_value) 지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다. 조건은 연산자의 왼쪽에 있는 열에 함수를 적용할 수 있습니다.
filter (`<column>` <logicalOperator><func(column)>) 지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다. 조건은 연산자의 오른쪽에 있는 열에 함수를 적용할 수 있습니다.
filter (<logicalfunc(column)>) 지정된 조건을 충족하는 행을 유지하고 다른 모든 행을 필터링합니다. 조건은 논리 함수를 열에 적용할 수 있습니다.
filter (`<column>` <logicalOperator> provide_value <andor> `<column>` <logicalOperator> provide_value) 지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다.
group_by
Copy link to section
group_by (`<column>`) 지정된 컬럼을 기반으로 데이터를 그룹화합니다.
group_by (desc (`<column>`)) 지정된 컬럼을 기반으로 내림차순으로 데이터를 그룹화합니다.
mutate
Copy link to section
mutate (provide_new_column = `<column>`) 새 열을 추가하고 기존 열을 유지합니다.
mutate (provide_new_column = <func(column)>) 함수를 열에 적용하는 지정된 표현식을 사용하여 새 열을 추가합니다. 기존 열 유지
mutate (provide_new_column = case_when (`<column>` <operator> provide_value_or_column_to_compare~provide_value_or_column_to_replace, `<column>` <operator> provide_value_or_column_to_compare~provide_value_or_column_to_replace, TRUE~provide_default_value_or_column)) 지정된 조건식을 사용하여 새 열을 추가합니다.
mutate (provide_new_column = `<column>` <operator> `<column>`) 기존 열로 계산을 수행하는 지정된 표현식을 사용하여 새 열을 추가합니다. 기존 열 유지
mutate (provide_new_column = coalesce (`<column>`, `<column>`)) 지정된 표현식을 사용하여 새 열의 누락된 값을 다른 지정된 열의 값으로 대체하는 새 열을 추가합니다. 다른 열을 지정하는 대신 값, 열의 함수 또는 값에 대한 함수를 지정할 수 있습니다. 기존 열 유지
mutate (provide_new_column = if_else (`<column>` <logicalOperator> provide_value, provide_value_for_true, provide_value_for_false)) 지정된 조건식을 사용하여 새 열을 추가합니다. 기존 열 유지
mutate (provide_new_column = `<column>`, provide_new_column = `<column>`) 여러 개의 새 열을 추가하고 기존 열을 유지합니다.
mutate (provide_new_column = n ()) 그룹의 값을 계산합니다. 그룹화가 이미 group_by를 사용하여 수행되었는지 확인합니다. 기존 열 유지
mutate_all
Copy link to section
mute_all (funs (<func>)) 지정된 함수를 모든 열에 적용하고 해당 열의 기존 값을 겹쳐씁니다. 누락된 값을 제거할지 여부를 지정하십시오.
mute_all (funs (. <operator> provide_value)) 지정된 연산자를 모든 열에 적용하고 해당 열의 기존 값을 겹쳐쓰십시오.
mute_all (funs ("provide_value" =. <operator> provide_value)) 지정된 연산자를 모든 열에 적용하고 결과를 보유할 새 열을 작성하십시오. 지정된 값으로 끝나는 새 열 이름을 지정하십시오.
mutate_at
Copy link to section
mute_at (vars (`<column>`), funs (<func>)) 지정된 열에 함수를 적용합니다.
mutate_if
Copy link to section
mute_if (<predicateFunc>, <func>) 지정된 조건을 충족하는 열에 함수를 적용합니다.
mute_if (<predicateFunc>, funs (. <operator> provide_value)) 지정된 조건을 충족하는 컬럼에 지정된 연산자를 적용하십시오.
mute_if (<predicateFunc>, funs (<func>)) 지정된 조건을 충족하는 열에 함수를 적용합니다. 누락된 값을 제거할지 여부를 지정하십시오.
이름 바꾸기
Copy link to section
rename (provide_new_column = `<column>`) 지정된 컬럼의 이름을 바꾸십시오.
sample_frac
Copy link to section
sample_frac (provide_number_between_0_and_1, weight= `<column>`, replace=<logical>) 데이터의 백분율을 기반으로 무작위 샘플을 생성하십시오. 가중치는 선택사항이고 행이 선택될 가능성을 비율로 나타냅니다. 숫자 열을 제공하십시오. 대체는 선택사항이고 해당 기본값은 FALSE입니다.
sample_n
Copy link to section
sample_n (provide_number_of_rows, weight = `<column>`, replace=<logical>) 행 수에 따라 무작위 데이터 샘플을 생성합니다. 가중치는 선택사항이고 행이 선택될 가능성을 비율로 나타냅니다. 숫자 열을 제공하십시오. 대체는 선택사항이고 해당 기본값은 FALSE입니다.
선택
Copy link to section
select (`<column>`) 지정된 컬럼을 유지합니다.
select (-`<column>`) 지정된 컬럼을 제거합니다.
select (starts_with ("provide_text_value")) 지정된 값으로 시작하는 이름으로 열을 유지합니다.
select (ends_with ("provide_text_value")) 열에 지정된 값으로 끝나는 이름을 유지하십시오.
select (contains ("provide_text_value")) 지정된 값을 포함하는 이름으로 열을 유지합니다.
select (matches ("provide_text_value")) 지정된 값과 일치하는 이름으로 열을 유지합니다. 지정된 값은 텍스트 또는 정규식일 수 있습니다.
select (`<column>`: `<column>`) 열을 지정된 범위로 유지합니다. 한 열에서 다른 열로 범위를 지정하십시오.
select (`<column>`, all ()) 모든 컬럼을 보존하지만 지정된 컬럼을 첫 번째 컬럼으로 만듭니다.
select (`<column>`, `<column>`) 지정된 컬럼을 유지합니다.
select_if
Copy link to section
select_if(<predicateFunc>)
지정된 조건을 충족하는 열을 보관합니다. 지원되는 함수는 다음과 같습니다.
이(가) 다음 포함
ends_with
일치
num_range
starts_with
요약
Copy link to section
요약 (provide_new_column = <func>(`<column>`)) 지정된 열에 집계 함수를 적용하여 여러 열 값을 단일 값으로 줄이십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
summarize_all
Copy link to section
summarize_all (<func>) 모든 컬럼에 집계 함수를 적용하여 여러 컬럼 값을 단일 값으로 줄이십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
summarize_all (funs (<func>)) 여러 집계 함수를 모든 컬럼에 적용하여 여러 컬럼 값을 단일 값으로 줄이십시오. 결과를 보유할 새 열을 작성하십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
summarize_if
Copy link to section
summarize_if(<predicate_conditions>,...) 지정된 조건을 충족하는 열에 집계 함수를 적용하여 다중 열 값을 단일 값으로 줄이십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오. 지원되는 함수는 다음과 같습니다.
수
최대
평균
분
표준 편차
합계
집계하다
Copy link to section
tally () 행 수 (문자열 컬럼의 경우) 를 계산하거나 그룹별로 데이터 총계 (숫자 값의 경우) 를 계산합니다. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
tally (wt = `<column>`) 가중 열에 대해 그룹별로 행 수 (문자열 열의 경우) 또는 데이터 총계 (숫자 열의 경우) 를 계산합니다.
tally (wt=<func>(`<column>`), sort = <logical>) 지정된 가중치 열에 함수를 적용하고 결과를 그룹별로 정렬하거나 정렬하지 않고 리턴합니다.
top_n
Copy link to section
top_n (provide_value) 각 그룹에서 맨 위 또는 맨 아래 N개행 (값 기준) 을 선택하십시오. 상위 N행을 선택하려면 양의 정수를 지정하십시오. 하위 N행을 선택하려면 음의 정수를 지정하십시오.
top_n (provide_value, `<column>`) 지정된 열을 기반으로 각 그룹에서 맨 위 또는 맨 아래 N개행 (값 기준) 을 선택하십시오. 상위 N행을 선택하려면 양의 정수를 지정하십시오. 하위 N행을 선택하려면 음의 정수를 지정하십시오.
중복 행이 계수에 영향을 주는 경우 top_n() 조작을 사용하기 전에 중복 제거 GUI 조작을 사용하십시오.
transmute
Copy link to section
transmute (<new_or_existing_column> = `<column>`) 지정된 표현식을 사용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column> = <func(column)>) 지정된 열에 함수를 적용하여 새 열을 추가하거나 기존 열을 겹쳐씁니다. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column> = `<column>` <operator> `<column>`) 지정된 열에 연산자를 적용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column> = `<column>`, <new_or_existing_column> = `<column>`) 여러 개의 새 열을 추가합니다. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column> = if_else (provide_value, provide_value_for_true, provide_value_for_false)) 지정된 조건식을 사용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.