Data Refinery는 오퍼레이션, 함수 및 논리 연산자를 코딩하기 위한 대화식 템플리트를 제공합니다. 페이지 맨 위의 명령행 텍스트 상자에 있는 템플리트에 액세스하십시오. 이 템플리트에는 구문 옵션으로 사용자를 돕는 대화식 지원이 포함되어 있습니다.
조작
배열
배열 (`<column>
`)
지정된 컬럼별로 행을 오름차순으로 정렬합니다.
정렬 (desc (`<column>
`))
지정된 열을 기준으로 내림차순으로 행을 정렬합니다.
정렬 (`<column>
`, `<column>
`)
행을 지정된 각 연속 열별로 오름차순으로 정렬하여 이전 정렬의 순서를 그대로 유지합니다.
수
count ()
그룹별 데이터 총계입니다.
count (`<column>
`)
지정된 컬럼으로 데이터를 그룹화하고 고유 값 (문자열 값의 경우) 이 있는 행 수를 리턴하거나 각 그룹의 총계 (숫자 값의 경우) 를 리턴합니다.
count (`<column>
`, wt= `<column>
`)
지정된 열별로 데이터를 그룹화하고 고유 값 (문자열 값의 경우) 이 있는 행 수를 리턴하거나 지정된 가중치 열에서 각 그룹 (숫자 값의 경우) 에 대한 총계를 리턴합니다.
count (`<column>
`, wt=<func>
(`<column>
`))
지정된 열로 데이터를 그룹화하고 지정된 가중치 열에 적용된 함수의 결과를 리턴합니다.
count (`<column>
`, wt=<func>
(`<column>
`), sort = <logical>
)
지정된 열로 데이터를 그룹화하고 지정된 가중치 열에 적용된 함수의 결과를 정렬되거나 정렬되지 않은 상태로 리턴합니다.
구별
distinct ()
모든 컬럼 또는 지정된 컬럼을 기반으로 구별되는 고유 행을 유지합니다.
필터
filter (`<column>
` <logicalOperator>
provide_value)
지정된 조건을 충족하는 행을 유지하고 다른 모든 행을 필터링합니다.
부울 열 유형의 경우 provide_value는 대문자 TRUE 또는 FALSE여야 합니다.
filter (`<column>
` == <logical>
)
논리 값 TRUE 또는 FALSE를 기반으로 지정된 필터 조건을 충족하는 행을 유지합니다.
filter (<func>
(`<column>
`) <logicalOperator>
provide_value)
지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다. 조건은 연산자의 왼쪽에 있는 열에 함수를 적용할 수 있습니다.
filter (`<column>
` <logicalOperator>
<func(column)>
)
지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다. 조건은 연산자의 오른쪽에 있는 열에 함수를 적용할 수 있습니다.
filter (<logicalfunc(column)>
)
지정된 조건을 충족하는 행을 유지하고 다른 모든 행을 필터링합니다. 조건은 논리 함수를 열에 적용할 수 있습니다.
filter (`<column>
` <logicalOperator>
provide_value <andor>
`<column>
` <logicalOperator>
provide_value)
지정된 조건을 충족하는 행을 보존하고 다른 모든 행을 필터링합니다.
group_by
group_by (`<column>
`)
지정된 컬럼을 기반으로 데이터를 그룹화합니다.
group_by (desc (`<column>
`))
지정된 컬럼을 기반으로 내림차순으로 데이터를 그룹화합니다.
mutate
mutate (provide_new_column = `<column>
`)
새 열을 추가하고 기존 열을 유지합니다.
mutate (provide_new_column = <func(column)>
)
함수를 열에 적용하는 지정된 표현식을 사용하여 새 열을 추가합니다. 기존 열 유지
mutate (provide_new_column = case_when (`<column>
` <operator>
provide_value_or_column_to_compare~provide_value_or_column_to_replace, `<column>
` <operator>
provide_value_or_column_to_compare~provide_value_or_column_to_replace, TRUE~provide_default_value_or_column))
지정된 조건식을 사용하여 새 열을 추가합니다.
mutate (provide_new_column = `<column>
` <operator>
`<column>
`)
기존 열로 계산을 수행하는 지정된 표현식을 사용하여 새 열을 추가합니다. 기존 열 유지
mutate (provide_new_column = coalesce (`<column>
`, `<column>
`))
지정된 표현식을 사용하여 새 열의 누락된 값을 다른 지정된 열의 값으로 대체하는 새 열을 추가합니다. 다른 열을 지정하는 대신 값, 열의 함수 또는 값에 대한 함수를 지정할 수 있습니다. 기존 열 유지
mutate (provide_new_column = if_else (`<column>
` <logicalOperator>
provide_value, provide_value_for_true, provide_value_for_false))
지정된 조건식을 사용하여 새 열을 추가합니다. 기존 열 유지
mutate (provide_new_column = `<column>
`, provide_new_column = `<column>
`)
여러 개의 새 열을 추가하고 기존 열을 유지합니다.
mutate (provide_new_column = n ())
그룹의 값을 계산합니다. 그룹화가 이미 group_by를 사용하여 수행되었는지 확인합니다. 기존 열 유지
mutate_all
mute_all (funs (<func>
))
지정된 함수를 모든 열에 적용하고 해당 열의 기존 값을 겹쳐씁니다. 누락된 값을 제거할지 여부를 지정하십시오.
mute_all (funs (. <operator>
provide_value))
지정된 연산자를 모든 열에 적용하고 해당 열의 기존 값을 겹쳐쓰십시오.
mute_all (funs ("provide_value" =. <operator>
provide_value))
지정된 연산자를 모든 열에 적용하고 결과를 보유할 새 열을 작성하십시오. 지정된 값으로 끝나는 새 열 이름을 지정하십시오.
mutate_at
mute_at (vars (`<column>
`), funs (<func>
))
지정된 열에 함수를 적용합니다.
mutate_if
mute_if (<predicateFunc>
, <func>
)
지정된 조건을 충족하는 열에 함수를 적용합니다.
mute_if (<predicateFunc>
, funs (. <operator>
provide_value))
지정된 조건을 충족하는 컬럼에 지정된 연산자를 적용하십시오.
mute_if (<predicateFunc>
, funs (<func>
))
지정된 조건을 충족하는 열에 함수를 적용합니다. 누락된 값을 제거할지 여부를 지정하십시오.
이름 바꾸기
rename (provide_new_column = `<column>
`)
지정된 컬럼의 이름을 바꾸십시오.
sample_frac
sample_frac (provide_number_between_0_and_1, weight= `<column>
`, replace=<logical>
)
데이터의 백분율을 기반으로 무작위 샘플을 생성하십시오. 가중치는 선택사항이고 행이 선택될 가능성을 비율로 나타냅니다. 숫자 열을 제공하십시오. 대체는 선택사항이고 해당 기본값은 FALSE입니다.
sample_n
sample_n (provide_number_of_rows, weight = `<column>
`, replace=<logical>
)
행 수에 따라 무작위 데이터 샘플을 생성합니다. 가중치는 선택사항이고 행이 선택될 가능성을 비율로 나타냅니다. 숫자 열을 제공하십시오. 대체는 선택사항이고 해당 기본값은 FALSE입니다.
선택
select (`<column>
`)
지정된 컬럼을 유지합니다.
select (-`<column>
`)
지정된 컬럼을 제거합니다.
select (starts_with ("provide_text_value"))
지정된 값으로 시작하는 이름으로 열을 유지합니다.
select (ends_with ("provide_text_value"))
열에 지정된 값으로 끝나는 이름을 유지하십시오.
select (contains ("provide_text_value"))
지정된 값을 포함하는 이름으로 열을 유지합니다.
select (matches ("provide_text_value"))
지정된 값과 일치하는 이름으로 열을 유지합니다. 지정된 값은 텍스트 또는 정규식일 수 있습니다.
select (`<column>
`: `<column>
`)
열을 지정된 범위로 유지합니다. 한 열에서 다른 열로 범위를 지정하십시오.
select (`<column>
`, all ())
모든 컬럼을 보존하지만 지정된 컬럼을 첫 번째 컬럼으로 만듭니다.
select (`<column>
`, `<column>
`)
지정된 컬럼을 유지합니다.
select_if
select_if(<predicateFunc>
)
지정된 조건을 충족하는 열을 보관합니다. 지원되는 함수는 다음과 같습니다.
- 이(가) 다음 포함
- ends_with
- 일치
- num_range
- starts_with
요약
요약 (provide_new_column = <func>
(`<column>
`))
지정된 열에 집계 함수를 적용하여 여러 열 값을 단일 값으로 줄이십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
summarize_all
summarize_all (<func>
)
모든 컬럼에 집계 함수를 적용하여 여러 컬럼 값을 단일 값으로 줄이십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
summarize_all (funs (<func>
))
여러 집계 함수를 모든 컬럼에 적용하여 여러 컬럼 값을 단일 값으로 줄이십시오. 결과를 보유할 새 열을 작성하십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
summarize_if
summarize_if(<predicate_conditions>
,...)
지정된 조건을 충족하는 열에 집계 함수를 적용하여 다중 열 값을 단일 값으로 줄이십시오. 누락된 값을 제거할지 여부를 지정하십시오. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오. 지원되는 함수는 다음과 같습니다.
- 수
- 최대
- 평균
- 분
- 표준 편차
- 합계
집계하다
tally ()
행 수 (문자열 컬럼의 경우) 를 계산하거나 그룹별로 데이터 총계 (숫자 값의 경우) 를 계산합니다. 먼저 group_by 연산을 사용하여 열 데이터를 그룹화하십시오.
tally (wt = `<column>
`)
가중 열에 대해 그룹별로 행 수 (문자열 열의 경우) 또는 데이터 총계 (숫자 열의 경우) 를 계산합니다.
tally (wt=<func>
(`<column>
`), sort = <logical>
)
지정된 가중치 열에 함수를 적용하고 결과를 그룹별로 정렬하거나 정렬하지 않고 리턴합니다.
top_n
top_n (provide_value)
각 그룹에서 맨 위 또는 맨 아래 N개행 (값 기준) 을 선택하십시오. 상위 N행을 선택하려면 양의 정수를 지정하십시오. 하위 N행을 선택하려면 음의 정수를 지정하십시오.
top_n (provide_value, `<column>
`)
지정된 열을 기반으로 각 그룹에서 맨 위 또는 맨 아래 N개행 (값 기준) 을 선택하십시오. 상위 N행을 선택하려면 양의 정수를 지정하십시오. 하위 N행을 선택하려면 음의 정수를 지정하십시오.
중복 행이 계수에 영향을 주는 경우 top_n() 조작을 사용하기 전에 중복 제거 GUI 조작을 사용하십시오.
transmute
transmute (<new_or_existing_column>
= `<column>
`)
지정된 표현식을 사용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column>
= <func(column)>
)
지정된 열에 함수를 적용하여 새 열을 추가하거나 기존 열을 겹쳐씁니다. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column>
= `<column>
` <operator>
`<column>
`)
지정된 열에 연산자를 적용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column>
= `<column>
`, <new_or_existing_column>
= `<column>
`)
여러 개의 새 열을 추가합니다. 표현식에 언급된 열만 유지하십시오.
transmute (<new_or_existing_column>
= if_else (provide_value, provide_value_for_true, provide_value_for_false))
지정된 조건식을 사용하여 새 열을 추가하거나 기존 열을 겹쳐쓰십시오. 표현식에 언급된 열만 유지하십시오.
그룹 해제
ungroup ()
데이터를 그룹 해제합니다.
함수
통합
- 평균
- 분
- n
- sd
- 합계
논리
- is.na
수치형
- abs
- 통합
- 컷
- 지수
- floor 함수
텍스트
- c
- 통합
- 붙여넣기
- tolower
- toupper
유형
- as.character
- as.double
- as.integer
- as.logical
논리 연산자
- <
- <=
- >=
- >
- 사이
- !=
- ==
- %in%
상위 주제: 데이터 정제