Data Refinery は、操作、関数、および論理演算子をコーディングするための対話式テンプレートを提供します。 ページの上部にあるコマンド・ライン・テキスト・ボックスからテンプレートにアクセスします。 テンプレートには、構文オプションの使用に役立つ対話式アシスタンスが含まれています。
操作
arrange
配置 (`<column>
`)
指定された列で行を昇順にソートします。
(desc (`<column>
`))
指定された列で行を降順にソートします。
配列 (`<column>
`, `<column>
`)
指定された連続する各列で行を昇順にソートし、前のソートからの順序をそのまま保持します。
カウント
count ()
グループごとにデータを合計します。
count (`<column>
`)
指定された列でデータをグループ化し、固有値を持つ行の数 (ストリング値の場合) を返すか、各グループの合計 (数値の場合) を返します。
count (`<column>
`, wt= `<column>
`)
指定された列でデータをグループ化し、固有値を持つ行の数 (ストリング値の場合) を返すか、指定された重み列の各グループ (数値の場合) の合計を返します。
count (`<column>
`, wt=<func>
(`<column>
`))
指定された列でデータをグループ化し、指定された重み列に適用された関数の結果を返します。
count (`<column>
`, wt=<func>
(`<column>
`), sort = <logical>
)
指定された列でデータをグループ化し、ソートされているかどうかにかかわらず、指定された重み列に適用された関数の結果を返します。
distinct
distinct ()
すべての列または指定された列に基づいて、個別の固有の行を保持します。
フィルター
filter (`<column>
` <logicalOperator>
provide_value)
指定された条件を満たす行を保持し、他のすべての行をフィルターで除外します。
列タイプがブール値の場合、provide_value は大文字の TRUE または FALSE でなければなりません。
filter (`<column>
` == <logical>
)
論理値 TRUE または FALSE に基づいて、指定されたフィルター条件を満たす行を保持します。
filter (<func>
(`<column>
`) <logicalOperator>
provide_value)
指定された条件を満たす行を保持し、他のすべての行をフィルターで除外します。 この条件は、演算子の左側の列に関数を適用できます。
filter (`<column>
` <logicalOperator>
<func(column)>
)
指定された条件を満たす行を保持し、他のすべての行をフィルターで除外します。 この条件は、演算子の右側の列に関数を適用できます。
filter (<logicalfunc(column)>
)
指定された条件を満たす行を保持し、他のすべての行をフィルターで除外します。 この条件は、列に論理関数を適用できます。
filter (`<column>
` <logicalOperator>
provide_value <andor>
`<column>
` <logicalOperator>
provide_value)
指定された条件を満たす行を保持し、他のすべての行をフィルターで除外します。
group_by
group_by (`<column>
`)
指定された列に基づいてデータをグループ化します。
group_by (desc (`<column>
`))
指定された列に基づいてデータを降順でグループ化します。
mutate
mutate (provide_new_column = `<column>
`)
新しい列を追加し、既存の列を保持します。
mutate (provide_new_column = <func(column)>
)
関数を列に適用する、指定された式を使用して新しい列を追加します。 既存の列を保持します。
mutate(provide_new_column = case_when(`<column>
` <operator>
provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, `<column>
` <operator>
provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, TRUE ~ provide_default_value_or_column))
Add a new column by using the specified conditional expression.
mutate (provide_new_column = `<column>
` <operator>
`<column>
`)
既存の列を使用して計算を実行する、指定された式を使用して新しい列を追加します。 既存の列を保持します。
mutate (provide_new_column = coalesce (`<column>
`, `<column>
`))
指定された式を使用して新しい列を追加します。これにより、新しい列の欠落値が別の指定された列の値に置き換えられます。 別の列を指定する代わりに、値、列の関数、または値の関数を指定することができます。 既存の列を保持します。
mutate (provide_new_column = if_else (`<column>
` <logicalOperator>
provide_value, provide_value_for_true, provide_value_for_false))
指定された条件式を使用して新しい列を追加します。 既存の列を保持します。
mutate (provide_new_column = `<column>
`, provide_new_column = `<column>
`)
複数の新しい列を追加し、既存の列を保持します。
mutate (provide_new_column = n ())
グループ内の値をカウントします。 group_by を使用してグループ化が既に行われていることを確認してください。 既存の列を保持します。
mutate_all
mutate_all (funs (<func>
))
指定された関数をすべての列に適用し、それらの列の既存の値を上書きします。 欠損値を削除するかどうかを指定します。
mutate_all (funs (. <operator>
provide_value))
指定された演算子をすべての列に適用し、それらの列の既存の値を上書きします。
mutate_all (funs ("provide_value" =. <operator>
provide_value))
指定された演算子をすべての列に適用し、結果を保持するための新しい列を作成します。 指定された値で終わる新しい列名を指定します。
mutate_at
mutate_at (vars (`<column>
`), funs (<func>
))
指定された列に関数を適用します。
mutate_if
mutate_if (<predicateFunc>
, <func>
)
指定された条件を満たす列に関数を適用します。
mutate_if (<predicateFunc>
, funs (. <operator>
provide_value))
指定された条件を満たす列に、指定された演算子を適用します。
mutate_if (<predicateFunc>
, funs (<func>
))
指定された条件を満たす列に関数を適用します。 欠損値を削除するかどうかを指定します。
rename
rename (provide_new_column = `<column>
`)
指定された列を名前変更します。
sample_frac
sample_frac (provide_number_between_0_and_1, weight= `<column>
`, replace=<logical>
)
データのパーセンテージに基づいてランダム・サンプルを生成します。 weight はオプションであり、行が選択される確率比です。 数値列を指定してください。 replace はオプションであり、そのデフォルトは FALSE です。
sample_n
sample_n (provide_number_of_rows, weight = `<column>
`, replace=<logical>
)
複数の行に基づいてデータのランダム・サンプルを生成します。 weight はオプションであり、行が選択される確率比です。 数値列を指定してください。 replace はオプションであり、そのデフォルトは FALSE です。
選択
select (`<column>
`)
指定された列を保持します。
select (-`<column>
`)
指定した列を削除します。
選択 (starts_with ("provide_text_value"))
指定された値で始まる名前の列を保持します。
選択 (ends_with ("provide_text_value"))
指定された値で終わる名前の列を保持します。
選択 (次を含む ("provide_text_value")))
指定された値を含む名前を持つ列を保持します。
選択 (一致 ("provide_text_value")))
指定された値と一致する名前の列を保持します。 指定された値は、テキストまたは正規表現にすることができます。
select (`<column>
`: `<column>
`)
指定された範囲内の列を保持します。 ある列から別の列までの範囲を指定します。
select (`<column>
`, all ())
すべての列を保持しますが、指定された列を最初の列にします。
select (`<column>
`, `<column>
`)
指定された列を保持します。
select_if
select_if(<predicateFunc>
)
指定された条件を満たす列を保持します。 サポートされる関数には、次のものがあります。
- 含む
- ends_with
- matches
- num_range
- starts_with
summarize
summarize (provide_new_column = <func>
(`<column>
`))
複数の列値を単一値に減らすために、指定された列に集約関数を適用します。 必ず、group_by 操作を使用して最初に列データをグループ化してください。
summarize_all
summarize_all (<func>
)
複数の列値を単一値に減らすために、すべての列に集約関数を適用します。 欠損値を削除するかどうかを指定します。 必ず、group_by 操作を使用して最初に列データをグループ化してください。
summarize_all (funs (<func>
))
複数の集約関数をすべての列に適用して、複数の列値を 1 つの値に減らします。 結果を保持するために新しい列を作成します。 欠損値を削除するかどうかを指定します。 必ず、group_by 操作を使用して最初に列データをグループ化してください。
summarize_if
summarize_if(<predicate_conditions>
,...)
複数の列値を 1 つの値に減らすために、指定された条件を満たす列に集約関数を適用します。 欠損値を削除するかどうかを指定します。 必ず、group_by 操作を使用して最初に列データをグループ化してください。 サポートされる関数には、次のものがあります。
- カウント
- max
- mean
- min
- standard deviation
- 合計
tally
tally ()
グループごとにデータの行数 (ストリング列の場合) または合計 (数値の場合) をカウントします。 必ず、group_by 操作を使用して最初に列データをグループ化してください。
tally (wt = `<column>
`)
重み付けされた列について、行の数をカウントするか (ストリング列の場合)、グループごとにデータを合計します (数値列の場合)。
tally (wt=<func>
(`<column>
`), sort = <logical>
)
指定された重み付け列に関数を適用し、結果をグループ別にソートするかどうかを返します。
top_n
top_n (provide_value)
各グループの上位または下位の N 行 (値による) を選択します。 上位 N 行を選択するには正の整数を指定します。下位 N 行を選択するには負の整数を指定します。
top_n (provide_value, `<column>
`)
指定された列に基づいて、各グループの上位 N 行または下位 N 行 (値による) を選択します。 上位 N 行を選択するには正の整数を指定します。下位 N 行を選択するには負の整数を指定します。
重複行がカウントに影響する場合は、「top_n ()」操作を使用する前に 「重複の削除」 GUI 操作を使用してください。
transmute
transmute (<new_or_existing_column>
= `<column>
`)
指定された式を使用して、新しい列を追加するか、既存の列を上書きします。 式に示されている列のみを保持します。
transmute (<new_or_existing_column>
= <func(column)>
)
指定された列に関数を適用して、新しい列を追加するか、既存の列を上書きします。 式に示されている列のみを保持します。
transmute (<new_or_existing_column>
= `<column>
` <operator>
`<column>
`)
指定された列に演算子を適用して、新しい列を追加するか、既存の列を上書きします。 式に示されている列のみを保持します。
transmute (<new_or_existing_column>
= `<column>
`, <new_or_existing_column>
= `<column>
`)
複数の新しい列を追加します。 式に示されている列のみを保持します。
transmute (<new_or_existing_column>
= if_else (provide_value, provide_value_for_true, provide_value_for_false))
指定された条件式を使用して、新しい列を追加するか、既存の列を上書きします。 式に示されている列のみを保持します。
ungroup
ungroup ()
データのグループ化を解除します。
関数
レコード集計
- mean
- min
- n
- sd
- 合計
論理
- is.na
数値
- abs
- coalesce
- cut
- exp
- floor
テキスト
- c
- coalesce
- 貼り付け
- tolower
- toupper
タイプ
- as.character
- as.double
- as.integer
- as.logical
論理演算子
- <
- <=
- >=
- >
- between
- !=
- ==
- %in% (%)
親トピック: データの精製