Data Refinery fornisce modelli interattivi per operazioni di codice, funzioni e operatori logici. Accedere ai modelli dalla casella di testo della riga comandi nella parte superiore della pagina. I modelli includono l'assistenza interattiva per aiutare l'utente con le opzioni di sintassi.
Operazioni
disporre
disporre (`<column>
`)
Ordina le righe, in ordine crescente, in base alle colonne specificate.
disponi (desc (`<column>
`))
Ordina le righe, in ordine decrescente, in base alla colonna specificata
disponi (`<column>
`, `<column>
`)
Ordina le righe, in ordine crescente, per ciascuna colonna successiva specificata, mantenendo intatto l'ordine dell'ordinamento precedente.
conteggio
count ()
Totale dati per gruppo.
count (`<column>
`)
Raggruppa i dati per la colonna specificata e restituisce il numero di righe con valori univoci (per i valori stringa) o restituisce il totale per ogni gruppo (per valori numerici).
count (`<column>
`, wt= `<column>
`)
Raggruppa i dati per la colonna specificata e restituisce il numero di righe con valori univoci (per i valori stringa) o restituisce il totale per ciascun gruppo (per i valori numerici) nella colonna peso specificata.
count (`<column>
`, wt=<func>
(`<column>
`))
Raggruppa i dati in base alla colonna specificata e restituisce il risultato della funzione applicata alla colonna peso specificata.
count (`<column>
`, wt=<func>
(`<column>
`), sort = <logical>
)
Raggruppa i dati in base alla colonna specificata e restituisce il risultato della funzione applicata alla colonna peso specificata, ordinata o meno.
distinct
distinct ()
Mantieni distinte, righe univoche basate su tutte le colonne o su colonne specificate.
filtro
filter (`<column>
` <logicalOperator>
valore_provisioning)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe.
Per il tipo di colonna booleana, provide_value deve essere TRUE o FALSE in maiuscolo.
filter (`<column>
` == <logical>
)
Conserva le righe che soddisfano le condizioni di filtro specificate in base al valore logico TRUE o FALSE.
filter (<func>
(`<column>
`) <logicalOperator>
valore_provisioning)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe. La condizione può applicare una funzione a una colonna a sinistra dell'operatore.
filter (`<column>
` <logicalOperator>
<func(column)>
)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe. La condizione può applicare una funzione a una colonna a destra dell'operatore.
filter (<logicalfunc(column)>
)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe. La condizione può applicare una funzione logica a una colonna.
filter (`<column>
` <logicalOperator>
valore_provisioning <andor>
`<column>
` <logicalOperator>
valore_provisioning)
Conserva le righe che soddisfano le condizioni specificate e filtra tutte le altre righe.
gruppo_da
group_by (`<column>
`)
Raggruppa i dati in base alla colonna specificata.
group_by (desc (`<column>
`))
Raggruppa i dati, in ordine decrescente, in base alla colonna specificata.
Mutate
mutate (provide_new_column = `<column>
`)
Aggiungere una nuova colonna e conservare le colonne esistenti.
mutate (provide_new_column = <func(column)>
)
Aggiungere una nuova colonna utilizzando l'espressione specificata, che applica una funzione a una colonna. Mantiene le colonne esistenti.
mutate (provide_new_column = case_when (`<column>
` <operator>
provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, `<column>
` <operator>
provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, TRUE ~ provide_default_value_or_column))
Aggiungere una nuova colonna utilizzando l'espressione condizionale specificata.
mutate (provide_new_column = `<column>
` <operator>
`<column>
`)
Aggiungere una nuova colonna utilizzando l'espressione specificata, che esegue un calcolo con le colonne esistenti. Mantiene le colonne esistenti.
mutate (provide_new_column = coalesce (`<column>
`, `<column>
`))
Aggiungere una nuova colonna utilizzando l'espressione specificata, che sostituisce i valori mancanti nella nuova colonna con i valori di un'altra colonna specificata. Oltre a specificare un'altra colonna, è possibile specificare un valore, una funzione in una colonna o una funzione in un valore. Mantiene le colonne esistenti.
mutate (provide_new_column = if_else (`<column>
` <logicalOperator>
valore_provisioning, provide_value_for_true, provide_value_for_false))
Aggiungere una nuova colonna utilizzando l'espressione condizionale specificata. Mantiene le colonne esistenti.
mutate (provide_new_column = `<column>
`, provide_new_column = `<column>
`)
Aggiungere più nuove colonne e conservare le colonne esistenti.
mutate (provide_new_column = n ())
Conta i valori nei gruppi. Verificare che il raggruppamento sia già stato eseguito utilizzando group_by. Mantiene le colonne esistenti.
mutate_all
mutate_all (funs (<func>
))
Applicare la funzione specificata a tutte le colonne e sovrascrivere i valori esistenti in tali colonne. Specifica se rimuovere i valori mancanti.
mutate_all (funs (. <operator>
provide_value))
Applica l'operatore specificato a tutte le colonne e sovrascrive i valori esistenti in tali colonne.
mutate_all (funs ("valore_provisioning" =. <operator>
provide_value))
Applica l'operatore specificato a tutte le colonne e crea nuove colonne per contenere i risultati. Assegna alle nuove colonne nomi che terminano con il valore specificato.
mutate_at
mutate_at (vars (`<column>
`), funs (<func>
))
Applica funzioni alle colonne specificate.
mutate_if
mutate_if (<predicateFunc>
, <func>
)
Applica funzioni alle colonne che soddisfano la condizione specificata.
mutate_if (<predicateFunc>
, funs (. <operator>
provide_value)
Applica l'operatore specificato alle colonne che soddisfano la condizione specificata.
mutate_if (<predicateFunc>
, funs (<func>
))
Applicare le funzioni alle colonne che soddisfano la condizione specificata. Specifica se rimuovere i valori mancanti.
rinominare
rename (provide_new_column = `<column>
`)
Rinomina la colonna specificata.
Sample_frac
sample_frac (provide_number_between_0_and_1, weight= `<column>
`, replace=<logical>
)
Genera un esempio casuale basato su una percentuale di dati. weight è un valore facoltativo ed è il rapporto di probabilità in base al quale verrà scelta la riga. Fornire una colonna numerica. replace è facoltativo e il relativo valore predefinito è FALSE.
Sample_n
sample_n (provide_number_of_rows, weight = `<column>
`, replace=<logical>
)
Genera un campione casuale di dati basato sul numero di righe. weight è un valore facoltativo ed è il rapporto di probabilità in base al quale verrà scelta la riga. Fornire una colonna numerica. replace è facoltativo e il relativo valore predefinito è FALSE.
selezionare
select (`<column>
`)
Mantieni la colonna specificata.
select (- `<column>
`)
Rimuovere la colonna specificata.
select (starts_with ("valore_testo_provisioning"))
Conserva le colonne con nomi che iniziano con il valore specificato.
select (ends_with ("provide_text_value"))
Conserva le colonne con nomi che terminano con il valore specificato.
select (contiene ("provide_text_value"))
Conserva le colonne con nomi che contengono il valore specificato.
select (corrisponde ("provide_text_value"))
Conserva le colonne con nomi che corrispondono al valore specificato. Il valore specificato può essere un testo o un'espressione regolare.
select (`<column>
`: `<column>
`)
Mantenere le colonne nell'intervallo specificato. Specificare l'intervallo da una colonna all'altra colonna.
select (`<column>
`, all ())
Mantieni tutte le colonne, ma rendi la colonna specificata la prima colonna.
select (`<column>
`, `<column>
`)
Conserva le colonne specificate.
select_if
select_if (<predicateFunc>
) Conserva le colonne che soddisfano la condizione specificata. Le funzioni supportate includono:
- contiene
- ends_with
- corrisponde
- num_intervallo
- starts_with
riepilogare
summarize (provide_new_column = <func>
(`<column>
`))
Applicare funzioni di aggregazione alle colonne specificate per ridurre più valori di colonna a un solo valore. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.
riepilogato_tutto
summarize_all(<func>
)
Apply an aggregate function to all of the columns to reduce multiple column values to a single value. Specifica se rimuovere i valori mancanti. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.
summarize_all (funs (<func>
))
Applicare più funzioni di aggregazione a tutte le colonne per ridurre i valori di più colonne a un singolo valore Crea nuove colonne per contenere i risultati. Specifica se rimuovere i valori mancanti. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.
riepilogato_se
summarize_if (<predicate_conditions>
, ...)
Applica le funzioni di aggregazione alle colonne che soddisfano le condizioni specificate per ridurre più valori di colonna a un singolo valore. Specifica se rimuovere i valori mancanti. Raggruppa prima i dati di colonna utilizzando l'operazione group_by. Le funzioni supportate includono:
- conteggio
- max
- media
- min
- minima
- somma
assegnare
tally ()
Conta il numero di righe (per le colonne stringa) o somma i dati (per i valori numerici) per gruppo. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.
tally (wt = `<column>
`)
Conta il numero di righe (per le colonne stringa) o somma i dati (per le colonne numeriche) per gruppo per la colonna ponderata.
(wt=<func>
(`<column>
`), sort = <logical>
)
Applica una funzione alla colonna pesata specificata e restituisce il risultato, per gruppo, ordinato o meno.
top_n
top_n (provide_value)
Selezionare le prime o le ultime N righe (per valore) in ciascun gruppo. Specificare un numero intero positivo per selezionare le N righe iniziali, specificare un numero intero negativo per selezionare le N righe finali.
top_n (provide_value, `<column>
`)
Selezionare le prime o le ultime N righe (per valore) in ciascun gruppo, in base alla colonna specificata. Specificare un numero intero positivo per selezionare le N righe iniziali, specificare un numero intero negativo per selezionare le N righe finali.
Se le righe duplicate influenzano il conteggio, utilizzare l'operazione GUI Rimuovi duplicati prima di utilizzare l'operazione top_n ().
Transmute
transmute (<new_or_existing_column>
= `<column>
`)
Aggiungere una nuova colonna o sovrascriverne una esistente utilizzando l'espressione specificata. Mantiene solo le colonne menzionate nell'espressione.
transmute (<new_or_existing_column>
= <func(column)>
)
Aggiungere una nuova colonna o sovrascriverne una esistente applicando una funzione alla colonna specificata. Mantiene solo le colonne menzionate nell'espressione.
transmute (<new_or_existing_column>
= `<column>
` <operator>
`<column>
`)
Aggiungere una nuova colonna o sovrascriverne una esistente applicando un operatore alla colonna specificata. Mantiene solo le colonne menzionate nell'espressione.
transmute (<new_or_existing_column>
= `<column>
`, <new_or_existing_column>
= `<column>
`)
Aggiungere più nuove colonne. Mantiene solo le colonne menzionate nell'espressione.
transmute (<new_or_existing_column>
= if_else (provide_value, provide_value_for_true, provide_value_for_false))
Aggiungere una nuova colonna o sovrascriverne una esistente utilizzando le espressioni condizionali specificate. Mantiene solo le colonne menzionate nelle espressioni.
separare
ungroup ()
Annulla il raggruppamento dei dati
Funzioni
Aggregazione
- media
- min
- n
- ds
- somma
Logica
- is.na
Numerico
- abs
- coalesce
- cut
- exp
- floor
Testo
- c
- coalesce
- paste
- tolower
- toupper
Tipo
- as.character
- as.double
- as.integer
- as.logical
Operatori logici
- <
- <=
- >=
- >
- tra
- !=
- ==
- %in%
Argomento principale Raffinazione dei dati