Data Refinery proporciona plantillas interactivas para que pueda codificar las operaciones, las funciones y los operadores lógicos. Acceda a las plantillas desde el recuadro de texto de línea de mandatos en la parte superior de la página. Las plantillas incluyen ayuda interactiva para ayudarle con las opciones de sintaxis.
Operaciones
arrange
organizar (`<column>
`)
Ordenar filas, en orden ascendente, por las columnas especificadas.
organizar (desc (`<column>
`))
Ordenar filas, en orden descendente, por la columna especificada.
organizar (`<column>
`, `<column>
`)
Ordenar filas, en orden ascendente, por cada columna sucesiva especificada, manteniendo intacto el orden de la clasificación anterior.
count
count ()
Total de datos por grupo.
count (`<column>
`)
Agrupar los datos por la columna especificada y devolver el número de filas con valores exclusivos (para valores de serie) o devolver el total para cada grupo (para valores numéricos).
count (`<column>
`, wt= `<column>
`)
Agrupar los datos por la columna especificada y devolver el número de filas con valores exclusivos (para valores de serie) o devolver el total de cada grupo (para valores numéricos) en la columna de ponderación especificada.
count (`<column>
`, wt=<func>
(`<column>
`))
Agrupar los datos por la columna especificada y devolver el resultado de la función aplicada a la columna de ponderación especificada.
count (`<column>
`, wt=<func>
(`<column>
`), sort = <logical>
)
Agrupar los datos por la columna especificada y devolver el resultado de la función aplicada a la columna de peso especificada, ordenada o no.
diferenciado
distinct ()
Mantiene filas distintas y exclusivas basadas en todas las columnas o en columnas especificadas.
filtrar
filter (`<column>
` <logicalOperator>
valor_proveedor)
Conserva las filas que cumplen la condición especificada y filtra todas las demás filas.
Para un tipo de columna booleano, provide_value debería ser TRUE o FALSE en mayúsculas.
filter (`<column>
` == <logical>
)
Conserva las filas que cumplen las condiciones de filtro especificadas basándose en el valor lógico TRUE o FALSE.
filter (<func>
(`<column>
`) <logicalOperator>
provide_value)
Conserva las filas que cumplen la condición especificada y filtra todas las demás filas. La condición puede aplicar una función a una columna en el lado izquierdo del operador.
filter (`<column>
` <logicalOperator>
<func(column)>
)
Conserva las filas que cumplen la condición especificada y filtra todas las demás filas. La condición puede aplicar una función a una columna en el lado derecho del operador.
filtro (<logicalfunc(column)>
)
Conservar las filas que cumplen la condición especificada y filtrar todas las demás filas. La condición puede aplicar una función lógica a una columna.
filter (`<column>
` <logicalOperator>
valor_proveedor <andor>
`<column>
` ` <logicalOperator>
valor_proveedor)
Conserva las filas que cumplen las condiciones especificadas y filtra todas las demás filas.
group_by
group_by (`<column>
`)
Agrupar los datos basándose en la columna especificada.
group_by (desc (`<column>
`))
Agrupar los datos, en orden descendente, basándose en la columna especificada.
mutate
mutate (provide_new_column = `<column>
`)
Añadir una nueva columna y mantener las columnas existentes.
mutate (provide_new_column = <func(column)>
)
Añada una nueva columna utilizando la expresión especificada, que aplica una función a una columna. Mantiene las columnas existentes.
mutate (provide_new_column = case_when (`<column>
` <operator>
provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, `<column>
` <operator>
provide_value_or_column_to_compare ~ provide_value_or_to_replace, TRUE ~ provide_default_value_or_column)))
Añada una nueva columna utilizando la expresión condicional especificada.
mutate (provide_new_column = `<column>
` <operator>
`<column>
`)
Añada una nueva columna utilizando la expresión especificada, que realiza un cálculo con las columnas existentes. Mantiene las columnas existentes.
mutate (provide_new_column = coalesce (`<column>
`, `<column>
`))
Añada una nueva columna utilizando la expresión especificada, que sustituye los valores perdidos en la nueva columna por los valores de otra columna especificada. Como alternativa a la especificación de otra columna, puede especificar un valor, una función en una columna o una función en un valor. Mantiene las columnas existentes.
mutate (provide_new_column = if_else (`<column>
` <logicalOperator>
provide_value, provide_value_for_true, provide_value_for_false))
Añada una nueva columna utilizando la expresión condicional especificada. Mantiene las columnas existentes.
mutate (provide_new_column = `<column>
`, provide_new_column = `<column>
`)
Añadir varias columnas nuevas y conservar las existentes.
mutate (provide_new_column = n ())
Cuenta los valores de los grupos. Asegúrese de que la agrupación ya se ha realizado utilizando group_by. Mantiene las columnas existentes.
mutate_all
mutate_all (funs (<func>
))
Aplicar la función especificada a todas las columnas y sobrescribir los valores existentes en dichas columnas. Especifique si desea eliminar los valores que faltan.
mutate_all (funs (. <operator>
provide_value))
Aplicar el operador especificado a todas las columnas y sobrescribir los valores existentes en dichas columnas.
mutate_all (funs ("valor_proveedor" =. <operator>
provide_value))
Aplicar el operador especificado a todas las columnas y crear nuevas columnas para contener los resultados. Dé nombres de las nuevas columnas que finalizan con el valor especificado.
mutate_at
mutate_at (vars (`<column>
`), funs (<func>
))
Aplicar funciones a las columnas especificadas.
mutate_if
mutate_if (<predicateFunc>
, <func>
)
Aplicar funciones a las columnas que cumplen la condición especificada.
mutate_if (<predicateFunc>
, funs (. <operator>
provide_value))
Aplicar el operador especificado a las columnas que cumplen la condición especificada.
mutate_if (<predicateFunc>
, funs (<func>
))
Aplicar funciones a las columnas que cumplen la condición especificada. Especifique si desea eliminar los valores que faltan.
redenominar
rename (provide_new_column = `<column>
`)
Renombrar la columna especificada.
sample_frac
sample_frac (provide_number_between_0_and_1, weight= `<column>
`, replace=<logical>
)
Generar una muestra aleatoria basada en un porcentaje de los datos. weight es opcional y es la proporción de probabilidad de que la fila sea elegida. Proporcione una columna numérica. replace es opcional y su valor predeterminado es FALSE.
sample_n
sample_n (provide_number_of_rows, weight = `<column>
`, replace=<logical>
)
Generar una muestra aleatoria de datos basada en un número de filas. weight es opcional y es la proporción de probabilidad de que la fila sea elegida. Proporcione una columna numérica. replace es opcional y su valor predeterminado es FALSE.
seleccionar
select (`<column>
`)
Conservar la columna especificada.
select (-`<column>
`)
Eliminar la columna especificada.
select (starts_with ("valor_texto_proveedor"))
Mantener columnas con nombres que empiecen por el valor especificado.
select (ends_with ("valor_texto_proveedor"))
Conservar las columnas con nombres que terminen con el valor especificado.
select (contiene ("valor_texto_proveedor"))
Mantener columnas con nombres que contengan el valor especificado.
select (matches ("valor_texto_proveedor"))
Mantener columnas con nombres que coincidan con el valor especificado. El valor especificado puede ser textual o una expresión regular.
select (`<column>
`: `<column>
`)
Mantener las columnas en el rango especificado. Especifique el rango como de una columna a otra columna.
select (`<column>
`, all ())
Conservar todas las columnas, pero hacer que la columna especificada sea la primera columna.
select (`<column>
`, `<column>
`)
Conservar las columnas especificadas.
select_if
select_if(<predicateFunc>
) Mantiene las columnas que cumplen la condición especificada. Las funciones soportadas incluyen:
- contiene
- ends_with
- coincide
- num_range
- starts_with
resumen
summarize (provide_new_column = <func>
(`<column>
`))
Aplicar funciones de agregación a las columnas especificadas para reducir varios valores de columna a un único valor. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.
summarize_all
summarize_all (<func>
)
Aplicar una función de agregación a todas las columnas para reducir varios valores de columna a un único valor. Especifique si desea eliminar los valores que faltan. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.
summarize_all (funs (<func>
))
Aplicar varias funciones de agregación a todas las columnas para reducir varios valores de columna a un único valor. Crea nuevas columnas para alojar los resultados. Especifique si desea eliminar los valores que faltan. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.
summarize_if
summarize_if(<predicate_conditions>
,...)
Aplica funciones de agregación a las columnas que cumplen las condiciones especificadas para reducir varios valores de columna a un solo valor. Especifique si desea eliminar los valores que faltan. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by. Las funciones soportadas incluyen:
- count
- máx
- media
- min.
- desviación estándar
- suma
tally
recuento ()
Recuenta el número de filas (para columnas de serie) o el total de los datos (para valores numéricos) por grupo. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.
recuento (wt = `<column>
`)
Cuenta el número de filas (para columnas de serie) o totaliza los datos (para columnas numéricas) por grupo para la columna ponderada.
recuento (wt=<func>
(`<column>
`), sort = <logical>
)
Aplica una función a la columna ponderada especificada y devuelve el resultado, por grupo, ordenado o no.
top_n
top_n (provide_value)
Seleccione las N filas superiores o inferiores (por valor) en cada grupo. Especifique un entero positivo para seleccionar las primeras N filas y un entero negativo para seleccionar las últimas N filas.
top_n (provide_value, `<column>
`)
Seleccione las N filas superiores o inferiores (por valor) en cada grupo, basándose en la columna especificada. Especifique un entero positivo para seleccionar las primeras N filas y un entero negativo para seleccionar las últimas N filas.
Si las filas duplicadas afectan al recuento, utilice la operación de la GUI de Eliminar duplicados antes de utilizar la operación top_n().
transmute
transmute (<new_or_existing_column>
= `<column>
`)
Añada una nueva columna o sobrescriba una existente utilizando la expresión especificada. Mantiene sólo las columnas mencionadas en la expresión.
transmute (<new_or_existing_column>
= <func(column)>
)
Añada una nueva columna o sobrescriba una existente aplicando una función a la columna especificada. Mantiene sólo las columnas mencionadas en la expresión.
transmute (<new_or_existing_column>
= `<column>
` <operator>
`<column>
`)
Añada una nueva columna o sobrescriba una existente aplicando un operador a la columna especificada. Mantiene sólo las columnas mencionadas en la expresión.
transmute (<new_or_existing_column>
= `<column>
`, <new_or_existing_column>
= `<column>
`)
Añadir varias columnas nuevas. Mantiene sólo las columnas mencionadas en la expresión.
transmute (<new_or_existing_column>
= if_else (provide_value, provide_value_for_true, provide_value_for_false))
Añada una columna nueva o sobrescriba una existente utilizando las expresiones condicionales especificadas. Mantiene solo las columnas mencionadas en las expresiones.
desagrupar
ungroup ()
Desagrupar los datos.
Funciones
Agregar
- media
- min.
- n
- sd
- suma
Lógico
- is.na
Numérico
- abs
- coalesce
- cortar
- exp
- inferior
Texto
- c
- coalesce
- pegar
- tolower
- toupper
Tipo
- as.character
- as.double
- as.integer
- as.logical
Operadores lógicos
- <
- <=
- >=
- >
- entre
- !=
- ==
- %in%
Tema principal: Cómo refinar datos