0 / 0
Volver a la versión inglesa de la documentación
Plantillas de código interactivas en Data Refinery
Última actualización: 07 oct 2024
Plantillas de código interactivas en Data Refinery

Data Refinery proporciona plantillas interactivas para que codifique operaciones, funciones y operadores lógicos. Acceda a las plantillas desde el recuadro de texto de línea de mandatos de la parte superior de la página. Las plantillas incluyen ayuda interactiva para ayudarle con las opciones de sintaxis.

Importante: el soporte es para las operaciones y funciones de la interfaz de usuario. Si inserta otras operaciones o funciones desde la biblioteca de código abierto, el flujo de Data Refinery podría fallar. Consulte la ayuda de la línea de mandatos y asegúrese de utilizar la lista de operaciones o funciones de las plantillas. Utilice los ejemplos de las plantillas para personalizar aún más la sintaxis según sea necesario.

Operaciones

arrange

organizar (`<column>`)
Ordenar filas, en orden ascendente, por las columnas especificadas.

organizar (desc (`<column>`))
Ordenar filas, en orden descendente, por la columna especificada.

organizar (`<column>`, `<column>`)
Ordenar filas, en orden ascendente, por cada columna sucesiva especificada, manteniendo intacto el orden de la clasificación anterior.

count

count ()
Total de datos por grupo.

count (`<column>`)
Agrupar los datos por la columna especificada y devolver el número de filas con valores exclusivos (para valores de serie) o devolver el total para cada grupo (para valores numéricos).

count (`<column>`, wt= `<column>`)
Agrupar los datos por la columna especificada y devolver el número de filas con valores exclusivos (para valores de serie) o devolver el total de cada grupo (para valores numéricos) en la columna de ponderación especificada.

count (`<column>`, wt=<func>(`<column>`))
Agrupar los datos por la columna especificada y devolver el resultado de la función aplicada a la columna de ponderación especificada.

count (`<column>`, wt=<func>(`<column>`), sort = <logical>)
Agrupar los datos por la columna especificada y devolver el resultado de la función aplicada a la columna de peso especificada, ordenada o no.

distinct

distinct ()
Mantiene filas distintas y exclusivas basadas en todas las columnas o en columnas especificadas.

filtrar

filter (`<column>` <logicalOperator> valor_proveedor)
Conserva las filas que cumplen la condición especificada y filtra todas las demás filas.
Para un tipo de columna booleano, provide_value debería ser TRUE o FALSE en mayúsculas.

filter (`<column>` == <logical>)
Conserva las filas que cumplen las condiciones de filtro especificadas basándose en el valor lógico TRUE o FALSE.

filter (<func>(`<column>`) <logicalOperator> provide_value)
Conserva las filas que cumplen la condición especificada y filtra todas las demás filas. La condición puede aplicar una función a una columna en el lado izquierdo del operador.

filter (`<column>` <logicalOperator> <func(column)>)
Conserva las filas que cumplen la condición especificada y filtra todas las demás filas. La condición puede aplicar una función a una columna en el lado derecho del operador.

filtro (<logicalfunc(column)>)
Conservar las filas que cumplen la condición especificada y filtrar todas las demás filas. La condición puede aplicar una función lógica a una columna.

filter (`<column>` <logicalOperator> valor_proveedor <andor> `<column>` ` <logicalOperator> valor_proveedor)
Conserva las filas que cumplen las condiciones especificadas y filtra todas las demás filas.

group_by

group_by (`<column>`)
Agrupar los datos basándose en la columna especificada.

group_by (desc (`<column>`))
Agrupar los datos, en orden descendente, basándose en la columna especificada.

mutate

mutate (provide_new_column = `<column>`)
Añadir una nueva columna y mantener las columnas existentes.

mutate (provide_new_column = <func(column)>)
Añada una nueva columna utilizando la expresión especificada, que aplica una función a una columna. Mantiene las columnas existentes.

mutate (provide_new_column = case_when (`<column>` <operator> provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, `<column>` <operator> provide_value_or_column_to_compare ~ provide_value_or_to_replace, TRUE ~ provide_default_value_or_column)))
Añada una nueva columna utilizando la expresión condicional especificada.

mutate (provide_new_column = `<column>` <operator> `<column>`)
Añada una nueva columna utilizando la expresión especificada, que realiza un cálculo con las columnas existentes. Mantiene las columnas existentes.

mutate (provide_new_column = coalesce (`<column>`, `<column>`))
Añada una nueva columna utilizando la expresión especificada, que sustituye los valores perdidos en la nueva columna por los valores de otra columna especificada. Como alternativa a la especificación de otra columna, puede especificar un valor, una función en una columna o una función en un valor. Mantiene las columnas existentes.

mutate (provide_new_column = if_else (`<column>` <logicalOperator> provide_value, provide_value_for_true, provide_value_for_false))
Añada una nueva columna utilizando la expresión condicional especificada. Mantiene las columnas existentes.

mutate (provide_new_column = `<column>`, provide_new_column = `<column>`)
Añadir varias columnas nuevas y conservar las existentes.

mutate (provide_new_column = n ())
Cuenta los valores de los grupos. Asegúrese de que la agrupación ya se ha realizado utilizando group_by. Mantiene las columnas existentes.

mutate_all

mutate_all (funs (<func>))
Aplicar la función especificada a todas las columnas y sobrescribir los valores existentes en dichas columnas. Especifique si desea eliminar los valores que faltan.

mutate_all (funs (. <operator> provide_value))
Aplicar el operador especificado a todas las columnas y sobrescribir los valores existentes en dichas columnas.

mutate_all (funs ("valor_proveedor" =. <operator> provide_value))
Aplicar el operador especificado a todas las columnas y crear nuevas columnas para contener los resultados. Dé nombres de las nuevas columnas que finalizan con el valor especificado.

mutate_at

mutate_at (vars (`<column>`), funs (<func>))
Aplicar funciones a las columnas especificadas.

mutate_if

mutate_if (<predicateFunc>, <func>)
Aplicar funciones a las columnas que cumplen la condición especificada.

mutate_if (<predicateFunc>, funs (. <operator> provide_value))
Aplicar el operador especificado a las columnas que cumplen la condición especificada.

mutate_if (<predicateFunc>, funs (<func>))
Aplicar funciones a las columnas que cumplen la condición especificada. Especifique si desea eliminar los valores que faltan.

rename

rename (provide_new_column = `<column>`)
Renombrar la columna especificada.

sample_frac

sample_frac (provide_number_between_0_and_1, weight= `<column>`, replace=<logical>)
Generar una muestra aleatoria basada en un porcentaje de los datos. weight es opcional y es la proporción de probabilidad de que la fila sea elegida. Proporcione una columna numérica. replace es opcional y su valor predeterminado es FALSE.

sample_n

sample_n (provide_number_of_rows, weight = `<column>`, replace=<logical>)
Generar una muestra aleatoria de datos basada en un número de filas. weight es opcional y es la proporción de probabilidad de que la fila sea elegida. Proporcione una columna numérica. replace es opcional y su valor predeterminado es FALSE.

seleccionar

select (`<column>`)
Conservar la columna especificada.

select (-`<column>`)
Eliminar la columna especificada.

select (starts_with ("valor_texto_proveedor"))
Mantener columnas con nombres que empiecen por el valor especificado.

select (ends_with ("valor_texto_proveedor"))
Conservar las columnas con nombres que terminen con el valor especificado.

select (contiene ("valor_texto_proveedor"))
Mantener columnas con nombres que contengan el valor especificado.

select (matches ("valor_texto_proveedor"))
Mantener columnas con nombres que coincidan con el valor especificado. El valor especificado puede ser textual o una expresión regular.

select (`<column>`: `<column>`)
Mantener las columnas en el rango especificado. Especifique el rango como de una columna a otra columna.

select (`<column>`, all ())
Conservar todas las columnas, pero hacer que la columna especificada sea la primera columna.

select (`<column>`, `<column>`)
Conservar las columnas especificadas.

select_if

select_if(<predicateFunc>) Mantiene las columnas que cumplen la condición especificada. Las funciones soportadas incluyen:

  • contiene
  • ends_with
  • matches
  • num_range
  • starts_with

summarize

summarize (provide_new_column = <func>(`<column>`))
Aplicar funciones de agregación a las columnas especificadas para reducir varios valores de columna a un único valor. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.

summarize_all

summarize_all (<func>)
Aplicar una función de agregación a todas las columnas para reducir varios valores de columna a un único valor. Especifique si desea eliminar los valores que faltan. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.

summarize_all (funs (<func>))
Aplicar varias funciones de agregación a todas las columnas para reducir varios valores de columna a un único valor. Crea nuevas columnas para alojar los resultados. Especifique si desea eliminar los valores que faltan. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.

summarize_if

summarize_if(<predicate_conditions>,...)
Aplica funciones de agregación a las columnas que cumplen las condiciones especificadas para reducir varios valores de columna a un solo valor. Especifique si desea eliminar los valores que faltan. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by. Las funciones soportadas incluyen:

  • count
  • máx
  • mean
  • min.
  • standard deviation
  • suma

tally

recuento ()
Recuenta el número de filas (para columnas de serie) o el total de los datos (para valores numéricos) por grupo. Asegúrese de agrupar los datos de columna en primer lugar utilizando la operación group_by.

recuento (wt = `<column>`)
Cuenta el número de filas (para columnas de serie) o totaliza los datos (para columnas numéricas) por grupo para la columna ponderada.

recuento (wt=<func>(`<column>`), sort = <logical>)
Aplica una función a la columna ponderada especificada y devuelve el resultado, por grupo, ordenado o no.

top_n

top_n (provide_value)
Seleccione las N filas superiores o inferiores (por valor) en cada grupo. Especifique un entero positivo para seleccionar las primeras N filas y un entero negativo para seleccionar las últimas N filas.

top_n (provide_value, `<column>`)
Seleccione las N filas superiores o inferiores (por valor) en cada grupo, basándose en la columna especificada. Especifique un entero positivo para seleccionar las primeras N filas y un entero negativo para seleccionar las últimas N filas.

Si las filas duplicadas afectan al recuento, utilice la operación de la GUI de Eliminar duplicados antes de utilizar la operación top_n().

transmute

transmute (<new_or_existing_column> = `<column>`)
Añada una nueva columna o sobrescriba una existente utilizando la expresión especificada. Mantiene sólo las columnas mencionadas en la expresión.

transmute (<new_or_existing_column> = <func(column)>)
Añada una nueva columna o sobrescriba una existente aplicando una función a la columna especificada. Mantiene sólo las columnas mencionadas en la expresión.

transmute (<new_or_existing_column> = `<column>` <operator> `<column>`)
Añada una nueva columna o sobrescriba una existente aplicando un operador a la columna especificada. Mantiene sólo las columnas mencionadas en la expresión.

transmute (<new_or_existing_column> = `<column>`, <new_or_existing_column> = `<column>`)
Añadir varias columnas nuevas. Mantiene sólo las columnas mencionadas en la expresión.

transmute (<new_or_existing_column> = if_else (provide_value, provide_value_for_true, provide_value_for_false))
Añada una columna nueva o sobrescriba una existente utilizando las expresiones condicionales especificadas. Mantiene solo las columnas mencionadas en las expresiones.

ungroup

ungroup ()
Desagrupar los datos.

Funciones

Agregar

  • mean
  • min.
  • n
  • sd
  • suma

Lógica

  • is.na

Numérica

  • abs
  • coalesce
  • cut
  • exp
  • floor

Texto

  • c
  • coalesce
  • paste
  • tolower
  • toupper

Tipo

  • as.character
  • as.double
  • as.integer
  • as.logical

Operadores lógicos

  • <
  • <=
  • >=
  • >
  • between
  • !=
  • ==
  • %in%

Tema principal: Cómo refinar datos

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información