0 / 0
Torna alla versione inglese della documentazione
Modelli di codice interattivi in Data Refinery
Ultimo aggiornamento: 07 ott 2024
Modelli di codice interattivi in Data Refinery

Data Refinery fornisce modelli interattivi per operazioni di codice, funzioni e operatori logici. Accedere ai modelli dalla casella di testo della riga comandi nella parte superiore della pagina. I modelli includono l'assistenza interattiva per aiutare l'utente con le opzioni di sintassi.

Importante: il supporto è per le operazioni e le funzioni nell'interfaccia utente. Se si inseriscono altre operazioni o funzioni da una libreria open source, il flusso Data Refinery potrebbe non riuscire. Consultare la guida della riga comandi e assicurarsi di utilizzare l'elenco di operazioni o funzioni dai template. Utilizzare gli esempi nei modelli per personalizzare ulteriormente la sintassi in base alle esigenze.

Operazioni

disporre

disporre (`<column>`)
Ordina le righe, in ordine crescente, in base alle colonne specificate.

disponi (desc (`<column>`))
Ordina le righe, in ordine decrescente, in base alla colonna specificata

disponi (`<column>`, `<column>`)
Ordina le righe, in ordine crescente, per ciascuna colonna successiva specificata, mantenendo intatto l'ordine dell'ordinamento precedente.

conteggio

count ()
Totale dati per gruppo.

count (`<column>`)
Raggruppa i dati per la colonna specificata e restituisce il numero di righe con valori univoci (per i valori stringa) o restituisce il totale per ogni gruppo (per valori numerici).

count (`<column>`, wt= `<column>`)
Raggruppa i dati per la colonna specificata e restituisce il numero di righe con valori univoci (per i valori stringa) o restituisce il totale per ciascun gruppo (per i valori numerici) nella colonna peso specificata.

count (`<column>`, wt=<func>(`<column>`))
Raggruppa i dati in base alla colonna specificata e restituisce il risultato della funzione applicata alla colonna peso specificata.

count (`<column>`, wt=<func>(`<column>`), sort = <logical>)
Raggruppa i dati in base alla colonna specificata e restituisce il risultato della funzione applicata alla colonna peso specificata, ordinata o meno.

distinct

distinct ()
Mantieni distinte, righe univoche basate su tutte le colonne o su colonne specificate.

filtro

filter (`<column>` <logicalOperator> valore_provisioning)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe.
Per il tipo di colonna booleana, provide_value deve essere TRUE o FALSE in maiuscolo.

filter (`<column>` == <logical>)
Conserva le righe che soddisfano le condizioni di filtro specificate in base al valore logico TRUE o FALSE.

filter (<func>(`<column>`) <logicalOperator> valore_provisioning)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe. La condizione può applicare una funzione a una colonna a sinistra dell'operatore.

filter (`<column>` <logicalOperator> <func(column)>)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe. La condizione può applicare una funzione a una colonna a destra dell'operatore.

filter (<logicalfunc(column)>)
Conserva le righe che soddisfano la condizione specificata e filtra tutte le altre righe. La condizione può applicare una funzione logica a una colonna.

filter (`<column>` <logicalOperator> valore_provisioning <andor> `<column>` <logicalOperator> valore_provisioning)
Conserva le righe che soddisfano le condizioni specificate e filtra tutte le altre righe.

gruppo_da

group_by (`<column>`)
Raggruppa i dati in base alla colonna specificata.

group_by (desc (`<column>`))
Raggruppa i dati, in ordine decrescente, in base alla colonna specificata.

Mutate

mutate (provide_new_column = `<column>`)
Aggiungere una nuova colonna e conservare le colonne esistenti.

mutate (provide_new_column = <func(column)>)
Aggiungere una nuova colonna utilizzando l'espressione specificata, che applica una funzione a una colonna. Mantiene le colonne esistenti.

mutate (provide_new_column = case_when (`<column>` <operator> provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, `<column>` <operator> provide_value_or_column_to_compare ~ provide_value_or_column_to_replace, TRUE ~ provide_default_value_or_column))
Aggiungere una nuova colonna utilizzando l'espressione condizionale specificata.

mutate (provide_new_column = `<column>` <operator> `<column>`)
Aggiungere una nuova colonna utilizzando l'espressione specificata, che esegue un calcolo con le colonne esistenti. Mantiene le colonne esistenti.

mutate (provide_new_column = coalesce (`<column>`, `<column>`))
Aggiungere una nuova colonna utilizzando l'espressione specificata, che sostituisce i valori mancanti nella nuova colonna con i valori di un'altra colonna specificata. Oltre a specificare un'altra colonna, è possibile specificare un valore, una funzione in una colonna o una funzione in un valore. Mantiene le colonne esistenti.

mutate (provide_new_column = if_else (`<column>` <logicalOperator> valore_provisioning, provide_value_for_true, provide_value_for_false))
Aggiungere una nuova colonna utilizzando l'espressione condizionale specificata. Mantiene le colonne esistenti.

mutate (provide_new_column = `<column>`, provide_new_column = `<column>`)
Aggiungere più nuove colonne e conservare le colonne esistenti.

mutate (provide_new_column = n ())
Conta i valori nei gruppi. Verificare che il raggruppamento sia già stato eseguito utilizzando group_by. Mantiene le colonne esistenti.

mutate_all

mutate_all (funs (<func>))
Applicare la funzione specificata a tutte le colonne e sovrascrivere i valori esistenti in tali colonne. Specifica se rimuovere i valori mancanti.

mutate_all (funs (. <operator> provide_value))
Applica l'operatore specificato a tutte le colonne e sovrascrive i valori esistenti in tali colonne.

mutate_all (funs ("valore_provisioning" =. <operator> provide_value))
Applica l'operatore specificato a tutte le colonne e crea nuove colonne per contenere i risultati. Assegna alle nuove colonne nomi che terminano con il valore specificato.

mutate_at

mutate_at (vars (`<column>`), funs (<func>))
Applica funzioni alle colonne specificate.

mutate_if

mutate_if (<predicateFunc>, <func>)
Applica funzioni alle colonne che soddisfano la condizione specificata.

mutate_if (<predicateFunc>, funs (. <operator> provide_value)
Applica l'operatore specificato alle colonne che soddisfano la condizione specificata.

mutate_if (<predicateFunc>, funs (<func>))
Applicare le funzioni alle colonne che soddisfano la condizione specificata. Specifica se rimuovere i valori mancanti.

rinominare

rename (provide_new_column = `<column>`)
Rinomina la colonna specificata.

Sample_frac

sample_frac (provide_number_between_0_and_1, weight= `<column>`, replace=<logical>)
Genera un esempio casuale basato su una percentuale di dati. weight è un valore facoltativo ed è il rapporto di probabilità in base al quale verrà scelta la riga. Fornire una colonna numerica. replace è facoltativo e il relativo valore predefinito è FALSE.

Sample_n

sample_n (provide_number_of_rows, weight = `<column>`, replace=<logical>)
Genera un campione casuale di dati basato sul numero di righe. weight è un valore facoltativo ed è il rapporto di probabilità in base al quale verrà scelta la riga. Fornire una colonna numerica. replace è facoltativo e il relativo valore predefinito è FALSE.

selezionare

select (`<column>`)
Mantieni la colonna specificata.

select (- `<column>`)
Rimuovere la colonna specificata.

select (starts_with ("valore_testo_provisioning"))
Conserva le colonne con nomi che iniziano con il valore specificato.

select (ends_with ("provide_text_value"))
Conserva le colonne con nomi che terminano con il valore specificato.

select (contiene ("provide_text_value"))
Conserva le colonne con nomi che contengono il valore specificato.

select (corrisponde ("provide_text_value"))
Conserva le colonne con nomi che corrispondono al valore specificato. Il valore specificato può essere un testo o un'espressione regolare.

select (`<column>`: `<column>`)
Mantenere le colonne nell'intervallo specificato. Specificare l'intervallo da una colonna all'altra colonna.

select (`<column>`, all ())
Mantieni tutte le colonne, ma rendi la colonna specificata la prima colonna.

select (`<column>`, `<column>`)
Conserva le colonne specificate.

select_if

select_if (<predicateFunc>) Conserva le colonne che soddisfano la condizione specificata. Le funzioni supportate includono:

  • contiene
  • ends_with
  • corrisponde
  • num_intervallo
  • starts_with

riepilogare

summarize (provide_new_column = <func>(`<column>`))
Applicare funzioni di aggregazione alle colonne specificate per ridurre più valori di colonna a un solo valore. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.

riepilogato_tutto

summarize_all(<func>)
Apply an aggregate function to all of the columns to reduce multiple column values to a single value. Specifica se rimuovere i valori mancanti. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.

summarize_all (funs (<func>))
Applicare più funzioni di aggregazione a tutte le colonne per ridurre i valori di più colonne a un singolo valore Crea nuove colonne per contenere i risultati. Specifica se rimuovere i valori mancanti. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.

riepilogato_se

summarize_if (<predicate_conditions>, ...)
Applica le funzioni di aggregazione alle colonne che soddisfano le condizioni specificate per ridurre più valori di colonna a un singolo valore. Specifica se rimuovere i valori mancanti. Raggruppa prima i dati di colonna utilizzando l'operazione group_by. Le funzioni supportate includono:

  • conteggio
  • max
  • media
  • min
  • minima
  • somma

assegnare

tally ()
Conta il numero di righe (per le colonne stringa) o somma i dati (per i valori numerici) per gruppo. Raggruppa prima i dati di colonna utilizzando l'operazione group_by.

tally (wt = `<column>`)
Conta il numero di righe (per le colonne stringa) o somma i dati (per le colonne numeriche) per gruppo per la colonna ponderata.

(wt=<func>(`<column>`), sort = <logical>)
Applica una funzione alla colonna pesata specificata e restituisce il risultato, per gruppo, ordinato o meno.

top_n

top_n (provide_value)
Selezionare le prime o le ultime N righe (per valore) in ciascun gruppo. Specificare un numero intero positivo per selezionare le N righe iniziali, specificare un numero intero negativo per selezionare le N righe finali.

top_n (provide_value, `<column>`)
Selezionare le prime o le ultime N righe (per valore) in ciascun gruppo, in base alla colonna specificata. Specificare un numero intero positivo per selezionare le N righe iniziali, specificare un numero intero negativo per selezionare le N righe finali.

Se le righe duplicate influenzano il conteggio, utilizzare l'operazione GUI Rimuovi duplicati prima di utilizzare l'operazione top_n ().

Transmute

transmute (<new_or_existing_column> = `<column>`)
Aggiungere una nuova colonna o sovrascriverne una esistente utilizzando l'espressione specificata. Mantiene solo le colonne menzionate nell'espressione.

transmute (<new_or_existing_column> = <func(column)>)
Aggiungere una nuova colonna o sovrascriverne una esistente applicando una funzione alla colonna specificata. Mantiene solo le colonne menzionate nell'espressione.

transmute (<new_or_existing_column> = `<column>` <operator> `<column>`)
Aggiungere una nuova colonna o sovrascriverne una esistente applicando un operatore alla colonna specificata. Mantiene solo le colonne menzionate nell'espressione.

transmute (<new_or_existing_column> = `<column>`, <new_or_existing_column> = `<column>`)
Aggiungere più nuove colonne. Mantiene solo le colonne menzionate nell'espressione.

transmute (<new_or_existing_column> = if_else (provide_value, provide_value_for_true, provide_value_for_false))
Aggiungere una nuova colonna o sovrascriverne una esistente utilizzando le espressioni condizionali specificate. Mantiene solo le colonne menzionate nelle espressioni.

separare

ungroup ()
Annulla il raggruppamento dei dati

Funzioni

Aggregazione

  • media
  • min
  • n
  • ds
  • somma

Logica

  • is.na

Numerico

  • abs
  • coalesce
  • cut
  • exp
  • floor

Testo

  • c
  • coalesce
  • paste
  • tolower
  • toupper

Tipo

  • as.character
  • as.double
  • as.integer
  • as.logical

Operatori logici

  • <
  • <=
  • >=
  • >
  • tra
  • !=
  • ==
  • %in%

Argomento principale Raffinazione dei dati

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni