projekt-lib pro R | IBM Cloud Pak for Data as a Service

Translation not up to date

The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.

Go back to the English version of the documentation

projekt-lib pro R

Last updated: 18. 8. 2023

projekt-lib pro R

Potřebujete-li interagovat s projekty Watson Studio a s aktivy projektu z notebooku, můžete použít knihovnu project-lib pro R. Knihovna je jako programmatické rozhraní k projektu.

Pomocí knihovny project-lib pro R můžete přistupovat k metadatům a aktivům projektu, včetně souborů a připojení. Knihovna také obsahuje funkce, které zjednodušují načítání souborů přidružených k projektu.

Pozn.:

-Funkce project-lib nekóduje nebo dekóduje data při ukládání dat do souboru nebo získávání dat ze souboru.
-Funkce produktu project-lib nemohou být použity k přístupu k připojeným aktivům složky (soubory na cestě v produktu Cloud Object Storage).

Použít knihovnu

Knihovna project-lib pro R je předinstalovaná a lze ji importovat přímo do notebooku v editoru notebooku. Chcete-li použít knihovnu project-lib v zápisníku, potřebujete ID projektu a token projektu.

Chcete-li vložit token projektu do notebooku, postupujte takto:

Klepněte na ikonu Více na panelu nástrojů zápisníku a poté klepněte na volbu Vložit token projektu.

Pokud token projektu existuje, přidá se do notebooku buňka s následujícími informacemi:
```
library(projectLib)
project <- projectLib::Project$new(sc, "<ProjectId>", "<ProjectToken>")
```
sc je kontext Spark, je-li použit Spark. <ProjectId> je ID vašeho projektu a <ProjectToken> je hodnota tokenu projektu.

Je-li ve zprávě řečeno, že neexistuje žádný token projektu, klepněte na odkaz ve zprávě a přesměrovává se na stránku projektu Řízení přístupu , kde můžete vytvořit token projektu. Chcete-li vytvořit token projektu, musíte být způsobilí. Podrobnosti naleznete v tématu Ruční přidání tokenu projektu.

Chcete-li vytvořit token projektu:
1. Na kartě Spravovat vyberte stránku Řízení přístupu a klepněte na volbu Nový přístupový token pod Tokeny přístupu.
2. Zadejte název, vyberte roli Editor pro projekt a vytvořte token.
3. Přejděte zpět na svůj notebook, klepněte na ikonu Více na panelu nástrojů zápisníku a poté klepněte na volbu Vložit token projektu.

Funkce produktu `project-lib`

Objekt projektu převedený na instanci vytvořený poté, co jste naimportovali knihovnu produktu project-lib , odkrývá sadu funkcí seskupených takto:

Načtení informací o projektu
Načtení souborů
uložit data
Číst data z připojení
Načíst připojená data

Načíst informace o projektu

Můžete použít následující funkce k programovému načtení informací souvisejících s projektantem.

get_name()

Tato funkce vrací název projektu.
get_description()

Tato funkce vrací popis projektu.
get_metadata()

Tato funkce vrací metadata projektu.
get_storage_metadata()

Tato funkce vrací metadata úložiště objektů přidružené k projektu.
get_project_bucket_name()

Tato funkce vrací název sektoru projektu v přidruženém úložišti objektů. Všechny soubory projektu jsou uloženy v tomto sektoru.
get_files()

Tato funkce vrací seznam souborů ve vašem projektu. Každý prvek ve vráceném seznamu obsahuje ID a název souboru. Seznam vrácených souborů není řazen podle žádného kritéria a lze jej změnit, když znovu zavoláte funkci.
get_assets()

Tato funkce vrací seznam všech aktiv projektu. Volitelný parametr assetType můžete předat do funkce get_assets , která vám umožňuje filtrovat aktiva podle typu. Akceptované hodnoty pro tento parametr jsou data_asset, connection a asset. Hodnota asset vrací všechna aktiva ve vašem projektu. Chcete-li například získat pouze datová aktiva, použijte funkci get_assets("data_asset").
get_connections()

Tato funkce vrací seznam připojení, která máte ve svém projektu. Každý prvek ve vráceném seznamu obsahuje ID a název připojení.

Načtení souborů

Chcete-li načíst soubory uložené v úložišti objektů přidruženém k vašemu projektu, můžete použít následující funkce.

Soubory můžete načítat dvěma způsoby:

get_file_url(filename) kde filename je jméno souboru, který chcete načíst.

Tato funkce vrací adresu URL pro načtení souboru z úložiště objektů pomocí produktu Spark. Adresa URL je vytvořena na základě typu úložiště objektů přidruženého k projektu. Konfigurace Hadoop jsou nastaveny automaticky při interakci s úložištěm objektů vašeho projektu.

Následující příklad ukazuje, jak použít tuto funkci k načtení dat z úložiště objektů pomocí Spark:
```
# Import the lib
library(projectLib)
project <- projectLib::Project$new(sc, "<ProjectId>", "<ProjectToken>")

# Get the url
url <- project$get_file_url("myFile.csv")

# Fetch the CSV file from the object storage using Spark
invisible(sparkR.session(appName = "SparkSession R"))

df.data <- read.df(
    url,
    source = "org.apache.spark.sql.execution.datasources.csv.CSVFileFormat",
    header = "true")
head(df.data)
```
get_file(filename) kde filename je jméno souboru, který chcete načíst.

Tato funkce načítá soubor do paměti běžícího jádra. Funkce vrátí bajtovou vyrovnávací paměť, kterou lze použít k vytvoření vazby na datové struktury specifické pro jádro, například rámec pro data R. Tato metoda načítání souborů se nedoporučuje pro velké soubory.

Následující příklad ukazuje, jak načíst soubor a číst data v rámci datového rámce R:
```
# Import project lib
library(projectLib)
project <- projectLib::Project$new(sc , "<ProjectId>", "<ProjectToken>")

# Fetch data
my.file <- project$get_file("my_file.csv")

# Read the CSV data file into a data frame
df.data <-  read.csv(text = rawToChar(my.file))
head(df.data)
```

uložit data

Chcete-li uložit data do paměti objektů přidružené k vašemu projektu, můžete použít následující funkci. Data budou přidána jako soubor do sektoru projektu v přidruženém úložišti Cloud Object Storage. Tato funkce provádí více akcí. Nejprve vloží data do úložiště objektů a pak přidá tato data jako datové aktivum do vašeho projektu, abyste si mohli prohlédnout data, která jste uložili jako soubor v seznamu aktiv dat ve vašem projektu.

save_data(filename, data, setProjectAsset=TRUE, overwrite=FALSE)

Funkce přijímá následující parametry:

filename: název vytvořeného souboru.
data: data k odeslání. Přijaty typy pro tento parametr jsou R základní objekty nebo vyrovnávací paměti řetězce.
setProjectAsset[optional]: přidá soubor do projektu jako datové aktivum poté, co byla data úspěšně přenesena do úložiště objektů. Vezme logickou hodnotu a hodnota true je nastavena jako výchozí.
overwrite[optional]: tento soubor přepíše, pokud soubor již existuje v úložišti objektů nebo v projektu. Ve výchozím nastavení je nastaven na hodnotu false.

Zde je příklad, který ukazuje, jak můžete uložit data do souboru v úložišti objektů:

library("projectLib")
project <- access_project()

# Capture CSV data from console output
csv_lines <- capture.output(write.csv(df.data, row.names=FALSE), type="output")
csv_raw <- charToRaw(paste0(csv_lines, collapse='\n'))

project$save_data("file.csv", csv_raw)

Číst data z připojení

Chcete-li získat metadata (pověření) daného připojení, můžete použít následující funkci.

get_connection: funkce bere jako vstup ID připojení nebo název připojení. Tyto hodnoty můžete získat pomocí funkce get_assets() , která vrací id, name a type všech aktiv uvedených v projektu.

Funkce get_connection vrací pověřovací údaje připojení, které můžete použít k načtení dat ze zdroje dat připojení.

Zde je příklad, který ukazuje, jak můžete načíst pověření připojení pomocí funkce get_connection :

# Import project lib
library(projectLib)
project <- projectLib::Project$new(sc , "<ProjectId>", "<ProjectToken>")

# Fetch connection
conn.cred <- project$get_connection(name="<ConnectionName>")

Pokud je vaším připojením například připojení k databázi dashDB , můžete načíst data spuštěním následujícího kódu:

library(ibmdbR)

props <- paste("DASHDB;DATABASE=BLUDB;HOSTNAME=", conn.cred$host, ";PORT=50000;PROTOCOL=TCPIP;", sep="")
conn <- idaConnect(props, uid = conn.cred$username, pwd = conn.cred$password, conType = "odbc")
idaInit(conn)

idf.1 <- ida.data.frame('<TableName>')
head(idf.1)

Načtení propojených dat

Chcete-li načíst pověření připojených dat, můžete použít následující funkci. Funkce vrátí slovník obsahující pověření připojení spolu s atributem datapath , který odkazuje na specifická data v tomto připojení, například tabulku v instanci dashDB nebo databázi v instanci Cloudant .

get_connected_data: tato funkce bere jako vstup ID připojených dat nebo název připojených dat. Tyto hodnoty můžete získat pomocí funkce get_assets() , která vrací id, name a type všech aktiv uvedených v projektu.

Zde je příklad, který ukazuje, jak načíst údaje pověření připojených dat v instanci dashDB pomocí funkce get_connected_data :

# Import project lib
library(projectLib)
project <- projectLib::Project$new(sc , "<ProjectId>", "<ProjectToken>")

# Fetch credentials of the connected data
conn.data <- project$get_connected_data(id="<ConnectedDataId>")

Nadřízené téma: Načítání a přístup k datům v zápisníku