0 / 0
Go back to the English version of the documentation
Knihovny AutoAI pro Python
Last updated: 22. 8. 2023
Knihovny AutoAI pro Python

Knihovna autoai-lib pro Python obsahuje sadu funkcí, které vám pomohou interaktivně spolupracovat s experimenty IBM Watson Machine Learning AutoAI . Pomocí knihovny produktu autoai-lib můžete přezkoumat a upravit transformace dat, které se budou konat při vytváření propojení procesů. Podobně můžete použít knihovnu produktu autoai-ts-libs k interakci s notebooky propojení procesů pro experimenty s časovými řadami.

Instalace autoai-lib nebo autoai-ts-libs pro Python

Postupujte podle pokynů v tématu Instalace vlastních knihoven a nainstalujte produkt autoai-lib nebo autoai-ts-libs.

Použití autoai-lib a autoai-ts-libs pro Python

Knihovna produktů autoai-lib a autoai-ts-libs pro Python obsahuje funkce, které vám pomohou interaktivně spolupracovat s experimenty IBM Watson Machine Learning AutoAI . Pomocí knihovny produktu autoai-lib můžete přezkoumat a upravit transformace dat, které se provedou při vytváření klasifikačních a regresních ropovodů. Pomocí knihovny produktu autoai-ts-libs můžete přezkoumat transformace dat, které se používají při vytváření ropovodů pro časové řady (prognózy).

Instalace autoai-lib a autoai-ts-libs pro Python

Postupujte podle pokynů v tématu Instalace vlastních knihoven a nainstalujte autoai-lib a autoai-ts-libs.

Funkce autoai-lib

Objekt projektu převedený na instanci, který byl vytvořen po importu knihovny produktu autoai-lib , odkrývá tyto funkce:

autoai_libs.transformers.exportable.NumpyColumnSelector()

Vybírá podmnožinu sloupců numerického pole

Použití:

autoai_libs.transformers.exportable.NumpyColumnSelector(columns=None)
Volba Popis
sloupce seznam indexů sloupců, které se mají vybrat

autoai_libs.transformers.exportable.CompressStrings()

Odstraní mezery a speciální znaky z řetězcových sloupců vstupního číselného pole X.

Použití:

autoai_libs.transformers.exportable.CompressStrings(compress_type='string', dtypes_list=None, misslist_list=None, missing_values_reference_list=None, activate_flag=True)
Volba Popis
compress_type typ komprese řetězců. 'string' pro odebrání mezer z řetězce a 'hash' pro vytvoření int hash. Výchozí hodnota je 'string'. 'hash' se používá pro sloupce s řetězci a cat_imp_strategy = 'most_frequent'
dtypes_list Seznam obsahující řetězce, které označují typ každého sloupce vstupního pole numpy X (řetězce jsou mezi 'char_str', 'int_str', 'float_str', 'float_num', 'float_int_num', 'int_num', 'boolean', 'Unknown'). Pokud žádný, budou zjištěny typy sloupců. Výchozí nastavení je Žádné.
misslist_list seznam obsahuje seznamy chybějících hodnot jednotlivých sloupců vstupního čísla X. Pokud žádná, budou zjištěny chybějící hodnoty každého sloupce. Výchozí nastavení je Žádné.
missing_values_reference_list reference list of missing values in the input numpy array X
activate_flag příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified.

autoai_libs.transformers.exportable.NumpyReplaceMissingValues()

Vzhledem k tomu, že pole numpy a referenční seznam chybějících hodnot pro něj chybí, nahradí chybějící hodnoty speciální hodnotou (obvykle speciální chybějící hodnota, například np.nan).

Použití:

autoai_libs.transformers.exportable.NumpyReplaceMissingValues(missing_values, filling_values=np.nan)
Volba Popis
missing_values referenční seznam chybějících hodnot
filling_values speciální hodnota, která je přiřazena k neznámým hodnotám

autoai_libs.transformers.exportable.NumpyReplaceUnknownValues()

Vzhledem k tomu, že pole numpy a referenční seznam známých hodnot pro každý sloupec nahradí hodnoty, které nejsou součástí referenčního seznamu, se speciální hodnotou (obvykle np.nan). Tato metoda se obvykle používá k odebírání popisků pro sloupce v sadě testovacích dat, které nebyly zobrazeny v odpovídajících sloupcích datové sady pro školení.

Použití:

autoai_libs.transformers.exportable.NumpyReplaceUnknownValues(known_values_list=None, filling_values=None, missing_values_reference_list=None)
Volba Popis
known_values_list referenční seznam seznamů známých hodnot pro každý sloupec
filling_values speciální hodnota, která je přiřazena k neznámým hodnotám
missing_values_reference_list referenční seznam chybějících hodnot

autoai_libs.transformers.exportable.boolean2float()

Převádí 1-D numpy pole řetězců, které představují booleovské hodnoty k plovám a nahrazuje chybějící hodnoty hodnotou np.nan. Změní také typ pole z 'objektu' na 'float'.

Použití:

autoai_libs.transformers.exportable.boolean2float(activate_flag=True)
Volba Popis
activate_flag příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified.

autoai_libs.transformers.exportable.CatImputer()

Tento transformátor je obálka pro kategoriální imputory. Interně v současné době používá sklearn SimpleImputer] (https://scikit-learn.org/stable/modules/generated/sklearn.impute.SimpleImputer.html)

Použití:

autoai_libs.transformers.exportable.CatImputer(strategy, missing_values, sklearn_version_family=global_sklearn_version_family, activate_flag=True)
Volba Popis
strategy řetězec, volitelný, default="mean ". Strategie imputace pro chybějící hodnoty.
-mean: nahradit za použití střední hodnoty po každém sloupci. Lze ji použít pouze s numerickými daty.
- median:nahraďte za použití mediánu podél každého sloupce. Lze jej použít pouze s číselnými daty.
- most_frequent:nahraďte tak, že každý sloupec obsahuje nejčastěji používanou hodnotu. Používá se s řetězci nebo číselnými daty.
- constant:nahraďte hodnotou fill_value. Může být použit s řetězci nebo s numerickými daty.
missing_values počet, řetězec, np.nan (výchozí) nebo Žádný. Zástupný symbol pro chybějící hodnoty. Jsou imputovány všechny výskyty chyb_hodnot.
sklearn_version_family řetězec označující verzi sklearn pro zpětnou kompatibilitu s verzemi 019 a 020dev. Aktuálně nepoužívané. Výchozí nastavení je Žádné.
activate_flag příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified.

autoai_libs.transformers.exportable.CatEncoder()

Tato metoda je obálka pro kategorický kodér. Je-li parametr kódování hodnotu 'ordinal', interně jej momentálně používá sklearn OrdinalEncoder. Je-li parametr kódování 'onehot' nebo 'onehot-dense' interně, používá skučení OneHotenkodéru

Použití:

autoai_libs.transformers.exportable.CatEncoder(encoding, categories, dtype, handle_unknown, sklearn_version_family=global_sklearn_version_family, activate_flag=True)
Volba Popis
encoding Funkce str, " onehot ',' onehot-dense 'nebo' ordinal '. Typ kódování, který se má použít (výchozí hodnota je 'ordinal')
'onehot': zakóduje funkce pomocí jednoho nebo aktivního schématu jednoho z K (nebo také tzv. 'fiktivního' kódování). Toto kódování vytváří binární sloupec pro každou kategorii a vrací rozptýlenou matici.
'onehot-dense': stejné jako 'onehot', ale vrací husté pole místo řídké matice.
'ordinal': enkódovat funkce jako ordinální celá čísla. Výsledkem je jediný sloupec celých čísel (0 až n_categories-1) na jednu funkci.
categories 'auto' nebo seznam seznamů/polí hodnot. Kategorie (jedinečné hodnoty) na jednu funkci:
'auto': Určit kategorie automaticky ze vzdělávacích dat.
list : categories[i] uchovává kategorie, které se očekávají ve sloupci ith. Předané kategorie musí být tříděny a nesmí směšovat řetězce a číselné hodnoty. Použité kategorie lze nalézt v atributu encoder.categories_ .
dtype typ čísla, výchozí np.float64 Požadovaný datový typ výstupu.
handle_unknown 'chyba' (výchozí) nebo 'ignorovat'. Zda se má při transformaci vyskytnout chyba nebo ignorovat, pokud je během transformace přítomna neznámá kategorická funkce (výchozí je zvýšit). Je-li tento parametr nastaven na hodnotu 'ignore' a během transformace je zjištěna neznámá kategorie, výsledné jednozakódované kódované sloupce pro tuto funkci jsou samé nuly. V inverzní transformaci je neznámá kategorie označena jako Žádná. Ignorování neznámých kategorií není podporováno pro encoding='ordinal'.
sklearn_version_family řetězec označující verzi sklearn pro zpětnou kompatibilitu s verzemi 019 a 020dev. Aktuálně nepoužívané. Výchozí nastavení je Žádné.
activate_flag příznak, který označuje, že tento transformátor je aktivní. If False, transform (X) outputs the input numpy array X unmodified.

autoai_libs.transformers.exportable.float32_transform()

Transformuje float64 numpy array na float32.

Použití:

autoai_libs.transformers.exportable.float32_transform(activate_flag=True)
Volba Popis
activate_flag příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified.

autoai_libs.transformers.exportable.FloatStr2Float()

Vzhledem k tomu, že číselné pole X a dtypes_list, které označuje typy svých sloupců, nahradí sloupce řetězců, které představují plovoucí znaky (typ 'float_str' v souboru dtypes_list), na sloupce plováků a nahradí jejich chybějící hodnoty hodnotou np.nan.

Použití:

autoai_libs.transformers.exportable.FloatStr2Float(dtypes_list, missing_values_reference_list=None, activate_flag=True)
Volba Popis
dtypes_list Seznam obsahuje řetězce, které označují typ každého sloupce vstupního pole numpy X (řetězce jsou mezi 'char_str', 'int_str', 'float_str', 'float_num', 'float_int_num', 'int_num', 'boolean', 'Unknown').
missing_values_reference_list referenční seznam chybějících hodnot
activate_flag příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified.

autoai_libs.transformers.exportable.NumImputer()

Tato metoda je obálka pro numerickou imputru.

Použití:

autoai_libs.transformers.exportable.NumImputer(strategy, missing_values, activate_flag=True)
Volba Popis
strategy num_imp_strategy: string, volitelné (výchozí hodnota = "mean "). Strategie imputace:
-Je-li "střední", nahraďte chybějící hodnoty pomocí střední hodnoty podél osy.
-Je-li hodnota "median", pak nahraďte chybějící hodnoty pomocí mediánu podél osy.
-Je-li "most_frequent", pak se chybějící hodnota nahradí za použití nejfrekventovanější hodnoty podél osy.
missing_values integer nebo "NaN", volitelné (výchozí hodnota = "NaN"). Zástupný symbol pro chybějící hodnoty. Jsou imputovány všechny výskyty chyb_hodnot:
-Pro chybějící hodnoty kódované jako np.nanpoužijte řetězcovou hodnotu "NaN".
- activate_flag: parametr, který označuje, že tento transformátor je aktivní. If False, transform (X) outputs the input numpy array X unmodified.

autoai_libs.transformers.exportable.OptStandardScaler()

Tento parametr je obálka pro změnu měřítka číselných proměnných. Aktuálně používá funkci sklearn StandardScaler interně.

Použití:

autoai_libs.transformers.exportable.OptStandardScaler(use_scaler_flag=True, num_scaler_copy=True, num_scaler_with_mean=True, num_scaler_with_std=True)
Volba Popis
num_scaler_copy Logická, volitelná, výchozí hodnota True. Je-li hodnota False, zkuste se vyhnout kopírování a místo toho měnit velikost místa. Není zaručeno, že tato akce bude vždy fungovat. Je-li například umístěna na místě, nejsou-li data pole NumPy nebo scipy.sparse CSR matrix, může být kopie stále vrácena.
num_scaler_with_mean Logická hodnota, True ve výchozím nastavení. Je-li hodnota True, před změnou měřítka se data zarovnat Výjimka je vyvolána při pokusu o řídké matrice, protože cennější je sestavení husté matice, která v běžných případech použití je pravděpodobně příliš velká, aby se vešla do paměti.
num_scaler_with_std Logická hodnota, True ve výchozím nastavení. Je-li hodnota True, měřítko dat na rozptyl jednotky (nebo ekvivalentně směrodatné odchylky jednotky).
use_scaler_flag Logický příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified. Výchozí hodnota je true.

autoai_libs.transformers.exportable.NumpyPermuteArray()

Uspořádá sloupce nebo řádky v číselníku na základě seznamu indexů.

Použití:

autoai_libs.transformers.exportable.NumpyPermuteArray(permutation_indices=None, axis=None)
Volba Popis
permutation_indices seznam indexů podle toho, které sloupce jsou přeuspořádány
axis 0 ztlumit podle sloupců. 1 vypnutí po řádcích.

Transformace funkcí

Tyto metody se vztahují na transformace funkcí popsané v části Podrobnosti implementaceAutoAI.

autoai_libs.cognito.transforms.transform_utils.TA1(fun, name = Žádný, datatypes = None, feat_constraints=None, tgraph = None, apply_all=True, col_names=None, col_dtypes=None)

Pro unární nestavové funkce, jako je čtvereček nebo log, použijte TA1.

Použití:

autoai_libs.cognito.transforms.transform_utils.TA1(fun, name=None, datatypes=None, feat_constraints=None, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba Popis
fun ukazatel funkce
name Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních.
datatypes seznam typů dat, z nichž jeden je platný vstup do funkce transformátoru (číselná hodnota, float, int atd.)
feat_constraints všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup pro tuto transformaci
tgraph objekt tgraph musí být počáteční TGraph () objekt. Tento parametr je volitelný a nelze jej předat, ale to může vést k selhání zjištění některé neefektivnosti kvůli nedostatku ukládání do mezipaměti.
apply_all only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich.
col_names názvy sloupců funkcí v seznamu
col_dtypes seznam datových typů sloupců funkce

autoai_libs.cognito.transforms.transform_utils.TA2()

Pro binární nestavové funkce, jako je součet, produkt, použijte TA2.

Použití:

autoai_libs.cognito.transforms.transform_utils.TA2(fun, name, datatypes1, feat_constraints1, datatypes2, feat_constraints2, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba Popis
fun ukazatel funkce
name: název řetězce, který jednoznačně identifikuje tento transformátor od ostatních.
datatypes1 seznam datových typů, z nichž některé jsou platné vstupy (první parametr) k funkci transformátoru (číselné, plovoucí, celé a tak dále)
feat_constraints1 všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup (první parametr) k této transformaci
datatypes2 seznam datových typů, z nichž některé jsou platné vstupy (druhý parametr) k funkci transformátoru (číselné, plovoucí, celé a tak dále)
feat_constraints2 všechna omezení, která musí být splněna sloupcem, aby byl považován za platný vstup (druhý parametr) k této transformaci
tgraph objekt tgraph musí být vyvolávajícím TGraph () objekt. Všimněte si, že tento parametr je volitelný a můžete předat Žádné, ale to má za následek chybějící neefektivitu v důsledku nedostatku ukládání do mezipaměti
apply_all only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich.
col_names názvy sloupců funkcí v seznamu
col_dtypes seznam datových typů sloupců funkce

autoai_libs.cognito.transforms.transform_utils.TB1()

Pro unární transformace založené na stavu (s fit/transformující se), jako je například častý počet.

Použití:

autoai_libs.cognito.transforms.transform_utils.TB1(tans_class, name, datatypes, feat_constraints, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba Popis
tans_class třída, která implementuje fit( ) a transform( ) v souladu s definicí funkce transformace
name Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních.
datatypes seznam typů dat, z nichž jeden je platný vstup do funkce transformátoru (číselná hodnota, plovoucí řádová čárka, atd.)
feat_constraints všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup pro tuto transformaci
tgraph objekt tgraph musí být vyvolávajícím TGraph () objekt. Všimněte si, že toto je volitelné a můžete předat Žádné, ale to má za následek chybějící neefektivitu v důsledku nedostatku ukládání do mezipaměti
apply_all only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich.
col_names názvy sloupců funkcí v seznamu.
col_dtypes seznam datových typů sloupců funkce.

autoai_libs.cognito.transforms.transform_utils.TB2()

Pro binární transformace založené na stavu (s fit/transform), jako např. group-by.

Použití:

autoai_libs.cognito.transforms.transform_utils.TB2(tans_class, name, datatypes1, feat_constraints1, datatypes2, feat_constraints2, tgraph=None, apply_all=True)
Volba Popis
tans_class třída, která implementuje funkci fit ()  a transform () v souladu s definicí funkce transformace
name Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních.
datatypes1 seznam datových typů, z nichž některé jsou platné vstupy (první parametr) k funkci transformátoru (číselná hodnota, float, int atd.)
feat_constraints1 všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup (první parametr) k této transformaci
datatypes2 seznam datových typů, z nichž některé jsou platné vstupy (druhý parametr) k funkci transformátoru (číselné, plovoucí, celé a tak dále)
feat_constraints2 všechna omezení, která musí být splněna sloupcem, aby byl považován za platný vstup (druhý parametr) k této transformaci
tgraph objekt tgraph musí být vyvolávajícím TGraph () objekt. Tento parametr je volitelný a může být předán Žádná, ale výsledkem je některá chybějící neefektivita kvůli nedostatku ukládání do mezipaměti.
apply_all only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich.

autoai_libs.cognito.transforms.transform_utils.TAM()

V případě transformace, která se používá na úrovni dat, jako je PCA, použijte TAM.

Použití:

autoai_libs.cognito.transforms.transform_utils.TAM(tans_class, name, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba Popis
tans_class třída, která implementuje fit( ) a transform( ) v souladu s definicí funkce transformace
name Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních.
tgraph objekt tgraph musí být vyvolávajícím TGraph () objekt. Tento parametr je volitelný a nelze jej předat, ale v důsledku nedostatku ukládání do mezipaměti má za následek chybějící neefektivitu
apply_all only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich.
col_names názvy sloupců funkcí v seznamu
col_dtypes seznam datových typů sloupců funkce

autoai_libs.cognito.transforms.transform_utils.TGen()

TGen je obecnou obálkou a lze ji použít pro většinu funkcí (nemusí však být nejefektivnější).

Použití:

autoai_libs.cognito.transforms.transform_utils.TGen(fun, name, arg_count, datatypes_list, feat_constraints_list, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba Popis
fun ukazatel funkce
name Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních.
arg_count number of inputs to the function, in this example it is 1, for binary, it is 2, and so on
datatypes_list seznam seznamů arg_count, které odpovídají přípustným vstupním datovým typům pro každý parametr. V předchozím příkladu, protože `arg_count=1``, výsledek je jeden seznam v rámci vnějšího seznamu a obsahuje jediný typ s názvem 'numeric'. V jiném případě by to mohl být specifický případ 'int' nebo ještě specifičtější 'int64'.
feat_constraints_list seznam argumentů arg_count, které odpovídají určitým omezením, které lze uložit při výběru vstupních funkcí
tgraph objekt tgraph musí být vyvolávajícím TGraph () objekt. Všimněte si, že tento parametr je volitelný a můžete předat Žádné, ale to má za následek chybějící neefektivitu v důsledku nedostatku ukládání do mezipaměti
apply_all only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich.
col_names názvy sloupců funkcí v seznamu
col_dtypes seznam datových typů sloupců funkce

autoai_libs.cognito.transforms.transform_utils.FS1()

Výběr funkcí, typ 1 (pomocí párové korelace mezi každou funkcí a cílem.)

Použití:

autoai_libs.cognito.transforms.transform_utils.FS1(cols_ids_must_keep, additional_col_count_to_keep, ptype)
Volba Popis
cols_ids_must_keep sériová čísla sloupců, které musí být uchovány bez ohledu na jejich důležitost funkcí
additional_col_count_to_keep kolik sloupců je třeba uchovat
ptype klasifikace nebo regrese

autoai_libs.cognito.transforms.transform_utils.FS2()

Výběr funkcí, typ 2.

Použití:

autoai_libs.cognito.transforms.transform_utils.FS2(cols_ids_must_keep, additional_col_count_to_keep, ptype, eval_algo)
Volba Popis
cols_ids_must_keep sériová čísla sloupců, které musí být uchovány bez ohledu na jejich důležitost funkcí
additional_col_count_to_keep kolik sloupců je třeba uchovat
ptype klasifikace nebo regrese

Funkce autoai-ts-libs

Kombinace transformátorů a odhadů je navržena a vybrána pro každý plynovod systémem AutoAI Time Series. Změna transformátorů nebo odhadců v generovaném zápisníku potrubí může způsobit neočekávané výsledky nebo dokonce selhání. Nedoporučujeme měnit zápisník pro generované kolony, a proto v současné době nenabídíme specifikaci funkcí pro knihovnu autoai-ts-libs .

Další informace

Výběr modelu AutoAI

Nadřazené téma: Uložení notebooku generovaného AutoAI

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more