Translation not up to date
Knihovna autoai-lib
pro Python obsahuje sadu funkcí, které vám pomohou interaktivně spolupracovat s experimenty IBM Watson Machine Learning AutoAI . Pomocí knihovny produktu autoai-lib
můžete přezkoumat a upravit transformace dat, které se budou konat při vytváření propojení procesů. Podobně můžete použít knihovnu produktu autoai-ts-libs
k interakci s notebooky propojení procesů pro experimenty s časovými řadami.
Instalace autoai-lib nebo autoai-ts-libs pro Python
Postupujte podle pokynů v tématu Instalace vlastních knihoven a nainstalujte produkt autoai-lib
nebo autoai-ts-libs
.
Použití autoai-lib a autoai-ts-libs pro Python
Knihovna produktů autoai-lib
a autoai-ts-libs
pro Python obsahuje funkce, které vám pomohou interaktivně spolupracovat s experimenty IBM Watson Machine Learning AutoAI . Pomocí knihovny produktu autoai-lib
můžete přezkoumat a upravit transformace dat, které se provedou při vytváření klasifikačních a regresních ropovodů. Pomocí knihovny produktu autoai-ts-libs
můžete přezkoumat transformace dat, které se používají při vytváření ropovodů pro časové řady (prognózy).
Instalace autoai-lib a autoai-ts-libs pro Python
Postupujte podle pokynů v tématu Instalace vlastních knihoven a nainstalujte autoai-lib a autoai-ts-libs.
Funkce autoai-lib
Objekt projektu převedený na instanci, který byl vytvořen po importu knihovny produktu autoai-lib
, odkrývá tyto funkce:
autoai_libs.transformers.exportable.NumpyColumnSelector()
Vybírá podmnožinu sloupců numerického pole
Použití:
autoai_libs.transformers.exportable.NumpyColumnSelector(columns=None)
Volba | Popis |
---|---|
sloupce | seznam indexů sloupců, které se mají vybrat |
autoai_libs.transformers.exportable.CompressStrings()
Odstraní mezery a speciální znaky z řetězcových sloupců vstupního číselného pole X.
Použití:
autoai_libs.transformers.exportable.CompressStrings(compress_type='string', dtypes_list=None, misslist_list=None, missing_values_reference_list=None, activate_flag=True)
Volba | Popis |
---|---|
compress_type |
typ komprese řetězců. 'string' pro odebrání mezer z řetězce a 'hash' pro vytvoření int hash. Výchozí hodnota je 'string'. 'hash' se používá pro sloupce s řetězci a cat_imp_strategy = 'most_frequent' |
dtypes_list |
Seznam obsahující řetězce, které označují typ každého sloupce vstupního pole numpy X (řetězce jsou mezi 'char_str', 'int_str', 'float_str', 'float_num', 'float_int_num', 'int_num', 'boolean', 'Unknown'). Pokud žádný, budou zjištěny typy sloupců. Výchozí nastavení je Žádné. |
misslist_list |
seznam obsahuje seznamy chybějících hodnot jednotlivých sloupců vstupního čísla X. Pokud žádná, budou zjištěny chybějící hodnoty každého sloupce. Výchozí nastavení je Žádné. |
missing_values_reference_list |
reference list of missing values in the input numpy array X |
activate_flag |
příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified. |
autoai_libs.transformers.exportable.NumpyReplaceMissingValues()
Vzhledem k tomu, že pole numpy a referenční seznam chybějících hodnot pro něj chybí, nahradí chybějící hodnoty speciální hodnotou (obvykle speciální chybějící hodnota, například np.nan).
Použití:
autoai_libs.transformers.exportable.NumpyReplaceMissingValues(missing_values, filling_values=np.nan)
Volba | Popis |
---|---|
missing_values |
referenční seznam chybějících hodnot |
filling_values |
speciální hodnota, která je přiřazena k neznámým hodnotám |
autoai_libs.transformers.exportable.NumpyReplaceUnknownValues()
Vzhledem k tomu, že pole numpy a referenční seznam známých hodnot pro každý sloupec nahradí hodnoty, které nejsou součástí referenčního seznamu, se speciální hodnotou (obvykle np.nan). Tato metoda se obvykle používá k odebírání popisků pro sloupce v sadě testovacích dat, které nebyly zobrazeny v odpovídajících sloupcích datové sady pro školení.
Použití:
autoai_libs.transformers.exportable.NumpyReplaceUnknownValues(known_values_list=None, filling_values=None, missing_values_reference_list=None)
Volba | Popis |
---|---|
known_values_list |
referenční seznam seznamů známých hodnot pro každý sloupec |
filling_values |
speciální hodnota, která je přiřazena k neznámým hodnotám |
missing_values_reference_list |
referenční seznam chybějících hodnot |
autoai_libs.transformers.exportable.boolean2float()
Převádí 1-D numpy pole řetězců, které představují booleovské hodnoty k plovám a nahrazuje chybějící hodnoty hodnotou np.nan. Změní také typ pole z 'objektu' na 'float'.
Použití:
autoai_libs.transformers.exportable.boolean2float(activate_flag=True)
Volba | Popis |
---|---|
activate_flag |
příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified. |
autoai_libs.transformers.exportable.CatImputer()
Tento transformátor je obálka pro kategoriální imputory. Interně v současné době používá sklearn SimpleImputer] (https://scikit-learn.org/stable/modules/generated/sklearn.impute.SimpleImputer.html)
Použití:
autoai_libs.transformers.exportable.CatImputer(strategy, missing_values, sklearn_version_family=global_sklearn_version_family, activate_flag=True)
Volba | Popis |
---|---|
strategy |
řetězec, volitelný, default="mean ". Strategie imputace pro chybějící hodnoty. - mean : nahradit za použití střední hodnoty po každém sloupci. Lze ji použít pouze s numerickými daty.- median :nahraďte za použití mediánu podél každého sloupce. Lze jej použít pouze s číselnými daty.- most_frequent :nahraďte tak, že každý sloupec obsahuje nejčastěji používanou hodnotu. Používá se s řetězci nebo číselnými daty.- constant :nahraďte hodnotou fill_value. Může být použit s řetězci nebo s numerickými daty. |
missing_values |
počet, řetězec, np.nan (výchozí) nebo Žádný. Zástupný symbol pro chybějící hodnoty. Jsou imputovány všechny výskyty chyb_hodnot. |
sklearn_version_family |
řetězec označující verzi sklearn pro zpětnou kompatibilitu s verzemi 019 a 020dev. Aktuálně nepoužívané. Výchozí nastavení je Žádné. |
activate_flag |
příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified. |
autoai_libs.transformers.exportable.CatEncoder()
Tato metoda je obálka pro kategorický kodér. Je-li parametr kódování hodnotu 'ordinal', interně jej momentálně používá sklearn OrdinalEncoder. Je-li parametr kódování 'onehot' nebo 'onehot-dense' interně, používá skučení OneHotenkodéru
Použití:
autoai_libs.transformers.exportable.CatEncoder(encoding, categories, dtype, handle_unknown, sklearn_version_family=global_sklearn_version_family, activate_flag=True)
Volba | Popis |
---|---|
encoding |
Funkce str, " onehot ',' onehot-dense 'nebo' ordinal '. Typ kódování, který se má použít (výchozí hodnota je 'ordinal') 'onehot': zakóduje funkce pomocí jednoho nebo aktivního schématu jednoho z K (nebo také tzv. 'fiktivního' kódování). Toto kódování vytváří binární sloupec pro každou kategorii a vrací rozptýlenou matici. 'onehot-dense': stejné jako 'onehot', ale vrací husté pole místo řídké matice. 'ordinal': enkódovat funkce jako ordinální celá čísla. Výsledkem je jediný sloupec celých čísel (0 až n_categories-1) na jednu funkci. |
categories |
'auto' nebo seznam seznamů/polí hodnot. Kategorie (jedinečné hodnoty) na jednu funkci: 'auto': Určit kategorie automaticky ze vzdělávacích dat. list : categories[i] uchovává kategorie, které se očekávají ve sloupci ith. Předané kategorie musí být tříděny a nesmí směšovat řetězce a číselné hodnoty. Použité kategorie lze nalézt v atributu encoder.categories_ . |
dtype |
typ čísla, výchozí np.float64 Požadovaný datový typ výstupu. |
handle_unknown |
'chyba' (výchozí) nebo 'ignorovat'. Zda se má při transformaci vyskytnout chyba nebo ignorovat, pokud je během transformace přítomna neznámá kategorická funkce (výchozí je zvýšit). Je-li tento parametr nastaven na hodnotu 'ignore' a během transformace je zjištěna neznámá kategorie, výsledné jednozakódované kódované sloupce pro tuto funkci jsou samé nuly. V inverzní transformaci je neznámá kategorie označena jako Žádná. Ignorování neznámých kategorií není podporováno pro encoding='ordinal' . |
sklearn_version_family |
řetězec označující verzi sklearn pro zpětnou kompatibilitu s verzemi 019 a 020dev. Aktuálně nepoužívané. Výchozí nastavení je Žádné. |
activate_flag |
příznak, který označuje, že tento transformátor je aktivní. If False, transform (X) outputs the input numpy array X unmodified. |
autoai_libs.transformers.exportable.float32_transform()
Transformuje float64 numpy array na float32.
Použití:
autoai_libs.transformers.exportable.float32_transform(activate_flag=True)
Volba | Popis |
---|---|
activate_flag |
příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified. |
autoai_libs.transformers.exportable.FloatStr2Float()
Vzhledem k tomu, že číselné pole X a dtypes_list, které označuje typy svých sloupců, nahradí sloupce řetězců, které představují plovoucí znaky (typ 'float_str' v souboru dtypes_list), na sloupce plováků a nahradí jejich chybějící hodnoty hodnotou np.nan.
Použití:
autoai_libs.transformers.exportable.FloatStr2Float(dtypes_list, missing_values_reference_list=None, activate_flag=True)
Volba | Popis |
---|---|
dtypes_list |
Seznam obsahuje řetězce, které označují typ každého sloupce vstupního pole numpy X (řetězce jsou mezi 'char_str', 'int_str', 'float_str', 'float_num', 'float_int_num', 'int_num', 'boolean', 'Unknown'). |
missing_values_reference_list |
referenční seznam chybějících hodnot |
activate_flag |
příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified. |
autoai_libs.transformers.exportable.NumImputer()
Tato metoda je obálka pro numerickou imputru.
Použití:
autoai_libs.transformers.exportable.NumImputer(strategy, missing_values, activate_flag=True)
Volba | Popis |
---|---|
strategy |
num_imp_strategy: string, volitelné (výchozí hodnota = "mean "). Strategie imputace: -Je-li "střední", nahraďte chybějící hodnoty pomocí střední hodnoty podél osy. -Je-li hodnota "median", pak nahraďte chybějící hodnoty pomocí mediánu podél osy. -Je-li "most_frequent", pak se chybějící hodnota nahradí za použití nejfrekventovanější hodnoty podél osy. |
missing_values |
integer nebo "NaN", volitelné (výchozí hodnota = "NaN"). Zástupný symbol pro chybějící hodnoty. Jsou imputovány všechny výskyty chyb_hodnot: -Pro chybějící hodnoty kódované jako np.nanpoužijte řetězcovou hodnotu "NaN". - activate_flag : parametr, který označuje, že tento transformátor je aktivní. If False, transform (X) outputs the input numpy array X unmodified. |
autoai_libs.transformers.exportable.OptStandardScaler()
Tento parametr je obálka pro změnu měřítka číselných proměnných. Aktuálně používá funkci sklearn StandardScaler interně.
Použití:
autoai_libs.transformers.exportable.OptStandardScaler(use_scaler_flag=True, num_scaler_copy=True, num_scaler_with_mean=True, num_scaler_with_std=True)
Volba | Popis |
---|---|
num_scaler_copy |
Logická, volitelná, výchozí hodnota True. Je-li hodnota False, zkuste se vyhnout kopírování a místo toho měnit velikost místa. Není zaručeno, že tato akce bude vždy fungovat. Je-li například umístěna na místě, nejsou-li data pole NumPy nebo scipy.sparse CSR matrix, může být kopie stále vrácena. |
num_scaler_with_mean |
Logická hodnota, True ve výchozím nastavení. Je-li hodnota True, před změnou měřítka se data zarovnat Výjimka je vyvolána při pokusu o řídké matrice, protože cennější je sestavení husté matice, která v běžných případech použití je pravděpodobně příliš velká, aby se vešla do paměti. |
num_scaler_with_std |
Logická hodnota, True ve výchozím nastavení. Je-li hodnota True, měřítko dat na rozptyl jednotky (nebo ekvivalentně směrodatné odchylky jednotky). |
use_scaler_flag |
Logický příznak, který označuje, že je tento transformátor aktivní. If False, transform (X) outputs the input numpy array X unmodified. Výchozí hodnota je true. |
autoai_libs.transformers.exportable.NumpyPermuteArray()
Uspořádá sloupce nebo řádky v číselníku na základě seznamu indexů.
Použití:
autoai_libs.transformers.exportable.NumpyPermuteArray(permutation_indices=None, axis=None)
Volba | Popis |
---|---|
permutation_indices |
seznam indexů podle toho, které sloupce jsou přeuspořádány |
axis |
0 ztlumit podle sloupců. 1 vypnutí po řádcích. |
Transformace funkcí
Tyto metody se vztahují na transformace funkcí popsané v části Podrobnosti implementaceAutoAI.
autoai_libs.cognito.transforms.transform_utils.TA1(fun, name = Žádný, datatypes = None, feat_constraints=None, tgraph = None, apply_all=True, col_names=None, col_dtypes=None)
Pro unární nestavové funkce, jako je čtvereček nebo log, použijte TA1.
Použití:
autoai_libs.cognito.transforms.transform_utils.TA1(fun, name=None, datatypes=None, feat_constraints=None, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba | Popis |
---|---|
fun |
ukazatel funkce |
name |
Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních. |
datatypes |
seznam typů dat, z nichž jeden je platný vstup do funkce transformátoru (číselná hodnota, float, int atd.) |
feat_constraints |
všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup pro tuto transformaci |
tgraph |
objekt tgraph musí být počáteční TGraph () objekt. Tento parametr je volitelný a nelze jej předat, ale to může vést k selhání zjištění některé neefektivnosti kvůli nedostatku ukládání do mezipaměti. |
apply_all |
only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich. |
col_names |
názvy sloupců funkcí v seznamu |
col_dtypes |
seznam datových typů sloupců funkce |
autoai_libs.cognito.transforms.transform_utils.TA2()
Pro binární nestavové funkce, jako je součet, produkt, použijte TA2.
Použití:
autoai_libs.cognito.transforms.transform_utils.TA2(fun, name, datatypes1, feat_constraints1, datatypes2, feat_constraints2, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba | Popis |
---|---|
fun |
ukazatel funkce |
name : název řetězce, který jednoznačně identifikuje tento transformátor od ostatních. |
|
datatypes1 |
seznam datových typů, z nichž některé jsou platné vstupy (první parametr) k funkci transformátoru (číselné, plovoucí, celé a tak dále) |
feat_constraints1 |
všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup (první parametr) k této transformaci |
datatypes2 |
seznam datových typů, z nichž některé jsou platné vstupy (druhý parametr) k funkci transformátoru (číselné, plovoucí, celé a tak dále) |
feat_constraints2 |
všechna omezení, která musí být splněna sloupcem, aby byl považován za platný vstup (druhý parametr) k této transformaci |
tgraph |
objekt tgraph musí být vyvolávajícím TGraph () objekt. Všimněte si, že tento parametr je volitelný a můžete předat Žádné, ale to má za následek chybějící neefektivitu v důsledku nedostatku ukládání do mezipaměti |
apply_all |
only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich. |
col_names |
názvy sloupců funkcí v seznamu |
col_dtypes |
seznam datových typů sloupců funkce |
autoai_libs.cognito.transforms.transform_utils.TB1()
Pro unární transformace založené na stavu (s fit/transformující se), jako je například častý počet.
Použití:
autoai_libs.cognito.transforms.transform_utils.TB1(tans_class, name, datatypes, feat_constraints, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba | Popis |
---|---|
tans_class |
třída, která implementuje fit( ) a transform( ) v souladu s definicí funkce transformace |
name |
Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních. |
datatypes |
seznam typů dat, z nichž jeden je platný vstup do funkce transformátoru (číselná hodnota, plovoucí řádová čárka, atd.) |
feat_constraints |
všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup pro tuto transformaci |
tgraph |
objekt tgraph musí být vyvolávajícím TGraph () objekt. Všimněte si, že toto je volitelné a můžete předat Žádné, ale to má za následek chybějící neefektivitu v důsledku nedostatku ukládání do mezipaměti |
apply_all |
only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich. |
col_names |
názvy sloupců funkcí v seznamu. |
col_dtypes |
seznam datových typů sloupců funkce. |
autoai_libs.cognito.transforms.transform_utils.TB2()
Pro binární transformace založené na stavu (s fit/transform), jako např. group-by.
Použití:
autoai_libs.cognito.transforms.transform_utils.TB2(tans_class, name, datatypes1, feat_constraints1, datatypes2, feat_constraints2, tgraph=None, apply_all=True)
Volba | Popis |
---|---|
tans_class |
třída, která implementuje funkci fit () a transform () v souladu s definicí funkce transformace |
name |
Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních. |
datatypes1 |
seznam datových typů, z nichž některé jsou platné vstupy (první parametr) k funkci transformátoru (číselná hodnota, float, int atd.) |
feat_constraints1 |
všechna omezení, která musí být splněna sloupcem, aby byla považována za platný vstup (první parametr) k této transformaci |
datatypes2 |
seznam datových typů, z nichž některé jsou platné vstupy (druhý parametr) k funkci transformátoru (číselné, plovoucí, celé a tak dále) |
feat_constraints2 |
všechna omezení, která musí být splněna sloupcem, aby byl považován za platný vstup (druhý parametr) k této transformaci |
tgraph |
objekt tgraph musí být vyvolávajícím TGraph () objekt. Tento parametr je volitelný a může být předán Žádná, ale výsledkem je některá chybějící neefektivita kvůli nedostatku ukládání do mezipaměti. |
apply_all |
only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich. |
autoai_libs.cognito.transforms.transform_utils.TAM()
V případě transformace, která se používá na úrovni dat, jako je PCA, použijte TAM.
Použití:
autoai_libs.cognito.transforms.transform_utils.TAM(tans_class, name, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba | Popis |
---|---|
tans_class |
třída, která implementuje fit( ) a transform( ) v souladu s definicí funkce transformace |
name |
Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních. |
tgraph |
objekt tgraph musí být vyvolávajícím TGraph () objekt. Tento parametr je volitelný a nelze jej předat, ale v důsledku nedostatku ukládání do mezipaměti má za následek chybějící neefektivitu |
apply_all |
only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich. |
col_names |
názvy sloupců funkcí v seznamu |
col_dtypes |
seznam datových typů sloupců funkce |
autoai_libs.cognito.transforms.transform_utils.TGen()
TGen je obecnou obálkou a lze ji použít pro většinu funkcí (nemusí však být nejefektivnější).
Použití:
autoai_libs.cognito.transforms.transform_utils.TGen(fun, name, arg_count, datatypes_list, feat_constraints_list, tgraph=None, apply_all=True, col_names=None, col_dtypes=None)
Volba | Popis |
---|---|
fun |
ukazatel funkce |
name |
Název řetězce, který jednoznačně identifikuje tento transformátor od ostatních. |
arg_count |
number of inputs to the function, in this example it is 1, for binary, it is 2, and so on |
datatypes_list |
seznam seznamů arg_count, které odpovídají přípustným vstupním datovým typům pro každý parametr. V předchozím příkladu, protože `arg_count=1``, výsledek je jeden seznam v rámci vnějšího seznamu a obsahuje jediný typ s názvem 'numeric'. V jiném případě by to mohl být specifický případ 'int' nebo ještě specifičtější 'int64'. |
feat_constraints_list |
seznam argumentů arg_count, které odpovídají určitým omezením, které lze uložit při výběru vstupních funkcí |
tgraph |
objekt tgraph musí být vyvolávajícím TGraph () objekt. Všimněte si, že tento parametr je volitelný a můžete předat Žádné, ale to má za následek chybějící neefektivitu v důsledku nedostatku ukládání do mezipaměti |
apply_all |
only use applyAll = True. To znamená, že transformátor vyjmenovává všechny funkce (nebo sady funkcí), které odpovídají zadaným kritériím, a používají poskytovanou funkci pro každou z nich. |
col_names |
názvy sloupců funkcí v seznamu |
col_dtypes |
seznam datových typů sloupců funkce |
autoai_libs.cognito.transforms.transform_utils.FS1()
Výběr funkcí, typ 1 (pomocí párové korelace mezi každou funkcí a cílem.)
Použití:
autoai_libs.cognito.transforms.transform_utils.FS1(cols_ids_must_keep, additional_col_count_to_keep, ptype)
Volba | Popis |
---|---|
cols_ids_must_keep |
sériová čísla sloupců, které musí být uchovány bez ohledu na jejich důležitost funkcí |
additional_col_count_to_keep |
kolik sloupců je třeba uchovat |
ptype |
klasifikace nebo regrese |
autoai_libs.cognito.transforms.transform_utils.FS2()
Výběr funkcí, typ 2.
Použití:
autoai_libs.cognito.transforms.transform_utils.FS2(cols_ids_must_keep, additional_col_count_to_keep, ptype, eval_algo)
Volba | Popis |
---|---|
cols_ids_must_keep |
sériová čísla sloupců, které musí být uchovány bez ohledu na jejich důležitost funkcí |
additional_col_count_to_keep |
kolik sloupců je třeba uchovat |
ptype |
klasifikace nebo regrese |
Funkce autoai-ts-libs
Kombinace transformátorů a odhadů je navržena a vybrána pro každý plynovod systémem AutoAI Time Series. Změna transformátorů nebo odhadců v generovaném zápisníku potrubí může způsobit neočekávané výsledky nebo dokonce selhání. Nedoporučujeme měnit zápisník pro generované kolony, a proto v současné době nenabídíme specifikaci funkcí pro knihovnu autoai-ts-libs
.
Další informace
Nadřazené téma: Uložení notebooku generovaného AutoAI