Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04 lip 2023
Węzeł Apriori pozwala wyodrębnić zestaw reguł na podstawie danych, pobierając reguły o najwyższej możliwej zawartości informacji. Apriori oferuje pięć różnych metod wybierania reguł i korzysta ze złożonego schematu indeksowania do efektywnego przetwarzania dużych zbiorów danych. W przypadku dużych problemów czas uczenia Apriori jest zwykle krótszy. Brak jest arbitralnego limitu co do liczby reguł do utrzymania, możliwa jest obsługa reguł z maksymalnie 32 predykcjami. Apriori wymaga, aby wszystkie zmienne wejściowe i wyjściowe były kategorialne, ale zapewniają lepszą wydajność, ponieważ jest zoptymalizowana dla tego typu danych.
Przykład
node = stream.create("apriori", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("partition", "Test")
# For non-transactional
node.setPropertyValue("use_transactional_data", False)
node.setPropertyValue("consequents", ["Age"])
node.setPropertyValue("antecedents", ["BP", "Cholesterol", "Drug"])
# For transactional
node.setPropertyValue("use_transactional_data", True)
node.setPropertyValue("id_field", "Age")
node.setPropertyValue("contiguous", True)
node.setPropertyValue("content_field", "Drug")
# "Model" tab
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "Apriori_bp_choles_drug")
node.setPropertyValue("min_supp", 7.0)
node.setPropertyValue("min_conf", 30.0)
node.setPropertyValue("max_antecedents", 7)
node.setPropertyValue("true_flags", False)
node.setPropertyValue("optimize", "Memory")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("evaluation", "ConfidenceRatio")
node.setPropertyValue("lower_bound", 7)
Właściwości węzła apriorinode |
Wartości | Opis właściwości |
---|---|---|
consequents |
field (pole) | W modelach Apriori zamiast standardowych zmiennych przewidywanych i wejściowych używa się następników i poprzedników. Zmienne wagi i częstości nie są używane. Więcej informacji na ten temat zawiera sekcja Właściwości wspólnego węzła modelowania . |
antecedents |
[field1 ... fieldN] | |
min_supp |
Liczba | |
min_conf |
Liczba | |
max_antecedents |
Liczba | |
true_flags |
Flaga | |
optimize |
Speed Memory |
|
use_transactional_data |
Flaga | |
contiguous |
Flaga | |
id_field |
łańcuch | |
content_field |
łańcuch | |
mode |
Simple Expert |
|
evaluation |
RuleConfidence DifferenceToPrior ConfidenceRatio InformationDifference NormalizedChiSquare |
|
lower_bound |
Liczba | |
optimize |
Speed Memory |
Służy do określania, czy budowanie modelu ma być optymalizowane pod kątem szybkości, czy zużycia pamięci. |
rules_without_antececents |
boolean (boolowskie) | Wybranie tej opcji spowoduje, że dozwolone będą reguły zawierające tylko następnik (jeden element lub zbiór elementów). Jest to przydatne, gdy interesuje nas ustalenie wspólnych elementów lub zbiorów elementów. Na przykład cannedveg to reguła jednoelementowa bez poprzednika, która wskazuje, że w danych często występuje zakup towaru cannedveg . |