Translation not up to date
Logistická regrese je statistická technika pro klasifikaci záznamů na základě hodnot vstupních polí. Je analogický k lineární regresi, ale vezme kategorické cílové pole místo číselné.
Předpokládejme například, že poskytovatel telekomunikačních služeb segmentoval své zákaznické základny podle vzorce užívání služeb, kategorizuje zákazníky do čtyř skupin. Pokud lze k předpovědi členství ve skupině použít demografická data, můžete přizpůsobit nabídky pro jednotlivé potenciální zákazníky.
Tento příklad používá tok s názvem Classifying Telecommmunications Customers, který je k dispozici v ukázkovém projektu importováno dříve. Datový soubor je telco.csv.
custcat
má čtyři možné hodnoty, které odpovídají čtyřem skupinám zákazníků, a to následujícím způsobem:Hodnota | Popisek |
---|---|
1 | Základní služba |
2 | E-služba |
3 | Služba Plus |
4 | Celková služba |
Protože cíl má více kategorií, je použit mnohonomický model. V případě cíle se dvěma odlišnými kategoriemi, jako je ano/ne, true/false, nebo churn/do churn, může být vytvořen binomický model. Další informace najdete v tématu Telekomunikační churn .