Translation not up to date
V přenosných počítačích můžete použít neparametrická distribuce, parametrická distribuce distribuce nebo parametrické modelování algoritmů SPSS pro prediktivní analýzu analýz.
Montáž neparametrická distribuce
Analýza přežití analyzuje data, kde proměnná výsledku je doba do výskytu události, která je předmětem zájmu. Distribuce časů událostí je obvykle popisována funkcí přežití.
Neparametrická distribuční funkce (NPDF) poskytuje odhad funkce přežití bez jakýchkoli předpokladů týkajících se distribuce údajů. NPDF obsahuje Kaplan-Meier odhad, životní tabulky a specializované rozšiřující algoritmy na podporu levé cenzurované, intervalu cenzurované, a opakující se údaje o události.
Příklad kódu produktu Python :
from spss.ml.survivalanalysis import NonParametricDistributionFitting
from spss.ml.survivalanalysis.params import DefinedStatus, Points, StatusItem
npdf = NonParametricDistributionFitting(). \
setAlgorithm("KM"). \
setBeginField("time"). \
setStatusField("status"). \
setStrataFields(["treatment"]). \
setGroupFields(["gender"]). \
setUndefinedStatus("INTERVALCENSORED"). \
setDefinedStatus(
DefinedStatus(
failure=StatusItem(points = Points("1")),
rightCensored=StatusItem(points = Points("0")))). \
setOutMeanSurvivalTime(True)
npdfModel = npdf.fit(df)
predictions = npdfModel.transform(data)
predictions.show()
Montáž parametrická distribuce
Analýza přežití analyzuje data, kde proměnná výsledku je doba do výskytu události, která je předmětem zájmu. Distribuce časů událostí je obvykle popisována funkcí přežití.
Parametric Distribution Armating (PDF) poskytuje odhad funkce přežití tím, že porovnává funkce pro několik známých distribucí (exponenciální, Weibullovo, logaritmické a logistické) určit, která data jsou nejlepší. Kromě toho mohou být porovnávány distribuce pro dvě nebo více skupin případů.
Python excemple code:
from spss.ml.survivalanalysis import ParametricDistributionFitting
from spss.ml.survivalanalysis.params import DefinedStatus, Points, StatusItem
pdf = ParametricDistributionFitting(). \
setBeginField("begintime"). \
setEndField("endtime"). \
setStatusField("status"). \
setFreqField("frequency"). \
setDefinedStatus(
DefinedStatus(
failure=StatusItem(points=Points("F")),
rightCensored=StatusItem(points=Points("R")),
leftCensored=StatusItem(points=Points("L")))
). \
setMedianRankEstimation("RRY"). \
setMedianRankObtainMethod("BetaFDistribution"). \
setStatusConflictTreatment("DERIVATION"). \
setEstimationMethod("MRR"). \
setDistribution("Weibull"). \
setOutProbDensityFunc(True). \
setOutCumDistFunc(True). \
setOutSurvivalFunc(True). \
setOutRegressionPlot(True). \
setOutMedianRankRegPlot(True). \
setComputeGroupComparison(True)
pdfModel = pdf.fit(data)
predictions = pdfModel.transform(data)
predictions.show()
Parametrické regresní modelování
Parametrický regresní modelování (PRM) je metoda analýzy přežití, která zahrnuje účinky kovariany na dobu přežití. PRM zahrnuje dva typy modelů: zrychlený čas selhání a frajon. Zrychlené modely času selhání předpokládají, že vztah logaritmu doby přežití a kovariany je lineární. Podněty, nebo náhodné efekty, modely jsou užitečné pro analýzu opakujících se událostí, korelované údaje o přežití nebo, když se pozorování seskupují do skupin.
PRM automaticky vybere rozdělení doby přežití (exponenciální, Weibullovo, log-normální nebo log-logistické), které nejlépe popisuje doby přežití.
Příklad kódu produktu Python :
from spss.ml.survivalanalysis import ParametricRegression
from spss.ml.survivalanalysis.params import DefinedStatus, Points, StatusItem
prm = ParametricRegression(). \
setBeginField("startTime"). \
setEndField("endTime"). \
setStatusField("status"). \
setPredictorFields(["age", "surgery", "transplant"]). \
setDefinedStatus(
DefinedStatus(
failure=StatusItem(points=Points("0.0")),
intervalCensored=StatusItem(points=Points("1.0"))))
prmModel = prm.fit(data)
PMML = prmModel.toPMML()
statXML = prmModel.statXML()
predictions = prmModel.transform(data)
predictions.show()
Nadřízené téma: Algoritmy prediktivních analýz produktuSPSS