資料の英語版に戻る

applyextension プロパティー

最終更新: 2025年2月11日

拡張モデル・ノードを使用して、拡張モデル・ナゲットを生成することができます。このモデルナゲットのスクリプト名は applyextension です。モデル作成ノード自体のスクリプトの詳細は、 extensionmodelnode プロパティーを参照してください。

Python for Spark の例

script example for Python for Spark
applyModel = stream.findByType("extension_apply", None)

score_script = """
import json
import spss.pyspark.runtime
from pyspark.mllib.regression import LabeledPoint
from pyspark.mllib.linalg import DenseVector
from pyspark.mllib.tree import DecisionTreeModel
from pyspark.sql.types import StringType, StructField

cxt = spss.pyspark.runtime.getContext()

if cxt.isComputeDataModelOnly():
    _schema = cxt.getSparkInputSchema()
    _schema.fields.append(StructField("Prediction", StringType(), nullable=True))
    cxt.setSparkOutputSchema(_schema)
else:
    df = cxt.getSparkInputData()

    _modelPath = cxt.getModelContentToPath("TreeModel")
    metadata = json.loads(cxt.getModelContentToString("model.dm"))

    schema = df.dtypes[:]
    target = "Drug"
    predictors = ["Age","BP","Sex","Cholesterol","Na","K"]

    lookup = {}
    for i in range(0,len(schema)):
        lookup[schema[i][0]] = i

    def row2LabeledPoint(dm,lookup,target,predictors,row):
        target_index = lookup[target]
        tval = dm[target_index].index(row[target_index])
        pvals = []
        for predictor in predictors:
            predictor_index = lookup[predictor]
            if isinstance(dm[predictor_index],list):
                pval = row[predictor_index] in dm[predictor_index] and dm[predictor_index].index(row[predictor_index]) or -1
            else:
                pval = row[predictor_index]
            pvals.append(pval)
        return LabeledPoint(tval, DenseVector(pvals))

    # convert dataframe to an RDD containing LabeledPoint
    lps = df.rdd.map(lambda row: row2LabeledPoint(metadata,lookup,target,predictors,row))
    treeModel = DecisionTreeModel.load(cxt.getSparkContext(), _modelPath);
    # score the model, produces an RDD containing just double values
    predictions = treeModel.predict(lps.map(lambda lp: lp.features))

    def addPrediction(x,dm,lookup,target):
        result = []
        for _idx in range(0, len(x[0])):
            result.append(x[0][_idx])
        result.append(dm[lookup[target]][int(x[1])])
        return result

    _schema = cxt.getSparkInputSchema()
    _schema.fields.append(StructField("Prediction", StringType(), nullable=True))
    rdd2 = df.rdd.zip(predictions).map(lambda x:addPrediction(x, metadata, lookup, target))
    outDF = cxt.getSparkSQLContext().createDataFrame(rdd2, _schema)

    cxt.setSparkOutputData(outDF)
"""
applyModel.setPropertyValue("python_syntax", score_script)

R の例

script example for R
applyModel.setPropertyValue("r_syntax", """
result<-predict(modelerModel,newdata=modelerData)
modelerData<-cbind(modelerData,result)
var1<-c(fieldName="NaPrediction",fieldLabel="",fieldStorage="real",fieldMeasure="",
fieldFormat="",fieldRole="")
modelerDataModel<-data.frame(modelerDataModel,var1)""")

表 1. applyextension プロパティー
`applyextension`プロパティー	値	プロパティーの説明
`r_syntax`	string	モデル・スコアリング用の R スクリプト・シンタックス。
`python_syntax`	string	モデル・スコアリング用の Python スクリプト・シンタックス。
`use_batch_size`	フラグ	バッチ処理を使用可能にします。
`batch_size`	整数	各バッチに含めるデータレコードの数を指定します。
`convert_flags`	`StringsAndDoubles` `LogicalValues`	フラグ型フィールドを変換するためのオプション。
`convert_missing`	フラグ	欠損値を R に変換するオプション`NA`移ります。
`convert_datetime`	フラグ	日付形式または日付/時刻形式の変数を R の日付/時刻形式に変換するためのオプション。
`convert_datetime_class`	`POSIXct` `POSIXlt`	日付形式または日付/時刻形式の変数のうち、どの形式の変数を変換するかを指定するためのオプション。

トピックは役に立ちましたか?

0/1000

Python for Spark の例Copy link to section

R の例Copy link to section

Python for Spark の例

R の例