摘要表说明
训练结束还会生出一个摘要表,其名为为结果表表名加上”_summary”,摘要表的字段说明如下:
l method: ‘tree_train’
l is_classification: 分类决策树为TRUE,回归决策树为FALSE。
l source_table: 训练数据表表名
l model_table: 训练结果表表名
l id_col_name: 训练表中包含ID信息的列名
l dependent_varname: 因变量名
l independent_varnames: 自变量名
l cat_features: 分类变量列表,逗号分隔
l con_features: 连续变量列表,逗号分隔
l total_rows_processed: 已处理行数
l total_rows_skipped: 跳过行数
l dependent_var_levels: 分类因变量的级数
l dependent_var_type: 因变量类型
l input_cp: 用于修剪训练树的代价复杂度参数
l independent_var_types: 自变量类型,逗号分隔
预测函数
语法
决策树预测函数的语法如下:
tree_predict( model, source, output, pred_type ) |
参数说明
l model:包含决策树模型的表名,应为tree_train返回的输出表。
l source:需预测数据表的表名。
l output:预测结果表表名。
l pred_type:可选,默认为’response’。对于回归树,输出总是因变量的预测值;对于分类树,’response’ 会输出因变量的类别预测,’prob’ 则会输出每种类别的概率。
决策树显示函数
显示函数输出决策树的图形表示。输出可以是’dot’格式,也可以是文本格式。
语法
决策树显示函数的语法如下:
tree_display( model_table, dot_format ) |
参数说明
l model_table: 包含决策树模型的表名,应为tree_train返回的输出表。
l dot_format: 如果为TRUE,则输出’dot’格式,如果为FALSE,则输出文本格式。




