属性测试条件的方法
决策树归纳算法必须为不同类型的属性提供表示属性测试条件和其对应输出的方法
二元属性
二元属性的测试条件产生两个可能的输出
标称属性
由于标称属性有多个属性值,他的测试条件可以用两种方法表示,对于多路划分,其输出数取决于该属性不同属性值的个数;某些决策树算法只产生二元划分,它们考虑创建k个属性值的二元划分的所有种方法。
序数属性
序数属性也可以产生二元或多路划分,只要不违背序数属性值的有序性,就可以对属性值进行分组
连续属性
对于连续属性来说,测试条件可以是有二元输出的比较测试()或(),也可以是具有形如vi<=A<vi+1输出的范围查询。对于二元划分,决策树算法必须考虑到所有可能的划分点v,并从中选择产生最佳划分的点。对于多路划分,算法必须考虑所有可能的连续值区间。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 笺札!










