決策樹是如何工作的
決策樹一般都是自上而下的來生成的。每個決策或事件(即自然狀態)都可能引出兩個或多個事件,導致不同的結果,把這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹。
選擇分割的方法有好幾種,但是目的都是一致的:對目標類嘗試進行最佳的分割。
從根到葉子節點都有一條路徑,這條路徑就是一條“規則”。
決策樹可以是二叉的,也可以是多叉的。
對每個節點的衡量:
1) 通過該節點的記錄數
2) 如果是葉子節點的話,分類的路徑
3) 對葉子節點正確分類的比例。
有些規則的效果可以比其他的一些規則要好。
決策樹對于常規統計方法的優缺點
優點:
1) 可以生成可以理解的規則。
2) 計算量相對來說不是很大。
3) 可以處理連續和種類字段。
4) 決策樹可以清晰的顯示哪些字段比較重要