Binary Decision Tree Synthesis: Splitting Criteria and the Algorithm LISTBB

Авторы: 
Журнал: 
Страница: 
11
УДК: 
519.95
В настоящее время интерес к классу индукторов, основанных на построении дере- вьев решений, не ослабевает, особенно в контексте парадигмы Data Mining. В то же время наиболее распространенные алгоритмы ID3 и C4.5, как показано в статье, не являются лучшими. Поэтому можно обнаружить успешные попытки создания но- вых эвристических критериев ветвления для алгоритмов синтеза деревьев решений. Сравнительное определение различных критериев ветвления, используемых для син- теза двоичных деревьев решений,  цель настоящей статьи. В рассмотрение включе- ниы критерии D, Ω, Z1 и другие, которые были разработаны автором еще в 1979–80 годах. Эти критерии определяют комбинированный принцип ветвления, который ис- пользуется в алгоритме LISTBB.
info_eng: 
In our days, interest to the class of inductors on the basis of decision trees does not weaken, especially in the context of Data Mining paradigm . At the same time most widespread Quinlan algorithms ID3 and C4.5, as we show in the paper, are not the best. It is therefore possible to see the successful attempts of creation another heuristic splitting criteria for the algorithms of synthesis of decision trees. Comparative definition of different splitting criteria used for the synthesis of binary decision trees is the purpose of the paper. We included the criteria D, Ω, Z1 and other which were developed by the author yet at 1979-80 years. These criteria define combined splitting principle which is used in the algorithm LISTBB.