'Split and peel' rule induction method

Журнал: 
Страница: 
25
УДК: 
519.23
Алгоритм PRIM [2] предназначен для построения ассоциативных решающих правил, описывающих области в пространстве входных данных, в которых среднее значение целевой переменной значительно выше, чем среднее значение целевой переменной на всем входном пространстве. Несмотря на успешное применение PRIM в различных задачах, качество решения может ухудшаться при работе с выборками из мульти- модальных распределений вероятностей. В данной работе предложена модификация исходного алгоритма: процедура разделения мод, которая заменяет процедуру уточ­нения для обработки мультимодальной подвыборки. Приведено сравнение результа­тов работы исходного и модифицированного алгоритма при анализе искуственного набора данных, имитирующего задачу поиска неисправностей.
info_eng: 
Patient Rule Induction Method (PRIM) [2] is a rule learning procedure that seeks to locate bumps: regions in the feature space where an output variable has substantially higher values than its mean value in entire input domain. Though accepted by many practical researches the original PRIM may perform poorly on datasets containing multiple bumps. The paper proposes an addition to classical PRIM: a splitting procedure that replaces peeling to process a multimodal bump. Performance of the new method is compared with the classical algorithm on an artificial dataset simulating fault analysis problem.