Борисов А. Е.

Zero-inflated boosted ensemble for small count problem

Журнал: 
Страница: 
5
В статье описан новый подход к обучению модели данных, описывающих редкие события, когда целевая переменная (число событий) может быть описана распре­делением с добавленными нулями (ZIP-распределением), Предложена ZIP-модель, основанная на ансамбле деревьев, построенном с помощью бустинга. Эта модель основана на комбинации идей ZIP-дерева и GBT-ансамбля, Наш алгоритм, назван­ный ZIP-GBT, сначала выводится теоретически в рамках подхода градиентного бу­стинга, предложенного Дж,Фридманом, Затем наш метод сравнивается эмпирически на двух реальных наборах данных и на двух синтезированных.