Материалы распечатаны с сайта OSzone.net. Дальнейшее применение материалов в других печатных изданиях, включая электронные статьи, должно сопровождаться указанием имени сайта OSzone.net и имени автора, если присутствует.
Классификационные модели Data Mining часто имеют невысокую точность выделения классов с небольшим числом записей, т.е. «редких» событий. Для решения этой проблемы в докладе рассмотрены подходы, связанные с выбором оптимального порогового значения вероятности принадлежности к редкому классу для классификации, а также oversampling – балансировка данных.Докладчик: Максим Гончаровhttp://www.sqlpass.org/24hours/russia2012