На воркшопе мы познакомимся с эффективным инструментом разведочного анализа, который пришел в аналитику данных из кредитного скоринга — оптимальным квантованием и биннингом данных. Это разбиение переменной на бины (bins) на основе информации о событии.
Применение инструмента:
- оценка предсказательной силы отдельной переменной на выходное поле;
- оценка силы и характера влияния отдельного бина на событие;
- борьба с пропусками, выбросами и экстремальными значениями;
- сокращение разнообразия уникальных значений в переменной;
- эффективное использование логистической регрессии.
Обсудим гипотезу независимого поведения признаков, индексы WoE и IV, классификацию WoE-трендов, алгоритм MAPE.
Практика в Loginom. Подробно разберем компонент Конечные классы и решим несколько кейсов, научимся интерпретировать WoE-диаграммы и вносить ручные правки в работу алгоритма оптимального биннинга. В домашнем задании будем тренироваться на реальном датасете онлайн-гипермаркета, которое разберем на втором вебинаре.