Скоринг лидов продают как способ навести порядок в воронке. На практике большинство моделей наводят порядок только в отчётах: цифра в карточке лида растёт, маркетинг рапортует о росте MQL, а в пайплайне ничего не меняется. Проблема почти никогда не в формуле. Проблема в том, что модель оценивает не то, что реально приводит к сделке.
Ниже - как устроены две основные модели, где каждая ломается и какой минимум скоринга имеет смысл собрать команде до 50 человек, не нанимая data scientist.
Rule-based против predictive: не выбор, а этап
Rule-based скоринг - это ручные правила. Запрос демо: +20. Целевая отрасль: +10. Открыл письмо: +2. Вы сами решаете, сколько весит каждый сигнал, исходя из своего понимания клиента. Модель прозрачна, её легко объяснить продажам и так же легко поправить.
Predictive скоринг работает иначе. Алгоритм обучается на исторических данных о сделках и сам находит, какие признаки коррелируют с closed-won. Он может обнаружить, что комбинация темпа роста компании и конкретного скачанного документа предсказывает покупку сильнее всего, что вы заложили руками. По разным оценкам predictive-подход даёт заметный прирост в доле sales-accepted лидов, но только при одном условии - чистых и консистентных исторических данных.
Это и есть главное недопонимание. Predictive не заменяет rule-based, он идёт после него. Пока у вас нет достаточного объёма размеченных сделок и чистого CRM, машинная модель просто автоматизирует ваши же ошибки, только быстрее и непрозрачнее. Команде на старте почти всегда нужен rule-based. Predictive - это апгрейд, который заслуживают данными.
Где скоринг ломается чаще всего
Четыре поломки встречаются почти в каждой второй модели.
Скоринг по vanity-сигналам. Открытия писем, скачивания PDF, визиты на сайт легко измерить, поэтому именно их и кладут в модель. Они раздувают счёт MQL и не создают выручки. Лид, открывший пять писем, выглядит горячим и не покупает никогда. Поведение должно весить меньше, чем фит, а внутри поведения вес должен быть у действий с реальным коммерческим намерением: запрос цены, повторный визит на pricing, регистрация на демо.
Игнорирование ICP fit. Модель, построенная только на активности, переоценивает плохо подходящие аккаунты и недооценивает хорошие. Рабочий скоринг тянет сигналы из четырёх корзин: фирмографика, данные о роли контакта, поведение и негативные сигналы. Если убрать фирмографику, вы получите активного студента с личной почтой выше, чем директора по продажам из целевого аккаунта.
Отсутствие negative scoring. Про него забывают почти все, а именно он не даёт корзине A забиться теми, кто никогда не купит. Личная почта, нерелевантная должность, отрасль вне ICP, лид без активности больше полугода - всё это должно тянуть счёт вниз. Без штрафов модель умеет только хвалить.
Модель не пересматривается. Скоринг деградирует: меняются кампании, растёт библиотека контента, смещается поведение покупателей. Без регулярной настройки доля ложноположительных растёт квартал за кварталом. Модель, которую не трогали год, почти наверняка врёт.
Привязывайте скоринг к сделкам, а не к MQL
Если успех модели измеряется числом созданных MQL, она будет гнаться за объёмом. Это структурная ловушка: вы оптимизируете метрику, которая не равна выручке.
Правильная отправная точка - выигранные сделки. Возьмите closed-won за последний год и разберите их в обратную сторону: какая фирмография, какие роли в комитете, какие действия предшествовали покупке. Стройте веса на этих паттернах, а не на представлениях о том, как выглядит идеальный клиент. Дальше модель оценивают не по MQL, а по встречам, созданному пайплайну, скорости движения и винам.
Здесь же возникает технический разрыв. Чтобы связать счёт лида с реальным результатом, нужно видеть весь жизненный цикл: от источника и рекламного касания до стадии сделки в CRM. Большинство стеков этого не показывают - рекламные данные живут отдельно от CRM. Инструменты вроде Prooflytics как раз закрывают этот разрыв, соединяя рекламную аналитику с жизненным циклом сделки в CRM, чтобы было видно, какие лиды и каналы доходят до closed-won, а не просто до статуса MQL.
Без чистого CRM не работает ничего
Любая модель - и rule-based, и predictive - стоит на данных CRM. Дубли аккаунтов, контакты без активности по полтора года, лиды с общими доменами почты, маскирующими компанию, нестандартизированные поля должностей - и скоринг начинает приоритизировать не тех людей в не тех аккаунтах.
С predictive хуже вдвойне. Модель учится на исторических данных, а они отражают тех, кого команда преследовала, а не тех, кого стоило. Если годами гонялись за определённым профилем по наитию, модель закрепит это смещение как истину.
Гигиена данных - это не разовая чистка, а процесс: дедупликация, нормализация должностей и отраслей, обогащение фирмографики, единые правила заполнения полей. Когда CRM не справляется штатными средствами, помогает кастомная интеграция и автоматизация очистки на стыке систем - это профиль работ Exceltic. Скоринг на грязных данных - дорогая иллюзия точности.
Практический минимум для команды до 50 человек
Не стройте сложную модель. После 8-10 ключевых свойств точность не растёт, а сопровождать и объяснять модель становится тяжелее.
Минимум, который реально работает:
- Фит (вес выше поведения). 4-5 фирмографических признаков из анализа closed-won: размер компании, отрасль, роль контакта, регион.
- Поведение с намерением. 2-3 действия, которые предшествовали реальным сделкам, а не активность ради активности.
- Негативные сигналы. Личная почта, нерелевантная должность, отрасль вне ICP, затухание активности.
- Единое определение хорошего лида. Самая частая поломка - не плохая модель, а маркетинг и продажи, тихо использующие разные определения. Согласуйте порог MQL вместе и зафиксируйте.
- Ревизия раз в квартал. Сверяйте, какие лиды дошли до сделки, и корректируйте веса.
Этого достаточно, чтобы скоринг приносил пользу. Predictive имеет смысл, когда накопится несколько сотен размеченных сделок и CRM будет чистым. До этого момента простая прозрачная модель, привязанная к реальным винам, обгонит любую машинную, обученную на мусоре.