Lead scoring для B2B: модели и ошибки

Скоринг лидов продают как способ навести порядок в воронке. На практике большинство моделей наводят порядок только в отчётах: цифра в карточке лида растёт, маркетинг рапортует о росте MQL, а в пайплайне ничего не меняется. Проблема почти никогда не в формуле. Проблема в том, что модель оценивает не то, что реально приводит к сделке.

Ниже - как устроены две основные модели, где каждая ломается и какой минимум скоринга имеет смысл собрать команде до 50 человек, не нанимая data scientist.

Rule-based против predictive: не выбор, а этап

Rule-based скоринг - это ручные правила. Запрос демо: +20. Целевая отрасль: +10. Открыл письмо: +2. Вы сами решаете, сколько весит каждый сигнал, исходя из своего понимания клиента. Модель прозрачна, её легко объяснить продажам и так же легко поправить.

Predictive скоринг работает иначе. Алгоритм обучается на исторических данных о сделках и сам находит, какие признаки коррелируют с closed-won. Он может обнаружить, что комбинация темпа роста компании и конкретного скачанного документа предсказывает покупку сильнее всего, что вы заложили руками. По разным оценкам predictive-подход даёт заметный прирост в доле sales-accepted лидов, но только при одном условии - чистых и консистентных исторических данных.

Это и есть главное недопонимание. Predictive не заменяет rule-based, он идёт после него. Пока у вас нет достаточного объёма размеченных сделок и чистого CRM, машинная модель просто автоматизирует ваши же ошибки, только быстрее и непрозрачнее. Команде на старте почти всегда нужен rule-based. Predictive - это апгрейд, который заслуживают данными.

Где скоринг ломается чаще всего

Четыре поломки встречаются почти в каждой второй модели.

Скоринг по vanity-сигналам. Открытия писем, скачивания PDF, визиты на сайт легко измерить, поэтому именно их и кладут в модель. Они раздувают счёт MQL и не создают выручки. Лид, открывший пять писем, выглядит горячим и не покупает никогда. Поведение должно весить меньше, чем фит, а внутри поведения вес должен быть у действий с реальным коммерческим намерением: запрос цены, повторный визит на pricing, регистрация на демо.

Игнорирование ICP fit. Модель, построенная только на активности, переоценивает плохо подходящие аккаунты и недооценивает хорошие. Рабочий скоринг тянет сигналы из четырёх корзин: фирмографика, данные о роли контакта, поведение и негативные сигналы. Если убрать фирмографику, вы получите активного студента с личной почтой выше, чем директора по продажам из целевого аккаунта.

Отсутствие negative scoring. Про него забывают почти все, а именно он не даёт корзине A забиться теми, кто никогда не купит. Личная почта, нерелевантная должность, отрасль вне ICP, лид без активности больше полугода - всё это должно тянуть счёт вниз. Без штрафов модель умеет только хвалить.

Модель не пересматривается. Скоринг деградирует: меняются кампании, растёт библиотека контента, смещается поведение покупателей. Без регулярной настройки доля ложноположительных растёт квартал за кварталом. Модель, которую не трогали год, почти наверняка врёт.

Привязывайте скоринг к сделкам, а не к MQL

Если успех модели измеряется числом созданных MQL, она будет гнаться за объёмом. Это структурная ловушка: вы оптимизируете метрику, которая не равна выручке.

Правильная отправная точка - выигранные сделки. Возьмите closed-won за последний год и разберите их в обратную сторону: какая фирмография, какие роли в комитете, какие действия предшествовали покупке. Стройте веса на этих паттернах, а не на представлениях о том, как выглядит идеальный клиент. Дальше модель оценивают не по MQL, а по встречам, созданному пайплайну, скорости движения и винам.

Здесь же возникает технический разрыв. Чтобы связать счёт лида с реальным результатом, нужно видеть весь жизненный цикл: от источника и рекламного касания до стадии сделки в CRM. Большинство стеков этого не показывают - рекламные данные живут отдельно от CRM. Инструменты вроде Prooflytics как раз закрывают этот разрыв, соединяя рекламную аналитику с жизненным циклом сделки в CRM, чтобы было видно, какие лиды и каналы доходят до closed-won, а не просто до статуса MQL.

Без чистого CRM не работает ничего

Любая модель - и rule-based, и predictive - стоит на данных CRM. Дубли аккаунтов, контакты без активности по полтора года, лиды с общими доменами почты, маскирующими компанию, нестандартизированные поля должностей - и скоринг начинает приоритизировать не тех людей в не тех аккаунтах.

С predictive хуже вдвойне. Модель учится на исторических данных, а они отражают тех, кого команда преследовала, а не тех, кого стоило. Если годами гонялись за определённым профилем по наитию, модель закрепит это смещение как истину.

Гигиена данных - это не разовая чистка, а процесс: дедупликация, нормализация должностей и отраслей, обогащение фирмографики, единые правила заполнения полей. Когда CRM не справляется штатными средствами, помогает кастомная интеграция и автоматизация очистки на стыке систем - это профиль работ Exceltic. Скоринг на грязных данных - дорогая иллюзия точности.

Практический минимум для команды до 50 человек

Не стройте сложную модель. После 8-10 ключевых свойств точность не растёт, а сопровождать и объяснять модель становится тяжелее.

Минимум, который реально работает:

Фит (вес выше поведения). 4-5 фирмографических признаков из анализа closed-won: размер компании, отрасль, роль контакта, регион.
Поведение с намерением. 2-3 действия, которые предшествовали реальным сделкам, а не активность ради активности.
Негативные сигналы. Личная почта, нерелевантная должность, отрасль вне ICP, затухание активности.
Единое определение хорошего лида. Самая частая поломка - не плохая модель, а маркетинг и продажи, тихо использующие разные определения. Согласуйте порог MQL вместе и зафиксируйте.
Ревизия раз в квартал. Сверяйте, какие лиды дошли до сделки, и корректируйте веса.

Этого достаточно, чтобы скоринг приносил пользу. Predictive имеет смысл, когда накопится несколько сотен размеченных сделок и CRM будет чистым. До этого момента простая прозрачная модель, привязанная к реальным винам, обгонит любую машинную, обученную на мусоре.

Lead scoring для B2B: модели и где они ломаются

Rule-based против predictive: не выбор, а этап

Где скоринг ломается чаще всего

Привязывайте скоринг к сделкам, а не к MQL

Без чистого CRM не работает ничего

Практический минимум для команды до 50 человек