Умный маркетолог

Детектор аномалий кликов и защита от склика

ML-анализ clickstream-данных, выявление бот-трафика и автоматическая приостановка кампаний с уведомлениями, последующая перераспределённая ставка.

Цель внедрения

Обеспечить обнаружение фрода с точностью ≥90% и экономию бюджета ≥7% в первый месяц работы

Технологический стек

Python, Requests, ClickHouse/BigQuery, PyOD, LightGBM, Scikit-learn, Airflow, Kafka, Streamlit

15%

Средний рост ROMI за 3 месяца

По данным Juniper Research 2024, рекламодатели теряют до 30% своего бюджетного фонда из‑за бот‑кликов и мошеннических сетей, что эквивалентно десяткам миллионов рублей ежеквартально. Аналитика Adloox показывает, что 25–35% всего цифрового трафика являются низкокачественными или автоматизированными, что приводит к «сгоранию» рекламных бюджетов без роста ключевых метрик. Маркетологи вынуждены вручную фильтровать огромные массивы данных, тратя по 10–15 часов в неделю на настройку IP‑блокировок и просмотр подозрительных кликов. Однако ручная блокировка IP‑диапазонов даёт лишь временный эффект: уже через несколько часов бот‑сети адаптируются и повторяют схему фрода с новой скоростью.

Дополнительные исследования Statista 2024 подтверждают: 40% рекламных кампаний в сегменте e‑commerce не приносят заявленной эффективности из‑за невидимого фрода, что увеличивает стоимость привлечения клиента (CAC) на 20–25%. При этом 60% рекламных агентств признают, что не имеют инструментов для оперативного выявления аномалий — они видят проблему лишь после завершения цикла и списания средств. Даже крупные бренды фиксируют потери до 15% маркетинговых затрат из‑за некачественного трафика, что снижает общий ROI на 10–15%.

Исследование Forrester 2024 показывает, что в период распродаж и сезонных e‑commerce‑акций уровень фрода может вырастать до 50%, и компании теряют до 45% бюджета на поддельные клики. Без автоматизации процесса через ML‑решения организации вынуждены перераспределять ресурсы на ручной мониторинг, что снижает скорость принятия решений и делает управление рекламой реактивным.

Суть решения 4GIC

‍

Сбор clickstream-данных

Подключаемся к источникам: Google Ads, Яндекс.Директ, VK Ads через API или выгрузки логов.
Собираем подробную информацию по каждому клику: IP, User-Agent, время, гео, клик-метки.

NLP и ML-анализ аномалий

PyOD-библиотеки выявляют статистические аномалии по скорости кликов и гео-паттернам.
LightGBM обучаем на базе помеченных исторических данных (bot vs human), включая фичи: session-length, среднее время на сайте, глубина просмотра.

Реактивное и проактивное реагирование

При подозрении на склики система автоматически приостанавливает кампанию или отдельно группу объявлений. - Уведомления в Slack/e-mail приходят менеджеру с рекомендациями (блокировать IP, менять креатив, запускать фильтрацию).

Интеграция с CRM и расчет настоящих конверсий

После попадания лида в CRM проводится анализ: совпадает ли конверсия с «подозрительным» кликом.
Автоматическое перераспределение ставок: бюджет переводится на проверенные источники, где a) меньше скликов, b) выше CR.

Отчётность и дашборд

В Streamlit-дашборде видно «нормальные» vs «анормальные» клики, saved-бюджет, ROI с учётом отсеянного фрода.
Также вкидываем рекомендации по оптимальным часовым группам и гео.

Выгода для бизнеса:

Экономия бюджета: снижение фрод-расходов на 5–10% ежемесячно.
Прозрачность: отчёт по реальному трафику и сэкономленным средствам.
Рост эффективности: увеличение CR и ROMI после перенаправления бюджета на качественный трафик.
Скорость реакции: обнаружение и блокировка аномалий в режиме реального времени.

Почему это лучше традиционного подхода?

‍

Традиционно

Ручная фильтрация IP-диапазонов, пост-аналитика.
Оценка фрода по итогам месяца.
Отсутствие связи с CRM, неполный учёт конверсий.

Сценарий 4GIC

Автоматическое обнаружение аномалий и мгновенная остановка кампании.
Реагирование в сутки, saved-бюджет считается в реальном времени.
Интеграция с CRM, расчёт реального CR и перенаправление бюджета.

Распространённые возражения

«У нас нет помеченных данных для обучения моделей» — При старте проекта мы в течение двух недель параллельно отмечаем подозрительные клики вручную и создаём «чистый» датасет для обучения LightGBM.

«Наш трафик приходит из многих источников — сложно собрать все логи» — Мы выстраиваем непрерывный ETL: API, CSV-выгрузки, коннекторы к ClickHouse, чтобы агрегировать гиперскейлом.

«Боюсь потерять легитимный трафик» — Пороговые значения аномалий настраиваются постепенно; первые 2 недели система работает в режиме «только уведомлений», без остановки объявлений.

Параметры сценария

Гипотеза — Автоматический ML-анализ кликов и блокировка бот-трафика снизят фрод-расходы на 5–10% и увеличат CR на 15%.

Цель внедрения — Обеспечить обнаружение фрода с точностью ≥90% и экономию бюджета ≥7% в первый месяц работы.

KPI и метрики

% фрод-расходов (цель < 7 %).
CR и ROMI после блокады.
Сэкономленный бюджет

Технологический стек

Сбор данных: Python, Requests, ClickHouse/BigQuery.
ML: PyOD, LightGBM, Scikit-learn.
ETL: Airflow, Kafka.
Дашборд: Streamlit.
Коммент: архитектура строится на гибких open-source компонентах, чтобы можно было добавлять новые источники трафика.

Шаги внедрения

Data Collection — подключение API, сбор исторических кликов и CRM-данных.
Labeling и обучение модели — ручная разметка и тренировка LightGBM.
Развёртывание в режиме «Noti-fication Only» — проверка точности и настройка порогов.
Production Roll-out — автоматическая блокировка кампаний/групп объявлений.
Мониторинг и дообучение — подключение новых данных, переобучение модели раз в месяц.

Влияние на бизнес заказчика

Экономия бюджета: 5–10% ежемесячно.
Увеличение CR: +10–15%.
Рост ROMI: +12%.
Экономия 20 ч/мес на ручной фильтрации.

Влияние на CX — Клиенты видят более релевантную рекламу без «бот-кликов» и воспринимают бренд как более профессиональный. Повышается качество трафика, что отражается в удовлетворённости и LTV.

Доп. идеи улучшения — Интеграция с IP‑блэклистами и Threat Intelligence. Реал‑тайм анализ поведения пользователей на сайте (mouse-tracking). ML-анализ времени суток и сезона для автоматических «чёрных списков».

Вывод

Защита рекламного бюджета от нечестного трафика — это вопрос выживания в высококонкурентных нишах. Решение 4GIC по аномалия-детектору не только экономит 5–10% средств ежемесячно, но и увеличивает отдачу от рекламы за счёт перенаправления бюджета на действительно работающие каналы. В условиях роста доли фрода в digital-маркетинге это одно из самых приоритетных вложений в области performance.

Следующее решение

Meeting Confirm Bot: автоматическое подтверждение встреч

Python (FastAPI, Llama-3), Calendar API (Google, Outlook), CRM API, WhatsApp/Telegram Bot API, Metabase/Superset, Docker/K8s, OAuth/RBAC

AI-бот рассылает напоминания и собирает подтверждения/переносы встреч через мессенджеры и email, синхронизирует CRM и календарь.

Партнер по продажам

“Двумя доминирующими источниками богатства будут компании, особенно те, которые используют ИИ, и земля, предложение которой ограничено.”

Сэм Альтман

Основатель OpenAI