Коротко
-
01
Что за инструмент
Predictor — модель искусственного интеллекта для прогнозирования кликабельности
-
02
Где используем
Платформа для размещения рекламы
-
03
Какие задачи решает
- Анализирует поведение потенциальных покупателей
- Прогнозирует количество кликов по баннерам на разных площадках
- Предлагает рекламодателю подходящие площадки для рекламы
- Экономит бюджет и увеличивает эффективность рекламной компании
-
04
Какому бизнесу подходит
Рекламные сети и платформы по закупке рекламного трафика
Рекламодатели
Площадки для размещения рекламы
Сервисы рекомендаций
Платформа помогает компаниям находить площадки для размещения рекламы
Наш заказчик — популярная рекламная платформа. Она помогает компаниям находить площадки для размещения рекламы.
Например, один из партнеров рекламной платформы — банк. Его клиенты каждый день используют банковское приложение. Рекламодатели используют его как площадку для размещения рекламы, где они могут предложить клиентам банка услуги и товары со скидкой.
Платформа не только связывает между собой рекламодателя и площадку, еще она предлагает разные услуги для них: проведение аукционов, консультирование, алгоритмы для эффективности рекламных компаний.

Проблема: компании теряют деньги на неудачных рекламных кампаниях
У компаний есть проблема — часто они не знают, какую площадку выбрать для размещения рекламы. Выбирают из-за известного бренда или наудачу. В итоге у объявления почти нет просмотров и кликов, компания теряет деньги, а рекламная платформа — клиентов.
Рекламная платформа решила внедрить новую услугу — прогнозирование кликабельности рекламных объявлений. Для этого нужен был модуль, который сможет проанализировать поведение пользователей и предсказать вероятность клика.
Решение: проверять эффективность кампании математическим алгоритмом
Для разработки решения рекламная платформа обратилась в Orbitsoft — так мы создали модуль прогнозирования кликабельности Predictor. Это код, который встраивается в архитектуру платформы, а пользователь видит дополнительные функции в личном кабинете при создании рекламной кампании.
Predictor анализирует данные о поведении пользователей и находит в них закономерности. Затем он создает прогноз, где лучше всего разместить объявление, чтобы на него кликнули. Это помогает компаниям размещать объявления для целевой аудитории.
Работает так: пользователь вводит запрос, Predictor собирает данные в хранилище. Дальше математическая модель анализирует данные. После анализа модуль предсказывает, на какую рекламу пользователь отреагирует. На основе этих данных платформа подбирает площадки с наибольшей вероятностью клика.

Создание прогноза состоит из четырех этапов:
- сбор данных для анализа;
- формулирование гипотезы прогноза;
- создание прогноза;
- тестирование прогноза на реальных запросах.
Рассказываем про каждый этап подробнее.
Этап 1. Сбор данных для анализа Чтобы создать прогноз, нужны вводные данные: какую рекламу анализируем, действия пользователей, техническая конфигурация запроса. Информацию предоставляет рекламная платформа из открытых протоколов браузера и своего хранилища. При регистрации на платформе пользователи разрешили использовать данные.
Таблица с данными для создания прогноза: | |
Информация о рекламе | — баннер, попап, объявление; — тематика рекламы; — рекламодатель; — адрес площадки. |
Действия пользователя | — кликнул; — проигнорировал; — закрыл; — отписался; — пожаловался; — остановил видео; — досмотрел видео до конца. |
Техническая информация | — user agent; — IP-адрес и его часть; — устройство пользователя; — браузер; — соотношение экрана; — геоданные. |
Данные мы делим на две равные части — одну часть данных будем использовать для создания прогноза, а вторую — для его тестирования.
Этап 2. Формулирование гипотезы. Дальше мы фильтруем данные по категориям, которые зависят от запроса рекламодателя.
Например, на платформу обратился интернет-магазин спорттоваров — заказчик хочет понять, где ему размещать рекламу о продаже фитнес-браслетов. Мы берем данные платформы и задаем фильтры по тематике объявлений, адресу площадок для размещения, типам устройств и количеству кликов по объявлениям.
В результате мы получаем информацию:
- реклама про фитнес-браслеты чаще всего размещается на игровых площадках;
- чаще всего пользователи кликают на попапы;
- больше всего кликов по рекламе с недорогих моделей IPhone и Android.
Дальше мы формулируем гипотезу для прогноза: интернет-магазину спорттоваров нужно размещать рекламу о фитнес-браслетах в виде попапов на игровых площадках. Скорее всего, целевая аудитория — это молодые люди от 20 до 35 с невысоким и среднем уровнем дохода, предпочитают покупать онлайн, в мобильных приложениях.
Этап 3. Создание прогноза. Чтобы получить цифры для прогноза и уточнения гипотезы, модель создает математический алгоритм. Для этого модель строит функцию зависимости одних данных от других и находит пересечения.
Например, мы предполагаем, что на рекламу недорогих фитнес-браслетов скорее всего кликнут студенты. Вводим данные нашей гипотезы: возраст до 35 лет, мобильные устройства, тип рекламы — баннеры, место размещение рекламы — игровые площадки. Модель обрабатывает запрос и выдает числа: за три месяца 1000 посетителей до 35 лет 700 раз нажали на баннер фитнес-браслета главного конкурента компании на определенной игровой площадке.
Благодаря алгоритму, мы получаем цифры для прогноза: если интернет-магазин разместит рекламу фитнес-браслетов на игровой площадке и установит цену, схожую с ценой конкурента, на объявление кликнут 20% посетителей.

Этап 4. Тестирование прогноза на реальных запросах. Дальше мы тестируем модель — сравниваем прогноз гипотезы и реальный результат из второй части данных, которые мы подготовили в начале.
Например, прогноз обещает, что 20% пользователей игровой площадки кликнут по баннеру с рекламой фитнес-браслетов. Мы смотрим данные за три предыдущих месяца у конкурентов и проверяем, состоялись ли эти клики на самом деле.
Если прогноз и данные из прошлого совпадут, значит, гипотеза была верна и прогноз можно считать точным. Если модель прогнозирует клики, а их не было — гипотеза не подтвердилась. Тогда возвращаемся к началу и проверяем новую гипотезу.
Точность тестирования измеряется в процентах. Например, мы проверяли гипотезу, что 70 посетителей из 100 кликнут на баннер. Точность предсказания — 70%.

Результат: эффективность рекламных кампаний выросла в среднем на 20%
Чтобы проверить, как повышается кликабельность с модулем Predictor, мы исследовали реальные рекламные кампании. В исследовании участвовали банки, e-commerce, сервисы бронирования и агрегаторы, медиа. Данные нам предоставила рекламная платформа.
Нас интересовал показатель CTR — соотношение кликов к показам. Например, в рекламной кампании агрегатора перелетов без применения модуля Predictor CTR составил 5,8%. Когда добавили прогноз, CTR вырос до 9,06%. Благодаря прогнозу, агрегатор перелетов получил больше кликов по рекламе.
Исследование показало, что у 10 рекламодателей показатель CTR увеличился в среднем на 20%. Стоимость рекламной кампании не изменилась, а точность увеличилась.
Технический блок
Хранение данных
- Сервера ABC, C3 — облачное решение от Amazon
- Протокол AWS S3, который поддерживается в Minio
- Hadoop 1.2.1 для подсчета статистики и списков ремаркетинга
Библиотеки данных
- TFS (Tensorflow Serving) www.tensorflow.org/tfx/guide/serving. Выступает в качестве хранилища версий модели. Поддерживает HDFS. Имеет RESTful API для предсказаний.
- TFMA (TensorFlow Model Analysis) www.tensorflow.org/tfx/guide/tfma. Выполняет расчет метрик моделей. Если аналитика подтверждает улучшение результатов модели, происходит обновление текущей версии. Если прогнозы для новой (candidate) модели хуже, чем для текущей (baseline), то модель остается без изменений.