Рекламная платформа в Интернете и мониторинг кампании в реальном времени
Используется JSoup для хрупковой информации на Amazon.
Поисковая реклама размещает онлайн -рекламу на передних страницах, которые показывают результаты пользователям из их запросов на поисковую систему. Этот сервер поискового объявления принимает тысячи данных о продукте в качестве кандидатов на рекламу и выбирает, фильтры, ранги, выделяют и ценят рекламу, когда входит поисковый запрос. Выбор и рейтинг поисковой рекламы основаны на качестве рекламы и цены предложений, предлагаемых рекламодателями.
Канцет рекламы сначала будет оцениваться и отфильтровать по оценке актуальности. Оценка актуальности заключается в измерении того, насколько релевантным запросом является ключевые слова в рекламе. Здесь оценка актуальности = количество запросов на соответствие слов / общее количество слов в ключевых словах. Для быстрого репрессии разобщенности ADS был построен перевернутый индекс ключевых слов ADS и хранится в кеше.
Уровень данных для поддержки онлайн -системы:
Вероятность клика пользователя (P-клик) играет важную роль в рейтинге рекламы.
Используйте процесс Spark ML, смоделированную пользователя, щелкните данные журнала и генерируйте модель прогнозирования.
Журнал: IP устройства IP, идентификатор устройства, идентификатор сеанса, запрос, Adid, Campaign, AD_Category_query_category (0/1), нажал (0/1)
Функции Pclick, извлеченные из журнала поиска и хранятся в магазине ключевых значений
Логистическая регрессия
Градиент повышает дерево
Оценка качества = 0,25 * Оценка актуальности + 0,75 * Pclick
Рейнг -оценка = балл качества * ставка
Цена (стоимость за клик) = следующий рейтинг / оценка качества текущего качества + 0,01
При получении поискового запроса система соответствует переписанию запроса с ключевыми словами рекламы с использованием инвертированного индекса, чтобы получить оценку актуальности, и прогнозировать вероятность клика по модели регрессии, сгенерированной из исторических данных 50 ГБ. Качество объявлений будет определен как по оценке релевантности, так и с вероятностью щелчка. Двигатель рекламы рассчитывает оценку качества и объединяет его с ценой ставки рекламы для окончательного рейтинга и цен.
Система мониторинга кампании в реальном времени создана для сбора рекламы соответствующих событий, сгенерированных онлайн -сервером рекламы и визита в тренде кампаний.
Система мониторинга кампании в реальном времени - это потоковой конвейер, который собирает и обрабатывает события рекламы, сгенерированные онлайн -рекламным двигателем. Случайные события, события впечатления и щелчок событий рекламы публикуются в очереди сообщений и обрабатываются для хранения в базе данных по потоковой передаче. Панельная панель фронта визуализирует бюджетный статус и динамическое впечатление, щелчок и ценообразование кампаний.