Plataforma de publicidade de pesquisa on -line e monitoramento de campanha em tempo real
Utilizou as informações do JSUP para rastreador na Amazon.
A publicidade de pesquisa está colocando anúncios on -line nas páginas do front -end que mostram resultados para usuários de suas consultas do mecanismo de pesquisa. Este servidor de anúncios de pesquisa leva milhares de dados do produto como anúncios de candidatos e seleciona, filtros, classifica, aloca e preços os anúncios quando a consulta de pesquisa entra. A seleção e a classificação dos anúncios de pesquisa são baseados na qualidade dos anúncios e no preço da oferta oferecido pelos anunciantes.
O Candiado de ADS será primeiro avaliado e filtrado pela pontuação de relevância. A pontuação de relevância é medir como a consulta relevante é para palavras -chave nos anúncios. Aqui, a pontuação de relevância = número da consulta de correspondência do Word / número total de palavras em palavras -chave. Para uma rápida recuperação de informações de anúncios, o índice invertido de palavras -chave de anúncios foi construído e armazenado em cache.
A camada de dados para apoiar o sistema online:
A probabilidade de o usuário clicar (clique P) desempenha um papel importante na classificação de anúncios.
Use o Spark ML Processo simulado Usuário Clique em Dados de log e gerar modelo de previsão.
LOG: IP do dispositivo, ID do dispositivo, ID da sessão, consulta, Adid, Campaignid, AD_Category_Query_Category (0/1), Clicou (0/1)
Recursos de pclick extraídos do log de pesquisa e armazenados na loja de valores-chave
Regressão logística
Árvore de reforço de gradiente
Pontuação de qualidade = 0,25 * Pontuação de relevância + 0,75 * pClick
Pontuação de classificação = pontuação de qualidade * lance
Preço (custo por clique) = Próxima pontuação de classificação / pontuação de qualidade atual + 0,01
Ao receber a consulta de pesquisa, o sistema corresponde à consulta reescrita com palavras -chave de anúncios usando o índice invertido para obter a pontuação de relevância e prever a probabilidade de clique pelo modelo de regressão gerado a partir de 50 GB de dados de cliques históricos. A qualidade dos anúncios será determinada pela pontuação de relevância e pela probabilidade de clique. O mecanismo de anúncios calcula a pontuação da qualidade e o combina com o preço do lance de anúncios para classificação e preço final.
O sistema de monitor de campanha em tempo real é construído para coletar os anúncios relevantes gerados pelo servidor de anúncios on -line e visular a tendência de campanhas.
O sistema de monitoramento de campanhas em tempo real é um pipeline de streaming que coleta e processa os eventos de anúncios gerados pelo mecanismo de anúncios de pesquisa on -line. Os eventos casuais, eventos de impressão e eventos de cliques de anúncios são publicados para enviar mensagens na fila e processadas para armazenar em banco de dados de maneira transmissor. O painel frontal visualiza o status do orçamento e a impressão dinâmica, clique e preços tendências de campanhas.