Plateforme de publicité de recherche en ligne et surveillance de la campagne en temps réel
Utilisé JSoup pour explorer les informations sur Amazon.
La publicité de recherche place des publicités en ligne sur les pages de fronts qui affichent des résultats aux utilisateurs de leurs requêtes de moteur de recherche. Ce serveur d'annonces de recherche prend des milliers de données sur les produits en tant que candidats d'annonces et sélectionne, filtre, classe, alloue et prix les publicités lorsque la requête de recherche entre.
Les ADS Canate seront d'abord évalués et filtrés par score de pertinence. Le score de pertinence est de mesurer la question de savoir de la requête pertinente pour les mots clés dans les publicités. Ici, le score de pertinence = nombre de Match Word Query / Nombre total de mots en mots clés. Pour une rétréivale rapide de l'informatique d'annonces, l'index inversé des mots clés d'annonces a été construit et stocké en cache.
La couche de données pour prendre en charge le système en ligne:
La probabilité de clic utilisateur (P-CLICK) joue un rôle important dans le classement des annonces.
Utilisez Spark ML Process simulé User Cliquez les données de journal et générez un modèle de prédiction.
Journal: IP de périphérique, ID de périphérique, ID de session, requête, adid, campagned, ad_category_query_category (0/1), cliquez sur (0/1)
Fonctionnalités PCLICK extraites du journal de recherche et stockées dans le magasin de valeurs clés
Régression logistique
Arbre de renforcement du gradient
Score de qualité = 0,25 * Score de pertinence + 0,75 * PCLICK
Score de classement = score de qualité * BIDE
Prix (coût par clic) = score de rang suivant / score de qualité actuel + 0,01
Lorsque vous recevez une requête de recherche, le système correspond à la requête de réécriture avec des mots clés des annonces en utilisant l'index inversé pour obtenir un score de pertinence et prédire la probabilité de clic par le modèle de régression généré à partir de données de clic historique 50 Go. La qualité des annonces sera déterminée par le score de pertinence et la probabilité de clic. Le moteur ADS calcule le score de qualité et le combine avec le prix des offres publicitaires pour le classement final et les prix.
Le système de moniteur de campagne en temps réel est conçu pour la collecte des événements pertinents des annonces générés par le serveur ADS en ligne et la visulation de la tendance des campagnes.
Le système de surveillance de campagne en temps réel est un pipeline de streaming qui collecte et traite les événements ADS générés par le moteur ADS de recherche en ligne. Les événements fortuits, les événements d'impression et les événements de clic des annonces sont publiés dans la file d'attente de messages et traités pour stocker dans la base de données de Streaming Way. Le tableau de bord frontal visualise l'état du budget et l'impression dynamique, la tendance des clics et des prix des campagnes.