منصة إعلانات البحث عبر الإنترنت ومراقبة الحملة في الوقت الفعلي
تستخدم JSoup إلى معلومات الزاحف على Amazon.
يضع الإعلانات البحث الإعلانات عبر الإنترنت على صفحات الواجهة الأمامية التي تعرض نتائج للمستخدمين من استعلامات محرك البحث. يأخذ خادم إعلانات البحث الآلاف من بيانات المنتجات كمرشحين واختيارين ومرشحات وتصنيفات وتخصيص الإعلانات والأسعار عند ظهور استعلام البحث. يعتمد اختيار وترتيب إعلانات البحث على جودة الإعلانات وسعر العطاء الذي يقدمه المعلنون.
سيتم أولاً تقييم ADS Candiate وتصفيتها من خلال درجة الصلة. درجة الأهمية هي قياس مدى أهمية الاستعلام للكلمات الرئيسية في الإعلانات. هنا درجة الأهمية = عدد استعلام مطابقة الكلمات / العدد الإجمالي للكلمات في الكلمات الرئيسية. من أجل repomation السريع للإعلانات ، تم بناء مؤشر الكلمات الرئيسية المقلوبة للكلمات الرئيسية الإعلانات وتخزينه في ذاكرة التخزين المؤقت.
طبقة البيانات لدعم النظام عبر الإنترنت:
يلعب احتمال نقر المستخدم (p-click) دورًا مهمًا في تصنيف الإعلانات.
استخدم Spark ML Process User User انقر فوق بيانات السجل وإنشاء نموذج التنبؤ.
السجل: الجهاز IP ، معرف الجهاز ، معرف الجلسة ، الاستعلام ، adid ، campaignid ، ad_category_query_category (0/1) ، نقر (0/1)
ميزات PCLICK مستخرجة من سجل البحث وتخزينها في متجر القيمة الرئيسية
الانحدار اللوجستي
شجرة تعزيز التدرج
درجة الجودة = 0.25 * درجة الصلة + 0.75 * PCLICK
درجة رتبة = نقاط الجودة * عرض
السعر (التكلفة لكل نقرة) = درجة المرتبة التالية / درجة الجودة الحالية + 0.01
عند تلقي استعلام البحث ، يعيد تطابق النظام إعادة كتابة الاستعلام باستخدام الكلمات الرئيسية للإعلانات باستخدام فهرس مقلوب للحصول على درجة الصلة ، والتنبؤ باحتمال النقر بواسطة نموذج الانحدار الذي تم إنشاؤه من بيانات النقرات التاريخية 50 جيجا بايت. سيتم تحديد جودة الإعلانات من خلال كل من درجة الأهمية واحتمال النقر. يحسب محرك ADS درجة الجودة ويجمع بينها مع سعر عرض الإعلانات للتصنيف النهائي والتسعير.
تم تصميم نظام مراقب الحملة في الوقت الفعلي لجمع الأحداث ذات الصلة الإعلانات التي تم إنشاؤها بواسطة خادم الإعلانات عبر الإنترنت ورسولك على توترات الحملات.
هو نظام مراقبة الحملات في الوقت الحقيقي هو خط أنابيب بث يجمع ويعالج أحداث الإعلانات التي تم إنشاؤها بواسطة محرك إعلانات البحث عبر الإنترنت. يتم نشر أحداث الصدفة وأحداث الانطباع وأحداث الإعلانات إلى قائمة انتظار الرسائل ومعالجتها للتخزين في قاعدة البيانات في طريق البث. تتخيل لوحة معلومات الواجهة الأمامية حالة الميزانية والانطباع الديناميكي والنقر وتسعير الحملات.