Platform Iklan Pencarian Online & Pemantauan Kampanye Realtime
Menggunakan JSoup untuk merayap informasi di Amazon.
Cari iklan menempatkan iklan online di halaman ujung depan yang menunjukkan hasil kepada pengguna dari permintaan mesin pencari mereka. Server ADS pencarian ini membutuhkan ribuan data produk sebagai kandidat iklan dan memilih, filter, peringkat, mengalokasikan dan harga iklan ketika kueri pencarian masuk. Pemilihan dan peringkat iklan pencarian didasarkan pada kualitas iklan dan harga penawaran yang ditawarkan oleh pengiklan.
ADS Candiate pertama -tama akan dievaluasi dan disaring oleh skor relevansi. Skor relevansi adalah untuk mengukur seberapa relevan kueri untuk kata -kata kunci dalam iklan. Di sini skor relevansi = jumlah kueri kecocokan kata / jumlah total kata dalam kata kunci. Untuk pengembalian cepat infomasi ADS, indeks kata kunci ADS terbalik dibangun dan disimpan dalam cache.
Lapisan data untuk mendukung sistem online:
Probabilitas klik pengguna (p-click) memainkan peran penting dalam peringkat iklan.
Gunakan Proses Spark ML Data Log Klik Pengguna dan Hasilkan Model Prediksi.
Log: IP Perangkat, ID Perangkat, ID Sesi, Kueri, Adid, CampaignID, AD_Category_Query_Category (0/1), diklik (0/1)
fitur pclick diekstraksi dari log pencarian dan disimpan di toko nilai kunci
Regresi logistik
Pohon meningkatkan gradien
Skor Kualitas = 0,25 * Skor Relevansi + 0,75 * PClick
Skor peringkat = skor kualitas * tawaran
Harga (biaya per klik) = skor peringkat berikutnya / skor kualitas saat ini + 0,01
Saat menerima kueri pencarian, sistem cocok dengan menulis ulang kueri dengan kata kunci iklan menggunakan indeks terbalik untuk mendapatkan skor relevansi, dan memprediksi probabilitas klik oleh model regresi yang dihasilkan dari data klik historis 50GB. Kualitas iklan akan ditentukan oleh skor relevansi dan probabilitas klik. Mesin ADS menghitung skor kualitas dan menggabungkannya dengan harga tawaran iklan untuk peringkat akhir dan harga.
Sistem monitor kampanye waktu nyata dibangun untuk mengumpulkan acara -acara relevan iklan yang dihasilkan oleh server iklan online dan visulasi tren kampanye.
Sistem pemantauan kampanye waktu nyata adalah pipa streaming yang mengumpulkan dan memproses acara iklan yang dihasilkan oleh mesin iklan pencarian online. Acara kebetulan, peristiwa kesan, dan acara klik iklan diterbitkan untuk mengantri pesan dan diproses untuk disimpan dalam database dengan cara streaming. Dasbor ujung depan memvisualisasikan status anggaran dan kesan dinamis, klik dan tren harga kampanye.