guess ดาวน์โหลด - การดาวน์โหลดซอร์สโค้ด guess

เดา. js (อัลฟ่า)

ไลบรารีและเครื่องมือสำหรับการเปิดใช้งานประสบการณ์ผู้ใช้ที่ขับเคลื่อนด้วยข้อมูลบนเว็บ

เร็ว

สำหรับผู้ใช้ webpack:

⚫การรวมกลุ่มที่ขับเคลื่อนด้วยข้อมูล

ติดตั้งและกำหนดค่า GuessPlugin - ปลั๊กอิน Webpack ที่คาดเดา JS ซึ่งทำให้กระบวนการตั้งค่ามากขึ้นโดยอัตโนมัติมากที่สุด

หากคุณต้องการลองใช้โมดูลที่เราเสนอเป็นรายบุคคลไดเรกทอรี packages มีสามแพ็คเกจ:

ga - โมดูลสำหรับดึงข้อมูลที่มีโครงสร้างจาก Google Analytics API เพื่อเรียนรู้เกี่ยวกับรูปแบบการนำทางของผู้ใช้
parser - โมดูลที่ให้การแยกวิเคราะห์กรอบ JavaScript นี่คือพลังความสามารถในการเดินทางเส้นทางที่ใช้ในปลั๊กอิน Webpack Guess
webpack - ปลั๊กอิน WebPack สำหรับการตั้งค่าการดึงข้อมูลการคาดการณ์ในแอปพลิเคชันของคุณ มันใช้โมดูล ga และ parser และเสนอตัวเลือกจำนวนมากสำหรับการกำหนดค่าวิธีการดึงข้อมูลการพยากรณ์ควรทำงานในแอปพลิเคชันของคุณ

สำหรับผู้ใช้ที่ไม่ใช่ Webpack:

⚫การโหลดที่ขับเคลื่อนด้วยข้อมูล

การดึงข้อมูลการทำนายของเราสำหรับเวิร์กโฟลว์ไซต์ให้ชุดขั้นตอนที่คุณสามารถทำตามเพื่อรวมการดึงข้อมูลการคาดการณ์โดยใช้ Google Analytics API เข้ากับเว็บไซต์ของคุณ

repo นี้ใช้ข้อมูล Google Analytics เพื่อพิจารณาว่าผู้ใช้ส่วนใหญ่มีแนวโน้มที่จะเยี่ยมชมถัดไปจากหน้ากำหนด สคริปต์ฝั่งไคลเอ็นต์ (ซึ่งคุณจะเพิ่มลงในแอปพลิเคชันของคุณ) ส่งคำขอไปยังเซิร์ฟเวอร์เพื่อรับ URL ของหน้าเว็บที่ควรดึงออกมาจากนั้นดึงข้อมูลทรัพยากรนี้ล่วงหน้า

เรียนรู้เพิ่มเติม

Guess.js คืออะไร?

Guess.js จัดเตรียมไลบรารีและเครื่องมือเพื่อลดความซับซ้อนของวิธีการวิเคราะห์ข้อมูลที่ขับเคลื่อนด้วยการทำนายเพื่อปรับปรุงการทดลองของผู้ใช้บนเว็บ ข้อมูลนี้สามารถขับเคลื่อนได้จากแหล่งข้อมูลจำนวนมากรวมถึงการวิเคราะห์หรือรูปแบบการเรียนรู้ของเครื่อง Guess.js มีจุดมุ่งหมายเพื่อลดแรงเสียดทานของการบริโภคและการใช้ความคิดนี้กับไซต์และแอพที่ทันสมัยทั้งหมดรวมถึงการสร้างห้องสมุดและเครื่องมือสำหรับเวิร์กโฟลว์ยอดนิยม

การใช้การวิเคราะห์ข้อมูลเชิงทำนายกับไซต์สามารถนำไปใช้ในบริบทจำนวนมาก:

ทำนายหน้าถัดไป (หรือหน้า) ผู้ใช้มีแนวโน้มที่จะเยี่ยมชมและดึงหน้าหน้าเหล่านี้ล่วงหน้าปรับปรุงประสิทธิภาพการโหลดหน้าเว็บที่รับรู้และความสุขของผู้ใช้
- ระดับหน้า: PRERENDER/PREFETCH หน้าซึ่งมีแนวโน้มมากที่สุดที่จะเข้าชมต่อไป
- Bundle-Level: Prefetch การรวมกลุ่มที่เกี่ยวข้องกับหน้า N ด้านบน ในการเดินเรือแต่ละหน้าเพื่อนบ้านทั้งหมดของหน้าปัจจุบันเรียงลำดับตามลำดับจากมากไปน้อยตามความน่าจะเป็นที่จะเข้าชม ฟ็อตสินทรัพย์ (JavaScript Chunks) สำหรับหน้า N ด้านบนขึ้นอยู่กับประเภทการเชื่อมต่อปัจจุบันที่มีประสิทธิภาพ
ทำนายเนื้อหาชิ้นต่อไป (บทความ, ผลิตภัณฑ์, วิดีโอ) ผู้ใช้มีแนวโน้มที่จะต้องการดูและปรับหรือกรองประสบการณ์ผู้ใช้เพื่อบัญชีสำหรับสิ่งนี้
ทำนายประเภทของวิดเจ็ตที่ผู้ใช้แต่ละคนมีแนวโน้มที่จะโต้ตอบกับเกมเพิ่มเติม (เช่นเกม) และใช้ข้อมูลนี้เพื่อปรับประสบการณ์ที่กำหนดเองมากขึ้น

ด้วยการร่วมมือกับจุดสัมผัสที่แตกต่างกันในระบบนิเวศที่สามารถใช้วิธีการที่ขับเคลื่อนด้วยข้อมูลได้อย่างง่ายดายเราหวังว่าจะสรุปโครงสร้างพื้นฐานทั่วไปเพื่อเพิ่มการบังคับใช้ในซ้อนเทคโนโลยีที่แตกต่างกัน

ปัญหาที่เราต้องการแก้ไข

นักพัฒนาที่ใช้ <link rel=prefetch> สำหรับการนำทางในอนาคตต้องพึ่งพาการอ่านเชิงพรรณนาด้วยตนเองเพื่อแจ้งการตัดสินใจของพวกเขาสำหรับสิ่งที่จะนำไปก่อน
การตัดสินใจเหล่านี้มักจะเกิดขึ้นในเวลาและ ..
- (1) มักจะไม่กลับมาอีกครั้งเมื่อมีการเปลี่ยนแปลงแนวโน้มข้อมูล
- (2) มีข้อ จำกัด มากในวิธีการใช้งาน การใช้งานมักจะนำเนื้อหามาล่วงหน้าจากหน้าแรกหรือชุดฮีโร่ขนาดเล็กมากเท่านั้น แต่ไม่ได้ทำเช่นนี้สำหรับจุดเข้าที่เป็นไปได้ทั้งหมดในเว็บไซต์ สิ่งนี้สามารถปล่อยโอกาสในการแสดงไว้บนโต๊ะ
- (3) ต้องการความเชื่อมั่นเกี่ยวกับข้อมูลที่ใช้ในการผลักดันการตัดสินใจโดยใช้การดึงข้อมูลล่วงหน้าหมายความว่านักพัฒนาอาจไม่ได้รับมันออกมาจากความกังวลว่าพวกเขาจะเสียแบนด์วิดท์ <link rel=prefetch> ปัจจุบันใช้กับ 5% ของ pageloads โครเมี่ยมทั้งหมด แต่อาจสูงกว่า
การใช้การวิเคราะห์เชิงพยากรณ์นั้นซับซ้อนเกินไปสำหรับนักพัฒนาเว็บโดยเฉลี่ย
- นักพัฒนาส่วนใหญ่ไม่คุ้นเคยกับวิธีการใช้ประโยชน์จาก Google Analytics API เพื่อกำหนดความน่าจะเป็นที่หน้าจะเข้าเยี่ยมชมต่อไป เราขาด:
- (1) โซลูชันระดับหน้า: โซลูชันฝั่งไคลเอ็นต์แบบดรอปอินสำหรับการดึงหน้าล่วงหน้าผู้ใช้จะไปเยี่ยมชม
- (2) โซลูชันระดับ Bundling: ชุดของปลั๊กอิน/เครื่องมือที่ทำงานกับ JavaScript Bundlers (เช่น Webpack) ในวันนี้เพื่อจัดกลุ่มและสร้างชุดรวมของชุดเส้นทางการนำทางที่เฉพาะเจาะจงอาจโหลดได้เร็วขึ้น
นักพัฒนาส่วนใหญ่ยังไม่คุ้นเคยกับวิธีการเรียนรู้ของเครื่อง โดยทั่วไป:
- (1) ไม่แน่ใจว่า (และทำไม) ML สามารถรวมเข้ากับสแต็คเทคโนโลยี (เว็บ) ที่มีอยู่เดิมได้
- (2) สิ่งที่คุณค่าของ tensorflow คืออะไรหรือที่โซลูชันเช่นเครื่องยนต์ CloudML พอดีเรามีโอกาสที่จะทำให้ค่าใช้จ่ายที่เกี่ยวข้องกับการใช้ประโยชน์จากการแก้ปัญหาเหล่านี้ง่ายขึ้น
วิธีการที่ดีที่สุดในชั้นเรียน / ลิ้มลองต่ำในพื้นที่นี้ยังคงเกิดขึ้นอย่างช้าๆและยังไม่สามารถเข้าถึงได้สำหรับนักพัฒนาเว็บโดยไม่มี ML หรือภูมิหลังด้านวิทยาศาสตร์ข้อมูล
- การเรียนรู้ของเครื่องพบกับคลาวด์: การดึงข้อมูลล่วงหน้าโดย IIH Nordic
  - ผู้จัดการแท็กเช่น Google Tag Manager สามารถใช้เพื่อแยกเนื้อหาหน้าเว็บจากการติดตามรหัสวิธีการใช้เนื้อหา สิ่งนี้ช่วยให้นักวิเคราะห์เว็บสามารถอัพเกรดรหัสการติดตามแบบเรียลไทม์โดยไม่มีการหยุดทำงานของไซต์ ผู้จัดการแท็กอนุญาตให้ใช้โซลูชันทั่วไปสำหรับการฉีดรหัสและสามารถใช้ในการปรับใช้การดึงข้อมูลอัจฉริยะ ข้อดี: การวิเคราะห์ที่ใช้ในการสร้างแบบจำลองนั้นมาจากแท็กผู้จัดการ นอกจากนี้เรายังสามารถส่งข้อมูลสดไปยังตัวทำนายโดยไม่ต้องใช้ตัวติดตามเพิ่มเติม หลังจากเพิ่มแท็ก (IIH Nordic) สองสามรายการลงในการติดตั้ง GTM ไซต์สามารถเริ่มต้นการดึงทรัพยากรล่วงหน้าของหน้าถัดไปและติดตามโอกาสในการประหยัดเวลาโหลด
  - IIH Nordic ย้ายโมเดลการดึงข้อมูลล่วงหน้าไปยังบริการเว็บของเบราว์เซอร์เมื่อผู้ใช้เยี่ยมชมหน้าใหม่ บริการตอบสนองต่อคำขอแต่ละครั้งและใช้ประโยชน์จาก Google Cloud, App Engine และ Cloud ML โซลูชันของพวกเขาเลือกแบบจำลองที่แม่นยำที่สุดตัวเลือก ได้แก่ โมเดลมาร์คอฟหรือส่วนใหญ่มักเป็นตาข่ายประสาทลึกในเทนเซอร์โฟล
  - เมื่อพฤติกรรมของผู้ใช้เปลี่ยนไปตามกาลเวลาแบบจำลองการทำนายจำเป็นต้องมีการอัปเดต (การฝึกอบรม) เป็นครั้งคราว การฝึกอบรมแบบจำลองเกี่ยวข้องกับการรวบรวมและแปลงข้อมูลและปรับพารามิเตอร์ของโมเดลให้เหมาะสม IIH Nordic ใช้ Google Cloud เพื่อดึงข้อมูลจากบริการการวิเคราะห์ของลูกค้าเป็นถังข้อมูลส่วนตัวใน BigQuery พวกเขาประมวลผลข้อมูลนี้ฝึกอบรมและทดสอบแบบจำลองการทำนายการอัพเดทบริการการทำนายอย่างราบรื่น
  - IIH Nordic แนะนำไซต์ขนาดเล็ก/ช้าอัปเดตโมเดลของพวกเขาทุกเดือน ไซต์ขนาดใหญ่อาจจำเป็นต้องฝึกอบรมทุกวันหรือแม้กระทั่งรายชั่วโมงสำหรับเว็บไซต์ข่าว
  - ประโยชน์ของโมเดลการฝึกอบรม ML ในคลาวด์นั้นง่ายดายในระดับเนื่องจากเครื่องจักรเพิ่มเติม GPU และโปรเซสเซอร์สามารถเพิ่มได้ตามต้องการ
  - การรวมกลุ่มที่ขับเคลื่อนด้วยการเรียนรู้ของเครื่อง อนาคตของเครื่องมือ JavaScript โดย Minko

ลำดับความสำคัญเริ่มต้น: ปรับปรุงประสิทธิภาพผ่านการดึงข้อมูลล่วงหน้าที่ขับเคลื่อนด้วยข้อมูล

ลำดับความสำคัญครั้งใหญ่ครั้งแรกสำหรับ Guess.js จะปรับปรุงประสิทธิภาพของเว็บผ่านการตรวจสอบเนื้อหาล่วงหน้า

ด้วยการสร้างรูปแบบของหน้าเว็บผู้ใช้มีแนวโน้มที่จะเยี่ยมชมเนื่องจากหน้าเข้าโดยพลการโซลูชันสามารถคำนวณความน่าจะเป็นที่ผู้ใช้จะไปเยี่ยมชมหน้าถัดไปหรือชุดหน้าและแหล่งข้อมูลล่วงหน้าสำหรับพวกเขาในขณะที่ผู้ใช้ยังคงดูหน้าปัจจุบันของพวกเขา สิ่งนี้มีความเป็นไปได้ในการปรับปรุงประสิทธิภาพการโหลดหน้าเว็บสำหรับการเข้าชมหน้าต่อมาเนื่องจากมีโอกาสที่แข็งแกร่งที่หน้าจะอยู่ในแคชของผู้ใช้แล้ว

แนวทางที่เป็นไปได้ในการคาดการณ์การดึงข้อมูล

ในการทำนายหน้าถัดไปผู้ใช้มีแนวโน้มที่จะเยี่ยมชมโซลูชันสามารถใช้ Google Analytics API ข้อมูลเซสชันของ Google Analytics สามารถใช้เพื่อสร้างแบบจำลองเพื่อทำนายหน้าเว็บที่เป็นไปได้มากที่สุดที่ผู้ใช้จะไปเยี่ยมชมต่อไปบนเว็บไซต์ ประโยชน์ของข้อมูลเซสชันนี้คือมันสามารถพัฒนาได้เมื่อเวลาผ่านไปดังนั้นหากเส้นทางการนำทางเฉพาะเปลี่ยนการคาดการณ์ก็สามารถอยู่ได้ทันสมัยเช่นกัน

ด้วยความพร้อมใช้งานของข้อมูลนี้เอ็นจิ้นสามารถแทรก <link rel="[prerender/prefetch/preload]"> แท็กเพื่อเร่งเวลาโหลดสำหรับคำขอหน้าถัดไป ในการทดสอบบางอย่างเช่นการโหลดหน้าโหลดซุปเปอร์ชาร์จของ Mark Edmondson ด้วย R สิ่งนี้นำไปสู่การปรับปรุง 30% ในเวลาโหลดหน้าเว็บ เครื่องหมายวิธีการที่ใช้ในการวิจัยของเขาเกี่ยวข้องกับการใช้แท็ก GTM และการเรียนรู้ด้วยเครื่องเพื่อฝึกอบรมแบบจำลองสำหรับการทำนายหน้า นี่คือเครื่องหมายความคิดอย่างต่อเนื่องในการเรียนรู้ของเครื่องจักรตรงกับคลาวด์ - การดึงข้อมูลล่วงหน้าอัจฉริยะ

ในขณะที่วิธีการนี้เป็นเสียงวิธีการที่ใช้อาจถือว่าซับซ้อนเล็กน้อย อีกวิธีหนึ่งที่สามารถทำได้ (ซึ่งง่ายกว่า) คือการพยายามรับข้อมูลการทำนายที่แม่นยำจาก Google Analytics API หากคุณเรียกใช้รายงานสำหรับหน้าและมิติพา ธ หน้าก่อนหน้านี้รวมกับการชมหน้าและออกจากตัวชี้วัดสิ่งนี้ควรให้ข้อมูลเพียงพอที่จะส่งผลต่อการดึงข้อมูลล่วงหน้าสำหรับหน้ายอดนิยมมากที่สุด

การเรียนรู้ของเครื่องจักรสำหรับการพยากรณ์

ML สามารถช่วยปรับปรุงความแม่นยำโดยรวมของการคาดการณ์ของโซลูชัน แต่ไม่จำเป็นสำหรับการใช้งานครั้งแรก การดึงข้อมูลการคาดการณ์สามารถทำได้โดยการฝึกอบรมแบบจำลองบนหน้าเว็บมีแนวโน้มที่จะเยี่ยมชมและปรับปรุงในรุ่นนี้เมื่อเวลาผ่านไป

เครือข่ายประสาทลึกนั้นดีโดยเฉพาะอย่างยิ่งในการล้อเล่นความซับซ้อนที่อาจนำไปสู่ผู้ใช้ที่เลือกหน้าหนึ่งเหนืออีกหน้าหนึ่งโดยเฉพาะอย่างยิ่งถ้าเราต้องการลองใช้เวอร์ชันของโซลูชันที่รองรับหน้าเว็บที่ผู้ใช้แต่ละคนอาจเยี่ยมชมหน้า "ผู้ใช้" ทั่วไป/ค่ามัธยฐาน " ลำดับหน้าคงที่ (ก่อนหน้า, ปัจจุบัน, ถัดไป) อาจเป็นวิธีที่ง่ายที่สุดในการเริ่มต้นจัดการกับตอนแรก ซึ่งหมายถึงการสร้างแบบจำลองที่ไม่ซ้ำกันกับชุดเอกสารของคุณ

การอัปเดตแบบจำลองมีแนวโน้มที่จะทำเป็นระยะดังนั้นอาจมีการตั้งค่างานทุกคืน/รายสัปดาห์เพื่อรีเฟรชตามพฤติกรรมผู้ใช้ใหม่ สิ่งนี้สามารถทำได้แบบเรียลไทม์ แต่มีแนวโน้มที่ซับซ้อนดังนั้นการทำมันอาจเพียงพอเป็นระยะ ใคร ๆ ก็สามารถจินตนาการถึงรูปแบบทั่วไปที่แสดงถึงรูปแบบพฤติกรรมสำหรับผู้ใช้ในไซต์ที่สามารถขับเคลื่อนด้วยชุดสถานะที่ผ่านการฝึกอบรม Google Analytics หรือคำอธิบายที่กำหนดเองที่คุณปลั๊กอินโดยใช้เลเยอร์ใหม่ลงในเราเตอร์ที่ทำให้ไซต์มีความสามารถในการคาดการณ์หน้าในอนาคตปรับปรุงประสิทธิภาพการโหลดหน้าเว็บ

แนวทางที่เป็นไปได้ในการเลือกล่วงหน้าแบบเก็งกำไร

prefetch แบบเก็งกำไรในการโหลดหน้าเว็บ

Prefetch แบบเก็งกำไรสามารถดึงหน้าล่วงหน้าน่าจะเป็นการนำทางไปยังการโหลดหน้าเว็บ สิ่งนี้ถือว่าการมีอยู่ของความรู้เกี่ยวกับความน่าจะเป็นที่หน้าจะต้องใช้หน้าถัดไปหรือชุดหน้าหรือรูปแบบการฝึกอบรมที่สามารถให้วิธีการที่ขับเคลื่อนด้วยข้อมูลเพื่อกำหนดความน่าจะเป็นดังกล่าว

การดึงข้อมูลล่วงหน้าในการโหลดหน้าเว็บสามารถทำได้หลายวิธีตั้งแต่การเลื่อนเวลาไปจนถึง UA เพื่อตัดสินใจว่าจะทำการดึงทรัพยากรล่วงหน้า (เช่นที่มีลำดับความสำคัญต่ำด้วย <link rel=prefetch> ) ในช่วงเวลาว่างของหน้า ผู้ใช้ไม่ต้องการการโต้ตอบเพิ่มเติม

prefetch แบบเก็งกำไรเมื่อลิงค์เข้ามาในวิวพอร์ต

หน้าเว็บสามารถเริ่มต้นการดึงเนื้อหาล่วงหน้าได้เมื่อลิงก์ในหน้าสามารถมองเห็นได้ในวิวพอร์ตซึ่งหมายความว่าผู้ใช้อาจมีโอกาสสูงกว่าที่ต้องการคลิกที่พวกเขา

นี่คือวิธีการที่ใช้โดย Gatsby (ซึ่งใช้ React และ React Router) การใช้งานเฉพาะของพวกเขามีดังนี้:

ในเบราว์เซอร์ที่รองรับ IntersectionObserver เมื่อใดก็ตามที่ส่วนประกอบ <Link> จะมองไม่เห็นลิงก์ "โหวต" สำหรับหน้าเว็บที่เชื่อมโยงกับการโหวตที่ได้รับล่วงหน้าจะมีค่าน้อยกว่าคะแนนน้อยกว่าในแต่ละครั้งดังนั้นลิงก์ที่ด้านบนของหน้าจะจัดลำดับความสำคัญ
เช่น NAV ด้านบนหากหน้าเชื่อมโยงกับหลายครั้งนับการลงคะแนนจะสูงขึ้น prefetcher จะใช้หน้าสุดยอดและเริ่มการดึงทรัพยากรล่วงหน้า
มันถูก จำกัด ให้ทำการดึงหน้าหนึ่งครั้งในแต่ละครั้งเพื่อลดการโต้แย้งผ่านแบนด์วิดท์ด้วยสิ่งของในหน้า (ไม่ใช่ปัญหาในเครือข่ายที่รวดเร็วหากผู้ใช้เข้าเยี่ยมชมหน้าและทรัพยากรยังไม่ได้รับการดาวน์โหลดอย่างสมบูรณ์

การเก็งกำไร prefetch เกี่ยวกับการโต้ตอบของผู้ใช้

หน้าสามารถเริ่มต้นทรัพยากรการดึงข้อมูลล่วงหน้าได้อย่างคาดหวังเมื่อผู้ใช้ระบุว่าพวกเขาสนใจเนื้อหาบางอย่าง สิ่งนี้สามารถใช้หลายรูปแบบรวมถึงเมื่อผู้ใช้เลือกที่จะโฮเวอร์ผ่านลิงก์หรือ UI บางส่วนที่จะนำทางไปยังหน้าแยกต่างหาก เบราว์เซอร์สามารถเริ่มดึงเนื้อหาสำหรับลิงค์ได้ทันทีที่มีข้อบ่งชี้ที่ชัดเจนของความสนใจ นี่เป็นวิธีการที่ใช้โดยไลบรารี JavaScript เช่น InstantClick

ความเสี่ยง

การบริโภคข้อมูล

เช่นเดียวกับกลไกใด ๆ สำหรับการดึงเนื้อหาล่วงหน้าล่วงหน้าสิ่งนี้จะต้องได้รับการติดต่ออย่างระมัดระวัง ผู้ใช้ในแผนข้อมูลที่ จำกัด อาจไม่ชื่นชมหรือได้รับประโยชน์มากนักจากหน้าเว็บที่ถูกนำไปก่อนเวลาโดยเฉพาะอย่างยิ่งหากพวกเขาเริ่มกินข้อมูลของพวกเขา มีกลไกที่ไซต์/โซลูชันอาจต้องคำนึงถึงข้อกังวลนี้เช่นการเคารพส่วนหัวบันทึกข้อมูล

การดึงหน้าไม่พึงประสงค์ล่วงหน้า

ลิงก์การดึงข้อมูลล่วงหน้าไปยังหน้า "ออกจากระบบ" น่าจะเป็นสิ่งที่ไม่พึงประสงค์ อาจกล่าวได้ในหน้าใด ๆ ที่กระตุ้นการดำเนินการในการโหลดหน้าเว็บ (เช่นการซื้อครั้งเดียวคลิก) การแก้ปัญหาอาจต้องการรวมบัญชีดำของ URL ซึ่งไม่เคยถูกดึงออกมาล่วงหน้าเพื่อเพิ่มโอกาสในการใช้งานหน้าเว็บที่มีประโยชน์

มาตรฐานเว็บ

อนาคตของ rel = prerender

ความพยายามบางอย่างที่จะทำตามข้อเสนอที่คล้ายกันในอดีตได้พึ่งพา <link rel=prerender> ขณะนี้ทีม Chrome กำลังสำรวจการหักล้าง Rel = Prerender ในความโปรดปรานของ NostatePrefetch ซึ่งเป็นกลไกที่เบากว่าของกลไกนี้ที่จะนำไปใช้กับแคช HTTP เท่านั้น แต่ไม่ใช้สถานะอื่นของแพลตฟอร์มเว็บ การแก้ปัญหาควรคำนึงถึงว่าจะต้องพึ่งพาการแทนที่ REL = prerender หรือใช้วิธีการ prefetch/preload/วิธีอื่น ๆ

มีความแตกต่างที่สำคัญสองประการระหว่าง nostateprefetch และ prefetch:

Nostate-Prefetch เป็นกลไกและ <link rel=prefetch> เป็น API Nostate-Prefetch สามารถร้องขอได้โดยจุดเข้าอื่น ๆ : การทำนาย Omnibox, แท็บที่กำหนดเอง, <link rel=prerender>
การใช้งานนั้นแตกต่างกัน: <link rel=prefetch> prefettes หนึ่งทรัพยากร แต่ nostate-prefetch ด้านบนของที่เรียกใช้สแกนเนอร์ preload บนทรัพยากร (ในการแสดงผลใหม่ใหม่) ค้นพบแหล่งย่อย

การวิเคราะห์ข้อมูลที่เกี่ยวข้อง

มีการวิเคราะห์ข้อมูลหลักสามประเภทที่ควรค่าแก่การรับรู้ในพื้นที่ปัญหานี้: อธิบายการทำนายและกำหนด แต่ละประเภทมีความสัมพันธ์กันและทีมช่วยใช้ประโยชน์จากความเข้าใจที่แตกต่างกัน

คำอธิบาย - เกิดอะไรขึ้น?

การวิเคราะห์เชิงพรรณนาสรุปข้อมูลดิบและเปลี่ยนเป็นสิ่งที่มนุษย์ตีความได้ มันสามารถดูเหตุการณ์ที่ผ่านมาไม่ว่าเหตุการณ์จะเกิดขึ้นเมื่อใด การวิเคราะห์เชิงพรรณนาช่วยให้ทีมเรียนรู้จากพฤติกรรมที่ผ่านมาและสิ่งนี้สามารถช่วยให้พวกเขามีอิทธิพลต่อผลลัพธ์ในอนาคต การวิเคราะห์เชิงพรรณนาสามารถกำหนดหน้าเว็บที่ผู้ใช้ไซต์ได้ดูก่อนหน้านี้และเส้นทางการนำทางที่พวกเขาได้รับจากหน้ารายการใดก็ตาม

ทำนาย - จะเกิดอะไรขึ้น?

การวิเคราะห์เชิงพยากรณ์“ ทำนาย” สิ่งที่จะเกิดขึ้นต่อไป การวิเคราะห์เชิงพยากรณ์ช่วยให้เราเข้าใจอนาคตและให้ข้อมูลเชิงลึกที่สามารถดำเนินการได้ของทีมโดยใช้ข้อมูล มันให้การประเมินความน่าจะเป็นของผลลัพธ์ในอนาคตที่เป็นประโยชน์ เป็นสิ่งสำคัญที่ต้องคำนึงถึงอัลกอริทึมเพียงไม่กี่ตัวที่สามารถทำนายเหตุการณ์ในอนาคตด้วยความแม่นยำที่สมบูรณ์ แต่เราสามารถใช้สัญญาณมากมายที่เรามีให้มากที่สุดเพื่อช่วยปรับปรุงความแม่นยำพื้นฐาน รากฐานของการวิเคราะห์เชิงพยากรณ์ขึ้นอยู่กับความน่าจะเป็นที่เรากำหนดจากข้อมูล การวิเคราะห์การทำนายสามารถทำนายหน้าถัดไปหรือชุดหน้าของหน้าผู้ใช้มีแนวโน้มที่จะเยี่ยมชมที่ได้รับจากหน้าเข้าโดยพลการ

prescriptive - เราควรทำอย่างไร?

การวิเคราะห์ที่กำหนดไว้ล่วงหน้าช่วยให้สามารถกำหนดการกระทำที่แตกต่างกันเพื่อเป็นแนวทางในการแก้ปัญหา การวิเคราะห์ที่กำหนดไว้ให้คำแนะนำการพยายามหาปริมาณการตัดสินใจในอนาคตผลกระทบอาจต้องให้คำแนะนำเกี่ยวกับผลลัพธ์ที่เป็นไปได้ก่อนที่จะมีการตัดสินใจเหล่านี้ การวิเคราะห์ที่กำหนดโดยมีจุดมุ่งหมายที่จะไม่เพียง แต่คาดการณ์ว่าจะเกิดอะไรขึ้น แต่ไปไกลกว่านั้น แจ้งว่าทำไมมันจะเกิดขึ้นและให้คำแนะนำเกี่ยวกับการกระทำที่สามารถใช้ประโยชน์จากการคาดการณ์ดังกล่าว การวิเคราะห์ที่กำหนดไว้สามารถทำนายหน้าถัดไปที่ผู้ใช้จะไปเยี่ยมชม แต่ยังแนะนำการกระทำเช่นการแจ้งให้คุณทราบถึงวิธีที่คุณสามารถปรับแต่งประสบการณ์ของพวกเขาเพื่อใช้ประโยชน์จากความรู้นี้

แบบจำลองการทำนายที่เกี่ยวข้อง

รุ่นมาร์คอฟ

วัตถุประสงค์หลักของแบบจำลองการทำนายในพื้นที่ปัญหาการดึงข้อมูลล่วงหน้าคือการระบุว่าคำขอที่ตามมาที่ผู้ใช้อาจต้องการได้รับการร้องขอหน้าเฉพาะ สิ่งนี้ช่วยให้เซิร์ฟเวอร์หรือไคลเอนต์สามารถดึงชุดหน้าถัดไปและพยายามให้แน่ใจว่าพวกเขาอยู่ในแคชของผู้ใช้ก่อนที่จะนำทางไปยังหน้าโดยตรง แนวคิดคือการลดเวลาในการโหลดโดยรวม เมื่อสิ่งนี้ถูกนำไปใช้ด้วยความระมัดระวังเทคนิคนี้สามารถลดเวลาการเข้าถึงหน้าและเวลาแฝงเพื่อปรับปรุงประสบการณ์ผู้ใช้โดยรวม

โมเดลมาร์คอฟถูกนำมาใช้อย่างกว้างขวางสำหรับการวิจัยและทำความเข้าใจกระบวนการสุ่ม (การกระจายความน่าจะเป็นแบบสุ่ม) [อ้างอิง, อ้างอิง] พวกเขาได้รับการแสดงให้เห็นว่าเหมาะสมสำหรับการสร้างแบบจำลองและทำนายพฤติกรรมการท่องเว็บของผู้ใช้ อินพุตสำหรับปัญหาเหล่านี้มีแนวโน้มที่จะเป็นลำดับของหน้าเว็บที่เข้าถึงโดยผู้ใช้หรือชุดผู้ใช้ (ทั่วทั้งไซต์) โดยมีเป้าหมายในการสร้างโมเดล Markov ที่เราสามารถใช้ในการจำลองและทำนายหน้าเว็บที่ผู้ใช้มักจะเข้าถึงต่อไป กระบวนการมาร์คอฟมีสถานะที่เป็นตัวแทนของหน้าและขอบที่เข้าถึงได้ซึ่งแสดงถึงความน่าจะเป็นในการเปลี่ยนผ่านระหว่างรัฐซึ่งคำนวณจากลำดับที่กำหนดในบันทึกการวิเคราะห์ โมเดล Markov ที่ผ่านการฝึกอบรมสามารถใช้ในการทำนายสถานะถัดไปที่กำหนดชุดของสถานะ K ก่อนหน้า

ในบางแอพพลิเคชั่นโมเดล Markov ลำดับที่หนึ่งไม่ถูกต้องในการทำนายพฤติกรรมการเรียกดูของผู้ใช้เนื่องจากสิ่งเหล่านี้ไม่ได้มองเข้าไปในอดีตเพื่อสร้างความแตกต่างระหว่างรูปแบบที่แตกต่างกัน นี่คือเหตุผลหนึ่งที่มีการใช้โมเดลลำดับที่สูงกว่า แบบจำลองที่มีลำดับสูงกว่าเหล่านี้มีข้อ จำกัด ที่มีความซับซ้อนของพื้นที่พื้นที่ความครอบคลุมในวงกว้างน้อยลงและบางครั้งก็ลดความแม่นยำในการทำนาย

โมเดล Markov ลำดับ KTH ทั้งหมด

วิธีหนึ่ง [อ้างอิง] ที่จะเอาชนะปัญหานี้คือการฝึกอบรมโมเดลมาร์คอฟคำสั่งซื้อที่แตกต่างกันซึ่งเราใช้ในระหว่างขั้นตอนการทำนาย นี่คือความพยายามในโมเดลมาร์คอฟตามลำดับทั้งหมดที่เสนอในการอ้างอิงนี้ อย่างไรก็ตามสิ่งนี้สามารถทำให้ความซับซ้อนของพื้นที่ของรัฐแย่ลง อีกวิธีหนึ่งคือการระบุรูปแบบการเข้าถึงที่พบบ่อย (การทำซ้ำที่ยาวที่สุด) และใช้ชุดลำดับนี้สำหรับการทำนาย แม้ว่าวิธีการนี้สามารถมีลำดับการลดขนาดของความซับซ้อนของพื้นที่พื้นที่ แต่ก็สามารถลดความแม่นยำในการทำนาย

รุ่นที่เลือกมาร์กอฟ

Selective Markov Models (SMM) ซึ่งจัดเก็บบางรัฐภายในโมเดลเท่านั้นที่ได้รับการเสนอเป็นวิธีแก้ปัญหาการแลกเปลี่ยนความซับซ้อนของพื้นที่ของรัฐ พวกเขาเริ่มต้นด้วยโมเดลมาร์คอฟตามลำดับทั้งหมด-วิธีการโพสต์การจัดวางจะถูกใช้เพื่อตัดสถานะที่ไม่คาดว่าจะเป็นตัวทำนายที่แม่นยำ ผลลัพธ์ของสิ่งนี้คือแบบจำลองที่มีพลังการทำนายเหมือนกันของแบบจำลองการสั่งซื้อทั้งหมดที่มีความซับซ้อนของพื้นที่น้อยลงและความแม่นยำในการทำนายที่สูงขึ้น ใน Deshpane และ Karpis เกณฑ์ที่แตกต่างกันในการตัดสถานะในแบบจำลองก่อนการทำนาย (ความถี่ความเชื่อมั่นข้อผิดพลาด) จะถูกดู

โมเดล Markov แบบเลือกแบบความหมาย

ใน Mabroukeh และ Ezeife ประสิทธิภาพของโมเดลมาร์คอฟลำดับที่ 1 และ 2 ที่เต็มไปด้วยความหมายได้รับการศึกษาและเปรียบเทียบกับ SMM ที่มีลำดับสูงกว่าและ SMM ที่มีความหมาย พวกเขาค้นพบว่า SMM ที่มีความหมายมีขนาดเล็กกว่า SMM ที่มีความถี่ 16% และให้ความแม่นยำเกือบเท่ากัน

การจัดกลุ่ม

การสังเกตรูปแบบการนำทางสามารถช่วยให้เราสามารถวิเคราะห์พฤติกรรมของผู้ใช้ วิธีการนี้ต้องการการเข้าถึงการระบุตัวตนของผู้ใช้เซสชันการจัดกลุ่มเป็นกลุ่มที่คล้ายกันและพัฒนาแบบจำลองสำหรับการทำนายโดยใช้รูปแบบการเข้าถึงปัจจุบันและก่อนหน้า งานก่อนหน้านี้ส่วนใหญ่ในสาขานี้อาศัยแผนการจัดกลุ่มเช่นเทคนิคการจัดกลุ่ม k-mean ที่มีระยะทางยุคลิดเพื่อปรับปรุงความเชื่อมั่นของการทำนาย หนึ่งในข้อเสียเปรียบในการใช้ k-mean คือความยากลำบากในการตัดสินใจเกี่ยวกับจำนวนกลุ่มการเลือกศูนย์สุ่มเริ่มต้นและลำดับการเข้าชมหน้านั้นไม่ได้รับการพิจารณาเสมอไป Kumar et al ตรวจสอบสิ่งนี้เสนอเทคนิคการจัดกลุ่มแบบลำดับชั้นด้วยระยะทาง Levenshtein ที่แก้ไขแล้ว PageRank โดยใช้ความยาวการเข้าถึงความถี่ความถี่และโมเดล Markov ลำดับที่สูงขึ้นสำหรับการทำนาย

รีวิววิจัย

เอกสารจำนวนมากที่อ้างถึงในส่วนต่อไปนี้มีศูนย์กลางอยู่ที่โมเดล Markov กฎการเชื่อมโยงและการจัดกลุ่ม เอกสารที่เน้นงานที่เกี่ยวข้องที่เกี่ยวข้องกับการค้นพบรูปแบบเพื่อการพัฒนาความแม่นยำในการทำนายหน้าคือการมุ่งเน้นของเรา

Sarukkai [2000]“ การทำนายการเชื่อมโยงและการวิเคราะห์เส้นทางโดยใช้โซ่มาร์คอฟ”

ใช้โมเดล Markov ลำดับที่หนึ่งเพื่อจำลองลำดับของหน้าเว็บที่ผู้ใช้ร้องขอสำหรับการทำนายหน้าถัดไปที่พวกเขามีแนวโน้มที่จะเข้าถึง โซ่มาร์คอฟอนุญาตให้ระบบสามารถจำลองรูปแบบการเข้าถึง URL แบบจำลองที่สังเกตได้ในบันทึกการนำทางตามสถานะก่อนหน้า โมเดล Markov“ ส่วนบุคคล” ได้รับการฝึกฝนสำหรับผู้ใช้แต่ละคนและใช้ในการทำนายเซสชันในอนาคตของผู้ใช้ ในทางปฏิบัติมีราคาแพงมากในการสร้างแบบจำลองที่ไม่ซ้ำกันสำหรับผู้ใช้แต่ละคนและค่าใช้จ่ายในการปรับขนาดสิ่งนี้จะกลายเป็นสิ่งที่ท้าทายมากขึ้นเมื่อไซต์มีฐานผู้ใช้ขนาดใหญ่

Chun-jung Lin [2005]” โดยใช้โมเดล Markov ที่ซ่อนอยู่เพื่อทำนายความตั้งใจของผู้ใช้ท่องเว็บในการซื้อไซเบอร์บนเว็บ”

กระดาษแผ่นแรกเพื่อตรวจสอบรุ่นที่ซ่อนอยู่ของ Markov (HMM) ผู้เขียนรวบรวมบันทึกเว็บเซิร์ฟเวอร์ตัดแต่งข้อมูลและแก้ไขเส้นทางที่ผู้ใช้ผ่าน จาก HMM ผู้เขียนได้สร้างแบบจำลองเฉพาะสำหรับการท่องเว็บที่ทำนายว่าผู้ใช้มีความตั้งใจที่จะซื้อแบบเรียลไทม์หรือไม่ มาตรการที่เกี่ยวข้องเช่นการเร่งการดำเนินการและผลกระทบของพวกเขาเมื่ออยู่ในโหมดการจัดซื้อ

Elli Voudigari [2010-2011]” กรอบสำหรับการทำนายอันดับหน้าเว็บ”

เสนอกรอบการทำนายตำแหน่งการจัดอันดับของหน้าเว็บตามการจัดอันดับก่อนหน้าของพวกเขา สมมติว่าชุดของการจัดอันดับ Top-K ต่อเนื่องผู้เขียนระบุตัวทำนายตามวิธีการที่แตกต่างกัน คุณภาพการทำนายถูกหาปริมาณเป็นความคล้ายคลึงกันระหว่างการจัดอันดับที่คาดการณ์ไว้และการจัดอันดับจริง การทดลองที่ละเอียดถี่ถ้วนได้ดำเนินการในชุดข้อมูลขนาดใหญ่ในโลกแห่งความเป็นจริงสำหรับการจัดอันดับ Coer-K ทั่วโลกและแบบสอบถาม ความหลากหลายของมาตรการความคล้ายคลึงกันที่มีอยู่สำหรับการเปรียบเทียบรายการอันดับสูงสุด K รวมถึงนวนิยายที่บันทึกไว้ในกระดาษ

Mogul [1996]“ การใช้การดึงข้อมูลล่วงหน้าเพื่อปรับปรุงเวลาแฝงเว็บทั่วโลก”

เสนอการใช้โมเดล N-HOP Markov เพื่อทำนายผู้ใช้หน้าเว็บถัดไปมีแนวโน้มที่จะเข้าถึง รูปแบบตรงกับลำดับการเข้าถึงปัจจุบันของผู้ใช้กับลำดับการเข้าถึงเว็บในอดีตของผู้ใช้เพื่อปรับปรุงความแม่นยำในการทำนายสำหรับการดึงข้อมูลล่วงหน้า

Borges, Levene [2007]“ การประเมินโมเดล Markov Chain ที่มีความยาวตัวแปรสำหรับการวิเคราะห์เซสชันการนำทางเว็บของผู้ใช้”

เสนอวิธีการที่ใช้การจัดกลุ่มแบบไดนามิกเพื่อเพิ่มความแม่นยำของโมเดลมาร์คอฟในการเป็นตัวแทนของการรวบรวมเซสชันการนำทางเว็บ ใช้แนวคิดการโคลนนิ่งของรัฐเพื่อทำซ้ำสถานะในการแยกการเชื่อมโยงในการเชื่อมโยงที่มีความน่าจะเป็นลำดับที่สองที่สอดคล้องกันแตกต่างกัน วิธีการที่เสนอรวมถึงเทคนิคการจัดกลุ่มที่กำหนดวิธีการกำหนด in-links ที่มีความน่าจะเป็นลำดับที่สองที่คล้ายกันกับโคลนเดียวกัน

Banu Deniz Gunel [2010]” การตรวจสอบผลของระยะเวลาขนาดหน้าและความถี่ในคำแนะนำหน้าถัดไปพร้อมอัลกอริทึมอันดับหน้า”

ขยายการใช้อัลกอริทึมหน้าแบบจัดอันดับด้วยแอตทริบิวต์การนำทางมากมาย: ขนาดของหน้าเวลาระยะเวลาของหน้าระยะเวลาการเปลี่ยนแปลง (การเข้าชมสองหน้าตามลำดับ) ความถี่ของหน้าและการเปลี่ยนแปลง กำหนดอันดับตามระยะเวลา (DPR) และอันดับหน้าตามอันดับ (PPR) ผู้เขียนดูความนิยมของการเปลี่ยนผ่านและหน้าโดยใช้ข้อมูลระยะเวลาโดยใช้ขนาดหน้าและความถี่เยี่ยมชม การใช้ค่าความนิยมของหน้ากระดาษนี้พยายามปรับปรุงอัลกอริธึมอันดับหน้าทั่วไปและแบบจำลองการทำนายหน้าถัดไปภายใต้ค่าสูงสุดที่กำหนด