ไลบรารีและเครื่องมือสำหรับการเปิดใช้งานประสบการณ์ผู้ใช้ที่ขับเคลื่อนด้วยข้อมูลบนเว็บ
สำหรับผู้ใช้ webpack:
ติดตั้งและกำหนดค่า GuessPlugin - ปลั๊กอิน Webpack ที่คาดเดา JS ซึ่งทำให้กระบวนการตั้งค่ามากขึ้นโดยอัตโนมัติมากที่สุด
หากคุณต้องการลองใช้โมดูลที่เราเสนอเป็นรายบุคคลไดเรกทอรี packages มีสามแพ็คเกจ:
ga - โมดูลสำหรับดึงข้อมูลที่มีโครงสร้างจาก Google Analytics API เพื่อเรียนรู้เกี่ยวกับรูปแบบการนำทางของผู้ใช้parser - โมดูลที่ให้การแยกวิเคราะห์กรอบ JavaScript นี่คือพลังความสามารถในการเดินทางเส้นทางที่ใช้ในปลั๊กอิน Webpack Guesswebpack - ปลั๊กอิน WebPack สำหรับการตั้งค่าการดึงข้อมูลการคาดการณ์ในแอปพลิเคชันของคุณ มันใช้โมดูล ga และ parser และเสนอตัวเลือกจำนวนมากสำหรับการกำหนดค่าวิธีการดึงข้อมูลการพยากรณ์ควรทำงานในแอปพลิเคชันของคุณสำหรับผู้ใช้ที่ไม่ใช่ Webpack:
การดึงข้อมูลการทำนายของเราสำหรับเวิร์กโฟลว์ไซต์ให้ชุดขั้นตอนที่คุณสามารถทำตามเพื่อรวมการดึงข้อมูลการคาดการณ์โดยใช้ Google Analytics API เข้ากับเว็บไซต์ของคุณ
repo นี้ใช้ข้อมูล Google Analytics เพื่อพิจารณาว่าผู้ใช้ส่วนใหญ่มีแนวโน้มที่จะเยี่ยมชมถัดไปจากหน้ากำหนด สคริปต์ฝั่งไคลเอ็นต์ (ซึ่งคุณจะเพิ่มลงในแอปพลิเคชันของคุณ) ส่งคำขอไปยังเซิร์ฟเวอร์เพื่อรับ URL ของหน้าเว็บที่ควรดึงออกมาจากนั้นดึงข้อมูลทรัพยากรนี้ล่วงหน้า
Guess.js จัดเตรียมไลบรารีและเครื่องมือเพื่อลดความซับซ้อนของวิธีการวิเคราะห์ข้อมูลที่ขับเคลื่อนด้วยการทำนายเพื่อปรับปรุงการทดลองของผู้ใช้บนเว็บ ข้อมูลนี้สามารถขับเคลื่อนได้จากแหล่งข้อมูลจำนวนมากรวมถึงการวิเคราะห์หรือรูปแบบการเรียนรู้ของเครื่อง Guess.js มีจุดมุ่งหมายเพื่อลดแรงเสียดทานของการบริโภคและการใช้ความคิดนี้กับไซต์และแอพที่ทันสมัยทั้งหมดรวมถึงการสร้างห้องสมุดและเครื่องมือสำหรับเวิร์กโฟลว์ยอดนิยม
การใช้การวิเคราะห์ข้อมูลเชิงทำนายกับไซต์สามารถนำไปใช้ในบริบทจำนวนมาก:
ด้วยการร่วมมือกับจุดสัมผัสที่แตกต่างกันในระบบนิเวศที่สามารถใช้วิธีการที่ขับเคลื่อนด้วยข้อมูลได้อย่างง่ายดายเราหวังว่าจะสรุปโครงสร้างพื้นฐานทั่วไปเพื่อเพิ่มการบังคับใช้ในซ้อนเทคโนโลยีที่แตกต่างกัน
<link rel=prefetch> สำหรับการนำทางในอนาคตต้องพึ่งพาการอ่านเชิงพรรณนาด้วยตนเองเพื่อแจ้งการตัดสินใจของพวกเขาสำหรับสิ่งที่จะนำไปก่อน<link rel=prefetch> ปัจจุบันใช้กับ 5% ของ pageloads โครเมี่ยมทั้งหมด แต่อาจสูงกว่าลำดับความสำคัญครั้งใหญ่ครั้งแรกสำหรับ Guess.js จะปรับปรุงประสิทธิภาพของเว็บผ่านการตรวจสอบเนื้อหาล่วงหน้า
ด้วยการสร้างรูปแบบของหน้าเว็บผู้ใช้มีแนวโน้มที่จะเยี่ยมชมเนื่องจากหน้าเข้าโดยพลการโซลูชันสามารถคำนวณความน่าจะเป็นที่ผู้ใช้จะไปเยี่ยมชมหน้าถัดไปหรือชุดหน้าและแหล่งข้อมูลล่วงหน้าสำหรับพวกเขาในขณะที่ผู้ใช้ยังคงดูหน้าปัจจุบันของพวกเขา สิ่งนี้มีความเป็นไปได้ในการปรับปรุงประสิทธิภาพการโหลดหน้าเว็บสำหรับการเข้าชมหน้าต่อมาเนื่องจากมีโอกาสที่แข็งแกร่งที่หน้าจะอยู่ในแคชของผู้ใช้แล้ว
ในการทำนายหน้าถัดไปผู้ใช้มีแนวโน้มที่จะเยี่ยมชมโซลูชันสามารถใช้ Google Analytics API ข้อมูลเซสชันของ Google Analytics สามารถใช้เพื่อสร้างแบบจำลองเพื่อทำนายหน้าเว็บที่เป็นไปได้มากที่สุดที่ผู้ใช้จะไปเยี่ยมชมต่อไปบนเว็บไซต์ ประโยชน์ของข้อมูลเซสชันนี้คือมันสามารถพัฒนาได้เมื่อเวลาผ่านไปดังนั้นหากเส้นทางการนำทางเฉพาะเปลี่ยนการคาดการณ์ก็สามารถอยู่ได้ทันสมัยเช่นกัน
ด้วยความพร้อมใช้งานของข้อมูลนี้เอ็นจิ้นสามารถแทรก <link rel="[prerender/prefetch/preload]"> แท็กเพื่อเร่งเวลาโหลดสำหรับคำขอหน้าถัดไป ในการทดสอบบางอย่างเช่นการโหลดหน้าโหลดซุปเปอร์ชาร์จของ Mark Edmondson ด้วย R สิ่งนี้นำไปสู่การปรับปรุง 30% ในเวลาโหลดหน้าเว็บ เครื่องหมายวิธีการที่ใช้ในการวิจัยของเขาเกี่ยวข้องกับการใช้แท็ก GTM และการเรียนรู้ด้วยเครื่องเพื่อฝึกอบรมแบบจำลองสำหรับการทำนายหน้า นี่คือเครื่องหมายความคิดอย่างต่อเนื่องในการเรียนรู้ของเครื่องจักรตรงกับคลาวด์ - การดึงข้อมูลล่วงหน้าอัจฉริยะ
ในขณะที่วิธีการนี้เป็นเสียงวิธีการที่ใช้อาจถือว่าซับซ้อนเล็กน้อย อีกวิธีหนึ่งที่สามารถทำได้ (ซึ่งง่ายกว่า) คือการพยายามรับข้อมูลการทำนายที่แม่นยำจาก Google Analytics API หากคุณเรียกใช้รายงานสำหรับหน้าและมิติพา ธ หน้าก่อนหน้านี้รวมกับการชมหน้าและออกจากตัวชี้วัดสิ่งนี้ควรให้ข้อมูลเพียงพอที่จะส่งผลต่อการดึงข้อมูลล่วงหน้าสำหรับหน้ายอดนิยมมากที่สุด
ML สามารถช่วยปรับปรุงความแม่นยำโดยรวมของการคาดการณ์ของโซลูชัน แต่ไม่จำเป็นสำหรับการใช้งานครั้งแรก การดึงข้อมูลการคาดการณ์สามารถทำได้โดยการฝึกอบรมแบบจำลองบนหน้าเว็บมีแนวโน้มที่จะเยี่ยมชมและปรับปรุงในรุ่นนี้เมื่อเวลาผ่านไป
เครือข่ายประสาทลึกนั้นดีโดยเฉพาะอย่างยิ่งในการล้อเล่นความซับซ้อนที่อาจนำไปสู่ผู้ใช้ที่เลือกหน้าหนึ่งเหนืออีกหน้าหนึ่งโดยเฉพาะอย่างยิ่งถ้าเราต้องการลองใช้เวอร์ชันของโซลูชันที่รองรับหน้าเว็บที่ผู้ใช้แต่ละคนอาจเยี่ยมชมหน้า "ผู้ใช้" ทั่วไป/ค่ามัธยฐาน " ลำดับหน้าคงที่ (ก่อนหน้า, ปัจจุบัน, ถัดไป) อาจเป็นวิธีที่ง่ายที่สุดในการเริ่มต้นจัดการกับตอนแรก ซึ่งหมายถึงการสร้างแบบจำลองที่ไม่ซ้ำกันกับชุดเอกสารของคุณ
การอัปเดตแบบจำลองมีแนวโน้มที่จะทำเป็นระยะดังนั้นอาจมีการตั้งค่างานทุกคืน/รายสัปดาห์เพื่อรีเฟรชตามพฤติกรรมผู้ใช้ใหม่ สิ่งนี้สามารถทำได้แบบเรียลไทม์ แต่มีแนวโน้มที่ซับซ้อนดังนั้นการทำมันอาจเพียงพอเป็นระยะ ใคร ๆ ก็สามารถจินตนาการถึงรูปแบบทั่วไปที่แสดงถึงรูปแบบพฤติกรรมสำหรับผู้ใช้ในไซต์ที่สามารถขับเคลื่อนด้วยชุดสถานะที่ผ่านการฝึกอบรม Google Analytics หรือคำอธิบายที่กำหนดเองที่คุณปลั๊กอินโดยใช้เลเยอร์ใหม่ลงในเราเตอร์ที่ทำให้ไซต์มีความสามารถในการคาดการณ์หน้าในอนาคตปรับปรุงประสิทธิภาพการโหลดหน้าเว็บ
Prefetch แบบเก็งกำไรสามารถดึงหน้าล่วงหน้าน่าจะเป็นการนำทางไปยังการโหลดหน้าเว็บ สิ่งนี้ถือว่าการมีอยู่ของความรู้เกี่ยวกับความน่าจะเป็นที่หน้าจะต้องใช้หน้าถัดไปหรือชุดหน้าหรือรูปแบบการฝึกอบรมที่สามารถให้วิธีการที่ขับเคลื่อนด้วยข้อมูลเพื่อกำหนดความน่าจะเป็นดังกล่าว
การดึงข้อมูลล่วงหน้าในการโหลดหน้าเว็บสามารถทำได้หลายวิธีตั้งแต่การเลื่อนเวลาไปจนถึง UA เพื่อตัดสินใจว่าจะทำการดึงทรัพยากรล่วงหน้า (เช่นที่มีลำดับความสำคัญต่ำด้วย <link rel=prefetch> ) ในช่วงเวลาว่างของหน้า ผู้ใช้ไม่ต้องการการโต้ตอบเพิ่มเติม
หน้าเว็บสามารถเริ่มต้นการดึงเนื้อหาล่วงหน้าได้เมื่อลิงก์ในหน้าสามารถมองเห็นได้ในวิวพอร์ตซึ่งหมายความว่าผู้ใช้อาจมีโอกาสสูงกว่าที่ต้องการคลิกที่พวกเขา
นี่คือวิธีการที่ใช้โดย Gatsby (ซึ่งใช้ React และ React Router) การใช้งานเฉพาะของพวกเขามีดังนี้:
<Link> จะมองไม่เห็นลิงก์ "โหวต" สำหรับหน้าเว็บที่เชื่อมโยงกับการโหวตที่ได้รับล่วงหน้าจะมีค่าน้อยกว่าคะแนนน้อยกว่าในแต่ละครั้งดังนั้นลิงก์ที่ด้านบนของหน้าจะจัดลำดับความสำคัญหน้าสามารถเริ่มต้นทรัพยากรการดึงข้อมูลล่วงหน้าได้อย่างคาดหวังเมื่อผู้ใช้ระบุว่าพวกเขาสนใจเนื้อหาบางอย่าง สิ่งนี้สามารถใช้หลายรูปแบบรวมถึงเมื่อผู้ใช้เลือกที่จะโฮเวอร์ผ่านลิงก์หรือ UI บางส่วนที่จะนำทางไปยังหน้าแยกต่างหาก เบราว์เซอร์สามารถเริ่มดึงเนื้อหาสำหรับลิงค์ได้ทันทีที่มีข้อบ่งชี้ที่ชัดเจนของความสนใจ นี่เป็นวิธีการที่ใช้โดยไลบรารี JavaScript เช่น InstantClick
เช่นเดียวกับกลไกใด ๆ สำหรับการดึงเนื้อหาล่วงหน้าล่วงหน้าสิ่งนี้จะต้องได้รับการติดต่ออย่างระมัดระวัง ผู้ใช้ในแผนข้อมูลที่ จำกัด อาจไม่ชื่นชมหรือได้รับประโยชน์มากนักจากหน้าเว็บที่ถูกนำไปก่อนเวลาโดยเฉพาะอย่างยิ่งหากพวกเขาเริ่มกินข้อมูลของพวกเขา มีกลไกที่ไซต์/โซลูชันอาจต้องคำนึงถึงข้อกังวลนี้เช่นการเคารพส่วนหัวบันทึกข้อมูล
ลิงก์การดึงข้อมูลล่วงหน้าไปยังหน้า "ออกจากระบบ" น่าจะเป็นสิ่งที่ไม่พึงประสงค์ อาจกล่าวได้ในหน้าใด ๆ ที่กระตุ้นการดำเนินการในการโหลดหน้าเว็บ (เช่นการซื้อครั้งเดียวคลิก) การแก้ปัญหาอาจต้องการรวมบัญชีดำของ URL ซึ่งไม่เคยถูกดึงออกมาล่วงหน้าเพื่อเพิ่มโอกาสในการใช้งานหน้าเว็บที่มีประโยชน์
ความพยายามบางอย่างที่จะทำตามข้อเสนอที่คล้ายกันในอดีตได้พึ่งพา <link rel=prerender> ขณะนี้ทีม Chrome กำลังสำรวจการหักล้าง Rel = Prerender ในความโปรดปรานของ NostatePrefetch ซึ่งเป็นกลไกที่เบากว่าของกลไกนี้ที่จะนำไปใช้กับแคช HTTP เท่านั้น แต่ไม่ใช้สถานะอื่นของแพลตฟอร์มเว็บ การแก้ปัญหาควรคำนึงถึงว่าจะต้องพึ่งพาการแทนที่ REL = prerender หรือใช้วิธีการ prefetch/preload/วิธีอื่น ๆ
มีความแตกต่างที่สำคัญสองประการระหว่าง nostateprefetch และ prefetch:
Nostate-Prefetch เป็นกลไกและ <link rel=prefetch> เป็น API Nostate-Prefetch สามารถร้องขอได้โดยจุดเข้าอื่น ๆ : การทำนาย Omnibox, แท็บที่กำหนดเอง, <link rel=prerender>
การใช้งานนั้นแตกต่างกัน: <link rel=prefetch> prefettes หนึ่งทรัพยากร แต่ nostate-prefetch ด้านบนของที่เรียกใช้สแกนเนอร์ preload บนทรัพยากร (ในการแสดงผลใหม่ใหม่) ค้นพบแหล่งย่อย
มีการวิเคราะห์ข้อมูลหลักสามประเภทที่ควรค่าแก่การรับรู้ในพื้นที่ปัญหานี้: อธิบายการทำนายและกำหนด แต่ละประเภทมีความสัมพันธ์กันและทีมช่วยใช้ประโยชน์จากความเข้าใจที่แตกต่างกัน
การวิเคราะห์เชิงพรรณนาสรุปข้อมูลดิบและเปลี่ยนเป็นสิ่งที่มนุษย์ตีความได้ มันสามารถดูเหตุการณ์ที่ผ่านมาไม่ว่าเหตุการณ์จะเกิดขึ้นเมื่อใด การวิเคราะห์เชิงพรรณนาช่วยให้ทีมเรียนรู้จากพฤติกรรมที่ผ่านมาและสิ่งนี้สามารถช่วยให้พวกเขามีอิทธิพลต่อผลลัพธ์ในอนาคต การวิเคราะห์เชิงพรรณนาสามารถกำหนดหน้าเว็บที่ผู้ใช้ไซต์ได้ดูก่อนหน้านี้และเส้นทางการนำทางที่พวกเขาได้รับจากหน้ารายการใดก็ตาม
การวิเคราะห์เชิงพยากรณ์“ ทำนาย” สิ่งที่จะเกิดขึ้นต่อไป การวิเคราะห์เชิงพยากรณ์ช่วยให้เราเข้าใจอนาคตและให้ข้อมูลเชิงลึกที่สามารถดำเนินการได้ของทีมโดยใช้ข้อมูล มันให้การประเมินความน่าจะเป็นของผลลัพธ์ในอนาคตที่เป็นประโยชน์ เป็นสิ่งสำคัญที่ต้องคำนึงถึงอัลกอริทึมเพียงไม่กี่ตัวที่สามารถทำนายเหตุการณ์ในอนาคตด้วยความแม่นยำที่สมบูรณ์ แต่เราสามารถใช้สัญญาณมากมายที่เรามีให้มากที่สุดเพื่อช่วยปรับปรุงความแม่นยำพื้นฐาน รากฐานของการวิเคราะห์เชิงพยากรณ์ขึ้นอยู่กับความน่าจะเป็นที่เรากำหนดจากข้อมูล การวิเคราะห์การทำนายสามารถทำนายหน้าถัดไปหรือชุดหน้าของหน้าผู้ใช้มีแนวโน้มที่จะเยี่ยมชมที่ได้รับจากหน้าเข้าโดยพลการ
การวิเคราะห์ที่กำหนดไว้ล่วงหน้าช่วยให้สามารถกำหนดการกระทำที่แตกต่างกันเพื่อเป็นแนวทางในการแก้ปัญหา การวิเคราะห์ที่กำหนดไว้ให้คำแนะนำการพยายามหาปริมาณการตัดสินใจในอนาคตผลกระทบอาจต้องให้คำแนะนำเกี่ยวกับผลลัพธ์ที่เป็นไปได้ก่อนที่จะมีการตัดสินใจเหล่านี้ การวิเคราะห์ที่กำหนดโดยมีจุดมุ่งหมายที่จะไม่เพียง แต่คาดการณ์ว่าจะเกิดอะไรขึ้น แต่ไปไกลกว่านั้น แจ้งว่าทำไมมันจะเกิดขึ้นและให้คำแนะนำเกี่ยวกับการกระทำที่สามารถใช้ประโยชน์จากการคาดการณ์ดังกล่าว การวิเคราะห์ที่กำหนดไว้สามารถทำนายหน้าถัดไปที่ผู้ใช้จะไปเยี่ยมชม แต่ยังแนะนำการกระทำเช่นการแจ้งให้คุณทราบถึงวิธีที่คุณสามารถปรับแต่งประสบการณ์ของพวกเขาเพื่อใช้ประโยชน์จากความรู้นี้
วัตถุประสงค์หลักของแบบจำลองการทำนายในพื้นที่ปัญหาการดึงข้อมูลล่วงหน้าคือการระบุว่าคำขอที่ตามมาที่ผู้ใช้อาจต้องการได้รับการร้องขอหน้าเฉพาะ สิ่งนี้ช่วยให้เซิร์ฟเวอร์หรือไคลเอนต์สามารถดึงชุดหน้าถัดไปและพยายามให้แน่ใจว่าพวกเขาอยู่ในแคชของผู้ใช้ก่อนที่จะนำทางไปยังหน้าโดยตรง แนวคิดคือการลดเวลาในการโหลดโดยรวม เมื่อสิ่งนี้ถูกนำไปใช้ด้วยความระมัดระวังเทคนิคนี้สามารถลดเวลาการเข้าถึงหน้าและเวลาแฝงเพื่อปรับปรุงประสบการณ์ผู้ใช้โดยรวม
โมเดลมาร์คอฟถูกนำมาใช้อย่างกว้างขวางสำหรับการวิจัยและทำความเข้าใจกระบวนการสุ่ม (การกระจายความน่าจะเป็นแบบสุ่ม) [อ้างอิง, อ้างอิง] พวกเขาได้รับการแสดงให้เห็นว่าเหมาะสมสำหรับการสร้างแบบจำลองและทำนายพฤติกรรมการท่องเว็บของผู้ใช้ อินพุตสำหรับปัญหาเหล่านี้มีแนวโน้มที่จะเป็นลำดับของหน้าเว็บที่เข้าถึงโดยผู้ใช้หรือชุดผู้ใช้ (ทั่วทั้งไซต์) โดยมีเป้าหมายในการสร้างโมเดล Markov ที่เราสามารถใช้ในการจำลองและทำนายหน้าเว็บที่ผู้ใช้มักจะเข้าถึงต่อไป กระบวนการมาร์คอฟมีสถานะที่เป็นตัวแทนของหน้าและขอบที่เข้าถึงได้ซึ่งแสดงถึงความน่าจะเป็นในการเปลี่ยนผ่านระหว่างรัฐซึ่งคำนวณจากลำดับที่กำหนดในบันทึกการวิเคราะห์ โมเดล Markov ที่ผ่านการฝึกอบรมสามารถใช้ในการทำนายสถานะถัดไปที่กำหนดชุดของสถานะ K ก่อนหน้า
ในบางแอพพลิเคชั่นโมเดล Markov ลำดับที่หนึ่งไม่ถูกต้องในการทำนายพฤติกรรมการเรียกดูของผู้ใช้เนื่องจากสิ่งเหล่านี้ไม่ได้มองเข้าไปในอดีตเพื่อสร้างความแตกต่างระหว่างรูปแบบที่แตกต่างกัน นี่คือเหตุผลหนึ่งที่มีการใช้โมเดลลำดับที่สูงกว่า แบบจำลองที่มีลำดับสูงกว่าเหล่านี้มีข้อ จำกัด ที่มีความซับซ้อนของพื้นที่พื้นที่ความครอบคลุมในวงกว้างน้อยลงและบางครั้งก็ลดความแม่นยำในการทำนาย
วิธีหนึ่ง [อ้างอิง] ที่จะเอาชนะปัญหานี้คือการฝึกอบรมโมเดลมาร์คอฟคำสั่งซื้อที่แตกต่างกันซึ่งเราใช้ในระหว่างขั้นตอนการทำนาย นี่คือความพยายามในโมเดลมาร์คอฟตามลำดับทั้งหมดที่เสนอในการอ้างอิงนี้ อย่างไรก็ตามสิ่งนี้สามารถทำให้ความซับซ้อนของพื้นที่ของรัฐแย่ลง อีกวิธีหนึ่งคือการระบุรูปแบบการเข้าถึงที่พบบ่อย (การทำซ้ำที่ยาวที่สุด) และใช้ชุดลำดับนี้สำหรับการทำนาย แม้ว่าวิธีการนี้สามารถมีลำดับการลดขนาดของความซับซ้อนของพื้นที่พื้นที่ แต่ก็สามารถลดความแม่นยำในการทำนาย
Selective Markov Models (SMM) ซึ่งจัดเก็บบางรัฐภายในโมเดลเท่านั้นที่ได้รับการเสนอเป็นวิธีแก้ปัญหาการแลกเปลี่ยนความซับซ้อนของพื้นที่ของรัฐ พวกเขาเริ่มต้นด้วยโมเดลมาร์คอฟตามลำดับทั้งหมด-วิธีการโพสต์การจัดวางจะถูกใช้เพื่อตัดสถานะที่ไม่คาดว่าจะเป็นตัวทำนายที่แม่นยำ ผลลัพธ์ของสิ่งนี้คือแบบจำลองที่มีพลังการทำนายเหมือนกันของแบบจำลองการสั่งซื้อทั้งหมดที่มีความซับซ้อนของพื้นที่น้อยลงและความแม่นยำในการทำนายที่สูงขึ้น ใน Deshpane และ Karpis เกณฑ์ที่แตกต่างกันในการตัดสถานะในแบบจำลองก่อนการทำนาย (ความถี่ความเชื่อมั่นข้อผิดพลาด) จะถูกดู
ใน Mabroukeh และ Ezeife ประสิทธิภาพของโมเดลมาร์คอฟลำดับที่ 1 และ 2 ที่เต็มไปด้วยความหมายได้รับการศึกษาและเปรียบเทียบกับ SMM ที่มีลำดับสูงกว่าและ SMM ที่มีความหมาย พวกเขาค้นพบว่า SMM ที่มีความหมายมีขนาดเล็กกว่า SMM ที่มีความถี่ 16% และให้ความแม่นยำเกือบเท่ากัน
การสังเกตรูปแบบการนำทางสามารถช่วยให้เราสามารถวิเคราะห์พฤติกรรมของผู้ใช้ วิธีการนี้ต้องการการเข้าถึงการระบุตัวตนของผู้ใช้เซสชันการจัดกลุ่มเป็นกลุ่มที่คล้ายกันและพัฒนาแบบจำลองสำหรับการทำนายโดยใช้รูปแบบการเข้าถึงปัจจุบันและก่อนหน้า งานก่อนหน้านี้ส่วนใหญ่ในสาขานี้อาศัยแผนการจัดกลุ่มเช่นเทคนิคการจัดกลุ่ม k-mean ที่มีระยะทางยุคลิดเพื่อปรับปรุงความเชื่อมั่นของการทำนาย หนึ่งในข้อเสียเปรียบในการใช้ k-mean คือความยากลำบากในการตัดสินใจเกี่ยวกับจำนวนกลุ่มการเลือกศูนย์สุ่มเริ่มต้นและลำดับการเข้าชมหน้านั้นไม่ได้รับการพิจารณาเสมอไป Kumar et al ตรวจสอบสิ่งนี้เสนอเทคนิคการจัดกลุ่มแบบลำดับชั้นด้วยระยะทาง Levenshtein ที่แก้ไขแล้ว PageRank โดยใช้ความยาวการเข้าถึงความถี่ความถี่และโมเดล Markov ลำดับที่สูงขึ้นสำหรับการทำนาย
เอกสารจำนวนมากที่อ้างถึงในส่วนต่อไปนี้มีศูนย์กลางอยู่ที่โมเดล Markov กฎการเชื่อมโยงและการจัดกลุ่ม เอกสารที่เน้นงานที่เกี่ยวข้องที่เกี่ยวข้องกับการค้นพบรูปแบบเพื่อการพัฒนาความแม่นยำในการทำนายหน้าคือการมุ่งเน้นของเรา
ใช้โมเดล Markov ลำดับที่หนึ่งเพื่อจำลองลำดับของหน้าเว็บที่ผู้ใช้ร้องขอสำหรับการทำนายหน้าถัดไปที่พวกเขามีแนวโน้มที่จะเข้าถึง โซ่มาร์คอฟอนุญาตให้ระบบสามารถจำลองรูปแบบการเข้าถึง URL แบบจำลองที่สังเกตได้ในบันทึกการนำทางตามสถานะก่อนหน้า โมเดล Markov“ ส่วนบุคคล” ได้รับการฝึกฝนสำหรับผู้ใช้แต่ละคนและใช้ในการทำนายเซสชันในอนาคตของผู้ใช้ ในทางปฏิบัติมีราคาแพงมากในการสร้างแบบจำลองที่ไม่ซ้ำกันสำหรับผู้ใช้แต่ละคนและค่าใช้จ่ายในการปรับขนาดสิ่งนี้จะกลายเป็นสิ่งที่ท้าทายมากขึ้นเมื่อไซต์มีฐานผู้ใช้ขนาดใหญ่
กระดาษแผ่นแรกเพื่อตรวจสอบรุ่นที่ซ่อนอยู่ของ Markov (HMM) ผู้เขียนรวบรวมบันทึกเว็บเซิร์ฟเวอร์ตัดแต่งข้อมูลและแก้ไขเส้นทางที่ผู้ใช้ผ่าน จาก HMM ผู้เขียนได้สร้างแบบจำลองเฉพาะสำหรับการท่องเว็บที่ทำนายว่าผู้ใช้มีความตั้งใจที่จะซื้อแบบเรียลไทม์หรือไม่ มาตรการที่เกี่ยวข้องเช่นการเร่งการดำเนินการและผลกระทบของพวกเขาเมื่ออยู่ในโหมดการจัดซื้อ
เสนอกรอบการทำนายตำแหน่งการจัดอันดับของหน้าเว็บตามการจัดอันดับก่อนหน้าของพวกเขา สมมติว่าชุดของการจัดอันดับ Top-K ต่อเนื่องผู้เขียนระบุตัวทำนายตามวิธีการที่แตกต่างกัน คุณภาพการทำนายถูกหาปริมาณเป็นความคล้ายคลึงกันระหว่างการจัดอันดับที่คาดการณ์ไว้และการจัดอันดับจริง การทดลองที่ละเอียดถี่ถ้วนได้ดำเนินการในชุดข้อมูลขนาดใหญ่ในโลกแห่งความเป็นจริงสำหรับการจัดอันดับ Coer-K ทั่วโลกและแบบสอบถาม ความหลากหลายของมาตรการความคล้ายคลึงกันที่มีอยู่สำหรับการเปรียบเทียบรายการอันดับสูงสุด K รวมถึงนวนิยายที่บันทึกไว้ในกระดาษ
เสนอการใช้โมเดล N-HOP Markov เพื่อทำนายผู้ใช้หน้าเว็บถัดไปมีแนวโน้มที่จะเข้าถึง รูปแบบตรงกับลำดับการเข้าถึงปัจจุบันของผู้ใช้กับลำดับการเข้าถึงเว็บในอดีตของผู้ใช้เพื่อปรับปรุงความแม่นยำในการทำนายสำหรับการดึงข้อมูลล่วงหน้า
เสนอวิธีการที่ใช้การจัดกลุ่มแบบไดนามิกเพื่อเพิ่มความแม่นยำของโมเดลมาร์คอฟในการเป็นตัวแทนของการรวบรวมเซสชันการนำทางเว็บ ใช้แนวคิดการโคลนนิ่งของรัฐเพื่อทำซ้ำสถานะในการแยกการเชื่อมโยงในการเชื่อมโยงที่มีความน่าจะเป็นลำดับที่สองที่สอดคล้องกันแตกต่างกัน วิธีการที่เสนอรวมถึงเทคนิคการจัดกลุ่มที่กำหนดวิธีการกำหนด in-links ที่มีความน่าจะเป็นลำดับที่สองที่คล้ายกันกับโคลนเดียวกัน
ขยายการใช้อัลกอริทึมหน้าแบบจัดอันดับด้วยแอตทริบิวต์การนำทางมากมาย: ขนาดของหน้าเวลาระยะเวลาของหน้าระยะเวลาการเปลี่ยนแปลง (การเข้าชมสองหน้าตามลำดับ) ความถี่ของหน้าและการเปลี่ยนแปลง กำหนดอันดับตามระยะเวลา (DPR) และอันดับหน้าตามอันดับ (PPR) ผู้เขียนดูความนิยมของการเปลี่ยนผ่านและหน้าโดยใช้ข้อมูลระยะเวลาโดยใช้ขนาดหน้าและความถี่เยี่ยมชม การใช้ค่าความนิยมของหน้ากระดาษนี้พยายามปรับปรุงอัลกอริธึมอันดับหน้าทั่วไปและแบบจำลองการทำนายหน้าถัดไปภายใต้ค่าสูงสุดที่กำหนด
![]() Minko Gechev | ![]() Addy Osmani | ![]() Katie Hempenius | ![]() Kyle Mathews |