المكتبات والأدوات لتمكين تجارب المستخدم القائمة على البيانات على الويب.
لمستخدمي WebPack:
قم بتثبيت وتكوين GuessPlugin - المكون الإضافي لـ Guess.js.JS WebPack والذي يتم أتمتة أكبر قدر ممكن من عملية الإعداد لك قدر الإمكان.
إذا كنت ترغب في تجربة الوحدات النمطية التي نقدمها بشكل فردي ، فإن دليل packages يحتوي على ثلاث حزم:
ga - وحدة لجلب البيانات المنظمة من واجهة برمجة تطبيقات Google Analytics للتعرف على أنماط تنقل المستخدم.parser - وحدة توفر إطار عمل JavaScript. هذا يعمل على تشغيل إمكانيات الترشيح التي تم تنفيذها في البرنامج المساعد لـ Musting WebPack.webpack - مكون إضافي لـ WebPack لإعداد الجلب التنبئي في التطبيق الخاص بك. يستهلك وحدات ga و parser ويوفر عددًا كبيرًا من الخيارات لتكوين كيفية عمل الجلب التنبئي في تطبيقك.لمستخدمي غير webpack:
يوفر سير العمل التنبئي للمواقع لدينا مجموعة من الخطوات التي يمكنك اتباعها لدمج الجلب التنبئي باستخدام واجهة برمجة تطبيقات Google Analytics إلى موقعك.
يستخدم هذا الريبو بيانات Google Analytics لتحديد الصفحة التي من المرجح أن يزورها المستخدم التالي من صفحة معينة. يرسل البرنامج النصي من جانب العميل (الذي ستقوم إضافته إلى التطبيق الخاص بك) طلبًا إلى الخادم للحصول على عنوان URL الخاص بالصفحة التي يجب أن يجلبها ، ثم يحترم هذا المورد.
يوفر Guess.js المكتبات والأدوات لتبسيط أساليب تنبؤية تحلل البيانات لتحسين تجارب المستخدم على الويب. يمكن نقل هذه البيانات من أي عدد من المصادر ، بما في ذلك التحليلات أو نماذج التعلم الآلي. يهدف Just.JS إلى خفض احتكاك استهلاك وتطبيق هذا التفكير على جميع المواقع والتطبيقات الحديثة ، بما في ذلك إنشاء المكتبات والأدوات لسير العمل الشهير.
يمكن تطبيق تطبيق تفكير البيانات التنبؤية على المواقع في عدد من السياقات:
من خلال التعاون عبر نقاط تعمل باللمس المختلفة في النظام الإيكولوجي حيث يمكن تطبيق الأساليب التي تعتمد على البيانات بسهولة ، نأمل أن نعمل على تعميم القطع الشائعة من البنية التحتية لزيادة قابلية تطبيقها في مداخن تقنية مختلفة.
<link rel=prefetch> للتنقل المستقبلي اعتمادًا كبيرًا على قراءة التحليلات الوصفية يدويًا لإبلاغ قراراتهم بما يجب عليهم.<link rel=prefetch> حاليًا على 5 ٪ من إجمالي عمليات التحميل ، ولكن قد يكون هذا أعلى.أولوية كبيرة الأولى لـ Guess.js ستعمل على تحسين أداء الويب من خلال الإصابة بالتنبؤ بالمحتوى.
من خلال إنشاء نموذج للصفحات ، من المحتمل أن يزور المستخدم ، بالنظر إلى صفحة الدخول التعسفية ، يمكن أن يحسب الحل احتمالية زيارة المستخدم على صفحة التالية أو مجموعة من الصفحات وموارد الجلب المسبق لهم بينما لا يزال المستخدم يشاهد صفحته الحالية. هذا لديه إمكانية تحسين أداء تحميل الصفحة لزيارات الصفحة التالية حيث توجد فرصة قوية لصفحة في ذاكرة التخزين المؤقت للمستخدم.
من أجل التنبؤ بالصفحة التالية التي من المحتمل أن يزورها المستخدم ، يمكن للحلول استخدام واجهة برمجة تطبيقات Google Analytics. يمكن استخدام بيانات جلسة Google Analytics لإنشاء نموذج للتنبؤ بالصفحة الأكثر احتمالًا التي سيقوم المستخدم بزيارتها التالية على الموقع. تتمثل فائدة بيانات الجلسة هذه في أنه يمكن أن تتطور بمرور الوقت ، بحيث إذا تغيرت مسارات التنقل الخاصة ، يمكن أن تظل التنبؤات محدثة أيضًا.
مع توفر هذه البيانات ، يمكن للمحرك إدراج <link rel="[prerender/prefetch/preload]"> علامات لتسريع وقت التحميل لطلب الصفحة التالية. في بعض الاختبارات ، مثل تحميل صفحات Mark Edmondson الفائقة مع R ، أدى ذلك إلى تحسن بنسبة 30 ٪ في أوقات تحميل الصفحة. تضمنت علامة النهج المستخدمة في بحثه باستخدام علامات GTM وتعلم الآلات لتدريب نموذج لتنبؤات الصفحة. هذه فكرة استمرت علامة في التعلم الآلي تلبي السحابة - الجليد الذكي.
في حين أن هذا النهج سليم ، يمكن اعتبار المنهجية المستخدمة معقدة بعض الشيء. هناك طريقة أخرى يمكن اتخاذها (وهو أبسط) وهو محاولة الحصول على بيانات تنبؤ دقيقة من واجهة برمجة تطبيقات Google Analytics. إذا قمت بتشغيل تقرير للصفحة وبعد PATH PATH السابق ، تم دمج أبعاد PAGE مع مقاييس Pageviews وخرج من المقاييس ، فيجب أن يوفر ذلك بيانات كافية لتوصيل الجبال المسبقة للصفحات الأكثر شيوعًا.
يمكن أن يساعد ML في تحسين الدقة الكلية لتنبؤات الحل ، ولكنها ليست ضرورة للتنفيذ الأولي. يمكن تحقيق الجلب التنبئي عن طريق تدريب نموذج على الصفحات من المحتمل أن يزورها المستخدمون ويتحسنون في هذا النموذج مع مرور الوقت.
الشبكات العصبية العميقة جيدة بشكل خاص في إغاظة التعقيدات التي قد تؤدي إلى اختيار مستخدم على صفحة واحدة ، على وجه الخصوص ، إذا أردنا محاولة إصدار من الحل الذي تم تقديمه للصفحات التي قد يزورها المستخدم الفردي مقابل الصفحات التي قد يزورها المستخدم "العام/الوسيط". قد تكون تسلسل الصفحات الثابتة (Prev ، الحالية ، التالية) الأسهل في البدء في التعامل معها في البداية. هذا يعني بناء نموذج فريد من نوعه لمجموعة المستندات الخاصة بك.
تميل تحديثات النماذج بشكل دوري ، لذلك يمكن للمرء إعداد وظيفة ليلية/أسبوعية للتحديث بناءً على سلوك المستخدم الجديد. يمكن أن يتم ذلك في الوقت الفعلي ، ولكن من المحتمل أن يكون معقدًا ، لذلك قد يكون القيام بذلك بشكل دوري كافيًا. يمكن للمرء أن يتخيل نموذجًا عامًا يمثل أنماطًا سلوكية للمستخدمين على موقع يمكن إما أن يكون مدفوعًا بمجموعة حالة مدربة ، أو Google Analytics ، أو وصفًا مخصصًا لك مكونًا إضافيًا باستخدام طبقة جديدة في جهاز توجيه يمنح الموقع القدرة على جلب الصفحات المستقبلية بشكل متوقع ، وتحسين أداء تحميل الصفحة.
من المحتمل أن يتم التنقل في الجلب المسبق للمضاربة في تحميل الصفحة. هذا يفترض وجود المعرفة حول احتمال أن الصفحة ستحتاج الصفحة إلى صفحة أو مجموعة من الصفحات التالية ، أو نموذج تدريب يمكن أن يوفر نهجًا يعتمد على البيانات لتحديد هذه الاحتمالات.
يمكن إنجاز الحمل المسبق على الصفحة بعدد من الطرق ، من التأجيل إلى UA لتحديد وقت الحصول على الموارد المسبقة (على سبيل المثال في الأولوية المنخفضة مع <link rel=prefetch> ) ، خلال وقت الخمول في الصفحة (عبر requestIdLecallback () ()) أو في بعض الفاصل الزمني الآخر. لا يلزم تفاعل إضافي من قبل المستخدم.
يمكن أن تبدأ الصفحة بشكل مضاربة محتوى مسبقًا عندما تكون الروابط الموجودة في الصفحة مرئية في منفذ العرض ، مما يدل على أن المستخدم قد يكون لديه فرصة أكبر في الرغبة في النقر عليها.
هذا هو النهج الذي يستخدمه Gatsby (والذي يستخدم React and React Router). تنفيذها المحدد على النحو التالي:
<Link> غير مرئي ، فإن الارتباط "الأصوات" للصفحة المرتبطة بأن تكون الأصوات المسبقة مسبقًا تستحق أقل بقليل في كل مرة حتى يتم إعطاء روابط في الجزء العلوي من الصفحة فوق تلك التي تنخفض إلى أسفل لأسفليمكن أن تبدأ الصفحة الموارد المسبقة للمضاربة عندما يشير المستخدم إلى أنهم مهتمون ببعض المحتوى. يمكن أن يتخذ ذلك العديد من النماذج ، بما في ذلك عندما يختار المستخدم أن يحوم فوق رابط أو جزء من واجهة المستخدم التي تنقلها إلى صفحة منفصلة. يمكن أن يبدأ المتصفح في جلب المحتوى للرابط بمجرد وجود مؤشر واضح على الاهتمام. هذا هو النهج الذي اتبعته مكتبات JavaScript مثل InstantClick.
كما هو الحال مع أي آلية للمحتوى الجاهز في وقت مبكر ، يجب التعامل مع هذا بعناية فائقة. قد لا يقدر مستخدم في خطة بيانات مقيدة أو يستفيد كثيرًا من الصفحات التي يتم جلبها في وقت مبكر ، وخاصة إذا بدأوا في تناول بياناتهم. هناك آليات يمكن أن يأخذها الموقع/الحل ليكون على دراية بهذا القلق ، مثل احترام رأس الحفظ.
من المحتمل أن تكون الروابط المسبقة لصفحات "تسجيل الخروج" غير مرغوب فيها. يمكن قول الشيء نفسه عن أي صفحات تؤدي إلى إجراء إجراء على تحميل الصفحة (مثل الشراء بنقرة واحدة). قد ترغب الحلول في إدراج قائمة سوداء بعنوان URL والتي لا يتم تجريدها من قبل لزيادة احتمال أن تكون صفحة مجسمة مسبقًا مفيدة.
اعتمدت بعض المحاولات لإنجاز مقترحات مماثلة في الماضي على <link rel=prerender> . يستكشف فريق Chrome حاليًا إهمال Rel = prerender لصالح NostatePrefetch - نسخة أخف من هذه الآلية التي لا تحتوي إلا على ذاكرة التخزين المؤقت HTTP ولكنها لا تستخدم حالة أخرى من نظام الويب. يجب أن يتحول الحل إلى ما إذا كان سيعتمد على الاستبدال إلى rel = prerender أو باستخدام مقاربات مسبقة/مسبق/غيرها من الأساليب.
هناك نوعان من الاختلافات الرئيسية بين NostatePrefetch و preft:
brefetch nostate هي آلية ، و <link rel=prefetch> هي واجهة برمجة التطبيقات. يمكن طلب prefetch من خلال نقاط الدخول الأخرى: التنبؤ Omnibox ، علامات التبويب المخصصة ، <link rel=prerender> .
التنفيذ مختلف: <link rel=prefetch> يسبق مورد واحد ، ولكن إعادة صياغة النزوح على رأس ذلك يدير الماسح الضوئي المسبق على المورد (في عارض جديد جديد) ، يكتشف resources و presfetting لهم أيضًا (دون أن تتكرر في الماسح الضوئي المسبق).
هناك ثلاثة أنواع أساسية من تحليلات البيانات التي تستحق أن تكون على دراية بها في مساحة المشكلة هذه: وصفية وتنبؤية وصفية. كل نوع مرتبط ومساعدة فرق الاستفادة من أنواع مختلفة من البصيرة.
يلخص التحليلات الوصفية البيانات الخام وتحويلها إلى شيء يمكن تفسيره من قبل البشر. يمكن أن ينظر إلى الأحداث الماضية ، بغض النظر عن متى حدثت الأحداث. تسمح التحليلات الوصفية للفرق بالتعلم من السلوكيات السابقة ، وهذا يمكن أن يساعدهم على التأثير على النتائج المستقبلية. يمكن أن تحدد التحليلات الوصفية الصفحات التي شاهدها مستخدمو الموقع سابقًا وما هي مسارات التنقل التي اتخذوها في ضوء أي صفحة إدخال معينة.
التحليلات التنبؤية "تتنبأ" بما يمكن أن يحدث بعد ذلك. تساعدنا التحليلات التنبؤية على فهم المستقبل وتمنح الفرق رؤى قابلة للتنفيذ باستخدام البيانات. ويوفر تقديرات لاحتمال أن تكون نتيجة مستقبلية مفيدة. من المهم أن تضع في اعتبارك أن القليل من الخوارزميات يمكن أن تتنبأ بالأحداث المستقبلية بدقة كاملة ، ولكن يمكننا استخدام أكبر عدد ممكن من الإشارات المتاحة لنا للمساعدة في تحسين دقة خط الأساس. يعتمد أساس التحليلات التنبؤية على الاحتمالات التي نحددها من البيانات. يمكن أن تتنبأ التحليلات التنبؤية بالصفحة التالية أو مجموعة الصفحات التي من المحتمل أن يزورها المستخدم في ظل صفحة إدخال تعسفية.
تتيح التحليلات الإلزامية وصف الإجراءات المحتملة المختلفة للتوجيه نحو حل ما. توفر التحليلات الإلزامية المشورة ، ومحاولة تحديد تأثير القرارات المستقبلية التي قد تضطر إلى تقديم المشورة بشأن النتائج المحتملة قبل اتخاذ هذه القرارات. يهدف التحليلات الإلزامية إلى عدم التنبؤ فقط بما سيحدث ولكنه يسير أبعد من ذلك ؛ إبلاغ سبب حدوث ذلك وتقديم توصيات حول الإجراءات التي يمكن أن تستفيد من هذه التنبؤات. يمكن أن تتنبأ التحليلات الإلزامية بالصفحة التالية التي سيزورها المستخدم ، ولكنها تقترح أيضًا إجراءات مثل إبلاغك بطرق يمكنك تخصيص خبرتهم للاستفادة من هذه المعرفة.
الهدف الرئيسي لنموذج التنبؤ في مساحة مشكلة الإذابة المسبقة هو تحديد الطلبات اللاحقة التي قد يحتاجها المستخدم ، بالنظر إلى طلب صفحة محدد. يتيح هذا لخادم أو عميل تقديم مسبقًا للمجموعة التالية من الصفحات ومحاولة التأكد من وجودها في ذاكرة التخزين المؤقت للمستخدم قبل الانتقال مباشرة إلى الصفحة. الفكرة هي تقليل وقت التحميل بشكل عام. عندما يتم تنفيذ ذلك بعناية ، يمكن لهذه التقنية أن تقلل من أوقات الوصول إلى الصفحة والكمون ، مما يحسن تجربة المستخدم الإجمالية.
تم استخدام نماذج Markov على نطاق واسع للبحث وفهم عملية الاستوكاستك (توزيع الاحتمالات العشوائي) [المرجع ، المرجع]. لقد ثبت أنها مناسبة بشكل جيد للنمذجة والتنبؤ بسلوك التصفح للمستخدم. تميل مدخلات هذه المشكلات إلى تسلسل صفحات الويب التي يتم الوصول إليها من قبل مستخدم أو مجموعة من المستخدمين (على مستوى الموقع) بهدف إنشاء نماذج Markov التي يمكننا استخدامها لتصوير الصفحات التي يمكن للمستخدم الوصول إليها بعد ذلك. تحتوي عملية Markov على ولايات تمثل الصفحات التي تم الوصول إليها وحواف تمثل احتمالات الانتقال بين الحالات التي يتم حسابها من تسلسل معين في سجل التحليلات. يمكن استخدام نموذج ماركوف المدربين للتنبؤ بالدولة التالية التي تم إعطاؤها مجموعة من الحالات السابقة.
في بعض التطبيقات ، ليست نماذج Markov من الدرجة الأولى دقيقة في التنبؤ بسلوكيات تصفح المستخدم لأنها لا تبحث دائمًا في الماضي لإثارة التمييز بين الأنماط المختلفة التي لوحظت. هذا هو أحد أسباب استخدام النماذج ذات الترتيب الأعلى. هذه النماذج ذات الترتيب الأعلى لها قيود مع تعقيد الفضاء الحكومي ، وتغطية أقل واسعة وأحيانًا انخفاض دقة التنبؤ.
إحدى الطرق [المرجع] للتغلب على هذه المشكلة هي تدريب نماذج ماركوف المختلفة ، والتي نستخدمها بعد ذلك خلال مرحلة التنبؤ. تمت محاولة هذا في نموذج ماركوف من كل KTH المقترح في هذا المرجع. هذا يمكن أن يجعل تعقيد فضاء الدولة أسوأ. هناك طريقة أخرى تتمثل في تحديد أنماط الوصول المتكررة (أطول تكرار متكرر) واستخدام هذه المجموعة من التسلسلات للتنبؤات. على الرغم من أن هذا النهج يمكن أن يكون له ترتيب الحد من الحجم على تعقيد مساحة الحالة ، إلا أنه يمكن أن يقلل من دقة التنبؤ.
كما تم اقتراح نماذج ماركوف الانتقائية (SMM) التي تخزن بعض الولايات داخل النموذج فقط كحل لمقايضات تعقيد الفضاء الحكومي. يبدأون بنموذج ماركوف من طراز KTH-يتم بعد ذلك استخدام نهج ما بعد التقديم لتوبيخ الحالات التي ليس من المتوقع أن تكون تنبؤات دقيقة. نتيجة هذا هو نموذج له نفس قوة التنبؤ لنماذج الترتيب بالكامل مع تعقيد الفضاء أقل ودقة تنبؤ أعلى. في Deshpane و Karpis ، يتم النظر في معايير مختلفة لتوبيخ الدول في النموذج قبل التنبؤ (التردد ، الثقة ، الخطأ).
في Mabroukeh و Ezeife ، تمت دراسة أداء نماذج Markov من الدرجة الأولى والثانية ومقارنتها مع SMM ذات الترتيب العالي و SMM الدلالي. واكتشفوا أن SMM المربى الدلالي لها حجم أصغر بنسبة 16 ٪ من SMM المربى بالتردد ويوفر دقة متساوية تقريبًا.
يمكن أن تسمح لنا مراقبة أنماط التنقل بتحليل سلوك المستخدم. يتطلب هذا النهج الوصول إلى تحديد جلسة المستخدم ، وجلسات التجميع في مجموعات مماثلة وتطوير نموذج للتنبؤ باستخدام أنماط الوصول الحالية والمبكرة. اعتمد الكثير من الأعمال السابقة في هذا المجال على مخططات التجميع مثل تقنية التجميع K-Means مع المسافة الإقليدية لتحسين ثقة التنبؤات. أحد العيوب التي تعاني من استخدام K-Means هي صعوبة تحديد عدد المجموعات ، واختيار المركز العشوائي الأولي وترتيب زيارات الصفحة لا يتم النظر فيه دائمًا. قام Kumar et al بالتحقيق في هذا ، حيث اقترح تقنية التجميع الهرمية مع مسافة Levenshtein المعدلة ، Pagerank باستخدام طول وقت الوصول ، وتردد نماذج Markov عالية الترتيب للتنبؤ.
تتركز العديد من الأوراق المشار إليها في القسم التالي حول نموذج ماركوف وقواعد الارتباط والتجميع. الأوراق التي تسلط الضوء على العمل ذي الصلة المتعلقة باكتشاف الأنماط لتطوير دقة التنبؤ بالصفحة هي محورنا.
يستخدم نماذج ماركوف من الدرجة الأولى لتصميم تسلسل صفحات الويب المطلوبة من قبل المستخدم للتنبؤ بالصفحة التالية التي من المحتمل أن تصل إليها. تسمح سلاسل ماركوف للنظام بنمذجة أنماط الوصول إلى عنوان URL ديناميكيًا لوحظ في سجلات التنقل بناءً على الحالة السابقة. يتم تدريب نموذج ماركوف "مخصص" لكل مستخدم ويستخدم للتنبؤ بجلسات المستخدم المستقبلية. في الممارسة العملية ، من المكلف للغاية إنشاء نموذج فريد لكل مستخدم وتصبح تكلفة تحجيم هذا أكثر تحديا عندما يكون لدى الموقع قاعدة مستخدم كبيرة.
أول ورقة للتحقيق في نماذج ماركوف المخفية (HMM). جمع المؤلف سجلات خادم الويب ، وقام بتشذيب البيانات وقام بتصحيح المسارات التي يمررها المستخدمون. استنادًا إلى HMM ، قام المؤلف ببناء نموذج محدد لتصفح الويب يتوقع ما إذا كان لدى المستخدمين نية الشراء في الوقت الفعلي. التدابير ذات الصلة ، مثل تسريع العملية وتأثيرها عند التحقيق في وضع الشراء.
يقترح إطار عمل للتنبؤ بمواقف تصنيف صفحة بناءً على تصنيفاتها السابقة. بافتراض مجموعة من التصنيفات المتتالية من أفضل K ، يحدد المؤلف المتنبئين بناءً على منهجيات مختلفة. يتم قياس جودة التنبؤ على أنها التشابه بين التصنيفات المتوقعة والفعلية. تم إجراء تجارب شاملة على مجموعة بيانات واسعة النطاق في العالم الحقيقي لكل من التصنيف العالمي والمعتمد على الاستعلام. مجموعة متنوعة من مقاييس التشابه الحالية لمقارنة القوائم المرتبة العليا بما في ذلك واحدة جديدة تم التقاطها في الورقة.
يقترح استخدام نماذج N-HOP Markov للتنبؤ بالوصول إلى صفحة الويب التالية من المحتمل أن يصلوا. يطابق النمط تسلسل الوصول الحالي للمستخدم مع تسلسل الوصول إلى الويب التاريخي للمستخدم لتحسين دقة التنبؤ للأحزاب المسبقة.
يقترح طرق ديناميكية قائمة على التجميع لزيادة دقة نموذج ماركوف في تمثيل مجموعة من جلسات التنقل على الويب. يستخدم مفهوم استنساخ الدولة لتكرار الدول بطريقة تفصل بين الروابط التي تتباعد احتمالات الترتيب الثاني المقابلة. تتضمن الطريقة المقترحة تقنية التجميع التي تحدد طريقة لتعيين الروابط مع احتمالات من الدرجة الثانية مماثلة لنفس الاستنساخ.
يمتد استخدام خوارزمية تصنيف الصفحة مع العديد من السمات الملاحية: حجم الصفحة ، ووقت مدة الصفحة ، ومدة الانتقال (زيارتين من صفحتين متتابعين) ، وتيرة الصفحة والانتقال. يحدد الرتبة المستندة إلى المدة (DPR) ورتبة الصفحة القائمة على الشعبية (PPR). نظر المؤلف في شعبية التحولات والصفحات باستخدام معلومات المدة ، باستخدامها بحجم الصفحة وزيارة التردد. باستخدام قيمة شعبية الصفحات ، تحاول هذه الورقة تحسين خوارزميات تصنيف الصفحات التقليدية ونموذج التنبؤ بالصفحة التالية بموجب قيمة من أعلى إلى أعلى.
![]() مينكو جيتشيف | ![]() آدي عثاني | ![]() كاتي هيمبينيوس | ![]() كايل ماثيوز |