guess تنزيل - guess تنزيل رمز المصدر

guess

شفرة المصدر الأخرى

1.0.0

تنزيل

Guess.JS (ألفا)

المكتبات والأدوات لتمكين تجارب المستخدم القائمة على البيانات على الويب.

Quickstart

لمستخدمي WebPack:

bundling تجميع البيانات

قم بتثبيت وتكوين GuessPlugin - المكون الإضافي لـ Guess.js.JS WebPack والذي يتم أتمتة أكبر قدر ممكن من عملية الإعداد لك قدر الإمكان.

إذا كنت ترغب في تجربة الوحدات النمطية التي نقدمها بشكل فردي ، فإن دليل packages يحتوي على ثلاث حزم:

ga - وحدة لجلب البيانات المنظمة من واجهة برمجة تطبيقات Google Analytics للتعرف على أنماط تنقل المستخدم.
parser - وحدة توفر إطار عمل JavaScript. هذا يعمل على تشغيل إمكانيات الترشيح التي تم تنفيذها في البرنامج المساعد لـ Musting WebPack.
webpack - مكون إضافي لـ WebPack لإعداد الجلب التنبئي في التطبيق الخاص بك. يستهلك وحدات ga و parser ويوفر عددًا كبيرًا من الخيارات لتكوين كيفية عمل الجلب التنبئي في تطبيقك.

لمستخدمي غير webpack:

⚫ التحميل القائم على البيانات

يوفر سير العمل التنبئي للمواقع لدينا مجموعة من الخطوات التي يمكنك اتباعها لدمج الجلب التنبئي باستخدام واجهة برمجة تطبيقات Google Analytics إلى موقعك.

يستخدم هذا الريبو بيانات Google Analytics لتحديد الصفحة التي من المرجح أن يزورها المستخدم التالي من صفحة معينة. يرسل البرنامج النصي من جانب العميل (الذي ستقوم إضافته إلى التطبيق الخاص بك) طلبًا إلى الخادم للحصول على عنوان URL الخاص بالصفحة التي يجب أن يجلبها ، ثم يحترم هذا المورد.

يتعلم أكثر

ما هو Gueth.js؟

يوفر Guess.js المكتبات والأدوات لتبسيط أساليب تنبؤية تحلل البيانات لتحسين تجارب المستخدم على الويب. يمكن نقل هذه البيانات من أي عدد من المصادر ، بما في ذلك التحليلات أو نماذج التعلم الآلي. يهدف Just.JS إلى خفض احتكاك استهلاك وتطبيق هذا التفكير على جميع المواقع والتطبيقات الحديثة ، بما في ذلك إنشاء المكتبات والأدوات لسير العمل الشهير.

يمكن تطبيق تطبيق تفكير البيانات التنبؤية على المواقع في عدد من السياقات:

توقع الصفحة التالية (أو الصفحات) من المرجح أن يزور المستخدم هذه الصفحات وتجريدها ، مما يحسن أداء تحميل الصفحة المتصورة وسعادة المستخدم.
- مستوى الصفحة: prerender/prefect على الأرجح أن تتم زيارتها بعد ذلك
- على مستوى الحزمة: مسبق الحزم المرتبطة بصفحات N العليا. في كل صفحات التنقل ، في جميع جيران الصفحة الحالية ، تم فرزهم بترتيب تنازلي من خلال احتمال زيارته. جلب الأصول (قطع JavaScript) لصفحات أفضل N ، اعتمادًا على النوع الفعلي للاتصال الحالي.
التنبؤ بالقطعة التالية من المحتوى (المقالة ، المنتج ، الفيديو) من المحتمل أن يرغب المستخدم في عرض تجربة المستخدم وضبطه أو تصفية ذلك.
توقع أنواع الأدوات المصغّرة التي من المحتمل أن يتفاعلها المستخدم الفردي مع المزيد (مثل الألعاب) واستخدام هذه البيانات لتكييف تجربة أكثر مخصصة.

من خلال التعاون عبر نقاط تعمل باللمس المختلفة في النظام الإيكولوجي حيث يمكن تطبيق الأساليب التي تعتمد على البيانات بسهولة ، نأمل أن نعمل على تعميم القطع الشائعة من البنية التحتية لزيادة قابلية تطبيقها في مداخن تقنية مختلفة.

المشاكل التي نتطلع إلى حلها

يعتمد المطورون الذين يستخدمون <link rel=prefetch> للتنقل المستقبلي اعتمادًا كبيرًا على قراءة التحليلات الوصفية يدويًا لإبلاغ قراراتهم بما يجب عليهم.
غالبًا ما يتم اتخاذ هذه القرارات في وقت ما و ..
- (1) لا يتم إعادة النظر في كثير من الأحيان مع تغير اتجاهات البيانات
- (2) محدودة للغاية في كيفية استخدامها. في كثير من الأحيان ، لن تقوم التطبيقات في كثير من الأحيان بتجميع المحتوى من صفحة منزلية أو مجموعة صغيرة جدًا من صفحات البطل ، ولكن لا تفعل ذلك لجميع نقاط الدخول الممكنة على الموقع. هذا يمكن أن يترك فرص الأداء على الطاولة.
- (3) تتطلب قدراً من الثقة حول البيانات المستخدمة لدفع القرارات حول استخدام الإصدار المسبق يعني أن المطورين قد لا يتبنونها بدافع القلق ، فإنهم سيضيعون النطاق الترددي. يتم استخدام <link rel=prefetch> حاليًا على 5 ٪ من إجمالي عمليات التحميل ، ولكن قد يكون هذا أعلى.
يعد تطبيق التحليلات التنبؤية معقدًا للغاية بالنسبة لمطور الويب العادي.
- معظم المطورين ليسوا على دراية بكيفية الاستفادة من واجهة برمجة تطبيقات Google Analytics لتحديد احتمال زيارة الصفحة بعد ذلك. نحن نفتقر:
- (1) حل على مستوى الصفحة: حل إسقاط من جانب العميل للصفحات المسبقة التي من المحتمل أن يزورها المستخدم
- (2) الحل على مستوى التجميع: مجموعة من الإضافات/الأدوات التي تعمل مع حزم JavaScript اليوم (على سبيل المثال حزمة الويب) للتجمع وإنشاء حزم/قطع يمكن أن يتم تحميل مجموعة معينة من مسارات التنقل بشكل أسرع لو كانت مسبقًا مسبقًا في وقت مبكر.
معظم المطورين ليسوا على دراية بعد كيف يعمل التعلم الآلي. هم عموما:
- (1) غير متأكدين من كيفية (ولماذا) ML في مداخن التقنية الحالية (الويب)
- (2) ما هو اقتراح قيمة TensorFlow أو حيث تتناسب حلول مثل محرك CloudML. لدينا فرصة لتبسيط النفقات العامة المرتبطة بالاستفادة من بعض هذه الحلول.
لا تزال أساليب الأفضل في الفئة / المنخفضة في هذا المجال ناشئة ببطء ولا يمكن الوصول إليها بعد لمطوري الويب دون خلفيات ML أو علوم البيانات.
- التعلم الآلي يلتقي السحابة: الجاذبية الذكية من قبل IIH NORDIC
  - يمكن استخدام مديري العلامات مثل Google Tag Manager لفصل محتوى الصفحة من تتبع التعليمات البرمجية كيفية استخدام المحتوى. يتيح ذلك لمحللي الويب ترقية رمز التتبع في الوقت الفعلي مع عدم تعطل الموقع. يسمح مديرو العلامات بحل عام لحقن التعليمات البرمجية ويمكن استخدامه لنشر الجذور المسبقة الذكية. المزايا: التحليلات المستخدمة لبناء النموذج تأتي من مدير العلامات. يمكننا أيضًا إرسال البيانات مباشرة إلى المتنبئ دون أن يكون المتبع الإضافي. بعد إضافة عدد قليل من علامات (IIH Nordic's) إلى تثبيت GTM ، يمكن للموقع أن يبدأ في الحصول على الموارد المسبقة للصفحات التالية وتتبع فرص توفير وقت التحميل.
  - قام IIH Nordic بنقل نموذج الإحسان المسبق التنبئي إلى خدمة الويب ، استفسارات المتصفح عندما يزور المستخدم صفحة جديدة. تستجيب الخدمة لكل طلب وتستفيد من Google Cloud و App Engine و Cloud ML. يختار حلهم النموذج الأكثر دقة ، وتشمل الخيارات نموذج Markov أو في أغلب الأحيان شبكة عصبية عميقة في Tensorflow.
  - مع تغيير سلوك المستخدم بمرور الوقت ، تتطلب النماذج التنبؤية التحديث (التدريب) من وقت لآخر. يتضمن تدريب النموذج جمع البيانات وتحويلها وتركيب معلمات النموذج وفقًا لذلك. IIH Nordic استخدم Google Cloud لسحب البيانات من خدمة تحليلات العميل إلى دلو بيانات خاص في BigQuery. يقومون بمعالجة هذه البيانات وتدريب واختبار النماذج التنبؤية ، وتحديث خدمة التنبؤ بسلاسة.
  - IIH NORDIC تقترح المواقع الصغيرة/البطيئة تحديث نماذجها شهريًا. قد تحتاج المواقع الكبيرة إلى إعادة تدريب يوميًا أو حتى كل ساعة لمواقع الأخبار.
  - إن فائدة تدريب نماذج ML في السحابة هي سهولة الحجم حيث يمكن إضافة آلات إضافية ، ويمكن إضافة وحدات معالجة الرسومات والمعالجات حسب الحاجة.
  - تجميع التعلم الآلي. مستقبل أدوات JavaScript من Minko

الأولوية الأولية: تحسين الأداء من خلال الجذاب المسبق للبيانات

أولوية كبيرة الأولى لـ Guess.js ستعمل على تحسين أداء الويب من خلال الإصابة بالتنبؤ بالمحتوى.

من خلال إنشاء نموذج للصفحات ، من المحتمل أن يزور المستخدم ، بالنظر إلى صفحة الدخول التعسفية ، يمكن أن يحسب الحل احتمالية زيارة المستخدم على صفحة التالية أو مجموعة من الصفحات وموارد الجلب المسبق لهم بينما لا يزال المستخدم يشاهد صفحته الحالية. هذا لديه إمكانية تحسين أداء تحميل الصفحة لزيارات الصفحة التالية حيث توجد فرصة قوية لصفحة في ذاكرة التخزين المؤقت للمستخدم.

النهج المحتملة للجلب التنبئي

من أجل التنبؤ بالصفحة التالية التي من المحتمل أن يزورها المستخدم ، يمكن للحلول استخدام واجهة برمجة تطبيقات Google Analytics. يمكن استخدام بيانات جلسة Google Analytics لإنشاء نموذج للتنبؤ بالصفحة الأكثر احتمالًا التي سيقوم المستخدم بزيارتها التالية على الموقع. تتمثل فائدة بيانات الجلسة هذه في أنه يمكن أن تتطور بمرور الوقت ، بحيث إذا تغيرت مسارات التنقل الخاصة ، يمكن أن تظل التنبؤات محدثة أيضًا.

مع توفر هذه البيانات ، يمكن للمحرك إدراج <link rel="[prerender/prefetch/preload]"> علامات لتسريع وقت التحميل لطلب الصفحة التالية. في بعض الاختبارات ، مثل تحميل صفحات Mark Edmondson الفائقة مع R ، أدى ذلك إلى تحسن بنسبة 30 ٪ في أوقات تحميل الصفحة. تضمنت علامة النهج المستخدمة في بحثه باستخدام علامات GTM وتعلم الآلات لتدريب نموذج لتنبؤات الصفحة. هذه فكرة استمرت علامة في التعلم الآلي تلبي السحابة - الجليد الذكي.

في حين أن هذا النهج سليم ، يمكن اعتبار المنهجية المستخدمة معقدة بعض الشيء. هناك طريقة أخرى يمكن اتخاذها (وهو أبسط) وهو محاولة الحصول على بيانات تنبؤ دقيقة من واجهة برمجة تطبيقات Google Analytics. إذا قمت بتشغيل تقرير للصفحة وبعد PATH PATH السابق ، تم دمج أبعاد PAGE مع مقاييس Pageviews وخرج من المقاييس ، فيجب أن يوفر ذلك بيانات كافية لتوصيل الجبال المسبقة للصفحات الأكثر شيوعًا.

التعلم الآلي من أجل الجلب التنبئي

يمكن أن يساعد ML في تحسين الدقة الكلية لتنبؤات الحل ، ولكنها ليست ضرورة للتنفيذ الأولي. يمكن تحقيق الجلب التنبئي عن طريق تدريب نموذج على الصفحات من المحتمل أن يزورها المستخدمون ويتحسنون في هذا النموذج مع مرور الوقت.

الشبكات العصبية العميقة جيدة بشكل خاص في إغاظة التعقيدات التي قد تؤدي إلى اختيار مستخدم على صفحة واحدة ، على وجه الخصوص ، إذا أردنا محاولة إصدار من الحل الذي تم تقديمه للصفحات التي قد يزورها المستخدم الفردي مقابل الصفحات التي قد يزورها المستخدم "العام/الوسيط". قد تكون تسلسل الصفحات الثابتة (Prev ، الحالية ، التالية) الأسهل في البدء في التعامل معها في البداية. هذا يعني بناء نموذج فريد من نوعه لمجموعة المستندات الخاصة بك.

تميل تحديثات النماذج بشكل دوري ، لذلك يمكن للمرء إعداد وظيفة ليلية/أسبوعية للتحديث بناءً على سلوك المستخدم الجديد. يمكن أن يتم ذلك في الوقت الفعلي ، ولكن من المحتمل أن يكون معقدًا ، لذلك قد يكون القيام بذلك بشكل دوري كافيًا. يمكن للمرء أن يتخيل نموذجًا عامًا يمثل أنماطًا سلوكية للمستخدمين على موقع يمكن إما أن يكون مدفوعًا بمجموعة حالة مدربة ، أو Google Analytics ، أو وصفًا مخصصًا لك مكونًا إضافيًا باستخدام طبقة جديدة في جهاز توجيه يمنح الموقع القدرة على جلب الصفحات المستقبلية بشكل متوقع ، وتحسين أداء تحميل الصفحة.

النهج المحتملة للمضاربة المسبقة

الجلب المسبق المضاربة في تحميل الصفحة

من المحتمل أن يتم التنقل في الجلب المسبق للمضاربة في تحميل الصفحة. هذا يفترض وجود المعرفة حول احتمال أن الصفحة ستحتاج الصفحة إلى صفحة أو مجموعة من الصفحات التالية ، أو نموذج تدريب يمكن أن يوفر نهجًا يعتمد على البيانات لتحديد هذه الاحتمالات.

يمكن إنجاز الحمل المسبق على الصفحة بعدد من الطرق ، من التأجيل إلى UA لتحديد وقت الحصول على الموارد المسبقة (على سبيل المثال في الأولوية المنخفضة مع <link rel=prefetch> ) ، خلال وقت الخمول في الصفحة (عبر requestIdLecallback () ()) أو في بعض الفاصل الزمني الآخر. لا يلزم تفاعل إضافي من قبل المستخدم.

الجلب المسبق للمضاربة عندما تأتي الروابط

يمكن أن تبدأ الصفحة بشكل مضاربة محتوى مسبقًا عندما تكون الروابط الموجودة في الصفحة مرئية في منفذ العرض ، مما يدل على أن المستخدم قد يكون لديه فرصة أكبر في الرغبة في النقر عليها.

هذا هو النهج الذي يستخدمه Gatsby (والذي يستخدم React and React Router). تنفيذها المحدد على النحو التالي:

في المتصفحات التي تدعم intersectionObserver ، كلما أصبح مكونًا <Link> غير مرئي ، فإن الارتباط "الأصوات" للصفحة المرتبطة بأن تكون الأصوات المسبقة مسبقًا تستحق أقل بقليل في كل مرة حتى يتم إعطاء روابط في الجزء العلوي من الصفحة فوق تلك التي تنخفض إلى أسفل لأسفل
على سبيل المثال ، إذا تم ربط الصفحة المرتبطة عدة مرات ، فإن عدد الأصوات الخاص به يرتفع ، فالأصوات المسبقة يأخذ الصفحة العليا ويبدأ الموارد المسبقة.
يقتصر على تصنيف صفحة واحدة في وقت واحد لخفض الخلاف على عرض النطاق الترددي مع الأشياء في الصفحة (وليس مشكلة على الشبكات السريعة. إذا قام المستخدم بزيارة صفحة وموارده لم يتم تنزيلها بالكامل ، فإن التوقف المسبق للتوقف حتى يتم تحميل الصفحة لضمان انتظار المستخدم في وقت أقل من الوقت.

الجلب المسبق المضاربة على تفاعل المستخدم

يمكن أن تبدأ الصفحة الموارد المسبقة للمضاربة عندما يشير المستخدم إلى أنهم مهتمون ببعض المحتوى. يمكن أن يتخذ ذلك العديد من النماذج ، بما في ذلك عندما يختار المستخدم أن يحوم فوق رابط أو جزء من واجهة المستخدم التي تنقلها إلى صفحة منفصلة. يمكن أن يبدأ المتصفح في جلب المحتوى للرابط بمجرد وجود مؤشر واضح على الاهتمام. هذا هو النهج الذي اتبعته مكتبات JavaScript مثل InstantClick.

المخاطر

استهلاك البيانات

كما هو الحال مع أي آلية للمحتوى الجاهز في وقت مبكر ، يجب التعامل مع هذا بعناية فائقة. قد لا يقدر مستخدم في خطة بيانات مقيدة أو يستفيد كثيرًا من الصفحات التي يتم جلبها في وقت مبكر ، وخاصة إذا بدأوا في تناول بياناتهم. هناك آليات يمكن أن يأخذها الموقع/الحل ليكون على دراية بهذا القلق ، مثل احترام رأس الحفظ.

مسبقات صفحات غير مرغوب فيها

من المحتمل أن تكون الروابط المسبقة لصفحات "تسجيل الخروج" غير مرغوب فيها. يمكن قول الشيء نفسه عن أي صفحات تؤدي إلى إجراء إجراء على تحميل الصفحة (مثل الشراء بنقرة واحدة). قد ترغب الحلول في إدراج قائمة سوداء بعنوان URL والتي لا يتم تجريدها من قبل لزيادة احتمال أن تكون صفحة مجسمة مسبقًا مفيدة.

معايير الويب

مستقبل rel = prerender

اعتمدت بعض المحاولات لإنجاز مقترحات مماثلة في الماضي على <link rel=prerender> . يستكشف فريق Chrome حاليًا إهمال Rel = prerender لصالح NostatePrefetch - نسخة أخف من هذه الآلية التي لا تحتوي إلا على ذاكرة التخزين المؤقت HTTP ولكنها لا تستخدم حالة أخرى من نظام الويب. يجب أن يتحول الحل إلى ما إذا كان سيعتمد على الاستبدال إلى rel = prerender أو باستخدام مقاربات مسبقة/مسبق/غيرها من الأساليب.

هناك نوعان من الاختلافات الرئيسية بين NostatePrefetch و preft:

brefetch nostate هي آلية ، و <link rel=prefetch> هي واجهة برمجة التطبيقات. يمكن طلب prefetch من خلال نقاط الدخول الأخرى: التنبؤ Omnibox ، علامات التبويب المخصصة ، <link rel=prerender> .
التنفيذ مختلف: <link rel=prefetch> يسبق مورد واحد ، ولكن إعادة صياغة النزوح على رأس ذلك يدير الماسح الضوئي المسبق على المورد (في عارض جديد جديد) ، يكتشف resources و presfetting لهم أيضًا (دون أن تتكرر في الماسح الضوئي المسبق).

تحليلات البيانات ذات الصلة

هناك ثلاثة أنواع أساسية من تحليلات البيانات التي تستحق أن تكون على دراية بها في مساحة المشكلة هذه: وصفية وتنبؤية وصفية. كل نوع مرتبط ومساعدة فرق الاستفادة من أنواع مختلفة من البصيرة.

وصفية - ماذا حدث؟

يلخص التحليلات الوصفية البيانات الخام وتحويلها إلى شيء يمكن تفسيره من قبل البشر. يمكن أن ينظر إلى الأحداث الماضية ، بغض النظر عن متى حدثت الأحداث. تسمح التحليلات الوصفية للفرق بالتعلم من السلوكيات السابقة ، وهذا يمكن أن يساعدهم على التأثير على النتائج المستقبلية. يمكن أن تحدد التحليلات الوصفية الصفحات التي شاهدها مستخدمو الموقع سابقًا وما هي مسارات التنقل التي اتخذوها في ضوء أي صفحة إدخال معينة.

التنبؤية - ماذا سيحدث؟

التحليلات التنبؤية "تتنبأ" بما يمكن أن يحدث بعد ذلك. تساعدنا التحليلات التنبؤية على فهم المستقبل وتمنح الفرق رؤى قابلة للتنفيذ باستخدام البيانات. ويوفر تقديرات لاحتمال أن تكون نتيجة مستقبلية مفيدة. من المهم أن تضع في اعتبارك أن القليل من الخوارزميات يمكن أن تتنبأ بالأحداث المستقبلية بدقة كاملة ، ولكن يمكننا استخدام أكبر عدد ممكن من الإشارات المتاحة لنا للمساعدة في تحسين دقة خط الأساس. يعتمد أساس التحليلات التنبؤية على الاحتمالات التي نحددها من البيانات. يمكن أن تتنبأ التحليلات التنبؤية بالصفحة التالية أو مجموعة الصفحات التي من المحتمل أن يزورها المستخدم في ظل صفحة إدخال تعسفية.

الإلزام - ماذا يجب أن نفعل؟

تتيح التحليلات الإلزامية وصف الإجراءات المحتملة المختلفة للتوجيه نحو حل ما. توفر التحليلات الإلزامية المشورة ، ومحاولة تحديد تأثير القرارات المستقبلية التي قد تضطر إلى تقديم المشورة بشأن النتائج المحتملة قبل اتخاذ هذه القرارات. يهدف التحليلات الإلزامية إلى عدم التنبؤ فقط بما سيحدث ولكنه يسير أبعد من ذلك ؛ إبلاغ سبب حدوث ذلك وتقديم توصيات حول الإجراءات التي يمكن أن تستفيد من هذه التنبؤات. يمكن أن تتنبأ التحليلات الإلزامية بالصفحة التالية التي سيزورها المستخدم ، ولكنها تقترح أيضًا إجراءات مثل إبلاغك بطرق يمكنك تخصيص خبرتهم للاستفادة من هذه المعرفة.

نماذج التنبؤ ذات الصلة

نماذج ماركوف

الهدف الرئيسي لنموذج التنبؤ في مساحة مشكلة الإذابة المسبقة هو تحديد الطلبات اللاحقة التي قد يحتاجها المستخدم ، بالنظر إلى طلب صفحة محدد. يتيح هذا لخادم أو عميل تقديم مسبقًا للمجموعة التالية من الصفحات ومحاولة التأكد من وجودها في ذاكرة التخزين المؤقت للمستخدم قبل الانتقال مباشرة إلى الصفحة. الفكرة هي تقليل وقت التحميل بشكل عام. عندما يتم تنفيذ ذلك بعناية ، يمكن لهذه التقنية أن تقلل من أوقات الوصول إلى الصفحة والكمون ، مما يحسن تجربة المستخدم الإجمالية.

تم استخدام نماذج Markov على نطاق واسع للبحث وفهم عملية الاستوكاستك (توزيع الاحتمالات العشوائي) [المرجع ، المرجع]. لقد ثبت أنها مناسبة بشكل جيد للنمذجة والتنبؤ بسلوك التصفح للمستخدم. تميل مدخلات هذه المشكلات إلى تسلسل صفحات الويب التي يتم الوصول إليها من قبل مستخدم أو مجموعة من المستخدمين (على مستوى الموقع) بهدف إنشاء نماذج Markov التي يمكننا استخدامها لتصوير الصفحات التي يمكن للمستخدم الوصول إليها بعد ذلك. تحتوي عملية Markov على ولايات تمثل الصفحات التي تم الوصول إليها وحواف تمثل احتمالات الانتقال بين الحالات التي يتم حسابها من تسلسل معين في سجل التحليلات. يمكن استخدام نموذج ماركوف المدربين للتنبؤ بالدولة التالية التي تم إعطاؤها مجموعة من الحالات السابقة.

في بعض التطبيقات ، ليست نماذج Markov من الدرجة الأولى دقيقة في التنبؤ بسلوكيات تصفح المستخدم لأنها لا تبحث دائمًا في الماضي لإثارة التمييز بين الأنماط المختلفة التي لوحظت. هذا هو أحد أسباب استخدام النماذج ذات الترتيب الأعلى. هذه النماذج ذات الترتيب الأعلى لها قيود مع تعقيد الفضاء الحكومي ، وتغطية أقل واسعة وأحيانًا انخفاض دقة التنبؤ.

نموذج ماركوف من طراز Kth

إحدى الطرق [المرجع] للتغلب على هذه المشكلة هي تدريب نماذج ماركوف المختلفة ، والتي نستخدمها بعد ذلك خلال مرحلة التنبؤ. تمت محاولة هذا في نموذج ماركوف من كل KTH المقترح في هذا المرجع. هذا يمكن أن يجعل تعقيد فضاء الدولة أسوأ. هناك طريقة أخرى تتمثل في تحديد أنماط الوصول المتكررة (أطول تكرار متكرر) واستخدام هذه المجموعة من التسلسلات للتنبؤات. على الرغم من أن هذا النهج يمكن أن يكون له ترتيب الحد من الحجم على تعقيد مساحة الحالة ، إلا أنه يمكن أن يقلل من دقة التنبؤ.

نماذج ماركوف الانتقائية

كما تم اقتراح نماذج ماركوف الانتقائية (SMM) التي تخزن بعض الولايات داخل النموذج فقط كحل لمقايضات تعقيد الفضاء الحكومي. يبدأون بنموذج ماركوف من طراز KTH-يتم بعد ذلك استخدام نهج ما بعد التقديم لتوبيخ الحالات التي ليس من المتوقع أن تكون تنبؤات دقيقة. نتيجة هذا هو نموذج له نفس قوة التنبؤ لنماذج الترتيب بالكامل مع تعقيد الفضاء أقل ودقة تنبؤ أعلى. في Deshpane و Karpis ، يتم النظر في معايير مختلفة لتوبيخ الدول في النموذج قبل التنبؤ (التردد ، الثقة ، الخطأ).

نماذج ماركوف الانتقائية الدلالية

في Mabroukeh و Ezeife ، تمت دراسة أداء نماذج Markov من الدرجة الأولى والثانية ومقارنتها مع SMM ذات الترتيب العالي و SMM الدلالي. واكتشفوا أن SMM المربى الدلالي لها حجم أصغر بنسبة 16 ٪ من SMM المربى بالتردد ويوفر دقة متساوية تقريبًا.

التجميع

يمكن أن تسمح لنا مراقبة أنماط التنقل بتحليل سلوك المستخدم. يتطلب هذا النهج الوصول إلى تحديد جلسة المستخدم ، وجلسات التجميع في مجموعات مماثلة وتطوير نموذج للتنبؤ باستخدام أنماط الوصول الحالية والمبكرة. اعتمد الكثير من الأعمال السابقة في هذا المجال على مخططات التجميع مثل تقنية التجميع K-Means مع المسافة الإقليدية لتحسين ثقة التنبؤات. أحد العيوب التي تعاني من استخدام K-Means هي صعوبة تحديد عدد المجموعات ، واختيار المركز العشوائي الأولي وترتيب زيارات الصفحة لا يتم النظر فيه دائمًا. قام Kumar et al بالتحقيق في هذا ، حيث اقترح تقنية التجميع الهرمية مع مسافة Levenshtein المعدلة ، Pagerank باستخدام طول وقت الوصول ، وتردد نماذج Markov عالية الترتيب للتنبؤ.

مراجعة البحث

تتركز العديد من الأوراق المشار إليها في القسم التالي حول نموذج ماركوف وقواعد الارتباط والتجميع. الأوراق التي تسلط الضوء على العمل ذي الصلة المتعلقة باكتشاف الأنماط لتطوير دقة التنبؤ بالصفحة هي محورنا.

Sarukkai [2000] "تنبؤ الارتباط وتحليل المسار باستخدام سلاسل ماركوف".

يستخدم نماذج ماركوف من الدرجة الأولى لتصميم تسلسل صفحات الويب المطلوبة من قبل المستخدم للتنبؤ بالصفحة التالية التي من المحتمل أن تصل إليها. تسمح سلاسل ماركوف للنظام بنمذجة أنماط الوصول إلى عنوان URL ديناميكيًا لوحظ في سجلات التنقل بناءً على الحالة السابقة. يتم تدريب نموذج ماركوف "مخصص" لكل مستخدم ويستخدم للتنبؤ بجلسات المستخدم المستقبلية. في الممارسة العملية ، من المكلف للغاية إنشاء نموذج فريد لكل مستخدم وتصبح تكلفة تحجيم هذا أكثر تحديا عندما يكون لدى الموقع قاعدة مستخدم كبيرة.

Chun-jung Lin [2005] "باستخدام نموذج Markov المخفي للتنبؤ بنية مستخدم الأمواج لشراء الإنترنت على الويب"

أول ورقة للتحقيق في نماذج ماركوف المخفية (HMM). جمع المؤلف سجلات خادم الويب ، وقام بتشذيب البيانات وقام بتصحيح المسارات التي يمررها المستخدمون. استنادًا إلى HMM ، قام المؤلف ببناء نموذج محدد لتصفح الويب يتوقع ما إذا كان لدى المستخدمين نية الشراء في الوقت الفعلي. التدابير ذات الصلة ، مثل تسريع العملية وتأثيرها عند التحقيق في وضع الشراء.

Elli Voudigari [2010-2011] "إطار للتنبؤ بتصنيف صفحة الويب".

يقترح إطار عمل للتنبؤ بمواقف تصنيف صفحة بناءً على تصنيفاتها السابقة. بافتراض مجموعة من التصنيفات المتتالية من أفضل K ، يحدد المؤلف المتنبئين بناءً على منهجيات مختلفة. يتم قياس جودة التنبؤ على أنها التشابه بين التصنيفات المتوقعة والفعلية. تم إجراء تجارب شاملة على مجموعة بيانات واسعة النطاق في العالم الحقيقي لكل من التصنيف العالمي والمعتمد على الاستعلام. مجموعة متنوعة من مقاييس التشابه الحالية لمقارنة القوائم المرتبة العليا بما في ذلك واحدة جديدة تم التقاطها في الورقة.

MOGUL [1996] "استخدام الجذور السابقة للتنبؤ بتحسين زمن الوصول على شبكة الإنترنت العالمي".

يقترح استخدام نماذج N-HOP Markov للتنبؤ بالوصول إلى صفحة الويب التالية من المحتمل أن يصلوا. يطابق النمط تسلسل الوصول الحالي للمستخدم مع تسلسل الوصول إلى الويب التاريخي للمستخدم لتحسين دقة التنبؤ للأحزاب المسبقة.

Borges ، Levene [2007] "تقييم نماذج سلسلة Markov المتغيرة الطول لتحليل جلسات التنقل على الويب للمستخدم".

يقترح طرق ديناميكية قائمة على التجميع لزيادة دقة نموذج ماركوف في تمثيل مجموعة من جلسات التنقل على الويب. يستخدم مفهوم استنساخ الدولة لتكرار الدول بطريقة تفصل بين الروابط التي تتباعد احتمالات الترتيب الثاني المقابلة. تتضمن الطريقة المقترحة تقنية التجميع التي تحدد طريقة لتعيين الروابط مع احتمالات من الدرجة الثانية مماثلة لنفس الاستنساخ.

Banu Deniz Gunel [2010] "التحقيق في تأثير المدة وحجم الصفحة والتردد في توصية الصفحة التالية مع خوارزمية تصنيف الصفحة".

يمتد استخدام خوارزمية تصنيف الصفحة مع العديد من السمات الملاحية: حجم الصفحة ، ووقت مدة الصفحة ، ومدة الانتقال (زيارتين من صفحتين متتابعين) ، وتيرة الصفحة والانتقال. يحدد الرتبة المستندة إلى المدة (DPR) ورتبة الصفحة القائمة على الشعبية (PPR). نظر المؤلف في شعبية التحولات والصفحات باستخدام معلومات المدة ، باستخدامها بحجم الصفحة وزيارة التردد. باستخدام قيمة شعبية الصفحات ، تحاول هذه الورقة تحسين خوارزميات تصنيف الصفحات التقليدية ونموذج التنبؤ بالصفحة التالية بموجب قيمة من أعلى إلى أعلى.