
محرك البحث هو نظام برامج مصمم لتنفيذ عمليات البحث على الويب. يبحثون عن شبكة الويب العالمية بطريقة منهجية للحصول على معلومات معينة محددة في استعلام البحث عن الويب. يتم تقديم نتائج البحث عمومًا في مجموعة من النتائج ، وغالبًا ما يشار إليها باسم صفحات محرك البحث (SERPs) ، قد تكون المعلومات مزيجًا من الروابط إلى صفحات الويب والصور ومقاطع الفيديو والرسوم البيانية والمقالات والأوراق البحثية وأنواع أخرى من الملفات. بعض محركات البحث أيضا بيانات الألغام المتاحة في قواعد البيانات أو الدلائل المفتوحة. على عكس دلائل الويب ، التي لا يحتفظ بها المحررين البشريون إلا ، تحتفظ محركات البحث أيضًا بالمعلومات في الوقت الفعلي عن طريق تشغيل خوارزمية على زاحف على شبكة الإنترنت. يتم وصف محتوى الإنترنت غير القادر على البحث عن طريق محرك البحث على الويب عمومًا بأنه شبكة الويب العميقة.
يحافظ محرك البحث على العمليات التالية في الوقت الفعلي القريب:
تحصل محركات البحث على الويب على معلوماتها عن طريق تزحف الويب من موقع إلى آخر. يتحقق "العنكبوت" عن اسم الملف القياسي Robots.txt ، الموجود إليه. يحتوي ملف robots.txt على توجيهات لعناكب البحث ، ويخبره بالصفحات التي يزحف عليها والتي لا تتجول. بعد التحقق من Robots.txt وإما العثور عليه أم لا ، يرسل العنكبوت بعض المعلومات إلى فهرسة اعتمادًا على العديد من العوامل ، مثل العناوين ، محتوى الصفحة ، JavaScript ، أوراق نمط متتالية (CSS) ، العناوين ، أو بيانات التعريف الخاصة بها في علامات HTML Meta. بعد عدد معين من الصفحات ، تم الزحف ، أو كمية البيانات المفهرسة ، أو الوقت الذي تقضيه على الموقع الإلكتروني ، يتوقف العنكبوت عن الزحف ويتحرك. "[n] o قد يزحف الزاحف على شبكة الإنترنت بالكامل. نظرًا للمواقع الإلكترونية اللانهائية ، فإن مصائد العنكبوت ، والبريد العشوائي ، وغيرها من حالات الشبكة الحقيقية ، يطبق الزحف بدلاً من ذلك سياسة الزحف لتحديد متى يجب أن يُعتبر زحف الموقع ما يكفي.
الفهرسة تعني ربط الكلمات والرموز المحددة الأخرى الموجودة على صفحات الويب لأسماء النطاق الخاصة بهم وحقول HTML القائمة على HTML. يتم إجراء الجمعيات في قاعدة بيانات عامة ، توفر لاستفسارات البحث على الويب. يمكن أن يكون الاستعلام من المستخدم كلمة واحدة أو كلمات متعددة أو جملة. يساعد الفهرس في العثور على المعلومات المتعلقة بالاستعلام في أسرع وقت ممكن. بعض تقنيات الفهرسة ، والتخزين المؤقت هي أسرار تجارية ، في حين أن تزحف الويب هو عملية واضحة لزيارة جميع المواقع على أساس منهجي.
بين زيارات العنكبوت ، يتم إرسال النسخة المخزنة من الصفحة (بعض أو كل المحتوى اللازم لتقديمه) المخزنة في ذاكرة عمل محرك البحث إلى مستفسر. إذا تأخرت الزيارة ، فيمكن لمحرك البحث أن يكون بمثابة وكيل ويب بدلاً من ذلك. في هذه الحالة ، قد تختلف الصفحة عن مصطلحات البحث المفهرسة. تحتوي الصفحة المخزنة مؤقتًا على ظهور الإصدار الذي تم فهرسة كلماته مسبقًا ، وبالتالي يمكن أن تكون النسخة المخزنة مؤقتًا من الصفحة مفيدة لموقع الويب عند فقدان الصفحة الفعلية ، ولكن تعتبر هذه المشكلة أيضًا شكلًا معتدلًا من Linkrot.
عادةً عندما يدخل المستخدم إلى استعلام في محرك بحث ، يكون بعض الكلمات الرئيسية. يحتوي الفهرس بالفعل على أسماء المواقع التي تحتوي على الكلمات الرئيسية ، ويتم الحصول عليها على الفور من الفهرس. يتم تحميل المعالجة الحقيقية في إنشاء صفحات الويب التي هي قائمة نتائج البحث: يجب مرجح كل صفحة في القائمة بأكملها وفقًا للمعلومات الواردة في الفهارس. ثم يتطلب عنصر نتيجة البحث العلوي البحث وإعادة الإعمار وتوصيف المقتطفات التي توضح سياق الكلمات الرئيسية المتطابقة. هذه ليست سوى جزء من المعالجة التي تتطلبها كل صفحة ويب لنتائج البحث ، وتتطلب المزيد من الصفحات (بجوار الجزء العلوي) المزيد من هذه المعالجة بعد المعالجة.
إلى جانب البحث عن الكلمات الرئيسية البسيطة ، تقدم محركات البحث عواملهم التي يحركها GUI-أو تعتمد على الأوامر ومعلمات البحث لتحسين نتائج البحث. توفر هذه الضوابط اللازمة للمستخدم الذي يشارك في حلقة التعليقات التي يتم إنشاؤها عن طريق التصفية والترجيح أثناء تحسين نتائج البحث ، بالنظر إلى الصفحات الأولية لنتائج البحث الأولى. على سبيل المثال ، من عام 2007 ، سمح محرك بحث Google.com بالتصفية حسب التاريخ من خلال النقر على "إظهار أدوات البحث" في أقصى اليسار من صفحة نتائج البحث الأولية ، ثم تحديد نطاق التاريخ المطلوب. من الممكن أيضًا الوزن حسب التاريخ لأن كل صفحة لديها وقت تعديل. تدعم معظم محركات البحث استخدام مشغلي Boolean ، أو وليس لمساعدة المستخدمين النهائيين على تحسين استعلام البحث. عوامل المشغلين المنطقية هي لعمليات البحث الحرفية التي تسمح للمستخدم بتحسين وتوسيع شروط البحث. يبحث المحرك عن الكلمات أو العبارات كما تم إدخالها تمامًا. توفر بعض محركات البحث ميزة متقدمة تسمى Search Evality ، والتي تتيح للمستخدمين تحديد المسافة بين الكلمات الرئيسية. هناك أيضًا بحث قائم على المفاهيم حيث يتضمن البحث استخدام تحليل إحصائي على الصفحات التي تحتوي على الكلمات أو العبارات التي تبحث عنها.
تعتمد فائدة محرك البحث على أهمية مجموعة النتيجة التي يعيدها. على الرغم من أنه قد يكون هناك ملايين صفحات الويب التي تتضمن كلمة أو عبارة معينة ، إلا أن بعض الصفحات قد تكون أكثر صلة أو شعبية أو موثوقة من غيرها. تستخدم معظم محركات البحث طرقًا لتصنيف النتائج لتوفير النتائج "الأفضل" أولاً. كيف يحرر محرك البحث الصفحات التي هي أفضل التطابقات ، والترتيب الذي يجب أن يتم عرض النتائج فيه ، يختلف اختلافًا كبيرًا من محرك إلى آخر. تتغير الأساليب أيضًا مع مرور الوقت مع تغيير استخدام الإنترنت وتتطور التقنيات الجديدة. هناك نوعان رئيسيان من محركات البحث التي تطورت: أحدهما هو نظام من الكلمات الرئيسية المحددة مسبقًا والمرتبة الهرمية التي برمجها البشر على نطاق واسع. والآخر هو نظام يولد "فهرس مقلوب" من خلال تحليل النصوص التي يحددها. يعتمد هذا النموذج الأول بشكل كبير على الكمبيوتر نفسه للقيام الجزء الأكبر من العمل.
معظم محركات البحث على الويب هي مشاريع تجارية مدعومة بإيرادات الإعلانات ، وبالتالي فإن بعضها يسمح للمعلنين بتصنيف قوائمهم أعلى في نتائج البحث مقابل رسوم. محركات البحث التي لا تقبل المال لنتائج البحث الخاصة بهم ، كسب المال عن طريق تشغيل الإعلانات ذات الصلة بالبحث إلى جانب نتائج محرك البحث العادي. محركات البحث تجني المال في كل مرة ينقر فيها شخص ما على أحد هذه الإعلانات.
.