قاعدة بيانات الارتباط الشخصية ، مجمع الارتباط ، مع وظائف RSS.
استخدام الحالات
- قارئ RSS
- مدير إشارة مرجعية
- مدير ارتباط يوتيوب ، الواجهة الأمامية
- محرك بحث بسيط جدا
- تحليل البيانات - تحليل تعفن الارتباط ، كم عدد الصفحة التي يتم ذكرها بواسطة مصادر أخرى ، وتحليل مجالات الارتباط ، إلخ.
سمات
عام
- إدارة الإشارات المرجعية ، مع العلامات ، ودعم التعليقات
- دعم "المساحات". يمكنك تحديد مساحات خاصة مثل "الموسيقى" ، "مقاطع الفيديو" ، "الأفلام" ، إلخ.
- تحليلات إدخال الكلمات الرئيسية للعثور على الاتجاهات
- وضع الضوء والوضع المظلم
- الصادرات التلقائية
- الوصول إلى عدة مستخدمين
- وضع كشك. تحديث تلقائي عندما يتم إلحاق عنوان URL باستخدام Param "refresh"
خدمات
- دعم تغذية RSS: يدعم YouTube RSS ، Reddit RSS ، Odysee ، OpenRSS
- دعم للصفحات المؤرشفة من خلال InternetArchive ، أو أي وسيلة أرشيف تم تكوينها
- دعم جيثب. صادرات. على سبيل المثال نطاقات الإنترنت والمستخدمين والمشاريع
- youtube تنزيل دعم من خلال مشروع YT-DLP
الزحف
- بعض قدرات الزحف على الإنترنت
- البحث الرابط. التنفيذ البسيط ، لا يستخدم البحث المرن
- لا يدعم دوران الوكيل. هذا مكشطة ويب أخلاقية ، لا ينبغي أن يتم البريد العشوائي مع الطلبات
- عوامل المستخدم القابلة للتكوين ، الزحف ، السيلينيوم ، الطلبات ، الكروم غير المكتشفة ، الزحف ، يمكن تمديده بسهولة
خصوصية
- البيانات المحلية ، لا خوارزميات ، لا إعلانات ، مستضافة ذاتيا
- تتبع إجراء المستخدم. يمكنك مراقبة وتحليل تاريخ "وجهات نظرك" ، "عمليات البحث" ، "التعليقات" ، "التصفح التاريخ"
مجموعة من المشاريع
- روابط مرجعية
- نطاقات الإنترنت والمستخدمين والمشاريع
- مستودع RSS GIT اليومي لعام 2024
- مستودع RSS GIT اليومي لعام 2023
- مستودع RSS GIT اليومي لعام 2022
- مستودع RSS GIT اليومي لعام 2021
- مستودع RSS GIT اليومي لعام 2020
الروابط
- لقطات الشاشة
- التثبيت ، التكوين
- https://renegat0x0.ddns.net/apps/catalog/ - مثيل يبدو وكأنه استبدال يوتيوب
- https://renegat0x0.ddns.net/apps/various/ - مثيل تجريبي ، والذي يحتوي على أشياء مختلفة
- ملاحظات حول صناعة البحث
- تحليل البيانات
- تطوير
بدائل
برامج بديلة لوضع إشارة مرجعية موجودة.
Hoarder ، Grimoire ، Barkmarkos ، Raindrop ، Linkace ، Ggather ، Zotero ، Onekeep ، Lasso ، Carrylinks ، Zlinky ، Wakelet ، Booky ، Webtag ، Idence ، Knowies
قائمة awasome في جيثب.
كيف تعمل؟
- يقرأ النظام "مصادر" بانتظام
- يتم فحص كل "مصدر" بانتظام للحصول على بيانات جديدة. خلاصات RSS هي نوع واحد من المصدر
- يتم إدراج روابط جديدة في قاعدة البيانات
- كل يوم يمكن تصدير الإشارات المرجعية الخاصة بك إلى مستودع ، إذا تم تكوينه
- يتم استخدام الروابط الجديدة لملء "الكلمات الرئيسية" الشائعة
خوارزمية الترتيب
يتم تصنيف كل صفحة بعدة عوامل.
- تصنيف المحتوى. [0..100] المدى
- المستخدمين أصوات. [-100..100] المدى
النتيجة متساوية وفقا للحساب
- تصنيف الصفحة = تصنيف المحتوى + أصوات المستخدمين
تصنيف المحتوى
للحصول على تصنيف جيد للصفحة ، من المستحسن اتباع معايير جيدة:
- التحقق من المخطط
- W3C التحقق
- توفير معلومات التعريف HTML. مزيد من المعلومات في بروتوكول الرسم البياني المفتوح
- توفير عنوان صالح ، وهو موجز ، ولكن ليس قصيرًا جدًا
- تقديم وصف صالح ، وهو موجز ، ولكن ليس قصيرًا جدًا
- تقديم تاريخ نشر صالح
- تقديم صورة مصغرة صالحة ، صورة الوسائط
- توفير رمز حالة HTML صالح. لا توجد إعادة توجيه خيالية ، يعيد توجيه جافا سكريبت
- توفير تغذية RSS. توفير معلومات meta html لها https://www.petefreitag.com/blog/rss-autodiscovery/
- توفير علامات الكلمات الرئيسية محرك البحث
صفحتك ، يوجد نطاق جنبا إلى جنب مع الآلاف من الصفحات الأخرى. تخيل أن بيانات التعريف الخاصة بك لها تأثير على تقديرك ، وترتيب الصفحة.
تذكر: صفحة جيدة دائمًا في المرتبة أعلى.
قد تتساءل ، لماذا أكتب عن حقل META "الكلمات الرئيسية" لمحرك البحث ، إذا لم تكن Google بحاجة إليها. حسنًا ، أنا لا أحب Google. إذا كنا نريد وجود حلول بديلة ، فيجب أن يكون من الممكن العثور بسهولة على صفحتك من محركات البحث البسيطة. توفير حقل الكلمات الرئيسية إذا كنت تدعم الويب المفتوح.
تصويت التصنيف
تتم إدارة قاعدة البيانات بواسطة قاعدة بيانات رابط RSS ، وأصوات المستخدم. يتم حساب متوسط الأصوات لكل رابط.
يصدّر
هناك العديد من أنواع التصدير. يمكن تصدير البيانات كل يوم.
تدعم الصادرات بنية ملف JSON.
نحافظ على بعض البيانات ، لكنها ليست استبدال Archive.org. نقوم بتخزين بيانات التعريف فقط حول صفحات الويب: العنوان ، الوصف ، الصورة المصغرة.
تحتوي معظم المشاهدات على زر "show json" الذي يوفر بيانات العرض باسم JSON. يمكن استخدام هذا بواسطة البرامج النصية ، للاستيراد ، التصدير.
أنواع الصادرات:
- البيانات اليومية - كل يوم له دليل خاص به
- البيانات السنوية - كل عام يحمل المعلومات بشكل منفصل
- البيانات غير المرتبطة بالوقت - البيانات في دلائل منفصلة ، وليست مرتبطة بالوقت
يستورد
القيام به من قبل لوحة المسؤول. يمكن استخدام ملفات بيانات JSON للواردات ، أو تطبيقات Django-Link-Arkive الأخرى [قيد الإنشاء].
مفاتيح API
يمكن للمسؤول إنشاء مفاتيح API لعدم تسجيل الدخول للوصول إلى المحتويات.
شكل:
https://yourpage.com/your-app/index?key=yourgeneratedkey
تاريخ
يمكنك الحفاظ على تاريخ تصفح الويب الخاص بك محليًا. ننسى تاريخ المتصفح أو الإشارات المرجعية.
من خلال هذا الحل المستضيف ، لا تحتاج إلى مزامنة أي شيء ، حيث يوجد كل شيء على هذا الخادم.
نسيان تاريخ تصفح الفيديو على YouTube أو الاشتراكات. يمكنك التحكم في ما تراه ومتى!
البرامج النصية
يمكن أيضًا استخدام وظائف التنقل على الويب بدون Django.
هناك بعض البرامج النصية التي يمكن استخدامها بدون تطبيق Django:
- yafr.py - قارئ تغذية آخر ، عميل سطر الأوامر
- page_props.py - أدوات سطر الأوامر التي تعرض خصائص الصفحة
- example_page_crawler.py - مثال البرنامج النصي الذي يمكن أن يزحف عبر صفحة الويب
- example_compare_crawlers.py - يوضح مقدار الوقت الذي يستغرقه تنفيذ زحف مختلف
- Converter.py - يحول ملفات JSON إلى جدول SQLITE
- DataAnalyzer.py - تحليل البيانات في ملفات JSON / جدول SQLite. يمكنك الاستعلام عن البيانات
- script_server.py - الخادم الذي يمكن استخدامه لإرسال زحف لبعض عناوين URL ، للحصول على بيانات التعريف
- script_client.py - العميل الذي يمكن استخدامه للاتصال بالخادم ، وتصحيح البرامج النصية للزاحف
- Workspace.py - إدارة مساحة العمل. يمكن استخدامها لتحديث المشروع
- backup.py - البرنامج النصي إلى النسخ الاحتياطي لبيانات postgresql
سهولة التنقل
تم إنشاء هذا المشروع لإعطاء libary من الملاحة. لذلك من رابط يجب أن يكون هناك التنقل إلى أماكن أخرى:
- جوجل
- محركات البحث الأخرى ، ويكيبيديا ، إلخ
- رابط إلى أرشيف الإنترنت ، إلخ.
حتى إذا قامت Google بتنفيذ روابط لأرشيف الإنترنت ، أو تقدم معظم هذه الميزات ، فيجب علينا مواصلة عملنا على هذا ، لأننا لا نعرف أبدًا متى تقرر الشركة عدم دعمها.
موحدة [قيد الإنشاء]
هذا المشروع متدرب. لذلك يمكنك الاعتماد على البيانات من مثيلات غانغ-ارتباط أخرى.
أنت تستطيع:
- حدد مصدر الوكيل للاستيراد التلقائي من مثيل أرشيف الارتباط الآخر
- استيراد الروابط يدويًا من مثيل أرشيف ارتباط آخر ، أو
مصادر وكيل [قيد الإنشاء]
أولاً ، يتيح تحديد سيناريو. لديك مثيل A والمثال B. مثيل B قد حدد مصدرًا.
لا تريد مثيل A لجلب نفس البيانات من الإنترنت. ترغب في جلب البيانات من المثيل ب.
للقيام بذلك:
- انتقل إلى المصادر B.
- ابحث عن المصدر المطلوب.
- انقر فوق "إظهار json" (نسخة نسخة من هذا العنوان)
- انتقل على الحالة أ إلى مصادر.
- أضف مصدرًا جديدًا
- الصق عنوان المثيل B ، رابط عنوان JSON
- يجب أن يقترح النظام نوع المصدر ليكون من JSON
إدارة المستخدم [قيد الإنشاء]
يستخدم المشروع وحدة مصادقة المستخدم الافتراضية.
خريطة الطريق للعبة نهاية.
- في البداية ، يمكن للمسؤول إضافة مستخدمين جدد. لتشغيل مثيل الاتصال المسؤول
- لا تنشئ كلمات مرور ، يتم إنشاؤها لك ، مع تعقيد مناسب. من فضلك اكتبها
- اتصل بالمستخدمين الآخرين ، يمكن للمستخدمين الآخرين أيضًا إضافة مستخدمين جدد ، إذا سمحت Karma بذلك
تأثير الكرمة على المستخدم:
- إذا انخفض الكرمة الخاصة بك إلى 0 تم حظر حسابك
- بعد عتبة معينة ، يمكنك تقديم روابط جديدة
- بعد عتبة معينة يمكنك تقديم التعليقات
- بعد عتبة معينة ، يمكنك رفع التصويت والتعليقات المنخفضة
- بعد حد معين ، تقوم بإنشاء مستخدمين (1 في اليوم)
ما الذي يسبب تغيير الكرمة:
- المسؤول ، أو المشرفين
- إضافة تصويت للرابط
- upvotes ، أو downvotes على التعليقات
- حظر المستخدمين الآخرين الذين دعوتهم
يتم تتبع إجراءات المستخدم بواسطة النظام ، فقط إذا تم تكوينه على ذلك:
- يمكن للمستخدمين نشر تعليقات للإدخالات
- يمكن للمستخدمين وضع علامة على الإدخالات
- يمكن للمستخدمين التصويت لصالح الإدخالات
- متاجر النظام محدودة من استعلامات البحث ، يمكن للمستخدم تحديد الاستعلامات السابقة من ComboBox
- متاجر النظام ترتيب الزيارات على الإدخالات. هذا يسمح بتوفير قسم "ذات صلة" لكل إدخال. على سبيل المثال ، إذا قمت بإدخال الإدخال "X" بعد "Y" ، فسيظهر "X" في القسم "Y" ذي الصلة
الأساس المنطقي
توجد العديد من البرامج ، لكن معظمها لديهم بعض القيود.
- الترخيص: بعض العملاء ليسوا مفتوح المصدر ، أو ليس مفتوحًا تمامًا (على سبيل المثال Reddit). بعض البرامج ليست برامج من منظور المستخدمين ، ولكنها خدمة: تغذية ، جيوب ، قارئ Readwise. أنها تتطلب حساب. يمكن أن تتغير شروطهم وخدمتهم
- الواجهة: معظم برامج RSS هي واجهة المستخدم الرسومية: Thunderbird ، Feeder. أردت صفحة ويب ، تطبيق يمكن الوصول إليه من أي مكان
- القدرة المفقودة على البحث (تطبيق NextCloud "News" ، Thunderbird ، تطبيق Android Feeder ، تطبيق Newsboat Linux)
- دعم العلامة المفقود (Thunderbird ، Android Feeder App)
- بعض البرامج لا توفر تصنيف الارتباط
- الاستيراد / التصدير: لا توفر معظم البرامج طريقة سهلة للقيام بذلك (أريد ملفات JSON!)
- المقياس: بعض المشاريع كبيرة. يركز هذا المشروع على توفير تجربة "مستخدم واحد". لا أريد العديد من التبعيات هنا
- الهدف: Reddit ، Lemmy AIM هو توفير تجربة التواصل الاجتماعي ، يهدف هذا المشروع إلى منح القدرة على إنشاء قاعدة بيانات للروابط
ملاحظات إضافية
ما الذي يطحن التروس الخاص بي؟
- لا توفر Google طريقة سهلة لمشاهدة الموقع المخطط مؤقتًا ، مثل Archive.org. لديهم ، إنهم فقط لا يسمحون لك بالوصول إليه
- ليس من السهل اكتشاف أماكن جديدة على الإنترنت. متى وجدت أي موقع "جديد" يستحق المشاهدة؟ مدونة؟ الموقع الشخصي؟ لدى Google فهرس مليارات الصفحات ، ومع ذلك يبدو الإنترنت فارغًا
- لن تكون صفحة الويب القديمة في المرتبة الأولى في Google Search
- لا يوجد زر في Google Search لترجمة رابط الوجهة
- يوفر YouTube قسم "ذات صلة" لمقاطع الفيديو. لماذا لا توفر Google قائمة ارتباط "ذات صلة" بالبحث؟
- من الصعب حقًا العثور على أي شيء عن Amiga أو Old Tech Stuff
- درايف الصفحة الأولى. نتيجة بحث Google الثانية مهمة. صفحة البحث في Google الثانية مهمة أيضًا. إذا بحثت عن "PHP" ، فهناك الآلاف من الأطر ، مشاريع تستحق المشاهدة. لماذا لا يمكنني العثور عليها بسهولة باستخدام بحث Google؟ نعطي بحث Google الكثير من الائتمان
archive.org:
- غير موثوق. في بعض الأحيان يصبح بطيئًا بشكل مؤلم. لا يزال أفضل من لا شيء
- تتم تغطية معظم وسائل الإعلام الرئيسية RSS ، لكن التغطية متقطعة. ليست كل الأيام مغطاة
- لا يوفر أرشيف الإنترنت (Archive.org) لقطات لكل يوم لجميع مصادر RSS. في بعض الأحيان بطيئة جدا. نود أن نتأكد من حدوث مثل هذه اللقطة. لذلك نحن بحاجة إلى تصدير الروابط إلى إعادة الريبو اليومية. يقدم تطبيق Django RSS أيضًا طلبات للأرشيف لصنع اللقطات
قانوني
- أنا لا أؤيد أي رابط كل رابط في قاعدة البيانات. قد تكون بعض الروابط مهمة بسبب مدى سوء المحتوى. أنا استخدم المفارقة في كثير من الأحيان ، وبالتالي احذر!
- كل شخص له الحق في نسيانه. إذا كان ينبغي إزالة أي رابط من قاعدة بيانات ، فيرجى الاتصال بي
- لا أحصل على أي شكل من أشكال التعويض النقدي من الارتباط ، أو بيانات حوله. تم توفير معلومات ارتباط البيانات بالفعل بواسطة مصادر RSS. مصدر RSS مسؤول عما يقدمونه مجانًا
إنهاء الملاحظات
جميع الروابط تنتمي إلينا!