تجربة محرك بحث سلس RSS مع تلميح من التعلم الآلي.
يمكن تنزيل تفريغ SQL لقاعدة البيانات التي تحتوي على أكثر من 3 ملايين إدخال تم استخلاصها منذ أكثر من عام على https://davidesantangelo.gumroad.com/l/nkyymb
Dato.rss في الإصدار التجريبي ، ومن المحتمل أن ترى العديد من التغييرات في المستقبل القريب.
إذا كان لديك تعليقات أو اقتراحات ، فيرجى إرسالها إلينا باستخدام علامة التبويب "المشكلات".
شكرا لمحاولة الإصدار التجريبي!
محرك البحث: ابحث بسرعة من خلال ملايين خلاصات RSS المتاحة.
API Restful: يحول بيانات التغذية إلى واجهة برمجة تطبيقات رائعة. تبسط API كيفية التعامل مع RSS أو Atom أو JSON. يمكنك إضافة وتتبع بيانات التغذية المفضلة لديك مع واجهة برمجة تطبيقات بسيطة وسريعة ونظيفة. يتم إثراء جميع الإدخالات من خلال التعلم الآلي والمحركات الدلالية.
curl ' https://<yourhost>/api/searches?q=news ' | json_pp
{
" data " : [
{
" id " : " 86b0f829-e300-4eef-82e1-82f34d03aff6 " ,
" type " : " entry " ,
" attributes " : {
" title " : " " Pandemic, Infodemic " : 2 Cartoon Characters Battling Fake News In Assam " ,
" url " : " https://www.ndtv.com/india-news/coronavirus-pandemic-infodemic-2-cartoon-characters-battling-fake-news-in-assam-2222333 " ,
" published_at " : 1588448805,
" body " : " An English daily in Assam's Guwahati has been publishing a cartoon strip to tackle the fake news related to the coronavirus pandemic. The two central characters- " Pandemic and Infodemic " - are being...<img src= " http://feeds.feedburner.com/~r/NDTV-LatestNews/~4/lEmH201Q8jI " height= " 1 " width= " 1 " alt= "" /> " ,
" text " : " An English daily in Assam's Guwahati has been publishing a cartoon strip to tackle the fake news related to the coronavirus pandemic. The two central characters- " Pandemic and Infodemic " - are being... " ,
" categories " : [
" all india "
],
" sentiment " : null,
" parent " : {
" id " : " c97bdae6-b5d1-4966-b9f3-615e29d4d47d " ,
" title " : " NDTV News - Special " ,
" url " : " feed:http://feeds.feedburner.com/NDTV-LatestNews " ,
" rank " : 99
},
" tags " : []
},
" relationships " : {
" feed " : {
" data " : {
" id " : " c97bdae6-b5d1-4966-b9f3-615e29d4d47d " ,
" type " : " feed "
}
}
}
},
]
}
يتم تنفيذ البحث للتو مع ميزة البحث الكامل للبحث عن النص.
لقد استخدمت جوهرة PG_Search ، والتي يمكن استخدامها بطريقتين:
البحث المتعدد: ابحث عبر نماذج متعددة وإرجاع مجموعة واحدة من النتائج. تخيل وجود ثلاثة نماذج: المنتج والعلامة التجارية والمراجعة. باستخدام بحث متعدد ، يمكننا البحث عبرها جميعًا في نفس الوقت ، ورؤية مجموعة واحدة من نتائج البحث. سيكون هذا مثاليًا لإضافة وظائف البحث الفدرالية إلى تطبيقك.
نطاق البحث: ابحث في نموذج واحد ، ولكن مع مرونة أكبر.
execute << - SQL
ALTER TABLE entries
ADD COLUMN searchable tsvector GENERATED ALWAYS AS (
setweight(to_tsvector( ' simple ' , coalesce(title, ' ' )), ' A ' ) ||
setweight(to_tsvector( ' simple ' , coalesce(body, ' ' )), ' B ' ) ||
setweight(to_tsvector( ' simple ' , coalesce(url, ' ' )), ' C ' )
) STORED;
SQLيتم توفير ترتيب التغذية بواسطة OpenRank مقياس سلطة مجال الجذر المجاني بناءً على مجموعة بيانات البحث الشائعة. القيمة مميزة بواسطة
( ( Math . log10 ( domain_rank ) / Math . log10 ( 100 ) ) * 100 ) . round يتم توفير التعلم الآلي بواسطة تحليلات النص الدلالي API Dandelion كخدمة ، من النص إلى بيانات قابلة للتنفيذ. استخراج المعنى من النص غير المنظم ووضعه في سياق مع واجهة برمجة تطبيقات بسيطة.
يمكنك إضافة العديد من الخلاصات كما تريد حتى يتم التعامل مع الزاحف التلقائي.
https: /// feeds/new
جميع وثائق API موجودة في قسم الويكي. لا تتردد في جعلها أفضل ، بالطبع.
https://github.com/davidesantangelo/dato.rss/wiki
لاستخدام بعض الميزات مثل إضافة تغذية جديدة تحتاج إلى رمز مع إذن الكتابة . حاليا فقط يمكنني تمكينه. في حالة الاتصال بي
بالإضافة إلى الكثير من جواهر Ruby ، قائمة كاملة منها في /main /gemfile.
إذا كنت تريد أن تدعمني في تكاليف الخادم للحفاظ على Dato.ess مجانًا وأعلى ، ففكر في الرعاية! شكرًا!
راعي جيثب
يتم الترحيب بتقارير الأخطاء وطلبات السحب على Github على https://github.com/davidesantantangelo/dato.rss. يهدف هذا المشروع إلى أن يكون مساحة آمنة ومرحبة للتعاون ، ومن المتوقع أن يلتزم المساهمون بقواعد سلوك العهد المساهم.
الجوهرة متوفرة كمصدر مفتوح بموجب شروط ترخيص معهد ماساتشوستس للتكنولوجيا.