ประสบการณ์เครื่องมือค้นหา RSS ที่ไร้รอยต่อด้วยคำใบ้ของการเรียนรู้ของเครื่อง
การถ่ายโอนข้อมูล SQL ของฐานข้อมูลที่มีการสกัดมากกว่า 3 ล้านรายการในกว่าหนึ่งปีสามารถดาวน์โหลดได้ที่ https://davidesantangelo.gumroad.com/l/nkyymb
dato.rss อยู่ในเบต้าและมีแนวโน้มที่จะเห็นการเปลี่ยนแปลงมากมายในอนาคตอันใกล้
หากคุณมีความคิดเห็นหรือข้อเสนอแนะโปรดส่งให้เราโดยใช้แท็บปัญหา
ขอบคุณที่ลองใช้เบต้า!
เครื่องมือค้นหา: ค้นหาฟีด RSS ที่พร้อมใช้งานได้อย่างรวดเร็ว
Restful API: เปลี่ยนข้อมูลฟีดเป็น API ที่ยอดเยี่ยม API ช่วยลดความซับซ้อนของวิธีการจัดการ RSS, Atom หรือ JSON คุณสามารถเพิ่มและติดตามข้อมูลฟีดที่คุณชื่นชอบด้วย API REST ที่เรียบง่ายและสะอาด รายการทั้งหมดได้รับการตกแต่งด้วยการเรียนรู้ของเครื่องจักรและเครื่องยนต์ความหมาย
curl ' https://<yourhost>/api/searches?q=news ' | json_pp
{
" data " : [
{
" id " : " 86b0f829-e300-4eef-82e1-82f34d03aff6 " ,
" type " : " entry " ,
" attributes " : {
" title " : " " Pandemic, Infodemic " : 2 Cartoon Characters Battling Fake News In Assam " ,
" url " : " https://www.ndtv.com/india-news/coronavirus-pandemic-infodemic-2-cartoon-characters-battling-fake-news-in-assam-2222333 " ,
" published_at " : 1588448805,
" body " : " An English daily in Assam's Guwahati has been publishing a cartoon strip to tackle the fake news related to the coronavirus pandemic. The two central characters- " Pandemic and Infodemic " - are being...<img src= " http://feeds.feedburner.com/~r/NDTV-LatestNews/~4/lEmH201Q8jI " height= " 1 " width= " 1 " alt= "" /> " ,
" text " : " An English daily in Assam's Guwahati has been publishing a cartoon strip to tackle the fake news related to the coronavirus pandemic. The two central characters- " Pandemic and Infodemic " - are being... " ,
" categories " : [
" all india "
],
" sentiment " : null,
" parent " : {
" id " : " c97bdae6-b5d1-4966-b9f3-615e29d4d47d " ,
" title " : " NDTV News - Special " ,
" url " : " feed:http://feeds.feedburner.com/NDTV-LatestNews " ,
" rank " : 99
},
" tags " : []
},
" relationships " : {
" feed " : {
" data " : {
" id " : " c97bdae6-b5d1-4966-b9f3-615e29d4d47d " ,
" type " : " feed "
}
}
}
},
]
}
การค้นหาถูกนำไปใช้กับคุณลักษณะการค้นหาข้อความแบบเต็มรูปแบบ
ฉันใช้ อัญมณี pg_search ซึ่งสามารถใช้ได้สองวิธี:
การค้นหาหลายครั้ง: ค้นหาในหลายรุ่นและส่งคืนผลลัพธ์อาร์เรย์เดียว ลองนึกภาพว่ามีสามรุ่น: ผลิตภัณฑ์แบรนด์และรีวิว การใช้การค้นหาหลายครั้งเราสามารถค้นหาได้ทั้งหมดในเวลาเดียวกันโดยเห็นผลการค้นหาชุดเดียว นี่จะเหมาะสำหรับการเพิ่มฟังก์ชั่นการค้นหาแบบสหพันธรัฐลงในแอพของคุณ
ขอบเขตการค้นหา: ค้นหาภายในรุ่นเดียว แต่มีความยืดหยุ่นมากขึ้น
execute << - SQL
ALTER TABLE entries
ADD COLUMN searchable tsvector GENERATED ALWAYS AS (
setweight(to_tsvector( ' simple ' , coalesce(title, ' ' )), ' A ' ) ||
setweight(to_tsvector( ' simple ' , coalesce(body, ' ' )), ' B ' ) ||
setweight(to_tsvector( ' simple ' , coalesce(url, ' ' )), ' C ' )
) STORED;
SQLการจัดอันดับฟีดจัดทำโดย OpenRank ตัวชี้วัดอำนาจโดเมนรูทอิสระตามชุดข้อมูลการค้นหาทั่วไป ค่าถูกทำให้เป็นบรรทัดฐานโดย
( ( Math . log10 ( domain_rank ) / Math . log10 ( 100 ) ) * 100 ) . round การเรียนรู้ของเครื่องจักรนั้นจัดทำโดย Dandelion API Semantic Text Analytics เป็นบริการตั้งแต่ข้อความไปจนถึงข้อมูลที่สามารถดำเนินการได้ แยกความหมายจากข้อความที่ไม่มีโครงสร้างและวางไว้ในบริบทด้วย API อย่างง่าย
คุณสามารถเพิ่มฟีดได้มากเท่าที่คุณต้องการสำหรับการรวบรวมข้อมูลอัตโนมัติในการจัดการ
https: /// ฟีด/ใหม่
เอกสาร API ทั้งหมดอยู่ในส่วน Wiki อย่าลังเลที่จะทำให้ดีขึ้นแน่นอน
https://github.com/davidesantangelo/dato.rss/wiki
ในการใช้คุณสมบัติบางอย่างเช่นการเพิ่มฟีดใหม่คุณต้องมีโทเค็นที่ได้รับอนุญาตจาก การเขียน ปัจจุบันมีเพียงฉันเท่านั้นที่สามารถเปิดใช้งานได้ ในกรณีที่ติดต่อฉัน
รวมถึงอัญมณีทับทิม จำนวนมาก รายการที่สมบูรณ์ซึ่งเป็นที่ /หลัก /gemfile
หากคุณต้องการสนับสนุนฉันในค่าใช้จ่ายของเซิร์ฟเวอร์เพื่อให้ dato.ess ฟรีขึ้นไปพิจารณาสปอนเซอร์! ขอบคุณ!
ผู้สนับสนุน GitHub
รายงานข้อผิดพลาดและคำขอดึงยินดีต้อนรับบน GitHub ที่ https://github.com/davidesantangelo/dato.rss โครงการนี้มีจุดประสงค์เพื่อเป็นพื้นที่ที่ปลอดภัยและเป็นมิตรสำหรับการทำงานร่วมกันและผู้สนับสนุนคาดว่าจะปฏิบัติตามจรรยาบรรณของผู้สนับสนุน
อัญมณีมีให้เป็นโอเพ่นซอร์สภายใต้ข้อกำหนดของใบอนุญาต MIT