Unlinked เป็นเครื่องขูดเว็บที่ออกแบบมาเพื่อระบุและตรวจจับลิงก์ที่ไม่เกี่ยวข้องในโพสต์ที่ใช้ชุมชนเช่นบนแพลตฟอร์มเช่น Stackoverflow, Medium และ Forum ที่คล้ายกัน
การตรวจจับความคล้ายคลึงกันตามเวกเตอร์ที่ไม่ได้เชื่อมโยงเพื่อวิเคราะห์ความเกี่ยวข้องของลิงก์ภายในโพสต์ แนวคิดหลักถูกสร้างขึ้นโดยใช้ ฐานข้อมูลเวกเตอร์ ซึ่งได้รับการฝึกอบรมล่วงหน้าบนคลังข้อมูลที่กว้างใหญ่ มีดโกนใช้ Spacy ซึ่งเป็นห้องสมุด NLP ยอดนิยมเพื่อคำนวณคำและการฝังประโยค
ในพื้นที่เวกเตอร์คำหรือประโยคที่เกี่ยวข้องกับความหมายมีแนวโน้มที่จะมีมุมที่เล็กลงระหว่างพวกเขาส่งผลให้คะแนนความคล้ายคลึงกันของโคไซน์สูง ในทางกลับกันคำหรือประโยคที่ไม่เกี่ยวข้องจะมีมุมที่ใหญ่กว่าส่งผลให้เกิดความคล้ายคลึงกันของโคไซน์ที่ต่ำกว่าหรือเชิงลบ สิ่งนี้ช่วยให้แอปพลิเคชันสามารถพิจารณาได้ว่าลิงก์ในโพสต์นั้นเกี่ยวข้องกับเนื้อหาหรือไม่

หากต้องการเรียกใช้ Unlinked บนเครื่องในพื้นที่ของคุณให้ทำตามขั้นตอนด้านล่าง:
โคลนที่เก็บ:
git clone https://github.com/Aashish1-1-1/Unlinkedนำทางไปยังไดเรกทอรีโครงการ:
cd Unlinked/unlinkedสร้างภาพนักเทียบท่า:
sudo docker build -t unlinked .เรียกใช้แอปพลิเคชัน:
sudo docker run -i unlinked