Untinked ist ein Web-Schaber, mit dem nicht verwandte Links in Community-basierten Beiträgen ermittelt und erfasst werden konnten, z. B. auf Plattformen wie Stackoverflow, Medium und ähnlichen Foren.
Unverinkte nutzt die vektorbasierte Ähnlichkeitserkennung, um die Relevanz von Links innerhalb eines Beitrags zu analysieren. Das Kernkonzept basiert auf der Verwendung einer Vektor-Datenbank , die auf einem riesigen Datenkorpus vorgebracht ist. Der Schaber verwendet Spacy , eine beliebte NLP -Bibliothek, um Wort- und Satz -Einbettungen zu berechnen.
Im Vektorraum haben semantisch verwandte Wörter oder Sätze in der Regel kleinere Winkel zwischen ihnen, was zu einem hohen Cosinus -Ähnlichkeitsbewertung führt. Umgekehrt haben nicht verwandte Wörter oder Sätze größere Winkel, was zu einer geringeren oder negativen Ähnlichkeit des Kosinus führt. Auf diese Weise kann die Anwendung feststellen, ob Links in einem Beitrag kontextuell mit dem Inhalt zusammenhängen oder nicht.

Befolgen Sie die folgenden Schritte, um auf Ihrer lokalen Maschine nicht verknüpft zu werden:
Klonen Sie das Repository:
git clone https://github.com/Aashish1-1-1/UnlinkedNavigieren Sie zum Projektverzeichnis:
cd Unlinked/unlinkedErstellen Sie das Docker -Bild:
sudo docker build -t unlinked .Führen Sie die Anwendung aus:
sudo docker run -i unlinked