Non lié est un grattoir Web conçu pour identifier et détecter des liens non apparentés dans des publications communautaires, telles que celles sur des plateformes telles que Stackoverflow, Medium et des forums similaires.
Sévénit non lié à la détection de similitude basée sur les vecteurs pour analyser la pertinence des liens dans un poste. Le concept de base est construit autour de l'utilisation d'une base de données vectorielle , qui est pré-formée sur un vaste corpus de données. Le grattoir utilise Spacy , une bibliothèque NLP populaire, pour calculer les intégres de mots et de phrases.
Dans l'espace vectoriel, des mots ou des phrases sémantiquement liés ont tendance à avoir des angles plus petits entre eux, entraînant un score de similitude en cosinus élevé. À l'inverse, les mots ou les phrases non liés auront des angles plus importants, entraînant une similitude de cosinus inférieure ou négative. Cela permet à l'application de déterminer si les liens dans un article sont ou non contextuellement liés au contenu.

Pour s'exécuter sans lien sur votre machine locale, suivez les étapes ci-dessous:
Clone le référentiel:
git clone https://github.com/Aashish1-1-1/UnlinkedAccédez au répertoire du projet:
cd Unlinked/unlinkedConstruisez l'image Docker:
sudo docker build -t unlinked .Exécutez l'application:
sudo docker run -i unlinked