ADW (Align, Disambiguate and Walk) Version 1.0 - 13 octobre 2014.
Démo en ligne: http://lcl.uniroma1.it/adw/
Introduction
Installation
Exigences
Démarrage rapide
Licence
Introduction =========================
Ce package fournit une implémentation Java d'ADW, une approche de similitude sémantique de pointe qui permet la comparaison des éléments lexicaux à différents niveaux lexicaux: des sens aux textes. Pour plus de détails sur l'approche, veuillez vous référer à: http://wwwusers.di.uniroma1.it/~navigli/pubs/acl_2013_pilehvar_jurgens_navigli.pdf
Cette version de version est préparée par Mohammad Taher Pilehvar (Université de Sapienza de Rome).
1- Téléchargez les signatures sémantiques (pour tous les concepts 118K dans WordNet 3.0, taille ~ 1,4 Go) en utilisant le lien suivant: http://lcl.uniroma1.it/adw/ppvs.30g.5k.tar.bz2
2- Extraire le fichier téléchargé dans le répertoire de votre choix.
Par exemple:
/home/username/signatures/
3- Mettez à jour l'entrée wn30g.ppv.path dans le fichier config/adw.properties avec le répertoire contenant des signatures sémantiques.
Par exemple:
wn30g.ppv.path=/home/username/signatures/ppvs.30g.5k/
4- Vous êtes prêt à partir! Pour commencer, continuez à lire le démarrage rapide.
Ce qui suit est un exemple d'utilisation pour mesurer la similitude sémantique en utilisant ADW.
ADW pipeLine = new ADW();
double score = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
Où:
text1 et text2 sont les deux éléments lexicaux à comparer. Les types de ces éléments lexicaux sont désignés par srcTextType et trgTextType , respectivement. Pour les formats d'entrée pris en charge, veuillez consulter 4.1.
disMethod Spécifie si la paire d'articles lexicaux doit être désambigée ou non. Dans la version actuelle, nous prenons en charge:
measure désigne la méthode utilisée pour comparer des paires de signatures sémantiques. Pour les méthodes prises en charge, veuillez consulter 4.2.
Par exemple:
//the two lexical items to be compared
String text1 = "a mill that is powered by the wind";
String text2 = "windmill.n.1";
//types of the two lexical items
ItemType srcTextType = ItemType.SURFACE;
ItemType trgTextType = ItemType.WORD_SENSE;
//if lexical items has to be disambiguated
DisambiguationMethod disMethod = DisambiguationMethod.ALIGNMENT_BASED;
//measure for comparing semantic signatures
SignatureComparison measure = new WeightedOverlap();
ADW pipeLine = new ADW();
double similarity = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
System.out.println(similarity);
Dans cette version, nous prenons en charge cinq formats d'entrée différents:
A baby is playing with a dog )baby#n be#v play#n dog#n ). Nous ne prenons en charge que quatre parties de la parole: les noms (n), les verbes (V), les adjectifs (a) et les adverbes (R).baby%1:18:00:: play%2:33:00:: dog%1:05:00:: :)09827683-n 01072949-v 02084071-n )baby.n.1 play.v.1 dog.n.1 ou baby#n#1 play#v#1 dog#n#1 )Différentes méthodes de comparaison de signature sont incluses (implémentez l'interface SignaturComparison):
Pour plus de détails sur les trois ci-dessus, veuillez consulter Pilehvar et al. (2013)
ADW (aligner, désambiguïser et marcher) - une approche unifiée pour mesurer la similitude sémantique.
Copyright (C) 2014 Sapienza University of Rome. Tous droits réservés.
Ce programme est distribué dans l'espoir qu'il sera utile, mais sans aucune garantie; Sans même la garantie implicite de qualité marchande ou d'adéquation à un usage particulier.
Si vous utilisez ce système, veuillez citer l'article suivant:
Mt Pilehvar, D. Jurgens et R. Navigli. Aligner, désambigué et marcher: une approche unifiée pour mesurer la similitude sémantique. Actes de la 51e réunion annuelle de l'Association for Computational Linguistics (ACL 2013), Sofia, Bulgarie, 4-9 août 2013, pp. 1341-1351.
Pour plus d'informations, veuillez contacter:
pilehvar atsign di (dot) Uniroma1 (dot) it
Pour les rapports de bogues, les correctifs et les problèmes, veuillez utiliser notre page GitHub: https://github.com/pilehvar/adw