ADW (Align, Disambiguate dan Walk) Versi 1.0 - 13 Oktober 2014.
Demo online: http://lcl.uniroma1.it/adw/
Perkenalan
Instalasi
Persyaratan
Awal yang cepat
Lisensi
Pendahuluan ==========================
Paket ini menyediakan implementasi ADW Java, pendekatan kesamaan semantik yang canggih yang memungkinkan perbandingan item leksikal pada tingkat leksikal yang berbeda: dari indera ke teks. Untuk detail lebih lanjut tentang pendekatan ini silakan lihat: http://wwwusers.di.uniroma1.it/~Navigli/pubs/acl_2013_pilehvar_jurgens_navigli.pdf
Versi rilis ini disiapkan oleh Mohammad Taher Pilehvar (Sapienza University of Rome).
1- Unduh tanda tangan semantik (untuk semua konsep 118k di WordNet 3.0, Ukuran ~ 1,4 GB) menggunakan tautan berikut: http://lcl.uniroma1.it/adw/ppss.30g.5k.tar.bz2
2- Ekstrak file yang diunduh di direktori pilihan Anda.
Misalnya:
/home/username/signatures/
3- Perbarui entri wn30g.ppv.path di file config/adw.properties dengan direktori yang berisi tanda tangan semantik.
Misalnya:
wn30g.ppv.path=/home/username/signatures/ppvs.30g.5k/
4- Anda siap untuk pergi! Untuk memulai, lanjutkan membaca dengan cepat.
Berikut ini adalah contoh penggunaan untuk mengukur kesamaan semantik menggunakan ADW.
ADW pipeLine = new ADW();
double score = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
Di mana:
text1 dan text2 adalah dua item leksikal yang harus dibandingkan. Jenis -jenis item leksikal ini dilambangkan dengan srcTextType dan trgTextType , masing -masing. Untuk format input yang didukung, silakan lihat 4.1.
disMethod menentukan apakah sepasang item leksikal harus disamban atau tidak. Dalam versi saat ini kami mendukung:
measure menunjukkan metode yang digunakan untuk membandingkan pasangan tanda tangan semantik. Untuk metode yang didukung, silakan lihat 4.2.
Misalnya:
//the two lexical items to be compared
String text1 = "a mill that is powered by the wind";
String text2 = "windmill.n.1";
//types of the two lexical items
ItemType srcTextType = ItemType.SURFACE;
ItemType trgTextType = ItemType.WORD_SENSE;
//if lexical items has to be disambiguated
DisambiguationMethod disMethod = DisambiguationMethod.ALIGNMENT_BASED;
//measure for comparing semantic signatures
SignatureComparison measure = new WeightedOverlap();
ADW pipeLine = new ADW();
double similarity = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
System.out.println(similarity);
Dalam versi ini, kami mendukung lima format input yang berbeda:
A baby is playing with a dog )baby#n be#v play#n dog#n ). Kami hanya mendukung empat bagian pidato: kata benda (n), kata kerja (v), kata sifat (a), dan kata keterangan (r).baby%1:18:00:: play%2:33:00:: dog%1:05:00:: :)09827683-n 01072949-v 02084071-n )baby.n.1 play.v.1 dog.n.1 atau baby#n#1 play#v#1 dog#n#1 )Metode perbandingan tanda tangan yang berbeda disertakan (mengimplementasikan antarmuka SignatureComparison):
Untuk detail dari tiga di atas, silakan lihat Pilehvar et al. (2013)
ADW (Align, Disambiguate dan Walk) - Pendekatan terpadu untuk mengukur kesamaan semantik.
Hak Cipta (C) 2014 Sapienza University of Rome. Semua hak dilindungi undang -undang.
Program ini didistribusikan dengan harapan akan bermanfaat, tetapi tanpa jaminan apa pun; bahkan tanpa jaminan tersirat dari dapat diperjualbelikan atau kebugaran untuk tujuan tertentu.
Jika Anda menggunakan sistem ini, silakan mengutip makalah berikut:
Gunung Pilehvar, D. Jurgens dan R. Navigli. Align, disambiguate dan walk: pendekatan terpadu untuk mengukur kesamaan semantik. Prosiding Pertemuan Tahunan ke-51 Asosiasi Linguistik Komputasi (ACL 2013), Sofia, Bulgaria, 4-9 Agustus 2013, hlm. 1341-1351.
Untuk informasi lebih lanjut, silakan hubungi:
Pilehvar Atsign Di (Dot) Uniroma1 (DOT) IT
Untuk laporan bug, perbaikan, dan masalah, silakan gunakan halaman GitHub kami: https://github.com/pilehvar/adw