ADW(ALIGN,DISAIMUAUTE和WALK)1.0版 - 2014年10月13日。
在線演示:http://lcl.uniroma1.it/adw/
介紹
安裝
要求
快速開始
執照
簡介========================
該軟件包提供了ADW的Java實現,ADW是一種最先進的語義相似性方法,可以在不同的詞彙級別上比較詞彙項目:從感官到文本。有關該方法的更多詳細信息,請參閱:http://wwwusers.di.uniroma1.it/~navigli/pubs/pubs/acl_2013_pilehvar_jurgens_navigli.pdf
該發行版由穆罕默德·塔赫·皮爾瓦爾(Mohammad Taher Pilehvar)(羅馬薩皮恩扎大學)編寫。
1-使用以下鏈接下載語義簽名(對於WordNet 3.0中的所有118K概念,尺寸〜1.4 GB)
2-在您選擇的目錄中提取下載的文件。
例如:
/home/username/signatures/
3-在config/adw.properties文件中使用包含語義簽名的目錄更新wn30g.ppv.path條目。
例如:
wn30g.ppv.path=/home/username/signatures/ppvs.30g.5k/
4-您準備出發!要開始,請繼續閱讀快速啟動。
以下是使用ADW測量語義相似性的用法示例。
ADW pipeLine = new ADW();
double score = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
在哪裡:
text1和text2是要比較的兩個詞彙項目。這些詞彙項目的類型分別用srcTextType和trgTextType表示。有關支持的輸入格式,請參見4.1。
disMethod是指定一對詞彙項目是否必須歧義。在當前版本中,我們支持:
measure表示用於比較語義標誌對的方法。有關支持的方法,請參閱4.2。
例如:
//the two lexical items to be compared
String text1 = "a mill that is powered by the wind";
String text2 = "windmill.n.1";
//types of the two lexical items
ItemType srcTextType = ItemType.SURFACE;
ItemType trgTextType = ItemType.WORD_SENSE;
//if lexical items has to be disambiguated
DisambiguationMethod disMethod = DisambiguationMethod.ALIGNMENT_BASED;
//measure for comparing semantic signatures
SignatureComparison measure = new WeightedOverlap();
ADW pipeLine = new ADW();
double similarity = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
System.out.println(similarity);
在此版本中,我們支持五種不同的輸入格式:
A baby is playing with a dog )baby#n be#v play#n dog#n )。我們僅支持語音的四個部分:名詞(n),動詞(v),形容詞(a)和副詞(r)。baby%1:18:00:: play%2:33:00:: dog%1:05:00:: :)09827683-n 01072949-v 02084071-n )baby.n.1 play.v.1 dog.n.1或baby#n#1 play#v#1 dog#n#1 )包括不同的簽名比較方法(實現SignatureComparison接口):
有關上述三個的詳細信息,請參見Pilehvar等。 (2013)
ADW(對齊,歧義和步行) - 一種統一的測量語義相似性的方法。
版權(C)2014年羅馬薩皮恩扎大學。版權所有。
該程序的分佈是希望它將有用的,但沒有任何保修;即使沒有對特定目的的適銷性或適合性的隱含保證。
如果您使用此系統,請引用以下論文:
Mt Pilehvar,D。Jurgens和R. Navigli。對齊,歧義和步行:測量語義相似性的統一方法。計算語言學協會第51屆年會論文集(ACL 2013),索非亞,保加利亞,2013年8月4日至9日,第1341-1351頁。
有關更多信息,請聯繫:
pilhvar atsign di(dot)uniromoma(點)
有關錯誤報告,修復和問題,請使用我們的github頁面:https://github.com/pilehvar/adw