ADW(ALIGN,DISAIMUAUTE和WALK)1.0版 - 2014年10月13日。
在线演示:http://lcl.uniroma1.it/adw/
介绍
安装
要求
快速开始
执照
简介========================
该软件包提供了ADW的Java实现,ADW是一种最先进的语义相似性方法,可以在不同的词汇级别上比较词汇项目:从感官到文本。有关该方法的更多详细信息,请参阅:http://wwwusers.di.uniroma1.it/~navigli/pubs/pubs/acl_2013_pilehvar_jurgens_navigli.pdf
该发行版由穆罕默德·塔赫·皮尔瓦尔(Mohammad Taher Pilehvar)(罗马萨皮恩扎大学)编写。
1-使用以下链接下载语义签名(对于WordNet 3.0中的所有118K概念,尺寸〜1.4 GB)
2-在您选择的目录中提取下载的文件。
例如:
/home/username/signatures/
3-在config/adw.properties文件中使用包含语义签名的目录更新wn30g.ppv.path条目。
例如:
wn30g.ppv.path=/home/username/signatures/ppvs.30g.5k/
4-您准备出发!要开始,请继续阅读快速启动。
以下是使用ADW测量语义相似性的用法示例。
ADW pipeLine = new ADW();
double score = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
在哪里:
text1和text2是要比较的两个词汇项目。这些词汇项目的类型分别用srcTextType和trgTextType表示。有关支持的输入格式,请参见4.1。
disMethod是指定一对词汇项目是否必须歧义。在当前版本中,我们支持:
measure表示用于比较语义标志对的方法。有关支持的方法,请参阅4.2。
例如:
//the two lexical items to be compared
String text1 = "a mill that is powered by the wind";
String text2 = "windmill.n.1";
//types of the two lexical items
ItemType srcTextType = ItemType.SURFACE;
ItemType trgTextType = ItemType.WORD_SENSE;
//if lexical items has to be disambiguated
DisambiguationMethod disMethod = DisambiguationMethod.ALIGNMENT_BASED;
//measure for comparing semantic signatures
SignatureComparison measure = new WeightedOverlap();
ADW pipeLine = new ADW();
double similarity = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
System.out.println(similarity);
在此版本中,我们支持五种不同的输入格式:
A baby is playing with a dog )baby#n be#v play#n dog#n )。我们仅支持语音的四个部分:名词(n),动词(v),形容词(a)和副词(r)。baby%1:18:00:: play%2:33:00:: dog%1:05:00:: :)09827683-n 01072949-v 02084071-n )baby.n.1 play.v.1 dog.n.1或baby#n#1 play#v#1 dog#n#1 )包括不同的签名比较方法(实现SignatureComparison接口):
有关上述三个的详细信息,请参见Pilehvar等。 (2013)
ADW(对齐,歧义和步行) - 一种统一的测量语义相似性的方法。
版权(C)2014年罗马萨皮恩扎大学。版权所有。
该程序的分布是希望它将有用的,但没有任何保修;即使没有对特定目的的适销性或适合性的隐含保证。
如果您使用此系统,请引用以下论文:
Mt Pilehvar,D。Jurgens和R. Navigli。对齐,歧义和步行:测量语义相似性的统一方法。计算语言学协会第51届年会论文集(ACL 2013),索非亚,保加利亚,2013年8月4日至9日,第1341-1351页。
有关更多信息,请联系:
pilhvar atsign di(dot)uniromoma(点)
有关错误报告,修复和问题,请使用我们的github页面:https://github.com/pilehvar/adw