ADW(align、dismbiguate and Walk)バージョン1.0- 2014年10月13日。
オンラインデモ:http://lcl.uniroma1.it/adw/
導入
インストール
要件
クイックスタート
ライセンス
はじめに==========================
このパッケージは、ADWのJava実装を提供します。これは、感覚からテキストまで、異なる語彙レベルでの語彙アイテムの比較を可能にする最先端のセマンティック類似性アプローチです。アプローチの詳細については、http://wwwusers.di.uniroma1.it/~navigli/pubs/acl_2013_pilehvar_jurgens_navigli.pdfを参照してください。
このリリースバージョンは、Mohammad Taher Pilehvar(Sapienza University of Rome)によって作成されています。
1-次のリンクを使用して、セマンティックシグネチャ(WordNet 3.0のすべての概念、サイズ〜1.4 GB)をダウンロードします:http://lcl.uniroma1.it/adw/ppvs.30g.5k.tar.bz2
2-選択したディレクトリにダウンロードされたファイルを抽出します。
例えば:
/home/username/signatures/
3-セマンティック署名を含むディレクトリを使用して、 config/adw.propertiesファイルのwn30g.ppv.pathエントリを更新します。
例えば:
wn30g.ppv.path=/home/username/signatures/ppvs.30g.5k/
4-あなたは行く準備ができています!開始するには、クイックスタートを読み続けます。
以下は、ADWを使用してセマンティックな類似性を測定するための使用例です。
ADW pipeLine = new ADW();
double score = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
どこ:
text1とtext2は、比較する2つの語彙項目です。これらの語彙項目のタイプは、それぞれsrcTextTypeとtrgTextTypeで示されます。サポートされている入力形式については、4.1を参照してください。
disMethod 、語彙アイテムのペアを曖昧に除去する必要があるかどうかを指定します。現在のバージョンでは、サポートしています。
measure 、セマンティック署名のペアを比較するために使用される方法を示します。サポートされている方法については、4.2を参照してください。
例えば:
//the two lexical items to be compared
String text1 = "a mill that is powered by the wind";
String text2 = "windmill.n.1";
//types of the two lexical items
ItemType srcTextType = ItemType.SURFACE;
ItemType trgTextType = ItemType.WORD_SENSE;
//if lexical items has to be disambiguated
DisambiguationMethod disMethod = DisambiguationMethod.ALIGNMENT_BASED;
//measure for comparing semantic signatures
SignatureComparison measure = new WeightedOverlap();
ADW pipeLine = new ADW();
double similarity = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
System.out.println(similarity);
このバージョンでは、5つの異なる入力形式をサポートしています。
A baby is playing with a dog )baby#n be#v play#n dog#n )。音声の4つの部分のみをサポートします:名詞(n)、動詞(v)、形容詞(a)、および副詞(r)。baby%1:18:00:: play%2:33:00:: dog%1:05:00:: :)09827683-n 01072949-v 02084071-n )baby.n.1 play.v.1 dog.n.1またはbaby#n#1 play#v#1 dog#n#1 )さまざまな署名比較方法が含まれています(SignAtureComparsisonインターフェイスを実装):
上記の3つの詳細については、Pilehvar et al。 (2013)
ADW(Align、Ambiguate、Walk) - セマンティックの類似性を測定するための統一されたアプローチ。
Copyright(c)2014 Sapienza大学ローマ大学。無断転載を禁じます。
このプログラムは、それが有用であることを期待して配布されますが、保証はありません。商品性や特定の目的に対するフィットネスの暗黙の保証さえありません。
このシステムを使用する場合は、次の論文を引用してください。
マウント・パイルヴァル、D。ユルゲンズ、R。ナビリグリ。整列、照明、歩き:意味的類似性を測定するための統一されたアプローチ。第51回計算言語学会協会(ACL 2013)の議事録、ブルガリア、ソフィア、2013年8月4〜9日、pp。1341-1351。
詳細については、お問い合わせください。
Pilehvar atsign di(dot)uniroma1(dot)it
バグレポート、修正、問題については、githubページを使用してください:https://github.com/pilehvar/adw