ADW (정렬, 명확성 및 걷기) 버전 1.0- 2014 년 10 월 13 일.
온라인 데모 : http://lcl.uniroma1.it/adw/
소개
설치
요구 사항
빠른 시작
특허
소개 ========================
이 패키지는 Senses에서 텍스트로 다른 어휘 수준에서 어휘 항목을 비교할 수있는 최첨단 시맨틱 유사성 접근법 인 ADW의 Java 구현을 제공합니다. 접근 방식에 대한 자세한 내용은 http://wwwusers.di.uniroma1.it/~navigli/pubs/acl_2013_pilehvar_jurgens_navigli.pdf를 참조하십시오.
이 릴리스 버전은 Mohammad Taher Pilehvar (Sapienza University of Rome)가 준비합니다.
1- 다음 링크를 사용하여 시맨틱 서명 (Wordnet 3.0, 크기 ~ 1.4GB의 모든 118k 개념에 대해)을 다운로드하십시오 : http://lcl.uniroma1.it/adw/ppvs.30g.5k.tar.bz2
2- 선택한 디렉토리에서 다운로드 된 파일을 추출하십시오.
예를 들어:
/home/username/signatures/
3- 시맨틱 서명이 포함 된 디렉토리와 함께 config/adw.properties 파일의 wn30g.ppv.path 항목을 업데이트하십시오.
예를 들어:
wn30g.ppv.path=/home/username/signatures/ppvs.30g.5k/
4- 당신은 갈 준비가되었습니다! 시작하려면 빠른 시작을 계속 읽으십시오.
다음은 ADW를 사용하여 시맨틱 유사성을 측정하기위한 사용 예입니다.
ADW pipeLine = new ADW();
double score = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
어디:
text1 과 text2 는 비교할 두 가지 어휘 항목입니다. 이러한 어휘 항목의 유형은 각각 srcTextType 및 trgTextType 로 표시됩니다. 지원되는 입력 형식은 4.1을 참조하십시오.
disMethod 어휘 항목 쌍이 명확하지 않은지 여부를 지정합니다. 현재 버전에서는 다음을 지원합니다.
measure 시맨틱 서명 쌍을 비교하는 데 사용 된 방법을 나타냅니다. 지원되는 방법은 4.2를 참조하십시오.
예를 들어:
//the two lexical items to be compared
String text1 = "a mill that is powered by the wind";
String text2 = "windmill.n.1";
//types of the two lexical items
ItemType srcTextType = ItemType.SURFACE;
ItemType trgTextType = ItemType.WORD_SENSE;
//if lexical items has to be disambiguated
DisambiguationMethod disMethod = DisambiguationMethod.ALIGNMENT_BASED;
//measure for comparing semantic signatures
SignatureComparison measure = new WeightedOverlap();
ADW pipeLine = new ADW();
double similarity = pipeLine.getPairSimilarity(text1, text2,
disMethod, measure,
srcTextType, trgTextType);
System.out.println(similarity);
이 버전에서는 5 가지 입력 형식을 지원합니다.
A baby is playing with a dog )baby#n be#v play#n dog#n ). 우리는 명사 (n), 동사 (v), 형용사 (a) 및 부사 (r)의 네 부분만을지지합니다.baby%1:18:00:: play%2:33:00:: dog%1:05:00:: :)09827683-n 01072949-v 02084071-n )baby.n.1 play.v.1 dog.n.1 또는 baby#n#1 play#v#1 dog#n#1 )다른 시그니처 비교 방법이 포함되어 있습니다 (SignatureComparison 인터페이스 구현) :
위의 세 가지에 대한 자세한 내용은 Filehvar et al. (2013)
ADW (정렬, 명확성 및 걷기) - 의미 론적 유사성을 측정하기위한 통일 된 접근법.
저작권 (C) 2014 로마 Sapienza University. 모든 권리 보유.
이 프로그램은 유용 할 것이지만 보증이 없다는 희망으로 배포됩니다. 상업성 또는 특정 목적에 대한 적합성에 대한 묵시적 보증조차 없습니다.
이 시스템을 사용하는 경우 다음 논문을 인용하십시오.
Mt Pilehvar, D. Jurgens 및 R. Navigli. 정렬, 명확성 및 걷기 : 의미 론적 유사성을 측정하기위한 통일 된 접근법. 2013 년 8 월 4-9 일, 불가리아 소피아, 컴퓨터 언어 협회 (ACL 2013)의 제 51 차 연례 회의, 1341-1351 쪽.
자세한 내용은 다음과 같이 문의하십시오.
filehvar는 di (dot) uniroma1 (dot) it을 atsign습니다
버그 보고서, 수정 및 문제는 github 페이지를 사용하십시오 : https://github.com/pilehvar/adw