تطبيقات Python لتقنيات الإحساس بالمعنى (WSD):
خوارزميات ليسك
تعظيم التشابه (انظر أيضًا ، Pedersen et al. (2003))
ملاحظة : يدعم PYWSD فقط Python 3 الآن ( pywsd>=1.2.0 ). إذا كنت تستخدم Python 2 ، فإن آخر إصدار ممكن هو pywsd==1.1.7 .
pip install -U nltk
python -m nltk.downloader 'popular'
pip install -U pywsd
$ python
> >> from pywsd . lesk import simple_lesk
> >> sent = 'I went to the bank to deposit my money'
> >> ambiguous = 'bank'
> >> answer = simple_lesk ( sent , ambiguous , pos = 'n' )
> >> print answer
Synset ( 'depository_financial_institution.n.01' )
> >> print answer . definition ()
'a financial institution that accepts deposits and channels the money into lending activities'لجميع الكلمات WSD ، حاول:
> >> from pywsd import disambiguate
> >> from pywsd . similarity import max_similarity as maxsim
> >> disambiguate ( 'I went to the bank to deposit my money' )
[( 'I' , None ), ( 'went' , Synset ( 'run_low.v.01' )), ( 'to' , None ), ( 'the' , None ), ( 'bank' , Synset ( 'depository_financial_institution.n.01' )), ( 'to' , None ), ( 'deposit' , Synset ( 'deposit.v.02' )), ( 'my' , None ), ( 'money' , Synset ( 'money.n.03' ))]
> >> disambiguate ( 'I went to the bank to deposit my money' , algorithm = maxsim , similarity_option = 'wup' , keepLemmas = True )
[( 'I' , 'i' , None ), ( 'went' , u'go' , Synset ( 'sound.v.02' )), ( 'to' , 'to' , None ), ( 'the' , 'the' , None ), ( 'bank' , 'bank' , Synset ( 'bank.n.06' )), ( 'to' , 'to' , None ), ( 'deposit' , 'deposit' , Synset ( 'deposit.v.02' )), ( 'my' , 'my' , None ), ( 'money' , 'money' , Synset ( 'money.n.01' ))]لقراءة التوقيعات المحسوبة مسبقًا لكل synset:
> >> from pywsd . lesk import cached_signatures
> >> cached_signatures [ 'dog.n.01' ][ 'simple' ]
set ([ u'canid' , u'belgian_griffon' , u'breed' , u'barker' , ... , u'genus' , u'newfoundland' ])
> >> cached_signatures [ 'dog.n.01' ][ 'adapted' ]
set ([ u'canid' , u'belgian_griffon' , u'breed' , u'leonberg' , ... , u'newfoundland' , u'pack' ])
> >> from nltk . corpus import wordnet as wn
> >> wn . synsets ( 'dog' )[ 0 ]
Synset ( 'dog.n.01' )
> >> dog = wn . synsets ( 'dog' )[ 0 ]
> >> dog . name ()
u'dog.n.01'
> >> cached_signatures [ dog . name ()][ 'simple' ]
set ([ u'canid' , u'belgian_griffon' , u'breed' , u'barker' , ... , u'genus' , u'newfoundland' ]) للاستشهاد pywsd :
تان liling. 2014. PYWSD: تطبيقات Python لتقنيات الإحساس بالمعنى (WSD) [Software]. تم الاسترجاع من https://github.com/alvations/pywsd
في bibtex :
@misc{pywsd14,
author = {Liling Tan},
title = {Pywsd: Python Implementations of Word Sense Disambiguation (WSD) Technologies [software]},
howpublished = {https://github.com/alvations/pywsd},
year = {2014}
}
مايكل ليك. 1986. الإحساس التلقائي باستخدام قواميس القراءة القابلة للقراءة: كيفية إخبار مخروط الصنوبر من مخروط الآيس كريم. في وقائع المؤتمر الدولي السنوي الخامس لوثائق النظم (Sigdoc '86) ، فرجينيا ديبويز (محرر). ACM ، نيويورك ، نيويورك ، الولايات المتحدة الأمريكية ، 24-26. doi = 10.1145/318723.318728 http://doi.acm.org/10.1145/318723.318728
Satanjeev Banerjee و Ted Pedersen. 2002. خوارزمية Lesk المكيفة لـ Word Sense Disambiguation باستخدام WordNet. في وقائع المؤتمر الدولي الثالث حول اللغويات الحسابية ومعالجة النص الذكي (Cicling '02) ، ألكساندر ف. جيلبخ (محرر). Springer-Verlag ، لندن ، المملكة المتحدة ، المملكة المتحدة ، 136-145.
Satanjeev Banerjee و Ted Pedersen. 2003. يتداخل اللمعان الممتد كمقياس للعلاقة الدلالية. في وقائع المؤتمر الدولي الثامن عشر المشترك حول الذكاء الاصطناعي ، الصفحات 805-810 ، Acapulco.
جاي ج. جيانغ وديفيد دبليو كونراث. 1997. التشابه الدلالي على أساس إحصاءات كوربوس والتصنيف المعجمي. في وقائع المؤتمر الدولي حول الأبحاث في اللغويات الحسابية ، تايوان.
كلوديا لياكوك ومارتن تشودورو. 1998. الجمع بين السياق المحلي وتشابه Wordnet لتحديد معنى الكلمة. في Fellbaum 1998 ، الصفحات 265-283.
Lee ، Yoong Keok ، Hwee Tou Ng ، و Tee Kiah Chia. "كلمة مراقبة الإشراف على الغموض مع آلات ناقلات الدعم ومصادر المعرفة المتعددة." Senseval-3: ورشة العمل الدولية الثالثة حول تقييم أنظمة التحليل الدلالي للنص. 2004.
ديكانغ لين. 1998. تعريف نظري للتشابه. في وقائع المؤتمر الدولي الخامس عشر للتعلم الآلي ، ماديسون ، ويسكونسن.
لينلين لي ، بنيامين روث وكارولين سبورديدر. 2010. نماذج الموضوعات لـ Word Sense Disambiguation والكشف عن المصطلح القائم على الرمز المميز. الاجتماع السنوي الثامن والأربعين لجمعية اللغويات الحسابية (ACL). أوبسالا ، السويد.
أندريا مورو ، روبرتو نافيجلي ، فرانشيسكو ماريا توتشي وريبيكا ج. باسونو. 2014. التعليق على ماسك كوربوس مع بابل. في وقائع المؤتمر الدولي التاسع حول موارد اللغة والتقييم (LREC'14). ريكيافيك ، أيسلندا.
Zhi Zhong و Hwee Tou ng. 2010. من المنطقي: نظام الغموض على كلمة واسعة النطاق للنص الحر. في وقائع مظاهرات نظام ACL 2010 (ACLDEMOS '10). جمعية اللغويات الحسابية ، سترودسبورغ ، بنسلفانيا ، الولايات المتحدة الأمريكية ، 78-83.
ستيفن بيرد ، إيوان كلاين ، وإدوارد لوبر. 2009. معالجة اللغة الطبيعية مع بيثون (الطبعة الأولى). O'Reilly Media ، Inc ..
Eneko Agirre و Aitor Soroa. 2009. تخصيص Pagerank من أجل الإحساس بالمعنى. وقائع المؤتمر الثاني عشر للفصل الأوروبي من جمعية اللغويات الحاسوبية (EACL-2009). أثينا ، اليونان.