يحتوي هذا المستودع على التعليمات البرمجية ومجموعات البيانات والروابط المتعلقة بأوراق الكيان/المعرفة من مشروع Vert ( V ersatile e ntity r ecshiplisition & disambigation t olkit) ، بواسطة مجموعة الحوسبة المعرفة ( KC ) في Microsoft Research Asia (MSRA).
تقوم مجموعتنا بتوظيف كل من المتدربين الأبحاث والموظفين بدوام كامل! إذا كنت مصلحة ، يرجى إلقاء نظرة على:
- فرص التدريب في KC (PDF) ؛
- مواقع الباحث أو RSDE واختيار "الصين" على الجانب الأيسر "البلد/المنطقة".
أخبار:
- 2023-SEP: وصل مشروع التعرف على النص أكثر من 9 ملايين تنزيل (عبر Nuget/NPM/PYPI)!
- 2023-مايو: ثلاث أوراق مقبولة من قبل ACL'23 ، بما في ذلك MLKD OOD و COLADA و TACR.
- 2022-Aug: وصل مشروع التعرف على Text أكثر من 5 ملايين تنزيل الحزم (عبر Nuget/NPM/PYPI)!
- 2022-May: وصل Tiara (Retrack V2) ، نظام الإجابة على أسئلة المعرفة الجديدة في KC (KBQA) ، إلى المرتبة الأولى في جميع فئات الإجابة على أسئلة التعميم (GrailQA) بما في ذلك التعميم الإجمالي ، والتعميم التكويني ، والرحلة الصفر.
- 2022-أبريل: لقد فتحنا الآن إصدار أحدث إصدار من نظام الربط لتفسير الجدول الدلالي التلقائي. يتضمن هذا الإصدار الجديد تحسين الأداء والاستقرار والمرونة والنتائج الشاملة. المساهمات والتعاون موضع ترحيب للغاية!
- 2022-Mar: وصل مشروع التعرف على النص إلى أكثر من 4 ملايين تنزيل الحزمة (عبر Nuget/NPM/PYPI)!
- 2021-Jul: وصل مشروع التعرف على النص إلى أكثر من 3 ملايين تنزيل الحزمة (عبر Nuget/NPM/PYPI)!
- 2021-MAY: وصل إعادة التشغيل إلى رقم 1 في الإجابة على الأسئلة القابلة للتعميم (Grailqa) لقاعدة المعرفة QA (KBQA).
- 2020-DEC: وصل مشروع التعرف على النص إلى أكثر من 2 مليون تنزيل (عبر NUGET/NPM/PYPI)!
- 2020-NOV: حصل نظام الربط ، الذي تم تطويره بالشراكة بين مجموعة الحوسبة المعرفة في MSRA ومتعاونينا في MSR Cambridge ، على المركز الثاني في تحدي SEMTAB 2020 (تحدي الويب الدلالي على البيانات الجدولية لمطابقة الرسم البياني للمعرفة)!
الأوراق الحديثة:
- تقطير المعرفة متعدد المستويات للكشف خارج التوزيع في النص ، Qianhui Wu ، Huiqiang Jiang ، Haonan Yin ، Börje F. Karlsson ، Chin-Yew Lin ، ACL 2023.
المستودع: https://github.com/microsoft/kc/tree/main/papers/mlkd_ood - كولادا: إطار تقليل العلامة التعاونية للتعرف على الكيان المسماة ، Tingting MA ، Qianhui Wu ، Huiqiang Jiang ، Börje F. Karlsson ، Tiejun Zhao ، Chin-Yew Lin ، ACL 2023.
المستودع: https://github.com/microsoft/vert-papers/tree/master/papers/colada - TACR: نموذج اختيار الخلايا القائم على الطاولة والتفكير من أجل الانتهاء من الأسئلة الهجينة ، جيان وو ، Yicheng Xu ، Yan Gao ، Jian-Guang Lou ، Börje F. Karlsson ، Manabu Okumura ، نتائج جمعية اللغويات الحاسوبية: ACL 2023.
- تيارا: استرجاع متعدد الحبيبات للإجابة على أسئلة قوية على قواعد المعرفة الكبيرة ، Yiheng Shu ، Zhiwei Yu ، Yuhan Li ، Börje F. Karlsson ، Tingting MA ، Yuzhong Qu ، Chin-Yew Lin ، Emnlp 2022 ، 2022.
مستودع: https://github.com/microsoft/kc/tree/master/papers/tiara - LinkingPark: نظام تفسير الجدول الدلالي التلقائي ، Shuang Chen ، Alperen Karaoglu ، Carina Negreanu ، Tingting MA ، Jin-Ge Yao ، Jack Williams ، Feng Jiang ، Andy Gordon ، Chin-Yew Lin ، Journal of Web Secantics ، 2022.
مستودع: https://github.com/microsoft/vert-papers/tree/master/papers/linkingpark - صفوف من العديد من المصادر: إثراء إكمال صف من ويكيداتا مع نموذج لغة مسبقًا ، كارينا نيغرينو ، ألبين كاروغلو ، جاك ويليامز ، شوانغ تشن ، دانييل فابيان ، أندرو جوردون ، وشينا يو ، ورشة عمل ويكي 2022.
- على فعالية ترميز الجملة من أجل الكشف عن القصد من التعلم ، والتشويش MA ، Qianhui Wu ، Zhiwei Yu ، Tiejun Zhao ، Chin-Yew Lin ، Naacl 2022.
مستودع: https://github.com/microsoft/kc/tree/master/papers/idml - تعلّف التعلم المتحلل من أجل التعرف على كيان قليلة المسماة ، Tingting MA ، Huiqiang Jiang ، Qianhui Wu ، Tiejun Zhao ، Chin-Yew Lin ، نتائج ACL 2022.
المستودع: https://github.com/microsoft/vert-papers/tree/master/papers/decomposedmetaner - Advpicker: الاستفادة بشكل فعال من البيانات غير المسماة عبر التمييز العددي لـ NER عبر اللغات ، Weile Chen ، Huiqiang Jiang ، Qianhui Wu ، Börje F. Karlsson ، Yi Guan ، ACL 2021.
المستودع: https://github.com/microsoft/vert-papers/tree/master/papers/advpicker - استرجاع: إطار عمل مرن وفعال للإجابة على أسئلة قاعدة المعرفة ، Shuang Chen ، Qian Liu ، Zhiwei Yu ، Chin-Yew Lin ، Jian-Guang Lou ، Feng Jiang ، ACL 2021. (Paper Demo)
مستودع: https://github.com/microsoft/kc/tree/master/papers/retrack - Boningknife: kintic intity lechance lectection and typing for ner ner عبر معرفة الحدود السابقة ، Huiqiang Jiang ، Guoxin Wang ، Weile Chen ، Chengxi Zhang ، Börje F. Karlsson ، Arxiv: 2107.09429 - 2020/2021.
- LinkingPark: نهج متكامل لتفسير المائدة الدلالية ، Shuang Chen ، Alperen Karaoglu ، Carina Negreanu ، Tingting MA ، Jin-Ge Yao ، Jack Williams ، Andy Gordon ، Chin-Yew Lin ، تحدي الويب الدلالي على بيانات المعرفة في مطابقة الرسم البياني (Semtab 2020) في ISWC 2020.
مستودع: https://github.com/microsoft/vert-papers/tree/master/papers/linkingpark - Unitrans: توحيد نقل النماذج ونقل البيانات من أجل التعرف على الكيان المسماة اللغوي مع بيانات غير مسموعة ، Qianhui Wu ، Zijia Lin ، Börje F. Karlsson ، Biqing Huang ، Jian-Guang Lou ، Ijcai 2020.
مستودع: https://github.com/microsoft/vert-papers/tree/master/papers/unitrans - NER أحادي/متعددة المصدر عبر اللغات عبر تعلم المعلم والطالب على البيانات غير المسماة في اللغة المستهدفة ، Qianhui Wu ، Zijia Lin ، Börje F. Karlsson ، Jian-Guang Lou ، Biqing Huang ، ACL 2020.
المستودع: https://github.com/microsoft/vert-papers/tree/master/papers/singlemulti-ts - التعلم التعويضي المحسّن للاعتراف بالكيان المسمى مع الحد الأدنى من الموارد ، Qianhui Wu ، Zijia Lin ، Guoxin Wang ، Hui Chen ، Börje F. Karlsson ، Biqing Huang ، Chin-Yew Lin ، Aaai 2020.
المستودع: https://github.com/microsoft/vert-papers/tree/master/papers/meta-cross - تحسين الارتباط بالكيان من خلال نمذجة معلومات نوع الكيان الكامنة ، Shuang Chen ، Jinpeng Wang ، Feng Jiang ، Chin-Yew Lin ، Aaai 2020.
- استكشاف تمثيلات الكلمات على التعرف على التعبير عن الوقت ، Sanxing Chen ، Guoxin Wang ، Börje Karlsson ، التقرير الفني - Microsoft Research Asia ، 2019.
- من أجل تحسين التعرف على الكيان المسمى العصبي مع الجريدة ، تيانيو ليو ، جين غون ياو ، تشين يو لين ، ACL 2019.
المستودع: https://github.com/microsoft/vert-papers/tree/master/papers/subtagger - CAN-REN: شبكة الانتباه التلافييل للتعرف على الكيان الصيني ، Yuying Zhu ، Guoxin Wang ، Börje F. Karlsson ، Naacl-HLT 2019.
المستودع: https://github.com/microsoft/vert-papers/tree/master/papers/can-ner - GRN: شبكة علاقة بوابات لتعزيز الشبكة العصبية التلافيفية للتعرف على الكيان المسماة ، Hui Chen ، Zijia Lin ، Guiguang Ding ، Jian-Guang Lou ، Yusen Zhang ، Börje F. Karlsson ، Aaai 2019.
مستودع: https://github.com/microsoft/vert-papers/tree/master/papers/grn-ner
المشاريع ذات الصلة:
- Microsoft/التعرف على النص -مكتبة مفتوحة المصدر توفر الاعتراف والتطبيع/دقة الأرقام والوحدات والتاريخ/الوقت والتسلسل (على سبيل المثال ، أرقام الهواتف ، عناوين URL) المعبر عنها بلغات متعددة ؛
- الحوسبة المعرفة (KC) على GitHub - مستودع مفتوح المصدر بما في ذلك الكود ومجموعات البيانات للمشاريع الأخرى من قبل مجموعة الحوسبة المعرفة في MSRA.
المساهمة
يرحب هذا المشروع بالمساهمات والاقتراحات. تطلب منك معظم المساهمات الموافقة على اتفاقية ترخيص المساهم (CLA) مع إعلان أن لديك الحق في ذلك في الواقع ، ويفعلنا في الواقع حقوق استخدام مساهمتك. لمزيد من التفاصيل ، تفضل بزيارة https://cla.opensource.microsoft.com.
عند إرسال طلب سحب ، سيحدد CLA Bot تلقائيًا ما إذا كنت بحاجة إلى توفير CLA وتزيين العلاقات العامة بشكل مناسب (على سبيل المثال ، فحص الحالة ، التعليق). ببساطة اتبع الإرشادات التي يقدمها الروبوت. ستحتاج فقط إلى القيام بذلك مرة واحدة عبر جميع عمليات إعادة الشراء باستخدام CLA لدينا.
اعتمد هذا المشروع رمز سلوك المصدر المفتوح Microsoft. لمزيد من المعلومات ، راجع مدونة الشهادة الأسئلة الشائعة أو الاتصال بـ [email protected] مع أي أسئلة أو تعليقات إضافية.