nlp_tasks
1.0.0
لقد كنت أعمل على العديد من مهام معالجة اللغة الطبيعية لفترة طويلة. في يوم من الأيام ، شعرت برسم خريطة لحقل NLP حيث أكسب لقمة العيش. أنا متأكد من أنني لست الشخص الوحيد الذي يريد رؤيته في لمحة عن المهام الموجودة في NLP.
لقد بذلت قصارى جهدي لتغطية أكبر عدد ممكن من المهام في NLP ، لكن من المسلم به أن هذا بعيد عن الشامل بسبب افتقاري إلى المعرفة. والمراجع المختارة منحازة تجاه إنجازات التعلم العميق الحديثة. أتوقع أن تكون هذه بمثابة نقطة انطلاق عندما تكون على وشك البحث في المهمة. سأستمر في تحديث هذا الريبو بنفسي ، لكن ما آمل حقًا هو التعاون في هذا العمل. لا تتردد في إرسال طلب سحب لي!
13 أكتوبر 2017.
بواسطة Kyubyong
تمت مراجعتها وتحديثها بواسطة YJ Choe في 18 أكتوبر 2017.
PAPER باستخدام الشبكات العصبيةPAPER مقاربة عصبية لتسجيل المقالات الآليةCHALLENGE Kaggle: The Hewlett Foundation: تسجيل مقال آليPROJECT (محرك تسجيل الذكاء الاصطناعي المحسن) WIKI التعرف على الكلامPAPER العميق 2: التعرف على الكلام الشامل باللغة الإنجليزية والماندرينPAPER : نموذج توليدي للصوت الخامPROJECT تنفيذ TensorFlow لهندسة Deepspeech في BaiduPROJECT الكلام إلى النص على الكعك: مستوى الجملة من الشوط إلى النهاية التعرف على خطاب اللغة الإنجليزية باستخدام Wavenet DeepMind'sCHALLENGE تحدي فصل خطاب التناغم الخامسDATA تحدي فصل خطاب التناغم الخامسDATA CSTR VCTK CorpusDATA Librispeech ASR CorpusDATA -كوربوس الكلام الهاتفيDATA TED-LIUM CORPUSDATA الكلام المفتوح والموارد اللغويةDATA شائعة البيانات WIKI التلقائيBOOK تلخيص النص التلقائيPAPER باستخدام الشبكات العصبيةPAPER مع الشبكات العصبية العودية وتطبيقها على تلخيص متعدد الوصولDATA (TAC)DATA (DUC) INFO الأساسيةPAPER لنماذج النماذج الأساسية للذكرPAPER تحسين حل الدقة الأساسية من خلال التعلم تمثيل موزع على مستوى الكيانCHALLENGE CONLL 2012 المهمة المشتركة: نمذجة النماذج غير المقيدة متعددة اللغات في ontonotesCHALLENGE CONLL 2011 المهمة المشتركة: نمذجة غير مقيدة في OntonotesCHALLENGE Semeval 2018 المهمة 4: تحديد الشخصية في الحوارات متعددة الأحزاب PAPER A الشبكة العصبية الترفيهية الترفيهية متعددة الطبقات لتصحيح الخطأ النحويPAPER لتصحيح الخطأ النحويPAPER لتصحيح الجملةCHALLENGE CONLL-2013 المهمة المشتركة: تصحيح الخطأ النحويCHALLENGE CONLL-2014 المهمة المشتركة: تصحيح الخطأ النحويDATA NUS NOS التجارة رخصة جسم التجربةDATA Lang-8 Learner CorporaDATA Cornell Movie-Dialogs CorpusPROJECT مصحح النص العميق للمشروعPRODUCT النحوي العميق PAPER من الرسم البياني إلى (تقريبا) أي لغةPAPER : دراسة حالة في التمثيل الصوتي عبر اللغاتPAPER لتحويل GRAPHEME إلى PHONEMEPROJECT G2PPROJECT G2P_EN: وحدة Python بسيطة لـ Grapheme English لتحويل الصوتDATA النطق متعدد اللغات PAPER : مسحPAPER للسخرية: إجراء اكتشاف السخرية في الوقت المناسب والسياق والشخصية للغايةPAPER على تويتر: نهج النمذجة السلوكيةCHALLENGE Semeval-2017 المهمة 6: #Hashtagwars: تعلم روح الدعابةCHALLENGE Semeval-2017 المهمة 7: اكتشاف وتفسير التورية الإنجليزيةDATA الساخرة من RedditDATA السخرية Corpus v2DATA السخرية مراجعة Amazon Corpus WIKIPAPER مشكلة ترسيد الرمزPAPER من الصوتيات إلى الصور: مستويات التمثيل في نموذج عصبي متكرر لتعلم اللغة البصريةPAPER لعلم الأصوات في نموذج عصبي متكرر من الكلام الأساسPAPER من أجل تأريض اللغة الموجهة نحو المهمةPAPER الصوتي-Word2Vec: تعليم تمثيلات الكلمات التي تستند إلى الأصواتCOURSE أساس الرؤية والسيطرةWORKSHOP للروبوتات WIKIPAPER باستخدام الشبكات العصبية العميقةPAPER اللغة الطبيعية مع شبكات التغذية الصغيرةCHALLENGE تقييم اللغة 2015 WIKITOOLKIT أدوات نموذج مجموعة أدوات مجموعة الأدوات KenlmPAPER للكلمات والعبارات وتكوينهاPAPER مع الشبكات العصبية المتكررةPAPERTHESIS تستند إلى الشبكات العصبيةDATA Penn TreebankTUTORIAL TensorFlow التعليمي حول نمذجة اللغة مع الشبكات العصبية المتكررة WIKI lemmatisationPAPER المفصل الضيق والعلامة المورفولوجية مع LemmingTOOLKIT Wordnet lemmatizerDATA TreeBank-3 WIKIPAPER : قذائف الشحوم على مستوى الجملة من طرف إلى نهايةPAPER في البريةPAPER التعرف على الكلام البصري على نطاق واسعPROJECT الشفاه - التقدير الصوتي البصري باستخدام الشبكات العصبية التلافيفية ثلاثية الأبعادPRODUCT liopaDATA مجموعة الجملة السمعية البصريةDATA BBC-Oxford 'Multi View Lip Reserences' (MV-LRS) PAPER من خلال تعلم مشترك للمحاذاة والترجمةPAPER في الوقت الخطيPAPER هو كل ما تحتاجهPAPER السادسة تحديات للترجمة الآلية العصبيةPAPERCHALLENGE ACL 2014 ورشة العمل التاسعة حول الترجمة الآلية الإحصائيةCHALLENGE EMNLP 2017 المؤتمر الثاني للترجمة الآلية (WMT17)DATA OpenSubTitles2016DATA wit3: جرد الويب للمحادثات المكتوبة والترجمةDATA المجال التعليمي QCRI (QED)PAPER متعدد المهام للتسلسل التعلمPAPER غير خاضعة للإشراف على التسلسل للتسلسل التعلمPAPER ترجمة الآلة العصبية متعددة اللغات من Google: تمكين ترجمة صفريةTOOLKIT مع ترميز زوج البايت (BPE)TOOLKIT متعددة الطرقTOOLKIT OpenNMT: مجموعة أدوات مفتوحة المصدر للترجمة الآلية العصبية WIKI الانعكاسPAPER باستخدام تسلسل الأحرف لتسلسل التعلمCHALLENGE Sigmorphon 2016 المهمة المشتركة: إعادة التشكيل المورفولوجيDATA sigmorphon2016 WIKI الربطPAPER القوي والكيان الجماعي الغموض من خلال التضمينات الدلالية WIKI المسمى الاعترافPAPER للتعرف على الكيان المسماةPROJECT OSU Twitter NLP أدواتCHALLENGE المسمى الاعتراف بالكيان في تويترCHALLENGE Conll 2002 مستقل للغة اسم التعرف على الكيانCHALLENGE مقدمة في المهمة المشتركة CONLL-2003: التعرف على الكيان المستقل للغةDATA conll-2002 ner corpusDATA conll-2003 ner corpusDATA المسماة للبيانات التعرف على الكيان في مهمة Twitter المشتركةTOOLKIT ستانفورد اسم التعرف على الكيان PAPER الديناميكي والتشفير التلقائي العودية للكشف عن إعادة صياغةPROJECT Paralex: التعلم الذي يحركه إعادة الصياغة للإجابة على الأسئلة المفتوحةCHALLENGE Semeval-2015 المهمة 1: إعادة الصياغة والتشابه الدلالي في TwitterDATA Microsoft Research Paraphrase CorpusDATA Microsoft Research Description CorpusDATADATA Flickr DatasetDATA مجموعة البيانات المرضىDATA PPDB: قاعدة بيانات إعادة الصياغةDATA Wikianswers إعادة صياغة مجموعة PAPER العصبي إعادة صياغة مع شبكات LSTM المتبقية مكدسةDATA توليد إعادة الصياغة العصبية مع شبكات LSTM المتبقية مكدسةCODE توليد إعادة الصياغة العصبية مع شبكات LSTM المتبقية مكدسةPAPER إطار توليلي عميق لتوليد إعادة صياغةPAPER مع ترجمة الآلة العصبية WIKITOOLKIT the Stanford Parser: محلل إحصائيTOOLKIT أدوات سبيسليPAPER كلغة أجنبيةPAPER A ، محلل التبعية السريع والدقيق باستخدام الشبكات العصبيةPAPERCHALLENGE CONLL 2017 المهمة المشتركة: تحليل متعدد اللغات من النص الخام إلى التبعيات العالميةCHALLENGE CONLL 2016 المهمة المشتركة: تحليل الخطاب الضحل متعدد اللغاتCHALLENGE conll 2015 المهمة المشتركة: تحليل الخطاب الضحلCHALLENGE Semeval-2016 المهمة 8: قد تكون تمثيل المعنى مجردة ، لكن هذه المهمة ملموسة! WIKI جزء من الكلامPAPER متعدد اللغات العلامات الجزئية مع نماذج الذاكرة طويلة المدى الطويل ثنائية الاتجاه وخسارة مساعدةPAPER غير خاضع للإشراف على علامات جزء من الكلام مع نماذج ماركوف المخفية المرساةDATA TreeBank-3TOOLKIT NLTK.TAG WIKI بينينPAPER لمحرك طريقة إدخال Pinyin الصينيةPROJECT المترجم الصيني العصبي WIKIPAPER اسألني أي شيء: شبكات الذاكرة الديناميكية لمعالجة اللغة الطبيعيةPAPER للإجابة على الأسئلة المرئية والنصيةCHALLENGE مهمة الإجابة على سؤال TRECCHALLENGE NTCIR-8: الوصول المتقدم للمعلومات عبر اللغات (ACLIA)CHALLENGE مسار الإجابة على سؤال ClefCHALLENGE Semeval-2017 المهمة 3: إجابة المجتمعCHALLENGE Semeval-2018 المهمة 11: فهم الآلة باستخدام المعرفة المنطقيةDATA MS Marco: Microsoft Machine Reading Commandension مجموعة بياناتDATA Maluuba NewsqaDATA : 100،000+ سؤال لفهم الجهاز للنصDATA GraphQuesions: مجموعة بيانات أسئلة غنية بالأسئلةDATA اختبار cloze و rocstories corporaDATA Microsoft Research Wikiqa CorpusDATA DeepMind Q&ADATA QasentDATA WIKIPAPER أ نهج التعلم العميق لاستخراج العلاقة من سياق التفاعل في نموذج التصنيع الاجتماعيCHALLENGE Semeval-2018 المهمة 7 استخراج العلاقة الدلالية وتصنيفها في الأوراق العلمية WIKIBOOK وضع العلامات على الأدوار الدلاليةPAPER إلى طرف لوضع العلامات على الأدوار الدلالية باستخدام الشبكات العصبية المتكررةPAPER العلامات الدور الدلالي العصبي مع تضمينات مسار التبعيةPAPER العلامات الدور الدلالي العميق: ما الذي ينجح وما هو التاليCHALLENGE conll-2005 المهمة المشتركة: وضع العلامات على الأدوار الدلاليةCHALLENGE conll-2004 المهمة المشتركة: وضع العلامات على الأدوار الدلاليةTOOLKIT إلينوي الدور الدلالي (SRL)DATA CONLL-2005 المهمة المشتركة: وضع العلامات على الأدوار الدلالية WIKIPAPER A التقييم الكمي والنوعية للكشف عن حدود الجملة للمجال السريريTOOLKIT NLTK المميزاتDATA الوطنية البريطانيةDATA -كوربوس الكلام الهاتفي WIKIINFO تحليل المشاعر الرائعةCHALLENGE Kaggle: Umich SI650 - تصنيف المشاعرCHALLENGE Semeval-2017 المهمة 4: تحليل المشاعر في TwitterCHALLENGE Semeval-2017 المهمة 5: تحليل المشاعر الدقيقة على المدونات الصغيرة والأخبار الماليةPROJECT senticnetPROJECT تحليل المشاعر مجموعة ستانفورد NLPDATA بيانات المعنويات متعددة المجالات (الإصدار 2.0)DATA STANFORD SESITINTDATA Twitter Twitter CorpusDATA التدريب على تحليل المعنويات Twitter CorpusDATA AFINN: قائمة الكلمات الإنجليزية المصنفة من أجل التكافؤ PAPER دون تجزئة زمنيةPAPER : شكل اليد من طرف إلى طرف والتعرف على لغة الإشارة المستمرةDATA rwth-phoenix-weatherDATA ASLLRPPROJECT Signall PAPER على أساس الشبكات العصبية العميقةPAPER A Neural Parametric Singing Synthesizer Modeling Timbre والتعبير من الأغاني الطبيعيةPRODUCT الصوتي: تكنولوجيا تخليق الصوت والبرامج التي طورتها YamahaCHALLENGE "Fill-in the Gap" WORKSHOP NLP+CSS: ورش عمل حول معالجة اللغة الطبيعية والعلوم الاجتماعية الحسابيةTOOLKIT مثل التسوق: تقليل تضخيم التحيز بين الجنسين باستخدام قيود على مستوى الجسمTOOLKIT الأدوات عبر الإنترنت بايز لتخصيص dirichlet الكامن (LDA)GROUP مختبر المعرفة بجامعة شيكاغو WIKIPAPER من أعمى إلى فصل مصدر الصوت الموجهةPAPER للأقنعة والشبكات العصبية المتكررة العميقة لفصل المصدر أحاديCHALLENGE (SISEC)CHALLENGE خطاب التناغم والاعتراف WIKIPAPER على DNN لتسوية السماعةPAPER على مذكرات المتحدث: نهج متكامل وتكراريPAPER على أساس اندماج بايزي المكاني الزمانيCHALLENGE تقييم النسخ الغني WIKI التعرف على المتحدثPAPER مخطط جديد للتعرف على المتحدثين باستخدام شبكة عصبية عميقة مدركة صوتيًاPAPER لتصحيح مكبر الصوت المعتمد على نص البصمةPAPER : نظام تضمين عصبي من طرف إلى طرفPROJECT Voice Vector: أي من نجوم هوليوود يشبه صوتي؟CHALLENGE تقييم التعرف على المتحدثين (SRE)INFO هل هناك أي اقتراحات لقواعد البيانات المجانية للتعرف على السماعة؟DATA voxceleb2: التعرف على السماعة العميقة WIKI Speech_SegressationPAPER من قبل الأطفال الذين يبلغون من العمر 8 أشهر: عندما تحسب إشارات الكلام أكثر من الإحصائياتPAPER غير الخاضع للرقابة تجزئة الكلمات واكتشاف المعجم باستخدام تضمينات الكلمات الصوتيةPAPER غير خاضع للإشراف من المدخلات الصوتيةPAPER الذي يشرف بشكل ضعيف على اكتشاف المصطلح المنطوق باستخدام معلومات جانبية عبر اللغاتDATA الكالسيك الإسباني WIKIPAPER TTS الطبيعي عن طريق تكييف Wavenet على تنبؤات طيفية MELPAPER : نموذج توليدي للصوت الخامPAPER : نحو تخليق الكلام من شوط إلى النهايةPAPER 3: 2000 مكبرات الصوت العصبية إلى الكلامPAPER نظام النص إلى الكلام القابل للتدريب بكفاءة بناءً على شبكات تلافيفية عميقة مع اهتمام موجهDATA الكتاب المقدس العالمي الإنجليزيDATA LJDATA بيانات البياناتCHALLENGE الثلجية 2017PRODUCT LyrebirdPROJECT مشروع FestvoxTOOLKIT Merlin: نظام توليف الكلام الشبكة العصبية (NN) WIKI تعزيز الكلامBOOK تعزيز الكلام: النظرية والممارسةPAPER دراسة تجريبية حول تعزيز الكلام على أساس تعزيزPAPER أ نهج الانحدار في تعزيز الكلام على أساس تعزيزPAPER على أساس عدوى إزالة التوحيد العميق WIKI تنقشPAPER الشبكة العصبية الخلفيةTOOLKIT NLTK الجذعية WIKIPAPER لتصنيف التسلسل: التحليل والتطبيق على الكشف عن قانون الاستخراج والمراقف الرئيسي WIKI التشابه الدلاليPAPER A مسح لنهج تشابه النصPAPER لترتيب أزواج نصية قصيرة مع الشبكات العصبية العميقة التلافيفيةPAPER تحسين تمثيلات دلالية من شبكات الذاكرة على المدى الطويل على المدى الطويل منظمةCHALLENGE Semeval-2014 المهمة 3: التشابه الدلالي عبر المستوىCHALLENGE Semeval-2014 المهمة 10: تشابه نصي الدلالي متعدد اللغاتCHALLENGE Semeval-2017 المهمة 1: التشابه النصي الدلاليWIKI التشابه النصي الدلالي ويكي WIKIPAPER محاذاة الورق من ويكيبيديا القياسية إلى ويكيبيديا البسيطةPAPER في بحث تبسيط النص الحالي: يمكن أن تساعد بيانات جديدةDATA Newsela بيانات WIKI النصيةPROJECT نصي المشروع مع TensorFlowPAPER ورقي مع الاهتمام المنظم والتكوينCHALLENGE Semeval-2014 المهمة 1: تقييم النماذج الدلالية التوزيعية التركيبية على الجمل الكاملة من خلال العلاقة الدلالية والاستنتاجات النصيةCHALLENGE Semeval-2013 المهمة 7: تحليل استجابة الطالب المشترك والتعرف على التحدي النصي النصي WIKI ترجمةINFO معلومات عن البرامج النصية غير اللاتينيةPAPER أ نهج التعلم العميق في ترجمة الآلةCHALLENGE أخبار 2016 مهمة مشتركة حول ترجمة الكيانات المسماةPROJECT الترجمة اليابانية العصبية - هل يمكنك أن تفعل أفضل من لوحة المفاتيح SwiftKey ™؟ PAPER الخلفي الصوتيات الصوتية لتحويل الصوت العديد إلى واحد دون تدريب على البيانات الموازيةPROJECT الشبكات العصبية العميقة لتحويل الصوت (نقل النمط الصوتي) في TensorFlowPROJECT تنفيذ نظام تحويل الصوت باستخدام propehetgrams الصوتيةCHALLENGE تحدي تحويل الصوت 2016CHALLENGE تحويل الصوت 2018DATA قواعد بيانات توليف الكلام CMU_ARCTICDATA توقيت البيانات الصوتية-مجموعة الكلام المستمر WIKI تضمينTOOLKIT Gensim: Word2VecTOOLKIT fasttextTOOLKIT : المتجهات العالمية لتمثيل الكلماتINFO أين تحصل على نموذج مسبقPROJECT ناقلات الكلمات المدربة مسبقًاPROJECT من أكثر من 30 لغةPROJECT Polyglot: تمثيلات الكلمات الموزعة لـ NLP متعدد اللغاتPROJECT BPEMB: مجموعة من تضمينات الكلمات الفرعية التي تم تدريبها مسبقًا في 275 لغةCHALLENGE Semeval 2018 Task 10 التقاط السمات التمييزيةPAPER للترجمة الآلية القائمة على العبارةPAPER A مسح لنماذج التضمين عبر اللغات INFO ما هو التنبؤ بالكلمة؟PAPER التنبؤ للشخصية القائمة على نموذج لغة الشبكة العصبية المتكررةPAPER تنبؤات تعليمية قائمة على التعلم العميق المدمجPAPER تقييم الكلمة التنبؤ: تأطير مدخرات مفتاحDATA تنبؤات الكلمات المدمجة على التعلم العميقPROJECT باستخدام الشبكات العصبية التلافيفية - هل يمكنك أن تفعل أفضل من لوحة مفاتيح iPhone ™؟CHALLENGE SEMEVAL-2018 المهمة 2 ، التنبؤ متعدد اللغات الرموز التعبيرية WIKIPAPER التعلم تجزئة الكلمات العصبية للصينيينPROJECT لتجزئة الكلمات الصينيةTOOLKITTOOLKIT NLTK المميزات DATA الاكتتاب كلمةPAPER O-matic: كلمة غامضة على نطاق واسع النطاقDATA Train-O-MaticDATA بابل