nlp_tasks
1.0.0
很長一段時間以來,我一直從事幾項自然語言處理任務。有一天,我想畫一張我謀生的NLP領域的地圖。我敢肯定,我不是唯一一個想看哪些任務在NLP中的人。
我竭盡所能涵蓋NLP中盡可能多的任務,但誠然,這遠非詳盡無遺,這純粹是由於我缺乏知識。選定的參考文獻對最近的深度學習成就有偏見。我希望當您要研究任務時,這些都是起點。我會繼續自己更新此存儲庫,但我真正希望您在這項工作上合作。不要猶豫,向我發送拉動請求!
2017年10月13日。
由Kyubyong
YJ Choe於2017年10月18日對YJ Choe進行了審查和更新。
PAPER自動文本評分PAPER一種自動論文評分的神經方法CHALLENGE kaggle:惠普基金會:自動論文得分PROJECT輕鬆(增強的AI評分引擎) WIKI語音識別PAPER深度演講2:用英語和普通話的端到端語音識別PAPER Wavenet:原始音頻的生成模型PROJECT Baidu的DeepSpeech架構的張量實現PROJECT語音到文本 - 波納特:使用DeepMind的Wavenet的端到端句子級別的英語語音識別CHALLENGE第五個鐘聲分離和認可挑戰DATA第五鐘語音分離和認可挑戰DATA CSTR VCTK語料庫DATA LibrisPeech ASR語料庫DATA Cwessboard-1電話演講語料庫DATA ted-lium語料庫DATA開放語音和語言資源DATA通用語音WIKI自動摘要BOOK自動文本摘要PAPER文本摘要PAPER及其在多文件摘要中的應用DATA文本分析會議(TAC)DATA文檔了解會議(DUC) INFO核心分辨率PAPER深入的增強學習,以提及級別的核心模型PAPER解決方案CHALLENGE CONLL 2012共享任務:對Ontonotes中的多語言無限制核心CHALLENGE CONLL 2011年共享任務:對Ontonotes中的無限制核心CHALLENGE Semeval 2018任務4:多方對話中的角色識別PAPER多層卷積編碼器折疊神經網絡,用於語法誤差校正PAPER神經網絡翻譯模型PAPER改編序列模型的句子校正模型CHALLENGE Conll-2013共享任務:語法錯誤校正CHALLENGE Conll-2014共享任務:語法錯誤校正DATA NUS非商業研究/試驗語料庫許可證DATA lang-8學習者語料庫DATA Cornell電影 - dialogs語料庫PROJECT深文校正器PRODUCT深語法PAPER )任何語言PAPER多語言神經語言模型:跨語言語音表示學習的案例研究PAPER序列到序列轉換的紙序列序列到序列模型PROJECT序列到序列G2P工具包PROJECT G2P_EN:一個簡單的英語墨西米模塊到音素轉換DATA多語言發音數據PAPER自動諷刺檢測:調查PAPER磁鐵:使諷刺檢測及時,上下文且非常個性化PAPER諷刺檢測:行為建模方法CHALLENGE Semeval-2017任務6:#HASHTAGWARS:學習一種幽默感CHALLENGE Semeval-2017任務7:檢測和解釋英語雙關語DATA諷刺評論DATA諷刺語料庫V2DATA諷刺亞馬遜評論語料庫WIKI符號接地問題PAPER符號接地問題PAPER :在視覺上的語言學習的複發神經模型中的表示級別PAPER神經模型中的語音編碼PAPER門控架構PAPER聲 - word2vec:學習單詞表示以聲音為基礎COURSE語言接地到視覺和控制WORKSHOP語言基礎WIKI語言標識PAPER自動語言識別PAPER自然語言處理與小饋送網絡CHALLENGE 2015語言識別評估WIKI語言模型TOOLKIT KENLM語言模型工具包PAPER分佈單詞和短語的表示及其組成性PAPERPAPER角色感知神經語言模型THESIS統計語言模型基於神經網絡DATA Penn TreebankTUTORIAL WIKI LemmatisationPAPER關節檸檬酸和形態標記TOOLKIT WordNet狐猴DATA樹庫-3 WIKI唇讀PAPER唇膏:端到端句子級唇讀PAPER唇閱讀句子PAPER大規模視覺識別PROJECT唇讀 - 使用3D卷積神經網絡跨音頻識別PRODUCT LiopaDATA網格視聽句子語料庫DATA BBC-Oxford“多視圖唇讀句”(MV-LRS)數據集PAPER神經機器翻譯通過共同學習對齊和翻譯PAPER神經機器翻譯PAPER關注PAPER六個挑戰神經機器翻譯PAPER短語和神經無監督的機器翻譯CHALLENGE ACL 2014統計機器翻譯的第九屆研討會CHALLENGE EMNLP 2017第二屆機器翻譯會議(WMT17)DATA opensubtitles2016DATA WIT3:抄錄和翻譯對話的網絡清單DATA QCRI教育領域(QED)語料庫PAPER多任務序列到序列學習PAPER無監督的預處理PAPER Google的多語言神經機器翻譯系統:啟用零彈性翻譯TOOLKIT字神經機器翻譯TOOLKIT包多路神經機器翻譯TOOLKIT OpenNMT:神經機器翻譯的開源工具包WIKI拐點PAPER形態拐角產生產生CHALLENGE Sigmorphon 2016年共享任務:形態重新發射DATA sigmorphon2016 WIKI實體鏈接PAPER和集體實體通過語義嵌入歧義WIKI命名為實體識別PAPER神經體系結構PROJECT OSU Twitter NLP工具CHALLENGE在Twitter中名為實體識別的挑戰CHALLENGE Conll 2002語言獨立的命名實體識別CHALLENGE介紹CONLL-2003共享任務:獨立於語言的命名實體識別DATA Conll-2002 NER COPUSDATA Conll-2003 NER COPUSDATA螺母識別TOOLKIT Stanford指定實體識別器PAPER動態池和展開遞歸自動編碼器用於釋義檢測PROJECT :釋義驅動的學習,用於開放問題答案CHALLENGE Semeval-2015任務1:Twitter中的釋義和語義相似性DATA Microsoft研究釋義語料庫DATA Microsoft研究視頻描述語料庫DATA pascal數據集DATA Flickr數據集DATA數據集DATA ppdb:釋義數據庫DATA wikianswers釋義語料庫PAPER神經釋義生成DATA神經釋義與堆疊殘留LSTM網絡的生成CODE神經釋義與堆疊殘留LSTM網絡的生成PAPER一個釋義生成的深層生成框架PAPER WIKI解析TOOLKIT Stanford Parser:統計解析器TOOLKIT包的解析器PAPER語法作為外語PAPERPAPER普通語義解析CHALLENGE CONLL 2017共享任務:從原始文本到通用依賴性的多語言解析CHALLENGE CONLL 2016年共享任務:多語言淺說話解析CHALLENGE CONLL 2015年共享任務:淺說話解析CHALLENGE Semeval-2016任務8:含義表示可能是抽象的,但是此任務是具體的! WIKI詞性標籤PAPER多語言詞性標籤PAPER定的紙張標記紙張帶有錨定標籤隱藏的馬爾可夫模型DATA樹庫-3TOOLKIT包NLTK.TAG軟件包WIKI Pinyin輸入方法PAPER神經網絡語言模型PROJECT神經中國音譯器WIKI問題回答PAPER問我任何事情:用於自然語言處理的動態記憶網絡PAPER動態存儲網絡CHALLENGE TREC問答任務CHALLENGE NTCIR-8:高級跨語言信息訪問(ACLIA)CHALLENGE CLEF問答軌道CHALLENGE Semeval-2017任務3:社區問題回答CHALLENGE Semeval-2018任務11:使用常識知識的機器理解DATA MS MARCO:Microsoft機器閱讀理解數據集DATA maluuba newsqaDATA小隊:100,000多個用於機器理解文本的問題DATA繪畫:一個特徵富的問題回答數據集DATA故事披肩測試和Rocstories CorporaDATA Microsoft Research Wikiqa語料庫DATA DeepMind問答數據集DATA qasentDATA教科書問題回答WIKI關係提取PAPER一種深度學習方法,從社會製造範式中的互動環境中提取關係提取CHALLENGE Semeval-2018任務7科學論文中的語義關係提取和分類WIKI語義角色標籤BOOK語義角色標籤PAPER端到端學習PAPER神經語義角色標記PAPER深層的語義角色標籤:有效和下一步CHALLENGE CONLL-2005共享任務:語義角色標籤CHALLENGE CONLL-2004共享任務:語義角色標籤TOOLKIT伊利諾伊語義角色標籤(SRL)DATA Conll-2005共享任務:語義角色標籤WIKI句子邊界歧義PAPER對臨床領域的句子邊界檢測進行定量和定性評估TOOLKIT NLTK TokenizersDATA英國國家語料庫DATA Cwessboard-1電話演講語料庫WIKI情感分析INFO令人敬畏的情感分析CHALLENGE Kaggle:Umich SI650-情感分類CHALLENGE Semeval-2017任務4:Twitter中的情感分析CHALLENGE Semeval-2017任務5:關於金融微博和新聞的細粒度情感分析PROJECT SenticnetPROJECTDATA多域情感數據集(版本2.0)DATA斯坦福情緒樹庫DATA Twitter情感語料庫DATA Twitter情感分析培訓語料庫DATA afinn:評級為Valence的英語單詞列表PAPER視頻的手語識別而無需時間細分PAPER子無:端到端的手形和連續的手語識別DATA rwth-phoenix天氣DATA asllrpPROJECT標誌PAPER唱歌語音綜合PAPER神經參數唱歌合成器建模音色和自然歌曲的表達PRODUCT Vocaloid:Yamaha開發的語音合成技術和軟件CHALLENGE特殊會議Interspeech 2016年歌唱綜合挑戰挑戰“填充差距” WORKSHOP NLP+CSS:自然語言處理和計算社會科學研討會TOOLKIT男人也喜歡購物:使用語料庫級約束減少性別偏見放大TOOLKIT在線變分貝葉斯GROUP芝加哥大學知識實驗室WIKI源分離PAPER從盲人到指導的音頻源分離PAPER聯合優化面具和深層復發性神經網絡,用於單膜源分離CHALLENGE信號分離評估運動(SISEC)CHALLENGE鐘聲分離和認可挑戰WIKI揚聲器診斷PAPER DNN的揚聲器聚類用於揚聲器PAPER診斷紙的無監督方法:一種綜合且迭代的方法PAPER音頻說話者診斷CHALLENGE豐富的轉錄評估WIKI發言人的認可PAPER一種使用語音意識深神經網絡的說話者識別的新穎方案PAPER深層神經網絡,用於小足跡依賴文本的揚聲器驗證PAPER揚聲器:端到端的神經揚聲器嵌入系統PROJECT Voice Vector:哪個好萊塢明星與我的聲音最相似?CHALLENGE NIST發言人的認可評估(SRE)INFO是否有有關揚聲器識別的免費數據庫的建議?DATA voxceleb2:深揚聲器識別WIKI Speech_TementationPAPER單詞分割:當語音提示計數時,PAPER無監督的單詞細分和使用聲詞嵌入發現的詞彙PAPERPAPER使用跨語性側信息弱監督的口頭髮現術語發現DATA呼叫者西班牙語演講WIKI語音綜合PAPER自然TTS合成通過調節象徵在MEL頻譜圖預測上PAPER Wavenet:原始音頻的生成模型PAPER塔科克斯:朝向端到端語音合成PAPER深聲3:2000揚聲器神經文本到語音PAPER有效訓練的文本到語音系統,並引導著DATA世界英語聖經DATA LJ語音數據集DATA LESSAC數據CHALLENGE暴雪挑戰2017PRODUCT列裡鳥PROJECT Festvox項目TOOLKIT Merlin:基於神經網絡(NN)語音合成系統WIKI演講增強BOOK演講增強:理論與實踐PAPER一項關於基於語音增強的實驗研究PAPER一種基於言語增強的回歸方法PAPER演講增強WIKI莖PAPER一個反向傳播神經網絡,以改善阿拉伯語TOOLKIT NLTK莖WIKI術語提取PAPER神經註意力模型:分析和應用關鍵術語提取和對話法檢測WIKI語義相似性PAPER調查文本相似性方法PAPER學習與卷積深神經網絡對短文對排名PAPER改進了樹木結構的長期短期內存網絡的語義表示CHALLENGE Semeval-2014任務3:跨級語義相似性CHALLENGE Semeval-2014任務10:多語言語義文本相似性CHALLENGE Semeval-2017任務1:語義文本相似性WIKI語義文本相似性Wiki WIKI文本簡化PAPER句子句子PAPER問題:新數據可以幫助DATA新聞數據WIKI文字需要PROJECTPAPER文本需要結構化注意力和構圖CHALLENGE SEMEVAL-2014任務1:通過語義相關性和文本構成的完整句子的構圖分佈語義模型的評估CHALLENGE Semeval-2013任務7:共同的學生響應分析和第8個認可文本挑戰挑戰WIKI音譯INFO音譯PAPER一種深度學習的機器音譯方法CHALLENGE新聞2016分享有關命名實體音譯的任務PROJECT - 您能比SwiftKey™鍵盤做得更好嗎? PAPER紙語音後驗PROJECT語音轉換的深度神經網絡(語音樣式傳輸)PROJECT語音轉換系統的實現,利用語音後驗CHALLENGE語音轉換挑戰2016CHALLENGE語音轉換挑戰2018DATA cmu_arctic語音綜合數據庫DATA觸發聲音 - 語音連續語音語料庫WIKI單詞嵌入TOOLKIT Gensim:Word2VecTOOLKIT FastTextTOOLKIT包手套:單詞表示的全局向量INFO在哪裡獲取驗證的模型PROJECT預訓練的單詞向量PROJECT預培訓的30多種語言的預訓練媒介PROJECT Polyglot:多語言NLP的分佈式單詞表示PROJECT :以275種語言的預訓練子字嵌入的集合CHALLENGE Semeval 2018任務10捕獲歧視性屬性PAPER雙語單詞嵌入PAPER跨語性嵌入模型的調查INFO什麼是單詞預測?PAPER基於復發性神經網絡語言模型的角色預測PAPER一個基於深度學習的單詞預測PAPER評估單詞預測:框架擊鍵節省DATA嵌入式深度學習的單詞預測PROJECT字預測 - 您可以比iPhone™鍵盤做得更好嗎?CHALLENGE Semeval-2018任務2,多語言表情符號預測WIKI單詞分割PAPER神經單詞細分學習PROJECT卷積神經網絡TOOLKIT Stanford Word SegmenterTOOLKIT NLTK Tokenizers DATA單詞態度的歧義PAPER列車摩托車:大規模監督的單詞感官在沒有手動培訓數據的情況下以多種語言的歧義DATA火車-O-MATIC數據DATA babelnet