nlp_tasks
1.0.0
很长一段时间以来,我一直从事几项自然语言处理任务。有一天,我想画一张我谋生的NLP领域的地图。我敢肯定,我不是唯一一个想看哪些任务在NLP中的人。
我竭尽所能涵盖NLP中尽可能多的任务,但诚然,这远非详尽无遗,这纯粹是由于我缺乏知识。选定的参考文献对最近的深度学习成就有偏见。我希望当您要研究任务时,这些都是起点。我会继续自己更新此存储库,但我真正希望您在这项工作上合作。不要犹豫,向我发送拉动请求!
2017年10月13日。
由Kyubyong
YJ Choe于2017年10月18日对YJ Choe进行了审查和更新。
PAPER自动文本评分PAPER一种自动论文评分的神经方法CHALLENGE kaggle:惠普基金会:自动论文得分PROJECT轻松(增强的AI评分引擎) WIKI语音识别PAPER深度演讲2:用英语和普通话的端到端语音识别PAPER Wavenet:原始音频的生成模型PROJECT Baidu的DeepSpeech架构的张量实现PROJECT语音到文本 - 波纳特:使用DeepMind的Wavenet的端到端句子级别的英语语音识别CHALLENGE第五个钟声分离和认可挑战DATA第五钟语音分离和认可挑战DATA CSTR VCTK语料库DATA LibrisPeech ASR语料库DATA Cwessboard-1电话演讲语料库DATA ted-lium语料库DATA开放语音和语言资源DATA通用语音WIKI自动摘要BOOK自动文本摘要PAPER文本摘要PAPER及其在多文件摘要中的应用DATA文本分析会议(TAC)DATA文档了解会议(DUC) INFO核心分辨率PAPER深入的增强学习,以提及级别的核心模型PAPER解决方案CHALLENGE CONLL 2012共享任务:对Ontonotes中的多语言无限制核心CHALLENGE CONLL 2011年共享任务:对Ontonotes中的无限制核心CHALLENGE Semeval 2018任务4:多方对话中的角色识别PAPER多层卷积编码器折叠神经网络,用于语法误差校正PAPER神经网络翻译模型PAPER改编序列模型的句子校正模型CHALLENGE Conll-2013共享任务:语法错误校正CHALLENGE Conll-2014共享任务:语法错误校正DATA NUS非商业研究/试验语料库许可证DATA lang-8学习者语料库DATA Cornell电影 - dialogs语料库PROJECT深文校正器PRODUCT深语法PAPER )任何语言PAPER多语言神经语言模型:跨语言语音表示学习的案例研究PAPER序列到序列转换的纸序列序列到序列模型PROJECT序列到序列G2P工具包PROJECT G2P_EN:一个简单的英语墨西米模块到音素转换DATA多语言发音数据PAPER自动讽刺检测:调查PAPER磁铁:使讽刺检测及时,上下文且非常个性化PAPER讽刺检测:行为建模方法CHALLENGE Semeval-2017任务6:#HASHTAGWARS:学习一种幽默感CHALLENGE Semeval-2017任务7:检测和解释英语双关语DATA讽刺评论DATA讽刺语料库V2DATA讽刺亚马逊评论语料库WIKI符号接地问题PAPER符号接地问题PAPER :在视觉上的语言学习的复发神经模型中的表示级别PAPER神经模型中的语音编码PAPER门控架构PAPER声 - word2vec:学习单词表示以声音为基础COURSE语言接地到视觉和控制WORKSHOP语言基础WIKI语言标识PAPER自动语言识别PAPER自然语言处理与小馈送网络CHALLENGE 2015语言识别评估WIKI语言模型TOOLKIT KENLM语言模型工具包PAPER分布单词和短语的表示及其组成性PAPERPAPER角色感知神经语言模型THESIS统计语言模型基于神经网络DATA Penn TreebankTUTORIAL WIKI LemmatisationPAPER关节柠檬酸和形态标记TOOLKIT WordNet狐猴DATA树库-3 WIKI唇读PAPER唇膏:端到端句子级唇读PAPER唇阅读句子PAPER大规模视觉识别PROJECT唇读 - 使用3D卷积神经网络跨音频识别PRODUCT LiopaDATA网格视听句子语料库DATA BBC-Oxford“多视图唇读句”(MV-LRS)数据集PAPER神经机器翻译通过共同学习对齐和翻译PAPER神经机器翻译PAPER关注PAPER六个挑战神经机器翻译PAPER短语和神经无监督的机器翻译CHALLENGE ACL 2014统计机器翻译的第九届研讨会CHALLENGE EMNLP 2017第二届机器翻译会议(WMT17)DATA opensubtitles2016DATA WIT3:抄录和翻译对话的网络清单DATA QCRI教育领域(QED)语料库PAPER多任务序列到序列学习PAPER无监督的预处理PAPER Google的多语言神经机器翻译系统:启用零弹性翻译TOOLKIT字神经机器翻译TOOLKIT包多路神经机器翻译TOOLKIT OpenNMT:神经机器翻译的开源工具包WIKI拐点PAPER形态拐角产生产生CHALLENGE Sigmorphon 2016年共享任务:形态重新发射DATA sigmorphon2016 WIKI实体链接PAPER和集体实体通过语义嵌入歧义WIKI命名为实体识别PAPER神经体系结构PROJECT OSU Twitter NLP工具CHALLENGE在Twitter中名为实体识别的挑战CHALLENGE Conll 2002语言独立的命名实体识别CHALLENGE介绍CONLL-2003共享任务:独立于语言的命名实体识别DATA Conll-2002 NER COPUSDATA Conll-2003 NER COPUSDATA螺母识别TOOLKIT Stanford指定实体识别器PAPER动态池和展开递归自动编码器用于释义检测PROJECT :释义驱动的学习,用于开放问题答案CHALLENGE Semeval-2015任务1:Twitter中的释义和语义相似性DATA Microsoft研究释义语料库DATA Microsoft研究视频描述语料库DATA pascal数据集DATA Flickr数据集DATA数据集DATA ppdb:释义数据库DATA wikianswers释义语料库PAPER神经释义生成DATA神经释义与堆叠残留LSTM网络的生成CODE神经释义与堆叠残留LSTM网络的生成PAPER一个释义生成的深层生成框架PAPER WIKI解析TOOLKIT Stanford Parser:统计解析器TOOLKIT包的解析器PAPER语法作为外语PAPERPAPER普通语义解析CHALLENGE CONLL 2017共享任务:从原始文本到通用依赖性的多语言解析CHALLENGE CONLL 2016年共享任务:多语言浅说话解析CHALLENGE CONLL 2015年共享任务:浅说话解析CHALLENGE Semeval-2016任务8:含义表示可能是抽象的,但是此任务是具体的! WIKI词性标签PAPER多语言词性标签PAPER定的纸张标记纸张带有锚定标签隐藏的马尔可夫模型DATA树库-3TOOLKIT包NLTK.TAG软件包WIKI Pinyin输入方法PAPER神经网络语言模型PROJECT神经中国音译器WIKI问题回答PAPER问我任何事情:用于自然语言处理的动态记忆网络PAPER动态存储网络CHALLENGE TREC问答任务CHALLENGE NTCIR-8:高级跨语言信息访问(ACLIA)CHALLENGE CLEF问答轨道CHALLENGE Semeval-2017任务3:社区问题回答CHALLENGE Semeval-2018任务11:使用常识知识的机器理解DATA MS MARCO:Microsoft机器阅读理解数据集DATA maluuba newsqaDATA小队:100,000多个用于机器理解文本的问题DATA绘画:一个特征富的问题回答数据集DATA故事披肩测试和Rocstories CorporaDATA Microsoft Research Wikiqa语料库DATA DeepMind问答数据集DATA qasentDATA教科书问题回答WIKI关系提取PAPER一种深度学习方法,从社会制造范式中的互动环境中提取关系提取CHALLENGE Semeval-2018任务7科学论文中的语义关系提取和分类WIKI语义角色标签BOOK语义角色标签PAPER端到端学习PAPER神经语义角色标记PAPER深层的语义角色标签:有效和下一步CHALLENGE CONLL-2005共享任务:语义角色标签CHALLENGE CONLL-2004共享任务:语义角色标签TOOLKIT伊利诺伊语义角色标签(SRL)DATA Conll-2005共享任务:语义角色标签WIKI句子边界歧义PAPER对临床领域的句子边界检测进行定量和定性评估TOOLKIT NLTK TokenizersDATA英国国家语料库DATA Cwessboard-1电话演讲语料库WIKI情感分析INFO令人敬畏的情感分析CHALLENGE Kaggle:Umich SI650-情感分类CHALLENGE Semeval-2017任务4:Twitter中的情感分析CHALLENGE Semeval-2017任务5:关于金融微博和新闻的细粒度情感分析PROJECT SenticnetPROJECTDATA多域情感数据集(版本2.0)DATA斯坦福情绪树库DATA Twitter情感语料库DATA Twitter情感分析培训语料库DATA afinn:评级为Valence的英语单词列表PAPER视频的手语识别而无需时间细分PAPER子无:端到端的手形和连续的手语识别DATA rwth-phoenix天气DATA asllrpPROJECT标志PAPER唱歌语音综合PAPER神经参数唱歌合成器建模音色和自然歌曲的表达PRODUCT Vocaloid:Yamaha开发的语音合成技术和软件CHALLENGE特殊会议Interspeech 2016年歌唱综合挑战挑战“填充差距” WORKSHOP NLP+CSS:自然语言处理和计算社会科学研讨会TOOLKIT男人也喜欢购物:使用语料库级约束减少性别偏见放大TOOLKIT在线变分贝叶斯GROUP芝加哥大学知识实验室WIKI源分离PAPER从盲人到指导的音频源分离PAPER联合优化面具和深层复发性神经网络,用于单膜源分离CHALLENGE信号分离评估运动(SISEC)CHALLENGE钟声分离和认可挑战WIKI扬声器诊断PAPER DNN的扬声器聚类用于扬声器PAPER诊断纸的无监督方法:一种综合且迭代的方法PAPER音频说话者诊断CHALLENGE丰富的转录评估WIKI发言人的认可PAPER一种使用语音意识深神经网络的说话者识别的新颖方案PAPER深层神经网络,用于小足迹依赖文本的扬声器验证PAPER扬声器:端到端的神经扬声器嵌入系统PROJECT Voice Vector:哪个好莱坞明星与我的声音最相似?CHALLENGE NIST发言人的认可评估(SRE)INFO是否有有关扬声器识别的免费数据库的建议?DATA voxceleb2:深扬声器识别WIKI Speech_TementationPAPER单词分割:当语音提示计数时,PAPER无监督的单词细分和使用声词嵌入发现的词汇PAPERPAPER使用跨语性侧信息弱监督的口头发现术语发现DATA呼叫者西班牙语演讲WIKI语音综合PAPER自然TTS合成通过调节象征在MEL频谱图预测上PAPER Wavenet:原始音频的生成模型PAPER塔科克斯:朝向端到端语音合成PAPER深声3:2000扬声器神经文本到语音PAPER有效训练的文本到语音系统,并引导着DATA世界英语圣经DATA LJ语音数据集DATA LESSAC数据CHALLENGE暴雪挑战2017PRODUCT列里鸟PROJECT Festvox项目TOOLKIT Merlin:基于神经网络(NN)语音合成系统WIKI演讲增强BOOK演讲增强:理论与实践PAPER一项关于基于语音增强的实验研究PAPER一种基于言语增强的回归方法PAPER演讲增强WIKI茎PAPER一个反向传播神经网络,以改善阿拉伯语TOOLKIT NLTK茎WIKI术语提取PAPER神经注意力模型:分析和应用关键术语提取和对话法检测WIKI语义相似性PAPER调查文本相似性方法PAPER学习与卷积深神经网络对短文对排名PAPER改进了树木结构的长期短期内存网络的语义表示CHALLENGE Semeval-2014任务3:跨级语义相似性CHALLENGE Semeval-2014任务10:多语言语义文本相似性CHALLENGE Semeval-2017任务1:语义文本相似性WIKI语义文本相似性Wiki WIKI文本简化PAPER句子句子PAPER问题:新数据可以帮助DATA新闻数据WIKI文字需要PROJECTPAPER文本需要结构化注意力和构图CHALLENGE SEMEVAL-2014任务1:通过语义相关性和文本构成的完整句子的构图分布语义模型的评估CHALLENGE Semeval-2013任务7:共同的学生响应分析和第8个认可文本挑战挑战WIKI音译INFO音译PAPER一种深度学习的机器音译方法CHALLENGE新闻2016分享有关命名实体音译的任务PROJECT - 您能比SwiftKey™键盘做得更好吗? PAPER纸语音后验PROJECT语音转换的深度神经网络(语音样式传输)PROJECT语音转换系统的实现,利用语音后验CHALLENGE语音转换挑战2016CHALLENGE语音转换挑战2018DATA cmu_arctic语音综合数据库DATA触发声音 - 语音连续语音语料库WIKI单词嵌入TOOLKIT Gensim:Word2VecTOOLKIT FastTextTOOLKIT包手套:单词表示的全局向量INFO在哪里获取验证的模型PROJECT预训练的单词向量PROJECT预培训的30多种语言的预训练媒介PROJECT Polyglot:多语言NLP的分布式单词表示PROJECT :以275种语言的预训练子字嵌入的集合CHALLENGE Semeval 2018任务10捕获歧视性属性PAPER双语单词嵌入PAPER跨语性嵌入模型的调查INFO什么是单词预测?PAPER基于复发性神经网络语言模型的角色预测PAPER一个基于深度学习的单词预测PAPER评估单词预测:框架击键节省DATA嵌入式深度学习的单词预测PROJECT字预测 - 您可以比iPhone™键盘做得更好吗?CHALLENGE Semeval-2018任务2,多语言表情符号预测WIKI单词分割PAPER神经单词细分学习PROJECT卷积神经网络TOOLKIT Stanford Word SegmenterTOOLKIT NLTK Tokenizers DATA单词态度的歧义PAPER列车摩托车:大规模监督的单词感官在没有手动培训数据的情况下以多种语言的歧义DATA火车-O-MATIC数据DATA babelnet