nlp_tasks
1.0.0
私は長い間、いくつかの自然言語処理タスクに取り組んできました。ある日、私は生計を立てているNLPフィールドの地図を描くように感じました。 NLPにタスクがあるのを見たいと思っているのは私だけではないと確信しています。
私はNLPでできるだけ多くのタスクをカバーするために最善を尽くしましたが、確かに、これは純粋に知識不足のために徹底的にはほど遠いものです。選択された参照は、最近の深い学習成果に偏っています。あなたがタスクを掘り下げようとしているとき、これらは出発点として機能すると思います。私はこのリポジトリを自分で更新し続けますが、私が本当に願っています。私にプルリクエストを送ることを躊躇しないでください!
2017年10月13日。
Kyubyongによって
2017年10月18日にYJ Choeによってレビューおよび更新されました。
PAPER自動テキストスコアリングPAPERエッセイスコアリングへのニューラルアプローチCHALLENGEカグル:ヒューレット財団:自動エッセイスコアリングPROJECT使いやすさ(強化されたAIスコアリングエンジン) WIKI音声認識PAPER深いスピーチ2:英語と北京語でのエンドツーエンドの音声認識PAPER Wavenet:生のオーディオの生成モデルPROJECTPROJECT -toxt-text-wavenet:deepmind'swavenetを使用したエンドツーエンドの文レベル英語の音声認識CHALLENGEDATA 5番目のチャイム音声分離と認識の課題DATA CSTR VCTKコーパスDATA Librispeech ASR CorpusDATA Switchboard-1電話スピーチコーパスDATAテッドリウムコーパスDATAを開いた音声および言語リソースDATA共通の音声WIKI自動要約BOOKPAPERテキストの要約PAPERランキングとマルチドキュメントの要約へのアプリケーションDATAテキスト分析会議(TAC)DATAドキュメント理解会議(DUC) INFOコアレファレンス解像度PAPER深補強学習PAPERCHALLENGE Conll 2012共有タスク:Ontonotesでの多言語の無制限のコアリファレンスのモデリングCHALLENGE Conll 2011共有タスク:Ontonotesの無制限のコアレファレンスのモデリングCHALLENGE Semeval 2018タスク4:マルチパーティダイアログの文字識別PAPERための多層畳み込みエンコーダデコーダーニューラルネットワークPAPERニューラルネットワーク翻訳モデルPAPER適応シーケンスモデルCHALLENGE Conll-2013共有タスク:文法的エラー修正CHALLENGE Conll-2014共有タスク:文法的エラー修正DATA NUS非営利研究/試験コーパスライセンスDATA Lang-8学習者CorporaDATAコーネルムービー - ダイアログスコーパスPROJECTPRODUCTディープグラマーPAPERグラフェムから音量間モデルPAPERポリグロットニューラル言語モデル:言語間の音声表現学習における事例研究PAPERマルチタスクシーケンスからシーケンスモデルPROJECTシーケンスからシーケンスG2PツールキットPROJECT G2P_EN:英語のグラフェムから音素変換用のシンプルなPythonモジュールDATA多言語の発音データPAPER自動皮肉検出:調査PAPER磁石:皮肉検出をタイムリー、コンテキスト、非常に個人的なものにするPAPERの皮肉検出:行動モデリングアプローチCHALLENGE Semeval-2017タスク6:#hashtagwars:ユーモアのセンスを学ぶCHALLENGE SEMVAL-2017タスク7:英語のしゃれの検出と解釈DATA皮肉なコメントDATA皮肉Corpus V2DATA皮肉AmazonはコーパスをレビューしますWIKIシンボルの接地問題PAPERPAPER :視覚的に接地された言語学習の再発性神経モデルにおける表現レベルPAPERエンコーディングPAPERのゲートアテンションアーキテクチャPAPER Sound-Word2Vec:音に基づいた単語表現を学習しますCOURSE言語の接地WORKSHOP言語の基礎WIKI言語識別PAPER自動言語識別PAPER自然言語処理CHALLENGE 2015言語認識評価WIKI言語モデルTOOLKIT KENLM言語モデルツールキットPAPERPAPER生成シーケンスPAPERキャラクター認識神経言語モデルTHESIS統計言語モデルDATAペンツリーバンクTUTORIAL Tensorflowチュートリアル再発性ニューラルネットワークを使用した言語モデリングWIKI lemmatationPAPER関節整数化とレミングによる形態学的タグ付けTOOLKIT WordNet LemmatizerDATAツリーバンク-3 WIKIリップリーディングPAPERリップネット:エンドツーエンドの文レベルのリップリーディングPAPER唇の読み文章PAPER大規模な視覚音声認識PROJECTリップリーディング - 3D畳み込みニューラルネットワークを使用したクロスオーディオ視聴覚認識PRODUCT liopaDATADATA BBC-OXFORD「マルチビューリップリーディング文」(MV-LRS)データセットPAPERニューラル機械翻訳PAPERニューラル機械翻訳PAPER注意はあなたが必要とするすべてですPAPERPAPERフレーズに基づいた&ニューラルの監視なし機械翻訳CHALLENGECHALLENGE EMNLP 2017機械翻訳に関する2回目の会議(WMT17)DATA opensubtitles2016DATA Wit3:転写および翻訳された講演のWebインベントリDATA QCRI教育ドメイン(QED)コーパスPAPERマルチタスクシーケンスPAPERPAPER Googleの多言語ニューラル機械翻訳システム:ゼロショット翻訳を可能にするTOOLKITキットサブワードニューラルマシン翻訳TOOLKITマルチウェイニューラルマシン翻訳TOOLKIT OpenNMT:神経機械翻訳用のオープンソースツールキットWIKI変曲PAPERの形態的変曲生成CHALLENGE Sigmorphon 2016の共有タスク:形態学的再損傷DATA Sigmorphon2016 WIKIエンティティがリンクしていますPAPER堅牢で集合的なエンティティは、セマンティックな埋め込みを通して曖昧性を乱しますWIKIの名前が付けられたエンティティ認識PAPERニューラルアーキテクチャPROJECT OSU Twitter NLPツールCHALLENGECHALLENGE Conll 2002言語に依存しない名前のエンティティ認識CHALLENGE紹介:言語に依存しない名前のエンティティ認識DATA CONLL-2002 NERコーパスDATA CONLL-2003 NERコーパスDATAナットTOOLKIT Stanfordという名前のEntity Recoldizerという名前PAPER動的プーリングと展開展開言い換えのための再帰自動エンコーダーPROJECT Paralex:オープンな質問応答のための言い換え駆動学習CHALLENGE Semeval-2015タスク1:Twitterでの言い換えと意味的類似性DATA Microsoft Research Paraphrase CorpusDATA Microsoft Researchビデオ説明コーパスDATAパスカルデータセットDATA FlickrデータセットDATA SICKデータセットDATA PPDB:言い換えデータベースDATAウィキアンズワース言い換えコーパスPAPER神経の言い換え生成DATAニューラルの言い換え生成CODEニューラルの言い換えをコードしますPAPER言い換えのための深い生成フレームワークPAPER言い換えWIKI解析TOOLKIT :統計パーサーTOOLKITスペイシーパーサーPAPER文法PAPERPAPERユニバーサルセマンティック解析CHALLENGE CONLL 2017共有タスク:生のテキストからユニバーサル依存関係への多言語解析CHALLENGE Conll 2016共有タスク:多言語の浅い談話の解析CHALLENGE CONLL 2015共有タスク:浅い談話の解析CHALLENGE Semeval-2016タスク8:意味表現は抽象的かもしれませんが、このタスクは具体的です! WIKI一部のスピーチタグ付けPAPER多言語部門のタグ付けは、双方向の長期記憶モデルと補助損失を伴うPAPERの一部のタグ付けDATAツリーバンク-3TOOLKIT nltk.tagパッケージWIKI Pinyin入力方法PAPERニューラルネットワーク言語モデルPROJECTニューラル中国語の翻訳者WIKI質問応答PAPER Ask Me Anthing:自然言語処理のための動的メモリネットワークPAPER動的メモリネットワークCHALLENGECHALLENGE NTCIR-8:高度な横断的情報アクセス(ACLIA)CHALLENGE Clage Clead質問応答トラックCHALLENGE Semeval-2017タスク3:コミュニティの質問応答CHALLENGE Semeval-2018タスク11:常識的な知識を使用した機械的理解DATA MS Marco:Microsoft Machine Readhing DatasetDATAマルバNewsqaDATA分隊:テキストの機械理解に関する100,000以上の質問DATAグラフクエスト:データセットに応答する特性が豊富な質問DATAストーリークローズテストとRocstories CorporaDATA Microsoft Research Wikiqa CorpusDATAディープマインドQ&AデータセットDATA QasentDATA教科書の質問応答WIKI関係抽出PAPER社会製造パラダイムにおける相互作用コンテキストからの関係抽出のための深い学習アプローチCHALLENGE SEMVAL-2018タスク7科学論文のセマンティック関係の抽出と分類WIKIセマンティックロールラベル付けBOOKPAPERエンドツーエンド学習PAPERニューラルセマンティックロールラベル付けPAPERディープセマンティックロールラベル付け:何が機能し、次に何がCHALLENGE -2005の共有タスク:セマンティックロールラベル付けCHALLENGE Conll-2004共有タスク:セマンティックロールラベル付けTOOLKITイリノイセマンティックロールラベル(SRL)DATA CONLL-2005共有タスク:セマンティックロールラベル付けWIKI文の境界の曖昧性除去PAPER臨床ドメインの文境界検出の定量的および定性的評価TOOLKIT NLTKトークナイザーDATADATA Switchboard-1電話スピーチコーパスWIKIセンチメント分析INFO素晴らしい感情分析CHALLENGE Kaggle:Umich SI650-センチメント分類CHALLENGE Semeval-2017タスク4:Twitterでの感情分析CHALLENGE Semeval-2017タスク5:金融マイクロブログとニュースに関する細かい感情分析PROJECT SenticNetPROJECTDATAマルチドメインセンチメントデータセット(バージョン2.0)DATAスタンフォードセンチメントツリーバンクDATA TwitterセンチメントコーパスDATA Twitterセンチメント分析トレーニングコーパスDATAアフィン:Valenceと評価された英語の単語のリストPAPERビデオベースの手話の認識PAPERサブネット:エンドツーエンドの手の形と連続的な手話認識DATA rwth-phoenix-weatherDATA asllrpPROJECT Signall PAPER歌声統合PAPERPRODUCTボーカロイド:ヤマハが開発した音声合成技術とソフトウェアCHALLENGEスペシャルセッションinterspeech 2016 Singing Synthesis Challenge「Fiell-in the Gap」 WORKSHOP NLP+CSS:自然言語処理と計算社会科学に関するワークショップTOOLKIT男性も買い物を好む:コーパスレベルの制約を使用した性別バイアス増幅を減らすTOOLKITオンラインバリエーションベイズ(LDA)GROUP WIKIソース分離PAPERPAPER共同最適化CHALLENGE信号分離評価キャンペーン(SISEC)CHALLENGE WIKIスピーカーの耳錯誤PAPER DNNベースのスピーカークラスタリングPAPERダイアリゼーションのための監視されていない方法:統合された反復アプローチPAPER視聴覚スピーカーの日記CHALLENGE WIKIスピーカーの認識PAPER認識のための新しいスキームPAPERの深いニューラルネットワークPAPERディープスピーカー:エンドツーエンドのニューラルスピーカー埋め込みシステムPROJECT Voice Vector:ハリウッドスターのどれが私の声に最も似ていますか?CHALLENGEニストスピーカー認識評価(SRE)INFOスピーカー認識のための無料データベースの提案はありますか?DATA VoxceleB2:ディープスピーカー認識WIKI speech_segmentationPAPER単語セグメンテーション:音声キューが統計よりもカウントされるときPAPERされていない単語のセグメンテーションとレキシコン発見PAPER辞書の発見PAPERDATAコールホームスペイン語のスピーチWIKI音声統合PAPER天然TTS合成PAPER Wavenet:生のオーディオの生成モデルPAPER Tacotron:エンドツーエンドの音声合成に向けてPAPER Deep Voice 3:2000スピーカーニューラルテキストからスピーチPAPERDATA世界英語聖書DATA LJ音声データセットDATA LessACデータCHALLENGEブリザードチャレンジ2017PRODUCT lyrebirdPROJECTTOOLKITマーリン:ニューラルネットワーク(NN)ベースの音声合成システムWIKI音声強化BOOKスピーチの強化:理論と実践PAPERに関する実験的研究PAPER音声拡張に基づく回帰アプローチdonepeepneuralnetworksPAPER音声強化WIKI茎PAPERTOOLKIT NLTKステムマーWIKI用語抽出PAPER神経注意モデル:分析と主要な用語抽出および対話法検出への応用WIKIセマンティックの類似性PAPERテキストの類似性の調査がアプローチしますPAPER学習PAPER木構造の長期メモリネットワークからのセマンティック表現を改善しましたCHALLENGE Semeval-2014タスク3:クロスレベルのセマンティックの類似性CHALLENGE Semeval-2014タスク10:多言語セマンティックテキストの類似性CHALLENGE Semeval-2017タスク1:セマンティックテキストの類似性WIKIセマンティックテキストの類似性wiki WIKIテキストの簡素化PAPERPAPERの問題単純化の研究:新しいデータが役立つDATA NewselaデータWIKIテキストの伴いPROJECTのテキストの誘惑PAPERテキストの伴いCHALLENGE SEMVAL-2014タスク1:セマンティック関連性とテキスト誘導による完全な文に関する構成分布セマンティックモデルの評価CHALLENGE Semeval-2013タスク7:共同学生対応分析と第8回認識テキストの絡み合い課題WIKI翻訳INFO音訳PAPERマシンの音訳への深い学習アプローチCHALLENGEニュース2016名前付きエンティティの音訳に関する共有タスクPROJECTニューラルの日本の音訳 - SwiftKey™キーボードよりも優れていることができますか? PAPER音声後部グラムPROJECTPROJECTCHALLENGE音声変換チャレンジ2016CHALLENGE音声変換チャレンジ2018DATA CMU_ARCTIC音声合成データベースDATAタイミット音響音声連続音声コーパスWIKI Word EmbeddingTOOLKIT Gensim:word2vecTOOLKIT fastTextTOOLKITグローブ:単語表現のグローバルベクターINFOPROJECTPROJECTPROJECTポリグロット:多言語NLPの分散ワード表現PROJECT BPEMB:275言語の事前に訓練されたサブワード埋め込みのコレクションCHALLENGE Semeval 2018タスク10識別属性のキャプチャPAPERの単語埋め込みPAPER並べ式埋め込みモデルの調査INFO単語予測とは何ですか?PAPERニューラルネットワーク言語モデルに基づく文字の予測PAPERPAPER :キーストロークの節約のフレーミングDATAPROJECTワード予測 - iPhone™キーボードよりも優れていることはありますか?CHALLENGE Semeval-2018タスク2、多言語絵文字予測WIKI WordセグメンテーションPAPERニューラルワードセグメンテーション学習PROJECT畳み込みニューラルネットワークTOOLKIT Stanford WordセグメンターTOOLKIT NLTKトークナイザーDATAワードセンスの分解PAPER列車-o-matic:手動トレーニングデータなしで複数の言語での大規模な監視された単語感覚の曖昧性DATAトレーニング-o-maticデータDATA babelnet