
- 完全なデータサイエンスタスク、資料などについては、データサイエンスリポジトリを確認してください。
- 機械学習アルゴリズムについては、機械学習リポジトリを確認してください。
- ディープラーニングアルゴリズムについては、ディープラーニングリポジトリを確認してください。
- コンピュータービジョンについては、コンピュータービジョンリポジトリを確認してください。
特定のタスク/ドメイン用のすべての素材を備えたフォルダー
再発性ニューラルネットワークと単語の埋め込みから変圧器と自己関節への最新のNLPテクニック。質問とテキスト生成の質問など、適用されたトピックをカバーしています。
これは、Yandex School of Data Analysis(YSDA)で教えられた(ML for)自然言語処理コースの拡張です。今のところ、ここではトピックの一部のみがカバーされる可能性があります。
このコースでは、2つの理由でテキストデータを含むデータマイニングアプリケーションで重要な役割を果たす検索エンジンテクノロジーをカバーします。まず、特定の問題に対して生データが大きい場合がありますが、多くの場合、関連するデータの比較的小さなサブセットであり、検索エンジンは、大規模なテキストコレクションで関連するテキストデータの小さなサブセットを迅速に発見するための不可欠なツールです。第二に、検索エンジンは、アナリストがデータで発見されたパターンを解釈するのを支援するために必要です。検索エンジンの基礎となる科学であるテキスト検索の基本的な概念、原則、および主要な手法を学びます。
O'Reillyメディアによる「実用的な自然言語処理」の公式リポジトリ
本として入手可能:PythonのNLP-クイックスタートガイド
| タイトル | 説明 |
|---|---|
| ACL | Vimeoで |
| [スタンフォードCS224N:深い学習を伴う自然言語処理 | 2021年冬](https://www.youtube.com/playlist?list=ploromvodv4rosh4v6133s9lfprhjembmj) |
| 自然言語処理(NLP)ゼロからヒーロー | Tensorflowによって |
| ゼロからヒーロー:TensorflowとKerasを備えたNLP(GDGソフィアミートアップ) | |
| 自然言語処理 | このコンテンツは、機械学習大学(MLU)が加速した自然言語処理クラスに基づいています。スライド、ノートブック、データセットはGitHubで利用できます |
私はGoogleの研究科学者です。私は自然言語加工と機械学習についてブログを書きます。
エンジニアリングブログのキュレーションリスト
Gradientは、AIについて誰もが簡単に学び、AIコミュニティ内での議論を促進できるようにする任務を伴う組織です。 2017年に、スタンフォードAIラボの学生と研究者のグループによって設立されました。
| タイトル | 説明 |
|---|---|
| テンソルコアのnvidiaディープラーニングの例 - 自然言語処理 | 深い学習の例 |
| 変圧器による自然言語処理 | O'Reillyの本「変圧器付きの自然言語処理」のノートと資料 |
| 素晴らしいNLP参照 | 知識の蒸留、推奨システム、特に自然言語処理(NLP)専用のリソースのキュレーションリスト |
| NLP-チュートリアル | |
| 自然言語処理チュートリアル | |
| Python付きNLP | scikit-learn、nltk、spacy、gensim、textblobなど... |
| NLPおよびデータサイエンスGithubリポジトリスポットライト | 過小評価されているNLPおよびデータサイエンスGithubリポジトリの毎日のスポットライト。 |
| NLP 101:深い学習と自然言語処理のためのリソースリポジトリ | このドキュメントは、自然言語処理の深い学習に熱意を持っている人のためにドラフトされています。良い推奨事項や提案がある場合は、さらに追加しようとします。 |
| NLP-PROGRESS | データセットや最も一般的なNLPタスクの現在の最先端を含む、自然言語処理(NLP)の進捗状況を追跡するリポジトリ。 |
| 顔を抱き締める | HFブログ投稿のパブリックリポジトリ |
| allennlp | Pytorchに基づいたオープンソースNLP研究ライブラリ。 Allenai.org |
NLPライブラリ、フレームワーク、モジュール
| タイトル | 説明 |
|---|---|
| 自然言語ツールキット(NLTK) | NLTK -The Natural Language Toolkit-自然言語処理の研究開発をサポートするオープンソースのPythonモジュール、データセット、チュートリアルのスイートです。 |
| フレア |
最先端の自然言語処理(NLP)の非常にシンプルなフレームワーク。 フレアは次のとおりです。 |
| テキスタシー | textacy 、高性能のスペイシーライブラリに基づいて構築された、さまざまな自然言語処理(NLP)タスクを実行するためのPythonライブラリです。基礎---トークン化、一部のスピーチのタグ付け、依存関係解析など---別のライブラリに委任されたtextacy 、主に前に来て後に続くタスクに焦点を当てています。 |
| allennlp | Pytorchに基づいて構築されたNLP Research Libraryは、さまざまな言語タスクに関する最先端の深い学習モデルを開発するためです。 |
| nlpgym | NLPGYMは、RLとNLPのアプリケーション間のギャップを埋めるためのツールキットです。これは、自然言語処理タスクに関するDRLアプリケーションの研究とベンチマークを促進することを目的としています。このツールキットは、シーケンスタグ付け、質問応答、シーケンス分類など、標準のNLPタスクのインタラクティブな環境を提供します。 |
| 原因 |
| タイトル | 説明 |
|---|---|
| NLPチュートリアル | 深い学習研究者向けの自然言語処理チュートリアル
|
| Pythonチュートリアルの自然言語処理 | 自然言語処理を使用してスタンドアップコメディアンを比較します |
? 100個の必見のNLPペーパー
? Sci-Hub(論文)
?スタンフォード、NLPセミナースケジュール
? CS224N:深い学習を伴う自然言語処理
? CIS 700-008-インタラクティブなフィクションとテキスト生成
?ハーバードNLP
?イラスト付き変圧器
双方向の注意フローニューラルネットワークをチームのベースラインとして実装し、Chris Chuteのモデルの実装を改善し、元の論文で説明されている単語文字入力を追加し、Gauthierdmnsのコードを改善しました。