素晴らしいバングラ
バングラコンピューティングに関するツール、データセット、リソースのコレクション。このリストは、バングラ(ベンガル語)言語での自然言語処理に関心のある研究者と愛好家を支援するために編集されました。お気軽に貢献してください。
タイピングツールとキーボード
エンドユーザー製品
- Avroキーボード(Windows、Mac、Linux、Ubuntu、オンライン)
- ridmikキーボード(Android)
- OpenBanglaキーボード
- オンラインprobhatキーボード
- Rokeyaキーボードレイアウト
- ボルノキーボード(Windows、Android)
ライブラリ
- Avro Phonetic Library(JavaScript、Go、C ++)
- ইউনিভার্সালকিবোর্ডসফটওয়্যার '' ' / uboard [bangla.gov.bd]
- jquery.ime-アヴロ、probhat、inscript、national(bd)をサポート
- bengaliphoneticparser.swift(openbangla)
- Rupantor-錆で書かれた非常に柔軟なベンガル語音声パーサー/コンバーター。また、Avro Phoneticもサポートしています。 (OpenBangla)
- Bijoy2Unicode- bijoyエンコーディングとユニコードバングラ間の双方向変換のためのPythonパッケージ。
固定および音声入力仕様
コーパス(コーパス)とデータセット
- コーパスビルダー(Aniruddha Adhikary et al、Banglakit)
- 言語独立したウィキペディアテキストコーパスダウンローダー
- インド語のスピーチの一部のタグセット:ベンガル語(LDC2010T16)
- IARPA BABEL BENGALI LANGUAGE PACK IARPA-BABEL103B-V0.4B(LDC2016S08)
- バングラレカコーパス(手書き)(ウラブ、ダッカ)
- バングローリット:多目的オフラインバングラ手書きデータセット(BUBT、ダッカ)
- バングラワードリスト(バングラアカデミーバナンアビダン)(SNLTR)
- バングラスピーチコーパス(IIT、Kharagpur)
- ベンガルのストップワードリスト(stopwords-iso)
- バングラTTSスピーチコーパス(Google)
- 大型ベンガルASRデータセット(Google)
- Ekush:バングラの手書きキャラクター(Diu、Dhaka)
- Ishara-Lipi:バングラ手話の数字と文字(Diu、Dhaka
- ベンガルの大規模なCommonCrawlデータセット
- ベンガルウィキペディアダンプデータセット
- ベンガル人オープンサブタイトルパラレルコーパス
- ベンガリ語翻訳データセット
- NLPタスクのベンガル人女性対男性名データセット
- Banglaemotion:バングラテキスト感情分析のベンチマークデータセット(CU、チッタゴン)
- オスカー:オープンスーパーラージクロールされたアルマナッハコーパス
- BN-HTRD:ドキュメントレベルのバングラ手書きのテキスト認識(HTR)(PUC、チッタゴン)のベンチマークデータセット
- バングラ合成ナンバープレートデータセット(Zabir al Nazi)
- ベンガル語の音声データセット(Common Voice、Mozilla)
NLPツール、スクリプト、ユーティリティ(プロジェクトも)
NLPツール
- Bangla Pos Tagger(HMM/CRF/ME BEAST)(IIT、Kharagpur)
- BanglaPosタガー(shm0007)
- バングラPOSタガー(UZL)
- バングラPOSタガー(XMLベース)(sunkuet02)
- Bangla Pos Tagger(ルールベース)(Sharif Mohammad Abdullah)
- 形態学的分析装置(IIT、Kharagpur)
- チャンカー(ルールベース)(IIT、Kharagpur)
- チャンカー(統計)(IIT、Kharagpur)
- ベンガル依存関係パーサー(Rajarshi Das et al)
- ベンガルステムマー(ルールベース)(Debasis Ganguly)
- ベンガルステムマー(ルールベース)(.net)(タパスnayak)
- ベンガルステムマー(ルールベース)(Java)(タパスナヤック)
- ベンガル・ステマー(PHP?)(Md。TanveerIslam、Tanveer Ahmed Nayeem)
- ベンガリステムマー(JavaScript)(Rifat Nabi)
- ベンガルステムマー(Java)(2015)(Tazim Hoque)
- ベンガリステムマー(Java)(2017)(Sudipto Roy)
- ベンガル語の埋め込み(Md。AfjalHossain)
- ベンガル語のワードネット(Soumen Ganguly)
- ベンガル感情分析(IPythonノートブック)(Abhishek Singh)
- キーワード抽出(マヒール)
- バングラ・ネル(Imranul Ashrafi、Muntasir Mohammad、Arani Shawkat Mauree、GalibMd。AzrafNijhum、Redwanul Karim、Nabeel Mohammed、Sifat Momen))
- ベンガリNLPライブラリ(BNLP)(サゴール)
- 絵文字からベンガル語のテキスト翻訳-NLP用のPythonパッケージ(Faruk&Sagor)
- バングラバートモデル(サゴール)
- [Bangla word2vec](https://github.com/menon92/bangla-word2vec)(Mehadi Hasan Menon)
- バングラNLPツールキット(Foysal)
辞書
- ベンガリ語彙辞書(2012)(Abhishek Gupta)
- ベンガル語辞書(Minhas Kamal)
- クロスプラットフォームベンガル語辞書(go/qml)(モニールザマン)
バングラの機械翻訳
- バングラから英語の翻訳者(メハディ・ハサン・メノン)
OCR/HTR
- ボルノバングラOCR(bangla.gov.bd)
- バングラOCR(Kmhasan)
- バングラOCR(crblp、bracu)
- バングラOCR(Fariha Nazmul)
- ベンガル語の手書きのOCRと畳み込みnn(dibyatanoy bhattacharjee)
- トランスファーラーニングを使用したNumta手書きのベンガル語の桁分類(Hasib Zunair、Nabeel Mohammed、Sifat Momen)
- ベンガル語の桁認識(Abhinav Agarwalla)
- ベンガル語の桁分類(Md。AfjalHossain)
- Bocra [R Bengali OCRのパッケージ]
- CNNとのベンガルOCR(Sanjiv)
- CNNを備えたベンガルの手書きOCR(BM ABIR
- バンガルOCRの合成データ生成(Mehadi Hasan Menon)
- バングラの手書きのテキスト認識のためのラインと単語のセグメンテーション(BN-DRISHTI)(PUC/CU、チッタゴン)
テキストへのスピーチ
- Voice.bangla.gov.bd
- テキストへのバングラのスピーチ(メハディ・ハサン・メノン)
TTS
- read.bangla.gov.bd
- Katha -Bangla TTS(CRBLP、BRACU)
- Bengali-hts(うーんベースのバングラTTS)(IIT、Kharagpur)
- Apona Pathok -Bangla TTS(失われた)
- Bangla-TTS(ディープCNNベースのリアルタイム(GPU)TTS)(Zabir al Nazi)
マルチモーダル
- バングラ(Zabir al Nazi)のクリップ(コントラスト言語 - イメージの事前トレーニング)の実装
- ベンガル語のミームとテキストからのマルチモーダルヘイトスピーチ検出(Rezaul Karim)
その他
- ベンガル語のスペルチェック(ankur)
- バングラコンテキストスペルチェッカー(Mahir Mahbub)
- Bagha-パーソナルアシスタント(Reyad Rahman)
- 双方向LSTM(Zabir al Nazi)によるバングラニュースカテゴリ分類
- Aurthohin -Gibberish Banglaテキストジェネレーター
- Bangla word2vecトレーニングと視覚化(Afnan ul haque nuhash)
- クリップを使用したバングラの画像検索と画像テキストマッチングシステム(Zabir al Nazi)
ランガウジュ(?)のプログラミング
- コロ(バングラに行く)
- パタカ
- Chascript(Syed Tanveer Jishan)
- パキ(シャフィンアシュラフ)
- パンティ(パラシュバウリ)
- ベンガルアルファベット
ウェブサイト
- 自然言語技術研究協会
- Bracu(バックアップミラー)、バングラ語処理に関する研究センター
フォント
- Bangla.gov.bd
- lipighor.com