Awesome-bangla
Uma coleção de ferramentas, conjuntos de dados e recursos na computação de Bangla. Esta lista foi compilada para ajudar pesquisadores e entusiastas interessados no processamento de linguagem natural com a língua Bangla (bengali). Por favor, sinta -se à vontade para contribuir.
Ferramentas de digitação e teclados
Produtos do usuário final
- Teclado Avro (Windows, Mac, Linux, Ubuntu, Online)
- Teclado Ridmik (Android)
- Teclado do Openbangla
- Teclado probhat online
- Layout do teclado de Rokeya
- Teclado Borno (Windows, Android)
Bibliotecas
- Biblioteca Fonética Avro (JavaScript, Go, C ++)
- ইউনিভার্সাল কিবোর্ড সফটওয়্যার 'ইউবোর্ড' / uboard [Bangla.gov.bd]
- jQuery.ime - suporta avro, probhat, inscrição, nacional (bd)
- Bengaliphoneticparser.swift (Openbangla)
- Rupantor - Um analisador bengali muito flexível/conversor escrito em ferrugem. Também suporta o Avro fonético. (Openbangla)
- BIJOY2UNICODE - Um pacote Python para conversão bidirecional entre a codificação BIJOY e o Unicode Bangla.
Especificações de entrada fixas e fonéticas
- Métodos de entrada bengali
Corpora (corpus) e conjuntos de dados
- Corpus Builder (Aniruddha Adhikary et al, Banglakit)
- Um idioma independente da wikipedia text corpus downloader
- Língua indiana Tag de parte de fala: Bengali (LDC2010T16)
- IARPA Babel Bengali Pacote IARPA-Babel103b-V0.4b (LDC2016S08)
- Banglalekha Corpus (manuscrito) (Ulab, Dhaka)
- BANGLAWriting: um conjunto de dados de caligrafia de Bangla multifuncional (Bubt, Dhaka)
- Lista de palavras de Bangla (Bangla Akademy Banan Abhidhan) (SNLTR)
- Corpus de fala de Bangla (IIT, Kharagpur)
- Lista de palavras de parada bengali (Stopwords-Iso)
- BANGLA TTS SCOEEN Corpus (Google)
- DataSet Bengali ASR grande (Google)
- Ekush: personagens manuscritos de Bangla (DIU, Dhaka)
- Ishara-Lipi: Bangla Signal Language Digits and Caracters (DIU, Dhaka
- Bengali Large CommonCrawl DataSet
- BENGALI WIKIPEDIA DUMP
- Bengali Open Swittle Parallel Corpus
- Conjunto de dados de tradução em inglês Bengali
- Bengali feminino vs masculino de dados para tarefas de NLP
- BANGLAEMOTION: Um conjunto de dados de referência para análise de emoção textual de Bangla (CU, Chittagong)
- Oscar: Open Super-Grearge Ratwled Almanach Corpus
- BN-HTRD: Um conjunto de dados de referência para o nível de documentos Offline Bangla Manuscrito Reconhecimento de Texto (HTR) (PUC, Chittagong)
- Placas de placas sintéticas de Bangla (Zabir Al Nazi)
- Conjunto de dados de fala bengali (voz comum, mozilla)
Ferramentas de PNL, scripts e utilitários (também projetos)
Ferramentas de PNL
- BANGLA POS TAGGER (HMM/CRF/ME baseado) (IIT, Kharagpur)
- BANGLA POS TAGGER (SHM0007)
- Bangla Pos Tagger (UZL)
- BANGLA POS TAGGER (baseado em XML) (Sunkuet02)
- Bangla Pos Tagger (baseada em regras) (Sharif Mohammad Abdullah)
- Analisador morfológico (IIT, Kharagpur)
- Chunker (baseado em regras) (IIT, Kharagpur)
- Chunker (estatístico) (IIT, Kharagpur)
- Analisador de dependência bengali (Rajarshi Das et al)
- Bengali Stemmer (baseado em regras) (Debasis Ganguly)
- Bengali Stemmer (baseado em regras) (.NET) (Tapas Nayak)
- Bengali Stemmer (baseado em regras) (Java) (Tapas Nayak)
- Bengali Stemmer (Php?) (Md. Tanveer Islam, Tanveer Ahmed Nayeem)
- Bengali Stemmer (JavaScript) (Rifat Nabi)
- Bengali Stemmer (Java) (2015) (Tazim Hoque)
- Bengali Stemmer (Java) (2017) (Sudipto Roy)
- Incorporação de palavras bengali (Md. Afjal Hossain)
- Bengali WordNet (Soumen Ganguly)
- Análise de sentimentos de bengali (notebook Ipython) (Abhishek Singh)
- Extração de palavras -chave (Mahir)
- Bangla ner (Imranul Ashrafi, Muntasir Mohammad, Arani Shawkat Mauree, Galib Md. Azraf Nijhum, Redwanul Karim, Nabeel Mohammed e Sifat Momen)
- Biblioteca Bengali NLP (BNLP) (Sagor)
- Emoji para Bengali Tradução de texto - pacote Python para NLP (Faruk & Sagor)
- Modelo Bangla Bert (Sagor)
- [Bangla Word2vec] (https://github.com/menon92/bangla-word2vec) (Mehadi Hasan Menon)
- Bangla NLP Toolkit (Foysal)
Dicionário
- Dicionário Lexical Bengali (2012) (Abhishek Gupta)
- Dicionário Bengali (Minas Kamal)
- Dicionário Bengali de plataforma cruzada (GO/QML) (Monir Zaman)
Tradução da máquina de Bangla
- Bangla para o tradutor de inglês (Mehadi Hasan Menon)
OCR/HTR
- Borno Bangla OCR (Bangla.gov.bd)
- Bangla OCR (Kmhasan)
- Bangla OCR (CRBLP, BRACU)
- Bangla OCR (Fariha Nazmul)
- OCR manuscrito de bengali com NN convolucional (Dibyatanoy Bhattacharjee)
- Classificação de dígitos bengali manuscrita de numta usando o aprendizado de transferência (Hasib Zunair, Nabeel Mohammed, Sifat Momen)
- Reconhecimento de dígitos bengali (Abhinav Agarwalla)
- Classificação de dígitos bengali (Md. Afjal Hossain)
- Pacote Bocra [r para Bengali OCR]
- Bengali OCR com CNN (Sanjiv)
- OCR manuscrito de bengali com CNN (BM Abir
- Geração de dados sintéticos para Bangal OCR (Mehadi Hasan Menon)
- Segmentação de linha e palavras para o reconhecimento de texto manuscrito de Bangla (BN-Drishti) (PUC/Cu, Chittagong)
Discurso para texto
- voz.bangla.gov.bd
- Discurso de Bangla para texto (Mehadi Hasan Menon)
TTS
- Read.bangla.gov.bd
- Katha - Bangla TTS (CRBLP, BRACU)
- Bengali-hts (Bangla TTS baseado em Hmm) (IIT, Kharagpur)
- APONA POTOK - BANGLA TTS (Lost)
- BANGLA-TTS (TTS em tempo real (GPU) baseado em CNN (Zabir al nazista)
Multimodal
- Implementação de clipe (Linguagem-Imagem Contrastiva) para Bangla (Zabir Al Nazi)
- Detecção multimodal de fala de ódio de memes e textos bengalis (Rezaul Karim)
Outros
- Verificação de ortografia bengali (Ankur)
- Verificador de ortografia contextual de Bangla (Mahir Mahbub)
- Bagha - Assistente Pessoal (Reyad Rahman)
- Classificação da categoria de notícias de Bangla com LSTM bidirecional (Zabir al nazista)
- Aurthohin - gerador de texto bobagem de Bangla
- Treinamento e visualização de Bangla Word2vec (Afnan Ul Haque Nuhash)
- Uma pesquisa de imagem e sistema de correspondência de texto de imagem para Bangla usando clipe (Zabir al nazista)
Programação Langauages (?)
- Koro (vá em Bangla)
- Potaka
- CHASCRIPT (Syed Tanveer Jishan)
- Pakhi (Shafin Ashraf)
- Pankti (Palash Bauri)
- Bengali-Alphabet
Sites
- Pesquisa de Tecnologia da Sociedade de Língua Natural
- Centro de Pesquisa sobre Processamento de Linguagem de Bangla, Bracu (espelho de backup)
Fontes
- Bangla.gov.bd
- lipighor.com