Bangla impresionante
Una colección de herramientas, conjuntos de datos y recursos en Bangla Computing. Esta lista fue compilada para ayudar a los investigadores y aficionados interesados en el procesamiento del lenguaje natural con el lenguaje de Bangla (bengalí). No dude en contribuir.
Herramientas y teclados de escritura
Productos de usuario final
- Teclado Avro (Windows, Mac, Linux, Ubuntu, en línea)
- Teclado Ridmik (Android)
- Teclado OpenBangla
- Teclado probhat en línea
- Diseño del teclado Rokeya
- Teclado de Borno (Windows, Android)
Bibliotecas
- Biblioteca Avro Phonetic (JavaScript, GO, C ++)
- ইউনিভার্সাল কিবোর্ড সফটওয়্যার 'ইউবোর্ড' / uboard [bangla.gov.bd]
- jQuery.ime - Apoya a Avro, Probhat, Inscript, National (BD)
- BengalifoneticParser.swift (OpenBangla)
- Rupantor: un analizador/convertidor fonético bengalí muy flexible escrito en óxido. También es compatible con Avro Phonetic. (OpenBangla)
- Bijoy2Unicode: un paquete de Python para la conversión bidireccional entre la codificación de Bijoy y unicode bangla.
Especificaciones de entrada fijas y fonéticas
- Métodos de entrada bengalíes
Corpría (corpus) y conjuntos de datos
- Corpus Builder (Aniruddha Adhikary et al, Banglakit)
- Un lenguaje independiente de Wikipedia Text Corpus Descargar
- Idioma indio Parte del habla etiqueta: bengalí (LDC2010T16)
- IARPA Babel Bengali Language Pack Iarpa-Babel103b-V0.4B (LDC2016S08)
- Corpus de Banglalekha (escritura a mano) (ULAB, Dhaka)
- Banglawriting: un conjunto de datos de escritura de bangla de bangla fuera de línea multipropósito (Bubt, Dhaka)
- Lista de palabras de Bangla (Bangla Akademy Banan Abhidhan) (SNLTR)
- Bangla Speech Corpus (IIT, Kharagpur)
- Lista de palabras de parada bengalí (Palabras de parada-iso)
- Bangla TTS Speech Corpus (Google)
- Gran conjunto de datos bengalí ASR (Google)
- Ekush: personajes escritos a mano de bangla (DIU, Dhaka)
- Ishara-Lipi: dígitos y caracteres de lenguaje de señas de bangla (Diu, Dhaka
- Conjunto de datos bengalí de granos comunes grandes
- Conjunto de datos de volcado bengalí wikipedia
- Bengalí Subtítulo Abierto Corpus paralelo
- Conjunto de datos de traducción bengalí
- Conjunto de datos de nombres bengalí vs nombres masculinos para tareas de PNL
- Banglaemotion: un conjunto de datos de referencia para el análisis de emociones textuales de Bangla (CU, Chittagong)
- Oscar: Corpus de Almanach SUPER GRAWLED SUPER LARGO
- BN-HTRD: un conjunto de datos de referencia para el nivel de texto escrito a mano de nivel de documento (HTR) (PUC, Chittagong)
- Bangla Synthetic Licleates DataSet (Zabir Al Nazi)
- Conjunto de datos de discursos bengalí (voz común, mozilla)
Herramientas, scripts y utilidades de PNL (también proyectos)
Herramientas de PNL
- Bangla POS Tagger (hmm/crf/me basado) (IIT, Kharagpur)
- Bangla POS Tagger (SHM0007)
- Bangla POS Tagger (UZL)
- Bangla POS Tagger (basado en XML) (Sunkuet02)
- Bangla POS Tagger (basado en reglas) (Sharif Mohammad Abdullah)
- Analizador morfológico (IIT, Kharagpur)
- Chunker (basado en reglas) (IIT, Kharagpur)
- Chunker (estadístico) (IIT, Kharagpur)
- Analizador de dependencia bengalí (Rajarshi Das et al)
- Bengalí Stemmer (basado en reglas) (Debasis Ganguly)
- Bengalí Stemmer (basado en reglas) (.NET) (Tapas Nayak)
- Bengalí Stemmer (basado en reglas) (Java) (Tapas Nayak)
- Bengalí Stemmer (PHP?) (Md. Tanveer Islam, Tanveer Ahmed Nayeem)
- Bengalí Stemmer (JavaScript) (Rifat Nabi)
- Bengalí Stemmer (Java) (2015) (Tazim Hoque)
- Bengalí Stemmer (Java) (2017) (Sudipto Roy)
- Incrustación de palabras bengalí (Md. Afjal Hossain)
- Wordnet bengalí (Soumen Ganguly)
- Análisis de sentimientos bengalí (cuaderno de iPython) (Abhishek Singh)
- Extracción de palabras clave (Mahir)
- Bangla Ner (Imranul Ashrafi, Muntasir Mohammad, Arani Shawkat Mauree, Galib Md. Azraf Nijhum, Redwanul Karim, Nabeel Mohammed y Sifat Momen)
- Biblioteca Bengali NLP (BNLP) (Sagor)
- Traducción de texto de emoji a bengalí - Paquete Python para NLP (Faruk & Sagor)
- Modelo Bangla Bert (Sagor)
- [Bangla Word2Vec] (https://github.com/menon92/bangla-word2vec) (Mehadi Hasan Menon)
- Bangla NLP Toolkit (Foysal)
Diccionario
- Diccionario léxico bengalí (2012) (Abhishek Gupta)
- Diccionario bengalí (Minhas Kamal)
- Diccionario bengalí multiplataforma (GO/QML) (Monir Zaman)
Traducción automática de Bangla
- Bangla to Inglés Translator (Mehadi Hasan Menon)
OCR/HTR
- Borno Bangla OCR (Bangla.gov.bd)
- Bangla OCR (Kmhasan)
- Bangla OCR (CRBLP, Bracu)
- Bangla OCR (Fariha Nazmul)
- OCR escrito a mano bengalí con NN convolucional (Dibyatanoy Bhattacharjee)
- Clasificación de dígitos bengalí escrito a mano Numta utilizando el aprendizaje de transferencia (Hasib Zunair, Nabeel Mohammed, Sifat Momen)
- Reconocimiento de dígitos bengalí (Abhinav Agarwalla)
- Clasificación de dígitos bengalí (Md. Afjal Hossain)
- Bocra [R paquete para bengalí OCR]
- OCR bengalí con CNN (Sanjiv)
- OCR escrito a mano bengalí con CNN (BM Abir
- Generación de datos sintéticos para Bangal OCR (Mehadi Hasan Menon)
- Segmentación de la línea y las palabras para el reconocimiento de texto escrito a mano de bengalí (Bn-Drishti) (PUC/CU, Chittagong)
Discurso a texto
- Voice.bangla.gov.bd
- Bangla Discurso al texto (Mehadi Hasan Menon)
TTS
- read.bangla.gov.bd
- Katha - Bangla TTS (CRBLP, Bracu)
- Bengali-HTS (Bangla TTS a base de HMM) (IIT, Kharagpur)
- APONA PATHOK - BANGLA TTS (PERDIDO)
- Bangla-TTS (TTS en tiempo real basado en CNN profundo (GPU) (Zabir Al Nazi)
Multimodal
- Implementación de clip (lenguaje contrastante-imagen previa) para bangla (Zabir Al Nazi)
- Detección de discursos de odio multimodal de memes y textos bengalíes (Rezaul Karim)
Otros
- Verificación de hechizos bengalí (Ankur)
- Bangla Contextual Speller (Mahir Mahbub)
- Bagha - Asistente personal (Reyad Rahman)
- Clasificación de categoría de noticias de Bangla con LSTM bidireccional (Zabir Al Nazi)
- Aurthohin - Genador de texto de Gibberish Bangla
- Bangla Word2Vec Training and Visualation (Afnan ul Haque Nuhash)
- Un sistema de búsqueda de imágenes y coincidencia de texto de imagen para Bangla usando Clip (Zabir Al Nazi)
Programación de langauages (?)
- KORO (ir en Bangla)
- Potaka
- Chascript (Syed Tanveer Jishan)
- Pakhi (Shafin Ashraf)
- Pankti (Palash Bauri)
- Alfabeto bengalí
Sitios web
- Sociedad para la Investigación de Tecnología del Lenguaje Natural
- Centro de Investigación sobre Procesamiento del Lenguaje de Bangla, Bracu (espejo de respaldo)
Fuentes
- bangla.gov.bd
- lipighor.com