Потрясающая-Банга
Коллекция инструментов, наборов данных и ресурсов на Bangla Computing. Этот список был составлен, чтобы помочь исследователям и любителям, заинтересованным в обработке естественного языка с языком Bangla (бенгальский). Пожалуйста, не стесняйтесь вносить свой вклад.
Инструменты для печати и клавиатуры
Продукты конечных пользователей
- Avro клавиатура (Windows, Mac, Linux, Ubuntu, онлайн)
- Ridmik Keyboard (Android)
- OpenBangla клавиатура
- Онлайн -клавиатура
- Рукия клавиатура
- Клавиатура Борно (Windows, Android)
Библиотеки
- Фонетическая библиотека Avro (JavaScript, Go, C ++)
- ইউনিভার্সাল কিবোর্ড সফটওয়্যার 'ইউবোর্ড' / uboard [bangla.gov.bd]
- jQuery.ime - поддерживает Avro, Probhat, Inscript, National (BD)
- BengaliphoneticParser.Swift (OpenBangla)
- Рутантор - очень гибкий бенгальский фонетический анализатор/преобразователь, написанный в ржавчине. Это также поддерживает Avro Phonetic. (OpenBangla)
- bijoy2unicode - пакет Python для двунаправленного преобразования между кодированием Bijoy и Unicode Bangla.
Фиксированные и фонетические входные характеристики
Корпуса (корпус) и наборы данных
- Corpus Builder (Aniruddha Adhikary et al, Banglakit)
- Независимый для языка в Википедии Text Corpus Downloader
- Индийский язык Часть речи текс: бенгальский (LDC2010T16)
- IARPA BABEL BENGALI PACK IARPA-BABEL103B-V0.4B (LDC2016S08)
- Banglalekha Corpus (почерк) (Улаб, Дакка)
- Banglawriting: многоцелевой автономный набор данных по почерке Bangla (Bubt, Dhaka)
- Bangla Word-List (Bangla Akademy Banan Abhidhan) (SNLTR)
- Bangla Speech Corpus (IIT, Харагпур)
- Список бенгальских остатков (Stopwords-ISO)
- Bangla TTS Speech Corpus (Google)
- Большой бенгальский набор данных ASR (Google)
- Экуш: рукописные персонажи Бангла (Diu, Dhaka)
- Ишара-Липи: языковые цифры и персонажи жестов Бангла (Diu, Dhaka
- Бенгальский большой набор данных Commoncrawl
- Бенгальский набор данных с дамп в Википедии
- Бенгальский открытый субтитры параллельный корпус
- Бенгаль-английский набор данных перевода
- Бенгальский набор данных по именам мужских имен для задач NLP
- Banglaemotion: контрольный набор данных для анализа текстовых эмоций Bangla (CU, Chittagong)
- Оскар: открытый супер-широкий ползал Almanach Corpus
- BN-HTRD: контрольный набор данных для уровня документов в автономном режиме Bangla Рукописное распознавание текста (HTR) (PUC, Chittagong)
- Бангла -синтетические лицензионные набор лицензий (Zabir al nazi)
- Бенгальский набор данных речи (общий голос, мозилла)
Инструменты, сценарии и утилиты NLP (также проекты)
Инструменты NLP
- Bangla Pos Tagger (HMM/CRF/ME на основе) (IIT, Kharagpur)
- Bangla Pos Tagger (SHM0007)
- Bangla POS Tagger (uzl)
- Bangla Pos Tagger (на основе XML) (sunkuet02)
- Bangla Pos Tagger (на основе правил) (Шариф Мохаммед Абдулла)
- Морфологический анализатор (IIT, Харагпур)
- Чункер (на основе правил) (IIT, Харагпур)
- Чункер (статистический) (IIT, Харагпур)
- Бенгальский анализатор зависимостей (Раджарши Дас и др.
- Бенгальский ствол (на основе правил) (Debasis ganguly)
- Бенгальский стермер (на основе правил) (.net) (тапас наяк)
- Бенгальский ствол (на основе правил) (java) (тапас наяк)
- Бенгальский стермер (PHP?) (Md. Tanveer Islam, Tanveer Ahmed Nayeem)
- Бенгальский стермер (JavaScript) (Рифат Наби)
- Бенгальский стермер (Java) (2015) (Tazim Hoque)
- Бенгальский стермер (Java) (2017) (Sudipto Roy)
- Внедрение бенгальского слова (Md. Afjal Hossain)
- Бенгальский словесный сети (сумен Гангули)
- Анализ бенгальских настроений (ноутбук ipython) (Абхишек Сингх)
- Извлечение ключевых слов (Махир)
- Bangla Ner (Имранул Ашрафи, Мунтасир Мохаммад, Арани Шоукат Мауре, Галиб М.Д. Азраф Ниджхум, Редванул Карим, Набил Мухаммед и Сифат Момен)
- Бенгальская библиотека НЛП (BNLP) (SAGOR)
- Эмодзи на бенгальский текстовый перевод - Пакет Python для NLP (Faruk & Sagor)
- Модель Bangla Bert (SAGOR)
- [Bangla word2vec] (https://github.com/menon92/bangla-word2vec) (Мехади Хасан Менон)
- Bangla NLP Toolkit (Foysal)
Словарь
- Бенгальский лексический словарь (2012) (Абхишек Гупта)
- Бенгальский словарь (Минхас Камаль)
- Кроссплатформенный бенгальский словарь (GO/QML) (Monir Zaman)
Бангла Машинный перевод
- Бангла на английский переводчик (Мехади Хасан Менон)
Ocr/htr
- Borno Bangla Ocr (bangla.gov.bd)
- Bangla ocr (кмхасан)
- Bangla OCR (CRBLP, Bracu)
- Bangla ocr (Фариха Назмул)
- Бенгальский рукописный OCR с сверточным NN (Dibyatanoy Bhattacharjee)
- Numta рукописная бенгальская цифровая классификация с использованием Transfer Learning (Hasib Zunair, Nabeel Mohammed, Sifat Momen)
- Бенгальское распознавание цифр (Абхинав Агарвалла)
- Бенгальская цифровая классификация (Md. Afjal Hossain)
- Bocra [R Package для бенгальского OCR]
- Бенгальский OCR с CNN (Sanjiv)
- Бенгальский рукописный OCR с CNN (BM Abir
- Генерация синтетических данных для Bangal OCR (Мехади Хасан Менон)
- Сегментация строки и слов для рукописного распознавания текста Bangla (BN-Drishti) (PUC/CU, Chittagong)
Речь в текст
- Voice.bangla.gov.bd
- Бангла речь на текст (Мехади Хасан Менон)
ТТС
- read.bangla.gov.bd
- Катха - Бангла ТТ (CRBLP, Bracu)
- Бенгали-ХТС (Бангла-ТТС на базе HMM) (IIT, Харагпур)
- Апона Паток - Бангла ТТ (Потерянный)
- Bangla-TTS (Deep CNN в реальном времени (GPU) TTS) (Zabir al nazi)
Мультимодальный
- Клип (контрастный язык-предварительное обучение) реализация для Bangla (Zabir al nazi)
- Обнаружение мультимодальной ненавистнической речи от бенгальских мемов и текстов (Rezaul Karim)
Другие
- Бенгальская проверка заклинаний (Анкур)
- Контекстная проверка орфографии Bangla (Махир Махбуб)
- Багха - личный помощник (Рейд Рахман)
- Классификация категорий новостей Bangla с двунаправленным LSTM (Zabir al nazi)
- Aurthohin - Гиббериш Бангла Текстовый генератор
- Обучение и визуализация Bangla Word2VEC (Afnan ul haque nuhash)
- Система поиска изображения и сопоставления текста изображения для Bangla с использованием CLIP (Zabir Al Nazi)
Программирование Langauages (?)
- Коро (иди в Бангла)
- Потака
- Chascript (Сайед Танвир Джишан)
- Пахи (Шафин Ашраф)
- Панкти (Палаш Баури)
- Бенгальский альфавит
Веб -сайты
- Общество исследований технологий естественного языка
- Центр исследований по обработке языка Бангла, Браку (резервное зеркало)
Шрифты
- bangla.gov.bd
- Lipighor.com