굉장한 뱅글라
방글라 컴퓨팅의 도구, 데이터 세트 및 리소스 모음. 이 목록은 Bangla (Bengali) 언어로 자연 언어 처리에 관심이있는 연구원과 애호가들을 돕기 위해 편집되었습니다. 자유롭게 기여하십시오.
타이핑 도구 및 키보드
최종 사용자 제품
- Avro 키보드 (Windows, Mac, Linux, Ubuntu, 온라인)
- Ridmik 키보드 (Android)
- OpenBangla 키보드
- 온라인 probhat 키보드
- Rokeya 키보드 레이아웃
- Borno 키보드 (Windows, Android)
도서관
- Avro 음성 도서관 (JavaScript, Go, C ++)
- ইউনিভার্সাল ইউনিভার্সাল ইউনিভার্সাল সফটওয়্যার 'ইউবোর্ড' / uboard [bangla.gov.bd]
- jQuery.ime- Avro, Probhat, Inscript, National (BD) 지원
- Bengaliphoneticparser.swift (OpenBangla)
- Rupantor- 녹로 쓰여진 매우 유연한 벵골어 음성 파서/변환기. 또한 Avro Phonetic도 지원합니다. (OpenBangla)
- Bijoy2Unicode- Bijoy 인코딩과 유니 코드 방글라 사이의 양방향 변환을위한 파이썬 패키지.
고정 및 음성 입력 사양
Corpora (코퍼스) 및 데이터 세트
- 코퍼스 빌더 (Aniruddha Adhikary et al, Banglakit)
- 언어 독립적 인 위키 백과 텍스트 코퍼스 다운로더
- 인도 언어 부품 태그 태그 세트 : 벵골어 (LDC2010T16)
- IARPA Babel Bengali Language Pack IARPA-BABEL103B-V0.4B (LDC2016S08)
- Banglalekha Corpus (필기) (Ulab, Dhaka)
- Banglawriting : 다목적 오프라인 Bangla 필기 데이터 세트 (Bubt, Dhaka)
- Bangla Word-List (Bangla Akademy Banan Abhidhan) (SNLTR)
- 방글라 연설 코퍼스 (IIT, Kharagpur)
- Bengali Stopwords 목록 (Stopwords-Iso)
- Bangla TTS Speech Corpus (Google)
- 대형 벵골어 ASR 데이터 세트 (Google)
- Ekush : Bangla 필기 캐릭터 (Diu, Dhaka)
- Ishara-Lipi : Bangla 수화 숫자와 캐릭터 (Diu, Dhaka
- 벵골어 대형 공통 크롤링 데이터 세트
- 벵골어 위키 백과 덤프 데이터 세트
- 벵골어 오픈 자막 평행 코퍼스
- 벵골어 영어 번역 데이터 세트
- NLP 작업용 벵골어 여성 대 남성 이름 데이터 세트
- Banglaemotion : Bangla 텍스트 감정 분석을위한 벤치 마크 데이터 세트 (CU, Chittagong)
- 오스카 : 오픈 초대형 기어 올라 알마 나흐 코퍼스
- BN-HTRD : 문서 레벨 오프라인 방글라 필기 텍스트 인식 (HTR)을위한 벤치 마크 데이터 세트 (PUC, Chittagong)
- 방글라 합성 번호판 데이터 세트 (Zabir Al Nazi)
- 벵골어 연설 데이터 세트 (Common Voice, Mozilla)
NLP 도구, 스크립트 및 유틸리티 (프로젝트)
NLP 도구
- Bangla pos tagger (hmm/crf/me 기반) (IIT, Kharagpur)
- 방글라 POS TAGGER (SHM0007)
- 방글라 POS TAGGER (UZL)
- Bangla Pos Tagger (XML 기반) (SunKuet02)
- Bangla Pos Tagger (규칙 기반) (Sharif Mohammad Abdullah)
- 형태 학적 분석기 (IIT, Kharagpur)
- Chunker (규칙 기반) (IIT, Kharagpur)
- Chunker (통계) (IIT, Kharagpur)
- 벵골어 의존성 파서 (Rajarshi Das et al)
- Bengali Stemmer (규칙 기반) (Debasis Ganguly)
- Bengali Stemmer (규칙 기반) (.NET) (Tapas Nayak)
- Bengali Stemmer (규칙 기반) (Java) (Tapas Nayak)
- Bengali Stemmer (Php?) (Md. Tanveer Islam, Tanveer Ahmed Nayeem)
- Bengali Stemmer (JavaScript) (Rifat Nabi)
- Bengali Stemmer (Java) (2015) (Tazim Hoque)
- Bengali Stemmer (Java) (2017) (Sudipto Roy)
- Bengali Word Embedding (Md. Afjal Hossain)
- Bengali Wordnet (Soumen Ganguly)
- 벵골어 감정 분석 (Ipython Notebook) (Abhishek Singh)
- 키워드 추출 (mahir)
- Bangla Ner (Imranul Ashrafi, Muntasir Mohammad, Arani Shawkat Mauree, Galib Md. Azraf Nijhum, Redwanul Karim, Nabeel Mohammed 및 Sifat Momen)
- 벵골어 NLP 도서관 (BNLP) (Sagor)
- 이모티콘 ~ 벵골어 텍스트 번역 - NLP 용 파이썬 패키지 (Faruk & Sagor)
- 방글라 버트 모델 (Sagor)
- [Bangla Word2vec] (https://github.com/menon92/bangla-word2vec) (Mehadi Hasan Menon)
- Bangla NLP 툴킷 (Foysal)
사전
- 벵골어 어휘 사전 (2012) (Abhishek Gupta)
- 벵골어 사전 (Minhas Kamal)
- 크로스 플랫폼 벵골어 사전 (GO/QML) (Monir Zaman)
방글라 기계 번역
- Bangla to English Translator (Mehadi Hasan Menon)
OCR/HTR
- Borno Bangla OCR (Bangla.gov.bd)
- 방글라 OCR (Kmhasan)
- 방글라 OCR (CRBLP, Bracu)
- 방글라 OCR (Fariha Nazmul)
- Convolutional NN (Dibyatanoy Bhattacharjee)과 벵골어 필기 OCR
- 전송 학습을 사용한 숫자 필기 벵골어 숫자 분류 (Hasib Zunair, Nabeel Mohammed, Sifat Momen)
- 벵골어 숫자 인식 (Abhinav Agarwalla)
- 벵골어 숫자 분류 (Md. Afjal Hossain)
- Bocra [벵갈리 OCR 용 패키지]
- CNN (Sanjiv)과 벵골어 OCR
- CNN과 함께 벵골어 필기 OCR (BM ABIR
- Bangal OCR의 합성 데이터 생성 (Mehadi Hasan Menon)
- 방글라 필기 텍스트 인식 (BN-DRISHTI)의 라인 및 단어 세분화 (PUC/CU, Chittagong)
텍스트로 연설
- Voice.bangla.gov.bd
- 방글라 연설 to Text (Mehadi Hasan Menon)
TTS
- read.bangla.gov.bd
- Katha -Bangla TTS (CRBLP, Bracu)
- Bengali-HTS (HMM 기반 방글라 TTS) (IIT, Kharagpur)
- Apona Pathok -Bangla tts (잃어버린)
- Bangla-TTS (Deep CNN 기반 실시간 (GPU) TTS (Zabir Al Nazi)
멀티 모달
- Bangla (Zabir Al Nazi)의 클립 (대비 언어-이미지 사전 훈련) 구현
- 벵골어 밈과 텍스트의 멀티 모달 증오 언어 탐지 (Rezaul Karim)
기타
- 벵골어 맞춤법 검사 (Ankur)
- 방글라 상황에 맞는 맞춤법 검사기 (Mahir Mahbub)
- 바가 - 개인 비서 (Reyad Rahman)
- Bangla News 카테고리 분류 양방향 LSTM (Zabir Al Nazi)
- Aurthohin- Gibberish Bangla 텍스트 생성기
- Bangla Word2Vec 교육 및 시각화 (Afnan ul Haque Nuhash)
- Clip을 사용한 Bangla의 이미지 검색 및 이미지 텍스트 매칭 시스템 (Zabir Al Nazi)
프로그래밍 langauages (?)
- Koro (방글라로 이동)
- 포타 카
- Chascript (Syed Tanveer Jishan)
- Pakhi (Shafin Ashraf)
- Pankti (Palash Bauri)
- 벵골어 알파벳
웹 사이트
- 자연 언어 기술 연구 학회
- 방글라 언어 처리 센터, Bracu (백업 미러)
글꼴
- Bangla.gov.bd
- lipighor.com