素晴らしいバロチNLPリソース
Balochi言語のNLPに関連するリソースのリポジトリ。コンパニオンリソースは、Huggingface Balochi Machine Learning Organizationです。
- 一般的なバロチ語
- Balochiテキストデータ /データセット
- 読者
- 他のバロチ材料
- NLPリソース
- 論文
- ブログの投稿 /インスピレーション
- 機関 /組織
- 低リソース言語
一般的なバロチ語
- バルチ語と文学 - イラニカ百科事典からの言語エントリ。
- バロチ語プロジェクト - ウプサラ大学(スウェーデン)のリソースと情報
- ジャハニ、カリーナ、コーン、アグネス。 (2009)「バロチ」。イラン言語、ウィンドフール編集、ガーノット、ロンドン、ニューヨーク:Routledge、2009、pp。634-692。 (リンク)
- ジャハニ、カリーナ。 (2013)「イランのバロチスタンのバロチ語と言語。」 Journal of the Middle East and Africa 4.2(2013):153-167。 (リンク)
- スプーナー、ブライアン。 「バロチ:言語の伝記に向けて。」アフガニスタンとその隣人における言語政策と言語の対立:言語の変化する政治選択2(2011):319。
- アリゾナ大学のイラン言語センターのWikiスタイルの概要ページ。
教科書 /言語学習リソース
- バロチ語の教科書であるマンセル・ロングワース・ダムズ(1922)(検索可能//全文)は、20世紀初頭にパキスタンで話されたバロチを反映しています。
- Abdul Razzaq Sabir博士(?)、Balochi Reader。 (Dunwoody Press Hardback / Audio CDS)
- バーカー、ムハンマド・アブド・アル・ラーマン、アクル・カーン・メンガル。 1969/1980。バルチのコース。モントリオール:マクギル大学イスラム研究所。 - 1960年代後半のパキスタンでのバロチの使用を反映しています。
- ファレル、ティモシー。 1990。BasicBalochi:入門コース。バロチスタンモノグラフシリーズ、1。ナポリ:Instituto Universitario Orientale、Dipartimento di Studi asiatici。 - バロチ南部の入門コース。 (ハードコピー @ SOAS)
- ギラニ、ジャミ・シャキビ; Kordi、Qani(1992)、イランの方言における比較プローブ:バルチ語のカーシ方言[ボリューム:10]。
- Archive.orgの教科書 - 2023年6月現在の13のエントリ。
- Michel Malherbe and Naseebullah(2013)。パーロン・バルシェ。 (フランス語)。
- DLIヘッドスタート:バロチ(オンラインコース)
- DLI Gloss:Balochi(オンライン読書 +研究用のリスニング資料)。リンク。
- NFLCグレードのエクササイズと材料。リンク。言語の学生向けの11のビデオと資料。
- DLI Language Survival Kit:Balochi。米軍のための基本的なフレーズブック。
- Okati、Farideh(2012)。イランの5つのバロチ方言の母音システム。 (abebooks)
- Okati、Farideh、PéturHelgason、Carina Jahani。 「イランの5つのバロチ方言での二重母音化。」 Orientalia Suecana 61(2013):107-119。
- スーハニ、バハレ。イラン・バロチ方言の音韻論:説明と分析。 diss。 2017年。
辞書 /用語集
- Mumtaz Ahmad(1985)、Baluchi Glossary。 (販売コピー//検索可能)
- ギルバートソン、ジョージウォーターズ。カーン、ガノ。英語Balochi Colloquial Dictionary [Volume:1 and 2](1996)。
- Balochi Dictionary(Sil / Uppsala University)c。 2019。Nolin。 - バロチ南部:10868語。 (英語を閲覧 / blowse balochi)。
- Dashti、Nasser(2021)。バロチ英語辞書。 (アマゾン)
- Abdul Ghafoor Jahandideh博士(?)ペルシャ語 - バロチ辞書。 (Vol 1 / vol 2)
- SAYAD GANJ○د伝 - 最初のBalochi辞書(Github Repo)
Balochiテキストデータ /データセット
- Balochi-WordLists - 2人のBalochiスピーカー(Junaid QadirとBalach Khan)によって収集されたリポジトリ
- Balochi Academy Digital Library - バロチアカデミーが提供するダウンロード用の電子ブック
- 教育資料 /読者(ここにリストされています)
- Archive.orgのBalochiの本 - 2023年6月の102冊の本
- バロチ図書館
- バロチ翻訳のコーラン。 (さまざまなオーディオとこちら。)
- baask.com - 多くのバロチ語の素材を含むポータル。
- バロチの聖書とその他のキリスト教の宗教資料(オーディオ +テキスト)。 (ジョシュアプロジェクトを介してリンク)
- Balochi Word List(GitHub Repo)-15k+単語が収集され、正式なワードリストが作成されました。
- Kissah.org-バロチの物語、Junaid Qadirが照合
読者
- Elbenbein、Josef(1990)。古典的および現代バロチ文学のアンソロジー(2巻)。 - 「ボリューム1、465ページは、さまざまな文学ジャンルで、バロチのテキストと英語の翻訳に直面している読者で構成されています。バロチはすべてラテン語の転写です。第2巻は、167ページのバロチ語英語用語集で、再びラテンスクリプトとアルファベット順の順序です。」
他のバロチ材料
- Balochi SpellingBee(Github Repo)
NLPリソース
- BalochiのNERプロジェクト(Github Repo)
- BalochiのNERプロジェクト(Github Repo)
- persoarabiclid - ペルシャ/アラビア語のスクリプトを使用するさまざまな言語を識別するためのデータセットとモデル(具体的にはバロチを含む;カバーされたすべての言語の特定の例を含むデータセットが含まれています)
- Unibal - バロチ語を転写して書くように設計された正書法。ライティングシステムを使用する多くのユーティリティとアプリが含まれています。 (UnibalスクリプトをサポートするGoogleフォント)
便利なツール /姉妹プロジェクト
- TKSEEM - トークン化ライブラリ(アラビア語のため)
- Maha - アラビア語のテキストのテキスト処理ライブラリ
論文
- マイケル・A・ヘッデリッヒ、ルーカス・ランゲ、ハイケ・アデル、ジャンニク・ストレトゲン、ディートリッヒ・クラコウ(2021)、「リソースの低いシナリオでの自然言語処理の最近のアプローチに関する調査」、ACLアンソロジー。
ブログの投稿 /インスピレーション
- ミランダ、LJ(2021)、「単語ベクトルをゼロから作成することに関するメモを研究」。 (リンク)
- ミランダ、LJ(2022)、「低リソース言語(タガログ語)の依存関係解析」。
- Bender、Emily M.(2019)、「#benderrule:私たちが勉強する言語の名前とそれが重要な理由」。
- Ahmadi、Sina(2019)、「なぜクルド語の言語処理が重要なのですか?」
- Ahmadi、Sina(2019)、「クルド人はリソースの少ない言語ですか?」
- Strick Van Linschoten、Alex(2023-)、NLPとBalochi言語に関する一連の投稿。
- Benoy、Kurian(2023)、Malayalam NLPプロジェクトに関する一連の投稿
機関 /組織
- バロチアカデミー(パキスタン、ケッタ)
- バロチ語言語センター(ウプサラ大学)
- バロッククラブ、バーレーン
- イラノロジー財団(イランシャール、イラン)
- バロチスタン大学(パキスタン、ケッタ)
- シスタン大学とバルチェスタン(イラン、ザヘダン)
低リソース言語
- 低リソース言語 - 低リソース(人間)言語の保全、開発、および文書化のためのリソース。