zemberek nlp
1.0.0
このプロジェクトは現在、メンテナンスモードが遅くなっています。
Zemberek-NLPは、トルコ語に自然言語処理ツールを提供しています。
最新バージョンは0.17.1(2019年7月23日)です。ログを変更します
よくある質問については、FAQをお読みください。
| モジュール | Maven Id | |
|---|---|---|
| コア | ZEMBEREK-CORE | 特別なコレクション、ハッシュ機能、ヘルパー。 |
| 形態 | Zemberek-Morphology | トルコの形態分析、曖昧性除去、単語の生成。 |
| トークン化 | Zemberek-Tokenization | トルコのトークン化と文の境界検出。 |
| 正規化 | Zemberek-Normalization | 基本的なスペルチェッカー、単語の提案。騒々しいテキストの正規化。 |
| ええと | Zemberek-ner | トルコの名前付きエンティティ認識。 |
| 分類 | Zemberek-Classification | FastTextプロジェクトのJavaポートに基づくテキスト分類。 |
| 言語識別 | zemberek-lang-id | テキスト言語の迅速な識別。 |
| 言語モデリング | zemberek-lm | 言語モデル圧縮アルゴリズムを提供します。 |
| アプリケーション | Zemberek-Apps | コンソールアプリケーション |
| GRPCサーバー | zemberek-grpc | 他の言語からアクセスするためのGRPCサーバー。 |
| 例 | Zemberek-Examples | 使用例。 |
これをpom.xmlファイルに追加します
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >および依存関係(たとえば形態):
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >Googleドライブページには、さまざまなバージョンのJARファイルが含まれています。
[ Zemberek-full.jar ]は、すべてのモジュールと依存関係を含む単一の瓶です。それが直接実行されるとき
java -jar zemberek-full.jar
利用可能なコンソールアプリケーションをリストします。
ここでは、プロジェクトからコードをコンパイルし、JARファイルを生成する方法に関する情報について説明します。
使用例のためのコードには、例モジュールがあります。
また、Zemberek-NLPをMavenモジュールとして使用するのと同じ例を持つ別のプロジェクトがあります:Turkish-NLP-Examples
さらなる問題については、問題のセクションをご覧ください。新しいものを自由に作成してください。
コードは、バージョン2.0のApacheライセンスに基づいてライセンスされています
このプロジェクトをアカデミック出版物で使用する場合は、このサイトを参照してください。
Contributors.txtファイルを参照してください。