zemberek nlp
1.0.0
이 프로젝트는 이제 느린 유지 보수 모드입니다.
Zemberek-NLP는 터키를위한 자연 언어 처리 도구를 제공합니다.
최신 버전은 0.17.1 (2019 년 7 월 23 일)입니다. 로그 변경
일반적인 질문은 FAQ를 읽으십시오.
| 기준 치수 | Maven ID | |
|---|---|---|
| 핵심 | Zemberek-Core | 특수 컬렉션, 해시 기능 및 도우미. |
| 형태 | Zemberek-Morphology | 터키 형태 분석, 명확성 및 단어 세대. |
| 토큰 화 | Zemberek-Tokenization | 터키 토큰 화 및 문장 경계 감지. |
| 표준화 | Zemberek-Normalization | 기본 맞춤법 검사기, 단어 제안. 시끄러운 텍스트 정규화. |
| 네르 | Zemberek-Ner | 터키어 명명 된 엔티티 인식. |
| 분류 | Zemberek-Classification | FastText 프로젝트의 Java 포트를 기반으로 한 텍스트 분류. |
| 언어 식별 | Zemberek-Lang-id | 텍스트 언어의 빠른 식별. |
| 언어 모델링 | Zemberek-LM | 언어 모델 압축 알고리즘을 제공합니다. |
| 응용 프로그램 | Zemberek-Apps | 콘솔 응용 프로그램 |
| GRPC 서버 | Zemberek-Grpc | 다른 언어에서 액세스하기위한 GRPC 서버. |
| 예 | Zemberek-Poomples | 사용 예제. |
이것을 pom.xml 파일에 추가하십시오
< repositories >
< repository >
< id >zemberek-repo</ id >
< name >zemberek Maven Repo on Github</ name >
< url >https://raw.github.com/ahmetaa/maven-repo/master</ url >
</ repository >
</ repositories >의존성 (예 : 형태) :
< dependencies >
< dependency >
< groupId >zemberek-nlp</ groupId >
< artifactId >zemberek-morphology</ artifactId >
< version >0.17.1</ version >
</ dependency >
</ dependencies >Google 드라이브 페이지에는 다른 버전의 JAR 파일이 포함되어 있습니다.
[ Zemberek-full.jar ]는 모든 모듈과 종속성을 포함하는 단일 항아리입니다. 직접 실행될 때
java -jar zemberek-full.jar
사용 가능한 콘솔 응용 프로그램을 나열합니다.
여기에서 코드를 컴파일하고 프로젝트에서 JAR 파일을 생성하는 방법에 대한 정보가 설명되어 있습니다.
사용 예제 코드에는 예제 모듈이 있습니다.
또한 Zemberek-NLP를 Maven 모듈로 사용하는 동일한 예제가있는 별도의 프로젝트가 있습니다.
추가 문제는 문제 섹션을 참조하고 새로운 문제를 자유롭게 만들 수 있습니다.
코드는 Apache 라이센스, 버전 2.0에 따라 라이센스가 부여됩니다
이 프로젝트를 학술 간행물에서 사용하는 경우이 사이트를 참조하십시오.
Contributors.txt 파일을 참조하십시오.