중국 데이터 모델이 스파이에 제공되었습니다. 이 모델은 현재 베타 공개 테스트 중입니다.
Jupyter 노트북을 기반으로 한 온라인 데모.
이 Doc Object王小明在北京的清华大学读书.

王小明在北京的清华大学读书Wang Xiaoming의 Doc 연구에 대한 NER 정보 중 일부 :

이 모델은 이진 파일 형태로 배포되며 사용자는 스파크에 대한 기본 지식을 가져야합니다 (버전> 2).
Python 3 (아마도 Python2를 지원하지만 잘 테스트되지는 않음)
릴리스 페이지에서 모델을 다운로드하십시오 ( New! 중국의 사용자에게 다운로드를 가속화 할 수있는 링크를 제공합니다). 다운로드 된 모델의 이름이 zh_core_web_sm-2.xxtar.gz 라고 가정합니다.
pip install zh_core_web_sm-2.x.x.tar.gz
RASA NLU와 같은 프레임 워크에서 후속 사용을 용이하게하려면 다음 명령을 실행 하여이 모델에 대한 링크를 설정해야합니다.
spacy link zh_core_web_sm zh실행이 완료되면 별명 ZH를 사용하여 모델에 액세스 할 수 있습니다.
데모 코드는 test.py 에 있습니다. 모델이 설치된 후 사용자는이 저장소에서 코드를 다운로드하거나 복제 한 다음 직접 실행할 수 있습니다.
python3 ./test.py 주소 http://127.0.0.1:5000 열면 다음이 표시됩니다.

워크 플로를 참조하십시오
이 프로젝트에 사용 된 코퍼스는 Ontonotes 5.0입니다.
Ontonotes 5.0은 LDC (Linguistic Data Consortium)의 저작권이있는 자료 이므로이 프로젝트에는 직접 포함 할 수 없습니다. 좋은 소식은 Ontonotes 5.0은 비즈니스 및 학업 조직을 포함한 그룹 사용자에게는 완전히 무료라는 것입니다. 사용자는 회사 또는 학업 조직 계정을 설정 한 다음 Ontonotes 5.0을 무료로 얻을 수 있습니다.
pos_ 올바르지 않습니다. 이것은 Spacy의 중국어 계급과 관련이 있습니다.shape_ 및 is_alpha 중국어에게는 의미가없는 것처럼 보이지만이를 확인하려면 권위있는 정보가 필요합니다.is_stop 가 올바르지 않습니다. 이것은 Spacy의 중국어 계급과 관련이 있습니다.vector 잘 훈련되지 않은 것 같습니다.is_oov 완전히 잘못되었습니다. 첫 번째 우선 순위 수정.Contributing.md를 읽고 당사에 풀 요청을 제출하십시오.
우리는 버전 작성 표준에 Semver를 사용합니다. 모든 버전을 이해하려면 tags 확인하십시오.
기고자에 대한 자세한 내용은 contributors 를 참조하십시오.
MIT 라이센스 - 자세한 내용은 License.md를 참조하십시오