Stanford Corenlp는 Java로 작성된 일련의 자연 언어 분석 도구를 제공합니다. 원시 인간 언어 텍스트 입력을 취하고 기본 형태의 단어, 연설 부분, 회사의 이름, 사람 등의 이름, 날짜, 시간 및 숫자 수량을 정상화하고 해석하고, 문장의 구조를 구별 문구 또는 종속성으로 표시하며, 어떤 명사구가 동일한 엔티티를 참조하는지를 나타낼 수 있습니다. 원래 영어를 위해 개발되었지만 현재는 (현대 표준) 아랍어, (본토) 중국어, 프랑스어, 독일어, 헝가리어, 이탈리아어 및 스페인어에 대한 다양한 수준의 지원을 제공합니다. Stanford Corenlp는 통합 프레임 워크로, 많은 언어 분석 도구를 텍스트에 쉽게 적용 할 수 있습니다. 일반 텍스트부터 두 줄의 코드로 모든 도구를 실행할 수 있습니다. 이 분석은 고급 및 도메인 별 텍스트 이해 응용 프로그램을위한 기본 빌딩 블록을 제공합니다. Stanford Corenlp는 학계, 산업 및 정부의 다양한 그룹에서 널리 사용되는 안정적이고 잘 테스트 된 자연어 처리 도구 세트입니다. 이 도구는 규칙 기반, 확률 론적 기계 학습 및 딥 러닝 구성 요소를 다양하게 사용합니다.
Stanford Corenlp 코드는 Java로 작성되었으며 GNU General Public License (V2 이상)에 따라 라이센스가 부여됩니다. 이것은 전체 GPL로, 많은 무료 용도를 허용하지만 다른 사람들에게 배포하는 독점 소프트웨어에서는 사용하지는 않습니다.
1 년에 여러 번 우리는 안정적인 커밋에 해당하는 새로운 버전의 소프트웨어를 배포합니다.
릴리스 사이의 시간 동안 개발 버전의 코드에서 항상 최신 버전을 사용할 수 있습니다.
다음은 최신 코드를 사용하는 데 도움이되는 몇 가지 지침입니다.
때로는 최신 버전의 코드가있는 업데이트 된 항아리를 제공합니다.
현재, 현재 출시 된 코드 버전은 가장 최근에 출시 된 JAR이지만 항상 Github Head 직접 최신작을 만들 수 있습니다.
cd CoreNLP ; antcd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edumvn package 에서이 명령을 실행하면 테스트를 실행하고이 JAR 파일을 빌드해야합니다. CoreNLP/target/stanford-corenlp-4.5.4.jarstanford-corenlp-models-current.jar 설치하려면 -Dclassifier=models 설정해야합니다. 스페인어의 샘플 명령 mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar 다음과 같습니다. 최신 코드에 해당하는 모델 항아리는 아래 표에서 찾을 수 있습니다.
Shift-Reduce Parser 및 Wikidict와 같은 더 큰 (영어) 모델 중 일부는 기본 모델 Jar와 함께 배포되지 않습니다. 이를 위해서는 영어 (추가) 및 영어 (KBP) 항아리를 다운로드해야합니다. 다른 언어에 대한 리소스에는 해당 모델 JAR의 사용이 필요합니다.
모델을 얻는 가장 좋은 방법은 GIT-LFS를 사용하여 포옹 페이스 허브에서 복제하는 것입니다.
예를 들어, 프랑스 모델을 얻으려면 다음 명령을 실행하십시오.
# Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install
git clone https://huggingface.co/stanfordnlp/corenlp-french
항아리는 아래 링크 또는 Hugging Face Hub 페이지에서 직접 다운로드 할 수 있습니다.
| 언어 | 모델 JAR | 마지막으로 업데이트되었습니다 |
|---|---|---|
| 아라비아 말 | 다운로드 (HF Hub) | 4.5.6 |
| 중국인 | 다운로드 (HF Hub) | 4.5.6 |
| 영어 (추가) | 다운로드 (HF Hub) | 4.5.6 |
| 영어 (KBP) | 다운로드 (HF Hub) | 4.5.6 |
| 프랑스 국민 | 다운로드 (HF Hub) | 4.5.6 |
| 독일 사람 | 다운로드 (HF Hub) | 4.5.6 |
| 헝가리 인 | 다운로드 (HF Hub) | 4.5.6 |
| 이탈리아 사람 | 다운로드 (HF Hub) | 4.5.6 |
| 스페인 사람 | 다운로드 (HF Hub) | 4.5.6 |
호스팅을 도와 주신 얼굴을 안아 주셔서 감사합니다!
Gradle 자체를 모르는 경우 공식 사이트를 참조하십시오 : https://gradle.org
Maven Central에 따라 Build.gradle에 다음을 작성하십시오.
dependencies {
implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}영어를 분석하려면 다음을 추가하십시오.
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "다른 버전을 사용하는 경우 "4.5.5"를 사용하는 버전으로 바꾸십시오.
Maven Central에서 Stanford Corenlp의 릴리스를 찾을 수 있습니다.
Stanford Corenlp 홈페이지에서 더 많은 설명과 문서를 찾을 수 있습니다.
Stanford Corenlp에 기여하는 것에 대한 자세한 내용은 Contributing.md 파일을 참조하십시오.
Corenlp에 대한 질문은 태그 Stanford-NLP와 함께 StackoverFlow 또는 메일 링리스트에 게시 할 수 있습니다.