한국어
中文(简体)
中文(繁体)
한국어
日本語
English
Português
Español
Русский
العربية
Indonesia
Deutsch
Français
ภาษาไทย
전체 사이트 맵
최신 업데이트
홈페이지
소스 다운로드
프로그래밍 관련
웹사이트 자원
웹 디자인 튜토리얼
네트워크 프로그래밍 튜토리얼
홈페이지
>
프로그래밍 관련
>
기타 소스코드
Portuguese NLP
기타 소스코드
1.0.0
다운로드
포르투갈어 -NLP
포르투갈어에 중점을 둔 자원 및 도구 목록.
데이터 세트
#pracegover- Instagram의 게시물을 기반으로 포르투갈 캡션이있는 멀티 모달 데이터 세트.
18 세기 포르투갈 의료 텍스트
AG_NEWS PT- 뉴스 기사의 AG 코퍼스의 자동 번역.
Alpaca 데이터 PT-BR-Stanford Alpaca 데이터 세트는 Helsinki-NLP/Opus-MT-TC-Big-EN-PT 모델을 사용하여 브라질 포르투갈어로 번역되었습니다.
Aspectbr- 웹 소비자 리뷰의 종횡비 기반 주석이 달린 데이터 세트.
ASSIN- 의미 론적 유사성 점수 및 부동산 주석이있는 데이터 세트. (포옹)
Assin 2- Assin의 시퀀스. (포옹)
자동 에세이 점수 (AES) 적 데이터 세트 - 포르투갈어의 자동 에세이 점수를위한 벤치 마크 (Huggingface)
AYA 데이터 세트 PT -Cohereforai AYA 데이터 세트 Filtrado Para Português (PT).
Blogset -Br- Brazillian 사용자가 작성한 Blogspot 플랫폼에서 수집 한 게시물 모음.
Bluex- 브라질 최고의 대학 입학 시험을 기반으로 한 벤치 마크.
Boolq -Tradução Automática do boolq.
Br-Quad-2.0- 스탠포드 질문 답변 데이터 세트 (Squad) 2.0은 브라질 포르투갈어 (PT-BR) 언어로 번역되었습니다.
Brands.br- 포르투갈어 리뷰 코퍼스
브라질 법원 결정 - 4043 Ementa (요약) 법원 결정 및 재판소 De Justiça de Alagoas (TJAL), Alagoas 주 대법원 (브라질)의 메타 데이터.
브라질 전자 상거래-Olist Store의 브라질 전자 상거래 공개 데이터 세트.
브라질 헤드 라인 감정 - 브라질 뉴스 기관 헤드 라인의 감정 분석이 포함 된 데이터 세트.
브라질 포르투갈어 문자 코퍼스 - 1840-1908 년 사이에 출판 된 브라질 문학의 370 만 단어 코퍼스.
브라질 포르투갈어 내러티브 에세이의 브라질 포르투갈어 내러티브 에세이 데이터 세트 - 자동 에세이 스코어링을위한 데이터 세트.
브라질 포르투갈어 감정 분석 데이터 세트.
브라질 TCU의 판단 - 연방 회계 법원 판단 - 브라질 (TCU).
BRWAC- 브라질 포르투갈 웹은 코퍼스입니다.
BRWAC2WIKI- 포르투갈어의 다중 문서 요약을위한 데이터 세트.
B2W -Reviews01- 제품 리뷰.
Canarim- 포르투갈어로 된 웹 페이지의 대규모 데이터 세트 (Huggingface)
CAROLINA -CORPUS Geral do Português Brasileiro Comperporâneo (Huggingface).
케이프 - 영어와 포르투갈어로 된 논문과 논문의 평행 코퍼스.
CC100 -Portuguese- Conneau & Wenzek et al. 이 데이터 세트는 CC-Net 저장소에서 2018 년 1 월부터 12 월까지 CommonCrawl Snapshots에서 처리 된 100 개의 단층 데이터 중 하나입니다.
Cetenfolha- 신문 Folha de S. Paulo의 뉴스.
Chave- 정보 검색 및 질문 답변을위한 수집.
CINTIL CORPUS- 포르투갈어의 언어 적으로 해석 된 코퍼스.
Clinicalner- 포르투갈어에서 임상 명명 된 기업 인식.
ComplexIdade 텍스트 파라 에스타 오스 에스코 레이스는 sistema Educacional Brasileiro를 수행합니다.
CORAA- 자동 음성 인식을위한 데이터 세트.
Coraa ser- 브라질 포르투갈 비공식 자발적인 연설에서 감정 인식.
CRAWLPT_DEDUP-CRAWLPT (중복 제거)는 BRWAC, C100-PT, OSCAR-2301의 Three Corpora로 구성됩니다.
CSTNEWS- 다중 문서 요약이있는 50 개의 뉴스 텍스트 클러스터와 여러 담론 및 시맨틱 주석이있는 코퍼스.
C-Oral-Brasil-이 프로젝트는 브라질 포르투갈어 자발적인 연설의 연구와 더 광범위하게 말하면 Corpora의 편집에 전념하고 있습니다.
DANTESTOCKS- 브라질 포르투갈어로 작성된 주식 시장 트윗의 코퍼스는 하렘의 분류에 따라 지명 된 단체와 주석을 달았습니다.
Deepagé- 포르투갈어에서 브라질 환경에 대한 질문에 대한 답변.
DNLT -BP- 브라질 포르투갈어의 신경 심리학 적 언어 테스트 데이터 세트.
적의 도전 - 에세이 작성과 180 개의 객관식 질문이 포함 된 객관적인 부분으로 구성됩니다.
적 -2022 및 EAPS-2023-이 프로젝트는 브라질 대학이 채택한 주요 표준화 된 입학 시험 인 Exame Nacional Do Ensino Médio (Enem)의 마지막 두 판의 모든 객관식 질문을 포함합니다.
에세이 -BR- 에세이 브 : 브라질 포르투갈어를위한 에세이 코퍼스.
확장 에세이 브로-에세이 브립 코퍼스의 확장 버전.
Factck.br- 포르투갈어에서 가짜 뉴스를 공부하는 데이터 세트.
FACTNEWS- 뉴스보고의 문장 수준의 사실을 예측하는 데이터 세트.
가짜 음성 - 브라질 포르투갈어의 딥 파이크는 XTTS 모델로 만들어졌습니다.
가짜 .BR- 브라질 포르투갈어 (Hugginface)로 작성된 참되고 가짜 뉴스를 정렬했습니다.
central_de_fatos- (huggingface).
Fakenewsset- (Huggingface).
Fake Pedia -Corpus- 가짜 뉴스 데이터 세트.
Fakerecogna- 실제 및 가짜 뉴스 (Huggingface)로 구성된 데이터 세트.
가짜 thatsapp.br- 텍스트 잘못된 정보의 자동 감지를 위해 PT -BR의 whatsapp 메시지의 주석이 달린 코퍼스.
FKTC- 가짜 뉴스 텍스트 컬렉션.
Floresta Sintá (C) Tica- 포르투갈어를위한 나무 뱅크.
Harem First- 포르투갈어의 지명 된 엔티티 인식자를위한 평가 대회.
하렘 2 차 - 포르투갈어의 지명 된 엔티티 인식 자에 대한 평가 대회.
증오 브 (Satebr) - 브라질 인스 타 그램 (Instagram)의 대규모 전문가 주석 코퍼스는 웹 및 소셜 미디어에 대한 증오심 표현 및 불쾌한 언어 탐지에 대한 의견을 말합니다.
역사적 포르투갈어 코포라 - 역사적 기업의 조작 및 역사적 사전 관리를위한 도구와 자원.
IMDB PT -TRADUção atomática do imbd.
INFRBR- 자연어 추론 데이터 세트.
Iudicium textum dataset- 브라질 연방 대법원이 통합 구성 (종이)에 만든 법적 문서를 포함합니다.
Lener -Br- 브라질 법률 텍스트에서 명명 된 엔티티 인식을위한 데이터 세트.
Legalpt_dedup -Legalpt (중복 제거)는 포르투갈어에서 공개적으로 이용 가능한 법적 데이터의 최대 금액을 집계합니다.
LEX2KIDS- 포르투갈어의 Lexicon은 어린이들에게 가장 많이 들었습니다.
MAC-MORPHO-Brazilian Portuguese Texts는 부분-연설 태그로 주석을 달았습니다.
milkqa- 답변 선택 과제에 대한 밀도가 높은 질문 데이터 세트.
브라질 중앙 은행의 분 - 브라질 중앙 은행의 통화 정책위원회의 분.
브라질 포르투갈 트윗의 Ner- PT -BR의 트위터 메시지는 Entities Per, Loc 및 Org에 주석이 달린다.
NERDE- Cade의 법학 문서는 Entities org, per, tempo, loc, loc, 다리 (법률), 문서 (문서), Valor에 대해 주석이 달린 문서.
News-Crawl-PT- Wmt에 사용되는 단일 언어 뉴스 크롤링.
이 사이트의 소식 Folha de São Paulo- 브라질 신문 Folha de São Paulo 소식.
브라질에서 출판 된 뉴스 - 글로보 그룹의 뉴스 편집.
OAB 시험 - 브라질 버전의 Bar Exam (미국) (Huggingface).
Revista Pesquisa Fapesp의 병렬 Corpora-Portuguese-English 및 Portuguese-Spanish 이중 언어 과학 뉴스 브라질 잡지 Revista Pesquisa Fapesp의 온라인 문제에 대한 컬렉션.
nurc-sp
Pirá- 바다에 대한 질문 응답을위한 이중 언어 포르투갈어-영어 데이터 세트.
PL-CORPUS- 품질 기준선을 가진 NER을위한 브라질 입법 문서의 코퍼스 인 Ulyssesner-Br의 일부.
PLUE- 접착제 벤치 마크 및 Scitail 데이터 세트의 포르투갈어 번역.
Poetisa- 포르투갈 가공 - 구문 분석 및 구문 분석을 향해.
Politiquices- Politiquices.pt 프로젝트와 관련된 데이터 세트.
Porsimplessent- 정렬 된 문장의 문장 쌍은 문장 가독성 평가를 조사하기 위해 쌍을 이룹니다.
Portilexicon -ud- 보편적 의존성에 따른 브라질 포르투갈어의 어휘.
포르투갈 증오-음성-다타타 세트-이진 주석이있는 5,668 개의 트윗으로 구성된 증오심 표현 탐지를위한 포르투갈 데이터 세트 (예 : '증오'대 '미인'(huggingface) (huggingface)
포르투갈 법적 문장 - 포르투갈 대법원 법원의 법적 문장 모음.
포르투갈 대통령 선거 -이 데이터 세트에는 주로 포르투갈어 트위터 스피어의 트윗과 사용자가 포함되어 있습니다.
PRACEGOVER- 인스 타 그램의 게시물을 기반으로 포르투갈 캡션과 관련된 이미지를 포함하는 다중 모달 데이터 세트.
Priberam Fine-Grained Opinion Corpus- 포르투갈의 세밀한 의존성 의견 채굴 코퍼스.
PropBank- 시맨틱 역할 레이블 (SRL)으로 주석이 달린 인스턴스가 포함되어 있습니다.
Projeto ACDC- Corpora에 대한 인터넷 액세스.
Puntuguese- 미세 편집과 함께 포르투갈어의 말장난 코퍼스 (huggingface)
QA -Portuguese- MQA 데이터 세트 포르투갈 스플릿 (QA Entailment Pairs)의 적응.
Quati-이 데이터 세트는 브라질 포르투갈어 (PT-BR) 정보 검색 (IR) 시스템 개발을 지원하는 것을 목표로하며, 원래 PT-BR에서 생성 된 문서 파산과 원어민이 생성 한 쿼리 (주제)를 제공합니다.
Rebel -Portuguese- 데이터 세트 de relações partir da wikipedia.
Reli -Resenha de Livros.
Repro : 브라질 포르투갈어의 의견 채굴을위한 벤치 마크 데이터 세트 - 브라질 포르투갈어의 의견 채굴을위한 벤치 마크 데이터 세트. (포옹)
Rhetalho- 코퍼스는 Daniel Marcu의 rsttool과 주석을 달았습니다.
SEMCLINBR- 포르투갈 임상 NLP 작업을위한 다중 제도 및 다중 전문가 시맨에 주석이 달린 코퍼스.
참깨 - 포르투갈어의 Ner를위한 코퍼스.
Sigarra News Corpus -Porto 대학의 Sigarra 정보 시스템.
Simplex -PB- 어휘 단순화 데이터베이스 및 포르투갈어의 벤치 마크.
Simplex-PB-2.0- 개선 된 버전의 단순 -PB.
Simplex-PB-3.0- 새로운 버전의 Simplex-PB.
Spotify 서브 세트 - 브라질 포르투갈어의 언어 변형 분류
Squad -Pt v1.1- 분대 데이터 세트의 포르투갈어 번역.
Squad-Pt v1.1-Pt-Br- 브라질의 브라질 포르투갈어 변환, 딥 러닝 브라질에 의해 번역되었습니다.
Squad -PT v2.0- Squad 2.0 데이터 세트의 포르투갈어 번역.
SST -2 PT- 스탠포드 감정 트리 뱅크의 자동 번역.
Temário- 뉴스 텍스트 및 요약 목적을위한 해당 인간 요약.
텍스트 복잡성 코퍼스 - 브라질 교육 시스템의 학교 인턴쉽을위한 텍스트 복잡성 코퍼스.
Breat -Br- 브라질 포르투갈어 (Github)의 소셜 미디어에서 독성 언어 탐지.
TTS -Portuguese Corpus- 포르투갈어에 대한 텍스트.
트윗 - 브라질 포르투갈어의 트윗.
감정 분석을위한 트윗.
UD_Portuguese -Bosque- 보편적 의존성 (UD) 포르투갈 트리 뱅크.
UD_Portuguese -Cintil- UD (Universal Dependencies) 포르투갈 트리 뱅크.
UD_Portuguese -GSD- UD (Universal Dependencies) 포르투갈 트리 뱅크.
UD_Portuguese -Petrogold- UD (Universal Dependencies) 포르투갈 트리 뱅크.
UD_Portuguese -Pud- UD (Universal Dependencies) 포르투갈 트리 뱅크.
Ulyssesner -Br- 지명 된 기업 인식을위한 브라질 입법 문서의 코퍼스
Utlcorpus- 브라질 포르투갈어의 온라인 리뷰의 코퍼스는 도움의 분류로 주석이 달렸다.
Winograd Schema Challenge- 포르투갈 기반 Winograd Schema Challenge의 솔버.
Wizardvicuna-ptbr-instruct-clean-Wizard Vicuna PT-Br Instruct Clean Dataset.
다국어 데이터 세트
대형 언어 모델에서 이민 그룹에 대한 고정 관념 및 부정적인 태도를 조사하기위한 다국어 데이터 세트
ASKD -ELI5 데이터 세트는 의료 질문 (AskDocs) 서브 레드에 적합합니다.
영어-포르투갈어 문장-Tatoeba 프로젝트의 영어-포르투갈어 문장.
Eur -Flex- 유럽 연합의 모든 공식 언어의 다국어 코퍼스.
EUROPARL- 유럽 의회 절차 병렬 코퍼스 1996-2011.
Europarl-ST- 다국어 연설 번역 코퍼스는 2008 년에서 2012 년 사이에 유럽 의회에서 수행 된 토론을 사용하여 건설 된 연설 번역을위한 짝을 이루는 오디오 텍스트 샘플을 포함합니다.
MC4- Common Crawl의 웹 크롤링 코퍼스의 다국어 거대, 청소 버전. 일반적인 크롤링 데이터 세트를 기반으로합니다.
MFAQ- 자주 묻는 질문에 대한 다국어 코퍼스는 일반 크롤링에서 구문 분석되었습니다.
MKQA- 다국어 지식 질문 및 답변 (GitHub).
MQA- 다국어의 질문과 답변 (MQA)은 일반적인 크롤링에서 구문 분석했습니다.
MMARCO- MS Marco Passage Ranking Dataset의 다국어 버전.
MROBUST- TREC 2004의 다국어 버전 강력한 통과 순위 데이터 세트
MultiConer- 명명 된 엔티티 인식을위한 대규모 다국어 데이터 세트.
필수 C- 다국어 연설 번역 코퍼스.
Opensubtitles- 번역 된 영화 자막 모음.
오스카 - 열린 초대형 코퍼스.
Tatoeba- 큰 문장 및 번역 데이터베이스.
TED2020- 2020 년 7 월부터 약 4000 개의 TED 및 TED -X 성적표의 크롤링이 포함되어 있습니다.
TSAR-2022 공유 작업 -TSAR2022 어휘 단순화에 대한 공유 작업.
Wikiann- LOC (위치), PER (Person) 및 ORG (조직) 태그로 IOB2 형식으로 주석이 매겨진 Wikipedia 기사로 구성된 다국어 명명 된 엔티티 인식 데이터 세트.
Wikilingua- Wikihow에서 추출한 다국어 추상적 요약 데이터 세트.
Wikimatrix- Wikipedia의 1620 년 언어 쌍의 병렬 문장.
Wikiner -Wikipedia에서 다국어를 지명 한 Entity Recognition.
Wikineural- 다국어 NER을위한 신경 및 지식 기반은 데이터 생성 (EMNLP 2021).
Wikipedia- 모든 언어의 청소 기사가 포함 된 Wikipedia 데이터 세트.
Xformal- 다국어 형식 스타일 전송을위한 벤치 마크.
XLSUM -BBC에서 1,350 만 명이 전문적으로 주석이 달린 기사 - 심리 쌍.
사전
BATS -PT- 더 큰 비유 테스트 세트 (BATS)의 어휘 부분을 포르투갈어로 수동으로 변환
Br.ispell- 브라질 포르투갈어 (Github)의 Ispell 사전.
ConceptNet- 개방형 다국어 지식 그래프.
Dicsin- 동의어와 반의어 사전.
포르투갈어 텍스트 분석을위한 어휘를 제공하는 Lexiconpt -R 패키지.
어휘 - 이름, 성, 약어 및 확장, 정지 단어 등의 사전.
LIWC- 언어 조사 및 단어 수 (사전)
ont.pt -ontologia 어휘 para o português.
OpenWordnet -PT- 포르투갈어 용 Open Access WordNet (사이트).
Oplexicon- 포르투갈어에 대한 감정 어휘.
Palavras- 브라질 포르투갈어의 단어 목록.
파펠.
PT -BR- 워드리스트, 동사, 컨쥬 게이션, 용어 주파수.
PT-LKB- 대규모 포르투갈 어휘-남성 지식 기반
풀로 - 포르투갈 통일 어휘 온톨로지.
Sentilex -Pt- 포르투갈어를위한 감정 어휘.
Stopwords- 포르투갈 스톱워드 컬렉션.
TEP2.
Unitex -PB- 어휘 자원.
VALEXPB- 브라질 포르투갈어 동사 동사 원자가의 어휘.
verbnet.br 1.0- 브라질 포르투갈어의 구두 사전.
Wikidict-DSL-PT-Wikidata 이중 언어 DSL 사전.
WordNetaffectbr- 감정의 어휘.
Wordnet.br- 포르투갈어 wordnet.
모델
Albertina PT -BR- 포르투갈어 언어를위한 버트 가족의 인코더 - 브라질의 미국 변형입니다.
Albertina PT -PT- 포르투갈어의 포르투갈어 - 포르투갈의 유럽 변형을위한 버트 패밀리의 인코더입니다.
Alpaca-Lora-Ptbr- 저급 라마르어 튜닝.
바트 -Bart Pre -Treinado em Português.
BERTIMBAU-BERTIMBAU BASE는 브라질 포르투갈어를위한 사방 된 버트 모델로, 3 가지 다운 스트림 NLP 작업에서 최첨단 공연을 달성합니다. 이름이 지정된 엔티티 인식, 문장 텍스트 유사성 및 텍스트 수입 인식 (GITHUB).
Biobertpt- 포르투갈어 언어 (Github)의 임상 도메인에 대해 훈련 된 미세 조정 된 버트 모델.
CABRITA- 포르투갈어의 미세한 교육 라마 (GitHub).
DEBERTINHA- 브라질 포르투갈어 (Github)에 적응 한 Deberta V3 Xsmall.
Electra -BRWAC에 대한 전자 모델.
Gervasio -PT -BR- 포르투갈어를위한 GPT 가족의 디코더 - 브라질의 미국 변형입니다.
Gervasio -PT -PT- 포르투갈어의 GPT 가족의 디코더 - 포르투갈의 유럽 변형입니다.
Glória 1.3B- 포르투갈 유럽 중심의 대형 언어 모델 (Huggingface)
GPT2 Small-Gportuguese-2 (포르투갈 GPT-2 Small)는 GPT-2 작은 모델을 기반으로 한 포르투갈어의 최첨단 언어 모델입니다.
GPT-Neo Small- Eletheurai의 GPT-Neo 125m에서 포르투갈어로 Finetuned 버전.
GPT2-BIO-PT- GPORTUGUESE-2 (GITHUB)의 생물 의학적 결제 버전.
Nerde -Base -Bertimbau는 사법 문서에 대해 NER에게 미세 조정했습니다.
Roberta-Pt-Br
Robertacrawlpt-Base-Robertacrawlpt-Base는 Crawlpt Corpora에서 처음부터 전반되는 일반적인 포르투갈 마스크 언어 모델입니다.
Robertalexpt -Base- 포르투갈 마스크 언어 모델은 법률과 크롤링 코퍼라에서 처음부터 사전에서 사라졌습니다.
Sabiá -Sabiá -7b는 Maritaca AI가 개발 한 포르투갈어 모델입니다.
Sabiá 2- 언어 모델은 포르투갈어 텍스트, 특히 브라질 도메인에서 훈련되었습니다.
브라질 포르투갈 데이터에 대한 T5 -T5 모델.
TGF-XLM-ROBERTA-BASE-PT-BR (GITHUB)
WAV2VEC- 공통 음성의 기차 및 검증 스플릿을 사용하여 포르투갈어의 미세 조정 된 Facebook/WAV2VEC2-LARGE-XLSR-53 6.1.
다국어 모델
BLOOM-BIGSCIENCE 대형 오픈 과학 오픈 액세스 다국어 언어 모델.
MBERT- MLM (Masked Language Modeling) 목표를 사용하여 가장 큰 Wikipedia를 사용하여 상위 104 개 언어에서 사전 치료 된 모델.
Mdeberta
MGPT- 다국어 GPT 모델. 자동 회귀 GPT와 같은 모델.
mminilm-mminilm-l6-v2 reranker는 mmarco에 미세 조정되었습니다
MT5- 다국어 T5. 대규모 다국어 미리 훈련 된 텍스트-텍스트 변압기.
XLM-Roberta-XLM-Roberta 모델 100 개 언어를 포함하는 2.5TB의 필터링 된 CommonCrawl 데이터에서 미리 훈련되었습니다.
LABSE- 언어-비수성 Bert 문장 인코더 (Labse)는 109 개 언어에 대한 문장 임베딩을 위해 훈련 된 버트 기반 모델입니다.
단어 임베딩
FastText- 다국어 단어 벡터.
레이저 - 언어 공유 문장 표현.
NILC -EMBEDDINGS- 포르투갈어로 USP에 의해 훈련 된 단어 임베딩.
뮤즈 - 다국어 감독 및 감독 된 임베딩.
단어 벡터 - 30 개 이상의 언어의 미리 훈련 된 단어 벡터.
메트릭
COH-METRIX-PORT- 브라질 포르투갈어에 CoH-Metrix 텍스트 분석 도구를 적응합니다.
NILC -METRIX- NILC Lab에서 10 년 이상 개발 된 메트릭을 수집합니다.
리더 보드
Open Pt LLM LeaderBoard -Open Pt LLM Leaderboard는 다양한 작업 및 데이터 세트에서 포르투갈어 언어로 대형 언어 모델 (LLM)의 평가를위한 벤치 마크를 제공하는 것을 목표로합니다.
프레임 워크
nlpnet
nltk
Polyglot
스파이
스탠자 NLP
UDPIPE
기관
Brasileiras em pln.
Hailab -PUCPR- 자연 언어 가공 및 기계 학습을 사용하여 건강 관리 솔루션을 개발하기위한 선구적인 연구 그룹.
Linguateca.
NILC.
Nlportuguês- 브라질 포르투갈어에서 NLP 코스를 만드는 데 전념했습니다.
NLX 그룹.
pln pucrs.
도구
Apertium -Por- 포르투갈어를위한 조리개 언어 데이터.
Autocorrect- 파이썬의 철자 조정자.
BRGRAM- XLE에서 시행 된 LFG 형식의 브라질 포르투갈어의 계산 문법 조각.
DICIO API- 포르투갈 사전 API.
DICT-PT-BR- 브라질 포르투갈어 사전.
Langugetool- 25 개 이상의 언어에 대한 스타일 및 문법 검사기.
LegalNLP- 브라질 법률 언어를위한 자연어 처리 방법.
Lexml Parser- 법률 문서를위한 파서.
LX Parser- 포르투갈어의 통계 선거구 파서.
Metaphone -PTBR- 포르투갈어에 대한 은유 알고리즘.
MLCONJUG3- 포르투갈어 및 기타 언어로 동사를 활용하는 파이썬 라이브러리.
Morphobr- 포르투갈어의 형태 학적 분석을위한 자원.
Opcluster- 세밀한 의견의 자동 추출 및 클러스터링.
PHONEMIZER- 여러 언어에 대한 간단한 텍스트 컨버터 변환기.
Porgram- HPSG 형식의 포르투갈어를위한 오픈 소스 계산 문법.
Pymetaphone -Br- 포르투갈어를위한 은유 알고리즘 패키지.
pysentimiento- 감정 분석 및 소셜 NLP 작업을위한 다국어 툴킷.
PyspellChecker- 다국어 맞춤법 검사.
RBAMR- 포르투갈어를위한 규칙 기반 AMR 파서.
VERBECC- 프랑스어, 스페인어, 포르투갈어, 이탈리아 및 루마니아어에 대한 머신 러닝을 사용하여 동사의 완전한 활용.
다른 목록
주석이 달린 의미 론적 관계 데이터 세트
언어 데이터 세트 - 포르투갈어를위한 언어 데이터 세트.
포르투갈어를위한 Ner-datasets
NILC
NILC 2
NILC 3
Opinando- 포르투갈어의 의견 채굴.
포르투갈 데이터 세트 목록
다른 링크
Opus -Opus는 웹에서 번역 된 텍스트 모음이 점점 커지고 있습니다.
통계 및 신경 기계 번역.
확장하다
추가 정보
버전
1.0.0
유형
기타 소스코드
업데이트 시간
2025-04-19
크기
11.87KB
출처
Github
관련 애플리케이션
GitHub sgrebnov/cordova plugin background download
2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings
2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home
2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home
2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p
2024-11-01
GitHub the via/releases
2024-11-01
추천
chat.petals.dev
기타 소스코드
1.0.0
GPT Prompt Templates
기타 소스코드
1.0.0
GPTyped
기타 소스코드
GPTyped 1.0.5
Google Dorks
기타 소스코드
1.0
shepherd
기타 소스코드
v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express
기타 소스코드
v1.1.0-rc-3
Google Dorks
기타 소스코드
1.0
shepherd
기타 소스코드
v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express
기타 소스코드
v1.1.0-rc-3
관련 정보
전체
Honkai Star Rail 다음 배너 및 현재 배너, Honkai Star Rail의 모든 배너 목록
2024-11-22
PLS DONATE x Tower Defense Simulator 이벤트에서 모든 보상을 받는 방법
2024-11-17
Dragon Age The Veilguard에서 Black Emporium을 잠금 해제하는 방법
2024-11-16
Black Ops 6 시즌 1에서 마네킹 Nuketown 부활절 달걀을 만드는 방법
2024-11-15
수십 년 만에 새로운 Donkey Kong Country 2 치트가 발견되었습니다.
2024-11-10
Black Ops 6(BO6)에서 연막탄으로 사살하고 둔기 트라우마 콜 카드를 잠금 해제하는 방법
2024-11-11
Warzone 및 Black Ops 6 시즌 1 출시 날짜 및 시간
2024-11-10
Dragon Age The Veilguard에서 아이스탈론 코리우스를 이기는 방법
2024-11-02
King Legacy에서 Luma Grove 및 Drakenhold Fortress에 도달하는 방법
2024-11-02
2024년 11월 포켓몬고 팀 로켓 그런트 카운터 및 라인업
2024-11-02
2024년 11월 Zenless Zone Zero 코드 및 사용 방법
2024-11-02
FF14에서 초코보를 얻는 방법 FF14에서 초코보를 얻는 방법 공유
2023-10-31