굉장한 포옹 페이스
이것은 Hugging Face Libraries와 통합 된 훌륭한 오픈 소스 프로젝트 및 응용 프로그램의 목록입니다.
기여하는 방법
? 공식 도서관
❤️으로 만든 퍼스트 파티 멋진 물건? 포옹 얼굴.
- 변압기-Jax, Pytorch 및 Tensorflow의 최첨단 자연어 처리.
- 데이터 세트-빠르고 사용하기 쉬운 효율적인 데이터 조작 도구를 갖춘 ML 모델을위한 최대의 사용 가능한 NLP 데이터 세트.
- 토큰 화제-연구 및 생산에 최적화 된 빠른 최첨단 토큰 화제.
- Knockknock- 교육이 두 줄의 추가 코드로 만 끝날 때 알림을받습니다.
- 가속-멀티 -GPU, TPU, 혼합 프레시션으로 Pytorch 모델을 훈련하고 사용하는 간단한 방법.
- AUTONLP- 최첨단 자연어 처리 모델을 훈련시키고 확장 가능한 환경에 자동으로 배치하십시오.
- NN_PRUNING- 결합 또는 훈련 중에 모델을 잘라냅니다.
- Huggingface_Hub- 클라이언트 라이브러리 Huggingface.co Hub에서 모델 및 기타 파일을 다운로드하여 게시합니다.
- 조정 - 변압기 기반 모델을 비교하기위한 벤치 마크.
? ? 튜토리얼
포옹 페이스 툴킷을 사용하는 방법을 배우십시오.
- 공식 코스 (Hugging Face) - 공식 코스 시리즈는? 포옹 얼굴.
- Transformers-Tutorials (@nielsrogge)-실제 데이터 세트에 여러 모델을 적용하기위한 튜토리얼.
? NLP 툴킷
NLP 툴킷은 변압기를 기반으로합니다. 스위스 군대!
- Allennlp (AI2) - 오픈 소스 NLP 리서치 라이브러리.
- Graph4NLP- NLP에 대한 그래프 신경망을 쉽게 사용할 수 있습니다.
- 번개 변압기 - Pytorch Lightning 인터페이스가있는 변압기.
- 어댑터 변압기-어댑터를 최첨단 언어 모델에 통합하여 변압기 라이브러리로 확장됩니다.
- OBSEI- 로우 코드 AI 워크 플로 자동화 도구로 워크 플로 파이프 라인에서 다양한 NLP 작업을 수행합니다.
- Trapper (OBS)-모듈 식 설계 및 일관된 API의 변압기 모델을 통해 최신 NLP.
- Flair- 최신 NLP를위한 매우 간단한 프레임 워크.
? 텍스트 표현
문장을 벡터로 변환합니다.
- 문장 변압기 (Ukplab의) - 널리 사용되는 인코더는 문장, 단락 및 이미지에 대한 밀도가 높은 벡터 표현을 계산합니다.
- 미백 (Microsoft) - 미백으로 쉽게 감독되지 않은 문장 임베딩 접근법.
- SIMCSE (프린스턴 출신)-대조적 인 학습을 가진 최첨단 문장.
- DensePhrases (Princeton의) - 규모에 따라 문구의 조밀 한 표현을 학습합니다.
추론 엔진
변압기 호환 API를 구현하는 고도로 최적화 된 추론 엔진.
- Turbotransformers (Tencent의) - 빠른 C ++ API가있는 변압기의 추론 엔진.
- FasterTransformer (NVIDIA) - NVIDIA GPU에서 고도로 최적화 된 변압기 기반 인코더 및 디코더 구성 요소를 실행하는 스크립트 및 레시피.
- LightSeq (Bytedance) - CUDA에서 구현 된 시퀀스 처리 및 생성을위한 고성능 추론 라이브러리.
- FASTSEQ (Microsoft) - 텍스트 생성, 요약, 번역 작업 등에 대한 인기있는 시퀀스 모델 (예 : BART, Prophetnet)의 효율적인 구현
? 모델 확장 성
여러 GPU에 걸친 병렬화 모델.
- ParalLelforMers (Tunib) - 모델 병렬 배포를위한 라이브러리.
- 오슬로 (Tunib) - 대규모 모델을 훈련시키는 데 도움이되는 다양한 기능을 지원하는 라이브러리.
- DeepSpeed (Microsoft) - DeepSpeed -Zero- 모델 크기는 모델의 변경 사항이 0에서 없습니다. HF 트레이너와 통합.
- FairScale (Facebook) - 제로 프로토콜도 구현됩니다. HF 트레이너와 통합.
- Colossalai (HPCaitech의) - 대규모 병렬 교육 (1D, 2D, 2.5D, 3D 및 서열 병렬 처리 및 제로 프로토콜)을위한 통합 딥 러닝 시스템.
? 닐 모델 압축/가속도
추론 속도 향상 모델을 압축 또는 가속화합니다.
- Torchdistill- 지식 증류를위한 Pytorch 기반 모듈 식 구성 중심 프레임 워크.
- 텍스트 브루어 (HFL)-언어 모델을 압축하는 최첨단 증류 방법.
- Bert-of Theseus (Microsoft)-원래 Bert의 구성 요소를 점차적으로 교체하여 Bert를 압축합니다.
? ️ 적대 공격
모델 견고성을 테스트하기 위해 적대 공격을 수행합니다.
- TextAttack (UVA) - NLP의 적대적 공격, 데이터 증강 및 모델 교육을위한 파이썬 프레임 워크.
- Textflint (Fudan) - NLP 용 통합 다국어 견고성 평가 툴킷.
- Openattack (THU) - 오픈 소스 텍스트 적대적 공격 툴킷.
? 스타일 전송
텍스트 스타일을 전송하십시오! 이제 왜 그것이 변압기라고 불리는 지 알고 있습니까?
- Styleformer- 스타일 사이에 텍스트를 부드럽게 전송하기위한 신경 언어 스타일 전송 프레임 워크.
- CONSERT- 자체 감독 문장 표현 전송을위한 대조적 인 프레임 워크.
? 감정 분석
인간의 감정과 감정을 분석합니다.
- Conv -Emotion- 대화에서 감정 인식을위한 다양한 아키텍처 구현.
? 문법 오류 수정
당신은 오타를 만들었습니다! 수정하겠습니다.
- Gramformer- 자연어 텍스트에서 문법 오류를 감지, 강조 및 수정하기위한 프레임 워크.
? 번역
다른 언어들로 번역.
- DL-Translate- HF 변압기를 기반으로하는 딥 러닝 기반 번역 라이브러리.
- Easynmt (ukplab의)-사용하기 쉬운 최첨단 번역 라이브러리 및 HF 변압기를 기반으로 한 도커 이미지.
지식과 실체
학습 지식, 광업 단체, 세계 연결.
- 순수 (프린스턴에서) - 텍스트에서 실체와 관계 추출.
? 연설
HF 라이브러리로 구동되는 음성 처리. 연설이 필요합니다!
- S3PRL- 자체 감독 연설 사전 훈련 및 표현 학습 툴킷.
- SpeechBrain- Pytorch 기반 스피치 툴킷.
? 다중 유체
다른 양식에서 세상을 이해합니다.
- Vilt (Kakao)-컨볼 루션 또는 지역 감독이없는 비전 및 언어 변압기.
? 강화 학습
RL Magic과 NLP를 결합!
- TRL- 인간 선호도와 일치하기 위해 근위 정책 최적화 (PPO)를 사용한 미세 조정 변압기.
❓ 질문 대답
답변을 찾고 계십니까? 구조대 변압기!
- Haystack (Deepset)-Wild에서 질문 응답 시스템을 개발하고 배포하기위한 엔드 투 엔드 프레임 워크.
? 추천 시스템
나는 이것이 당신에게 적합하다고 생각합니다!
- Transformers4rec (NVIDIA) - 순차적 및 세션 기반 권장 사항을 위해 변압기로 구동되는 유연하고 효율적인 라이브러리입니다.
⚖️ 평가
HF 데이터 세트에 의해 구동되는 모델 출력 및 데이터 품질 평가!
- 배심원 (OBSS)-NLP (자연어 생성)를 위해 Spesifically (자연 언어 생성)를 평가하는 NLP 모델 출력을 평가하는 데 사용하기 쉬운 도구.
- 스포트라이트 - 한 줄의 코드로 HF 데이터 세트를 대화식으로 탐색하십시오. 모델 결과 (예 : 임베딩, 예측)를 사용하여 중요한 데이터 세그먼트 및 모델 실패 모드를 이해합니다.
? 신경 검색
검색, 그러나 신경망의 힘으로!
- JINA 통합 - 포옹 페이스의 JINA 통합 API.
- 통합 (Text2Vec) (QA) - 포옹 얼굴 변압기의 통합을 짜십시오.
- Colbert (Stanford의) - 빠르고 정확한 검색 모델로 수십 밀리 초의 대형 텍스트 컬렉션에 대한 확장 가능한 Bert 기반 검색을 가능하게합니다.
☁ 클라우드
클라우드는 당신의 삶을 쉽게 만듭니다!
- Amazon Sagemaker- Amazon Sagemaker에서 포옹 페이스 트랜스포머 모델을 더 쉽게 훈련시킬 수 있습니다.
하드웨어
마법이 일어날 수있는 인프라.
- Qualcomm- Snapdragon에서 변압기 활성화에 대한 협업.
- 인텔 - 구성 옵션을위한 Intel과의 협업.