Потрясающе
Это список некоторых замечательных проектов и приложений с открытым исходным кодом, интегрированных с библиотеками обнимающего лица.
Как внести свой вклад
? Официальные библиотеки
Первопартийная классная вещь, изготовленная из ❤ by? Обнимающееся лицо.
- Трансформеры-современная обработка естественного языка для JAX, Pytorch и Tensorflow.
- Наборы данных-самый большой центр готовых к использованию наборов данных NLP для моделей ML с быстрыми, простыми в использованием и эффективными инструментами манипулирования данными.
- Токенизаторы-быстрые современные токенизаторы, оптимизированные для исследований и производства.
- Knocknock - Получите уведомление, когда ваше обучение заканчивается только двумя дополнительными строками кода.
- Accelerate-простой способ обучения и использования моделей Pytorch с мульти-GPU, TPU, смешанным назначением.
- AUTONLP-Обучение современных моделей обработки естественного языка и автоматически развернуть их в масштабируемой среде.
- nn_pruning - Обрезать модель во время создания или обучения.
- guggingface_hub - клиентская библиотека для загрузки и публикации моделей и других файлов в концентраторе hurgingface.co.
- Tune - эталон для сравнения моделей на основе трансформаторов.
? ? Учебные пособия
Узнайте, как использовать набор инструментов для обнимающего лица, пошаговый.
- Официальный курс (от обнимающего лица) - официальная серия курсов, предоставленная? Обнимающееся лицо.
- Transformers-tutorials (от @nielsrogge)-Учебные пособия по применению нескольких моделей на наборах данных реального мира.
? Наборы инструментов NLP
Наборы инструментов NLP построены на трансформаторах. Швейцарская армия!
- Allennlp (от AI2) - исследовательская библиотека NLP с открытым исходным кодом.
- Graph4nlp - включение простого использования нейронных сетей графика для NLP.
- Молния трансформаторы - трансформаторы с интерфейсом пит -молнии.
- Адаптерные трансформаторы-расширение в библиотеку трансформаторов, интегрируя адаптеры в современные языковые модели.
- OBSEI - инструмент автоматизации рабочих процессов с низким кодом и выполняет различные задачи NLP в трубопроводе рабочих процессов.
- Ловец (от OBS)-современный NLP через модели трансформатора в модульной конструкции и последовательных API.
- FLAIR-очень простая структура для современного NLP.
? Текстовое представление
Преобразование предложения в вектор.
- Трансформаторы предложений (из UKPLAB) - широко используемые кодеры вычисляют плотные векторные представления для предложений, абзацев и изображений.
- Отбелингберт (от Microsoft) - легкий подход к внедрению без отбеливания без отбеливания.
- Симксе (из Принстона)-современное предложение, встроенное с контрастным обучением.
- Денсифразы (из Принстона) - Учебное обучение плотные представления фраз в масштабе.
Двигатели вывода
Высоко оптимизированные двигатели вывода реализуют API-совместимые с трансформаторами.
- Турботрансформаторы (от Tencent) - механизм вывода для трансформаторов с быстрым API C ++.
- Feartransformer (от nvidia) - сценарий и рецепт для запуска высоко оптимизированного компонента энкодера и декодера на основе трансформатора на графических процессорах Nvidia.
- Lightseq (от Bytedance) - высокопроизводительная библиотека выводов для обработки последовательностей и генерации, реализованной в CUDA.
- FASTSEQ (от Microsoft) - Эффективная реализация моделей популярных последовательностей (например, BART, ProphetNet) для генерации текста, суммирования, задач перевода и т. Д.
? Масштабируемость модели
Модели параллелей в нескольких графических процессорах.
- Parallefreformers (от Tunib) - библиотека для модели параллельного развертывания.
- OSLO (от TUNIB) - библиотека, которая поддерживает различные функции, которые помогут вам обучать крупномасштабные модели.
- DeepSpeed (от Microsoft) - Deepspeed -Zero - масштабирует любой размер модели с нулевыми или без изменений в модели. Интегрирован с тренером HF.
- Fairscale (из Facebook) - также реализует нулевой протокол. Интегрирован с тренером HF.
- Colossalai (от hpcaitech) - единая система глубокого обучения для крупномасштабного параллельного обучения (1D, 2D, 2,5D, 3D и параллелизм последовательности и нулевой протокол).
? ️ модели сжатие/ускорение
Сжатие или ускорение моделей для улучшения скорости вывода.
- TOCHDISTILL-модульная, основанная на конфигурации структура для дистилляции знаний.
- TextBrewer (от HFL)-современные методы дистилляции для сжатия языковых моделей.
- Bert-of Thezeus (от Microsoft)-сжатие Bert, постепенно заменив компоненты оригинального BERT.
? ️ состязательной атаки
Проведение состязательной атаки для проверки модели надежности.
- TextAttack (от UVA) - структура Python для состязательных атак, увеличения данных и обучения модели в NLP.
- Textflint (от fudan) - унифицированный инструментарий для оценки многоязычной прочности для NLP.
- OpenAttack (от Thu) - инструментарий текстовой атаки с открытым исходным кодом.
? Стиль перенос
Перенесите стиль текста! Теперь вы знаете, почему это называется Transformer?
- StyleFormer - структура передачи стиля нейронного языка для плавного передачи текста между стилями.
- Consert - контрастная рамка для самоотверженного передачи представления предложения.
? Анализ настроений
Анализ настроения и эмоции людей.
- Конвешение - внедрение различных архитектур для распознавания эмоций в разговорах.
? Грамматическая коррекция ошибок
Вы сделали опечатку! Позвольте мне исправить это.
- Gramformer - структура для обнаружения, выделения и исправления грамматических ошибок в текстовом языке естественного языка.
? Перевод
Перевод между разными языками.
- DL-Translate-библиотека переводов на основе глубокого обучения на основе трансформаторов HF.
- EasyNmt (из UKPlab)-простая в использовании, современная библиотека переводов и изображения Docker на основе трансформаторов HF.
Знание и сущность
Учебные знания, горнодобывающие сущности, соединение мира.
- Чистый (из Принстона) - сущность и извлечение отношений из текста.
? Речь
Обработка речи, основанная на библиотеках HF. Нужна речь!
- S3PRL-самоотверженная речь перед тренировкой и представлением инструментария обучения.
- Speechbrain - речевой инструментарий на основе питорха.
? Многомодальность
Понимание мира из разных методов.
- Vilt (от Kakao)-трансформатор видения и языка без свертки или регионального надзора.
? Подкрепление обучения
Объединение магии RL с NLP!
- TRL - Трансформеры тонкой настройки с использованием оптимизации проксимальной политики (PPO), чтобы соответствовать человеческим предпочтениям.
❓ Ответ на вопрос
Ищете ответы? Трансформеры на спасение!
- Haystack (от DeepSet)-сквозная структура для разработки и развертывания вопросов-ответных систем в дикой природе.
? Рекомендованные системы
Я думаю, что это прямо для вас!
- Transformers4Rec (от NVIDIA) - гибкая и эффективная библиотека, основанная на трансформаторах для последовательных и сеансовых рекомендаций.
⚖ Оценка
Оценка выходов модели и качества данных, включенных в силу наборов данных HF!
- Жюри (от OBS)-простые в использовании инструмент для оценки выходов модели NLP, специфически для NLG (генерация естественного языка), предлагая различные автоматизированные метрики текста в тексте.
- Spotlight - Интерактивно изучить свой набор данных HF с одной строкой кода. Используйте результаты модели (например, встраивание, прогнозы) для понимания критических сегментов данных и режимов сбоя модели.
? Нейронный поиск
Поиск, но с силой нейронных сетей!
- Интеграция Джины - Джина интеграция обнимающего лица Ускоренного API.
- Weaviate Integration (Text2VEC) (QA) - Weaviate Integration of Hugging Face Transformers.
- COLBERT (из Стэнфорда) - модель быстрого и точного поиска, позволяющая масштабируемому поиску на основе BERT по сравнению с большими текстовыми коллекциями в десятках миллисекунд.
☁ Облако
Облако облегчает вашу жизнь!
- Amazon SageMaker - облегчаю возможность обучать моделей обнимания лиц трансформеров в Amazon SageMaker.
Аппаратное обеспечение
Инфраструктура, позволяющая случиться магии.
- Qualcomm - Сотрудничество по включению трансформаторов в Snapdragon.
- Intel - Сотрудничество с Intel для параметров конфигурации.