Dataset на свой собственный. 
SEQ2SEQ (Чатбот): Fine Tune Flan-T5 на коде Alpaca
SEQ2SEQ: Fine Tun
input sentence: Given a set of numbers, find the maximum value.
{10, 3, 25, 6, 16}
response: 25
input sentence: Convert from celsius to fahrenheit.
Temperature in Celsius: 15
response: Fahrenheit
input sentence: Arrange the given numbers in ascending order.
2, 4, 0, 8, 3
response: 0, 3, 4, 8
input sentence: What is the capital of France?
response: paris
input sentence: Name two types of desert biomes.
response: sahara
input sentence: Given a set of numbers, find the maximum value.
{10, 3, 25, 6, 16}
response: 25
input sentence: Convert from celsius to fahrenheit.
Temperature in Celsius: 15
response: 77
input sentence: Arrange the given numbers in ascending order.
2, 4, 0, 8, 3
response: 0, 2, 3, 4, 8
input sentence: What is the capital of France?
response: Paris
input sentence: Name two types of desert biomes.
response: Desert biomes can be divided into two main types: arid and semi-arid. Arid deserts are characterized by high levels of deforestation, sparse vegetation, and limited water availability. Semi-desert deserts, on the other hand, are relatively dry deserts with little to no vegetation.
Этот репозиторий содержит начало обработки данных и алгоритмы NLP с использованием Pytorch и часто Huggingface (трансформаторы) для следующих моделей:
Документ: Иерархические сети внимания. Реализация Pytorch: код
Документ: Bert Pytorch Реализация: код
БЕРТ-КНН АНСАМБЛ. Реализация Pytorch: код
Документ: Реализация CNN Pytorch на уровне символов: код
Бумага: Дистильберт Пейтор Реализация: код
Distilgpt-2. Реализация Pytorch: код
Документ: сверточные нейронные сети для предложений Классификация Pytorch Реализация: код
Документ: T5-классификация Pytorch Реализация: код
Документ: T5-Summarization Pytorch Реализация: код
Создание корпуса: поиск текстовых файлов. Код: код
Документ: Heinsein Маршрутизация Torchtext Реализация: код
Entity Entgeddings и ленивая загрузка. Код: код
Семантическое сходство. Код: код
Squad 2.0 BERT ENTARDDINGS EMISSIONS в Pytorch. Код: код
SST-5 BERT ENTARDINGS EMISSINGS в Pytorch. Код: код
Кредиты: Группа Хедвига сыграла важную роль в том, чтобы помочь мне изучить многие из этих моделей.
Более приятные выходы r отметки можно найти здесь: http://seekinginference.com/nlp/