Dataset existente com o seu. 
SEQ2SEQ (CHATBOT): Tune Flan-T5 no código da ALPACA
SEQ2SEQ: Tune Fine Flan-T5 nos dados usando o código da estrutura do HuggingFace
input sentence: Given a set of numbers, find the maximum value.
{10, 3, 25, 6, 16}
response: 25
input sentence: Convert from celsius to fahrenheit.
Temperature in Celsius: 15
response: Fahrenheit
input sentence: Arrange the given numbers in ascending order.
2, 4, 0, 8, 3
response: 0, 3, 4, 8
input sentence: What is the capital of France?
response: paris
input sentence: Name two types of desert biomes.
response: sahara
input sentence: Given a set of numbers, find the maximum value.
{10, 3, 25, 6, 16}
response: 25
input sentence: Convert from celsius to fahrenheit.
Temperature in Celsius: 15
response: 77
input sentence: Arrange the given numbers in ascending order.
2, 4, 0, 8, 3
response: 0, 2, 3, 4, 8
input sentence: What is the capital of France?
response: Paris
input sentence: Name two types of desert biomes.
response: Desert biomes can be divided into two main types: arid and semi-arid. Arid deserts are characterized by high levels of deforestation, sparse vegetation, and limited water availability. Semi-desert deserts, on the other hand, are relatively dry deserts with little to no vegetation.
Este repositório contém o processamento de dados do início ao final e os algoritmos de PNL usando pytorch e frequentemente huggingface (transformadores) para os seguintes modelos:
Papel: Redes de atenção hierárquica Pytorch Implementação: Código
Papel: Bert Pytorch Implementação: Código
Ensemble Bert-CNN. Implementação de Pytorch: código
Papel: CNN Pytorch de nível de caractere implementação: código
Artigo: Distilbert Pytorch Implementação: Código
Destilgpt-2. Implementação de Pytorch: código
Artigo: Redes neurais convolucionais para classificação de sentenças Pytorch Implementação: Código
Artigo: Classificação T5 Implementação Pytorch: Código
Artigo: T5-Summarização Pytorch Implementação: Código
Construindo um corpus: pesquise arquivos de texto. Código: Código
Papel: Heinsein Roteamento Torchtext Implementação: Código
Incorporações de entidade e carregamento preguiçoso. Código: Código
Similaridade semântica. Código: Código
Esquadrão 2.0 Emissões de incorporação Bert em pytorch. Código: Código
Emissões de incorporação de SST-5 Bert em Pytorch. Código: Código
Créditos: O Hedwig Group tem sido fundamental para me ajudar a aprender muitos desses modelos.
As saídas de marcação mais agradáveis podem ser encontradas aqui: http://seekinginference.com/nlp/