Dataset existente con el suyo. 
SEQ2SEQ (ChatBot): Fine Tune Flan-T5 en el código Alpaca
SEQ2SEQ: Fine Flan-T5 en los datos utilizando el código de marco de DataSet Huggingface
input sentence: Given a set of numbers, find the maximum value.
{10, 3, 25, 6, 16}
response: 25
input sentence: Convert from celsius to fahrenheit.
Temperature in Celsius: 15
response: Fahrenheit
input sentence: Arrange the given numbers in ascending order.
2, 4, 0, 8, 3
response: 0, 3, 4, 8
input sentence: What is the capital of France?
response: paris
input sentence: Name two types of desert biomes.
response: sahara
input sentence: Given a set of numbers, find the maximum value.
{10, 3, 25, 6, 16}
response: 25
input sentence: Convert from celsius to fahrenheit.
Temperature in Celsius: 15
response: 77
input sentence: Arrange the given numbers in ascending order.
2, 4, 0, 8, 3
response: 0, 2, 3, 4, 8
input sentence: What is the capital of France?
response: Paris
input sentence: Name two types of desert biomes.
response: Desert biomes can be divided into two main types: arid and semi-arid. Arid deserts are characterized by high levels of deforestation, sparse vegetation, and limited water availability. Semi-desert deserts, on the other hand, are relatively dry deserts with little to no vegetation.
Este repositorio contiene el procesamiento de datos inicial y los algoritmos NLP utilizando Pytorch y a menudo Huggingface (Transformers) para los siguientes modelos:
Documento: Redes de atención jerárquica Pytorch Implementación: Código
Documento: Implementación de Bert Pytorch: código
Bert-CNN Ensemble. Implementación de Pytorch: código
Documento: Implementación de CNN Pytorch a nivel de personaje: código
Documento: Distilbert Pytorch Implementación: Código
Distilgpt-2. Implementación de Pytorch: código
Documento: Redes neuronales convolucionales para la clasificación de oraciones Pytorch Implementación: Código
Documento: implementación de Pytorch de clasificación T5: código
Documento: implementación de pytorch t5-sumarización: código
Construyendo un corpus: buscar archivos de texto. Código: Código
Documento: Heinsein Ruting TorchText Implementación: Código
Entidad incrustaciones y carga perezosa. Código: Código
Similitud semántica. Código: Código
Squad 2.0 Bert Emisos de incrustaciones en Pytorch. Código: Código
SST-5 BERT INCRETDINGS EMISIONES EN PYTORCH. Código: Código
Créditos: El grupo Hedwig ha sido fundamental para ayudarme a aprender muchos de estos modelos.
Las salidas de marcado R más amables se pueden encontrar aquí: http://seekinginference.com/nlp/