Este repositório contém todos os recursos para o workshop de dias de aprendizado de máquina aplicado, encontre seu eu artificial: gerar texto que soa como você.
Neste workshop, os participantes têm a tarefa de baixar seus próprios logs de bate -papo e criar um bot de bate -papo que gera texto semelhante à sua redação. Como alternativa ao uso de logs de bate-papo, fornecemos vários conjuntos de dados de conversação (e não conversacionais) neste repositório.
Sinta -se à vontade para se juntar ao nosso Gitter durante o workshop:
Encontre o workshop desliza aqui.
O workshop é dividido em 3 tarefas. Você pode executar cada tarefa localmente (clonando este repositório) ou executando o notebook Colab (consulte os links abaixo). Se você executar localmente, verifique se você tem acesso às GPU (s) e estiver executando o Python 3.6+ (também verifique se você tem espaço de armazenamento suficiente). Instruções mais detalhadas são fornecidas nas diferentes subpastas.
Tune GPT-2 em vários conjuntos de dados (incluindo tweets, poesia, código de programação, xadrez, música e muito mais!). Obrigado a @Manueth por compilar os conjuntos de dados!
➡️ Leia mais
Utilizamos a mesma abordagem de transferência de estilo para treinar um modelo de conversação de nossos logs de bate -papo. Você pode usar chatistics para analisar seus próprios logs de bate -papo ou usar alguns dos recursos fornecidos. Obrigado ao @MasterScrat por compilar os conjuntos de dados de conversação!
➡️ Leia mais
Estendemos a abordagem na Tarefa 2, introduzindo aprendizado de várias tarefas, melhorando o pré-processamento de dados e adicionando tipos de token.
➡️ Leia mais