Download do cakechat - Download de código fonte de cakechat

cakechat

Outro código-fonte

v2.0.1

Baixar

Nota no topo: o projeto não é mantido.

Os modelos de diálogo baseados em transformadores funcionam melhor e recomendamos usá-los em vez do Cakechat baseado em RNN. Veja, por exemplo, https://github.com/microsoft/dialogpt

Cakechat: sistema de diálogo generativo emocional

O Cakechat é um back -end para chatbots capazes de expressar emoções por meio de conversas.

Representação do Cakechat

O Cakechat é construído em Keras e Tensorflow.

O código é flexível e permite condicionar as respostas do modelo por uma variável categórica arbitrária. Por exemplo, você pode treinar seu próprio modelo de conversação neural baseado em persona ^[1] ou criar uma máquina de bate-papo emocional ^[2] .

Principais requisitos

Python 3.5.2
Tensorflow 1.12.2
Keras 2.2.4

Índice

Arquitetura e recursos de rede
Início rápido
Configuração para treinamento e teste
1. Docker
  1. Configuração somente para CPU
  2. Configuração habilitada para GPU
2. Configuração manual
Obtendo o modelo pré-treinado
Dados de treinamento
Treinando o modelo
1. Ajustando o modelo pré-treinado em seus dados
2. Treinando o modelo do zero
3. Trem distribuído
4. Cálculo das métricas de validação
5. Testando o modelo treinado
Executando o servidor Cakechat
1. HTTP-Server local
  1. Descrição da API HTTP-Server
2. Gunicorn http-server
3. Telegram Bot
Visão geral do repositório
1. Ferramentas importantes
2. Configurações importantes de configuração
Exemplo de uso de casos
Referências
Créditos e suporte
Licença

Arquitetura e recursos de rede

Arquitetura de rede

Modelo:

Arquitetura hierárquica do codificador recorrente (HRED) para lidar com o contexto de diálogo profundo ^[3] .
RNN multicamada com células GRU. A primeira camada do codificador em nível de expressão é sempre bidirecional. Por padrão, a implementação do CUDNNGRU é usada para ~ 25% de aceleração durante a inferência.
O vetor de pensamento é alimentado no decodificador em cada etapa de decodificação.
O decodificador pode ser condicionado a qualquer rótulo categórico, por exemplo, rótulo de emoção ou id de persona.

Camada de incorporação de palavras:

Pode ser inicializado usando o modelo W2V treinado em seu corpus.
A camada de incorporação pode ser fixa ou ajustada junto com outros pesos da rede.

Decodificação

4 algoritmos diferentes de geração de resposta: "amostragem", "feamsearch", "amostragem-reranking" e "feamsearch-reranking". A reranquilha dos candidatos gerados é realizada de acordo com a probabilidade de log ou MMI-critérios ^[4] . Consulte as configurações Descrição Descrição para obter detalhes.

Métricas:

Perplexidade
métricas distintas n-gramas ajustadas ao tamanho das amostras ^[4] .
Similaridade lexical entre amostras do modelo e algum conjunto de dados fixo. A similaridade lexical é uma distância cosseno entre o vetor TF-IDF das respostas geradas pelo modelo e tokens no conjunto de dados.
Métricas de classificação: precisão média média e recall média@k. ^[5]

Início rápido

Caso você esteja familiarizado com o Docker, aqui está a maneira mais fácil de executar um modelo de Cakechat pré-treinado como servidor. Pode ser necessário executar os seguintes comandos com sudo .

Versão da CPU:

 docker pull lukalabs/cakechat:latest && 

docker run --name cakechat-server -p 127.0.0.1:8080:8080 -it lukalabs/cakechat:latest bash -c "python bin/cakechat_server.py"

Versão da GPU:

 docker pull lukalabs/cakechat-gpu:latest && 

nvidia-docker run --name cakechat-gpu-server -p 127.0.0.1:8080:8080 -it lukalabs/cakechat-gpu:latest bash -c "CUDA_VISIBLE_DEVICES=0 python bin/cakechat_server.py"

É isso! Agora teste seu servidor Cakechat executando o seguinte comando em sua máquina host:

 python tools/test_api.py -f localhost -p 8080 -c "hi!" -c "hi, how are you?" -c "good!" -e "joy"

O ditado de resposta pode ser assim:

 {'response': "I'm fine!"}

Configuração para treinamento e teste

Docker

O Docker é a maneira mais fácil de configurar o ambiente e instalar todas as dependências para treinamento e teste.

Configuração somente para CPU

Nota: Recomendamos fortemente o uso do ambiente habilitado para GPU para treinamento do modelo Cakechat. A inferência pode ser feita tanto nas GPUs quanto nas CPUs.

Instale o docker.
Puxe uma imagem do Docker somente CPU do DockerHub:

 docker pull lukalabs/cakechat:latest

Execute um contêiner do docker no ambiente somente CPU:

 docker run --name <YOUR_CONTAINER_NAME> -it lukalabs/cakechat:latest

Configuração habilitada para GPU

Instale o NVIDIA-Docker para o suporte da GPU.
Puxe a imagem do docker habilitada para GPU do DockerHub:

 docker pull lukalabs/cakechat-gpu:latest

Execute um recipiente do docker no ambiente habilitado para GPU:

 nvidia-docker run --name <YOUR_CONTAINER_NAME> -it cakechat-gpu:latest

É isso! Agora você pode treinar seu modelo e conversar com ele. Veja a seção correspondente abaixo para obter mais instruções.

Configuração manual

Se você não quiser lidar com o Docker, pode instalar todos os requisitos manualmente:

 pip install -r requirements.txt -r requirements-local.txt

NB:

Recomendamos instalar os requisitos dentro de um VirtualEnv para evitar mexer com os pacotes do sistema.

Obtendo o modelo pré-treinado

Você pode fazer o download de nossos pesos de modelo pré-treinado executando python tools/fetch.py .

Os parâmetros do modelo pré-treinado são os seguintes:

Tamanho do contexto 3 (<speaker_1_utterance>, <speaker_2_utterance>, <speaker_1_utterance>)
Cada enunciado codificado contém até 30 tokens
O enunciado decodificado contém até 32 tokens
O codificador e o decodificador têm 2 camadas GRU com 768 unidades ocultas cada
A primeira camada do codificador é bidirecional

Dados de treinamento

O modelo foi treinado em um corpus do Twitter pré -processado com ~ 50 milhões de diálogos (11 GB de dados de texto). Para limpar o corpus, removemos

URLs, retweets e citações;
menciona e hashtags que não são precedidas por palavras regulares ou marcas de pontuação;
mensagens que contêm mais de 30 tokens.

Usamos nosso classificador de emoções para rotular cada enunciada com uma das 5 emoções a seguir: "neutral", "joy", "anger", "sadness", "fear" e usamos esses rótulos durante o treinamento. Para marcar seu próprio corpus com emoções que você pode usar, por exemplo, ferramenta Deepmoji.

Infelizmente, devido à política de privacidade do Twitter, não temos permissão para fornecer nosso conjunto de dados. Você pode treinar um modelo de diálogo em qualquer conjunto de dados de conversação de texto disponível para você, uma ótima visão geral dos conjuntos de dados de conversação existentes pode ser encontrada aqui: https://breakend.github.io/dialogdatasets/

Os dados de treinamento devem ser um arquivo TXT, onde cada linha é um objeto JSON válido, representando uma lista de enunciados de diálogo. Consulte nosso conjunto de dados de trem fictício para ver a estrutura de arquivo necessária. Substitua este corpus fictício pelos seus dados antes do treinamento.

Treinando o modelo

Existem duas opções:

Treinamento do zero
Ajustando o modelo treinado fornecido

A primeira abordagem é menos restritiva: você pode usar os dados de treinamento desejar e definir qualquer params de configuração do modelo. No entanto, você deve estar ciente de que precisará de dados de trem suficientes (pelo menos de 50 MB), uma ou mais GPUs e paciência suficiente (dias) para obter as respostas do bom modelo.

A segunda abordagem é limitada pela escolha dos parâmetros de configuração do modelo pré-treinado-consulte cakechat/config.py para a lista completa. Se os parâmetros padrão forem adequados para sua tarefa, o ajuste fino deve ser uma boa opção.

Ajustando o modelo pré-treinado em seus dados

Busque o modelo pré-treinado da Amazon S3 executando python tools/fetch.py .
Coloque seu corpus de texto de treinamento em data/corpora_processed/train_processed_dialogs.txt . Certifique -se de que seu conjunto de dados seja grande o suficiente, caso contrário, o seu modelo risca para exceder os dados e os resultados serão ruins.
Execute python tools/train.py .
1. O script procurará os pesos do modelo pré-treinado nos results/nn_models , o caminho completo é inferido a partir do conjunto de parâmetros de configuração.
2. Se você deseja inicializar os pesos do modelo a partir de um arquivo personalizado, poderá especificar o caminho para o arquivo via -i , por exemplo, python tools/train.py -i results/nn_models/my_saved_weights/model.current .
3. Não se esqueça de definir CUDA_VISIBLE_DEVICES=<GPU_ID> Variável de ambiente (com <gpu_id> como na saída do comando nvidia-smi ) se você deseja usar a GPU. Por exemplo, CUDA_VISIBLE_DEVICES=0 python tools/train.py executará o processo de trem na GPU 0-és.
4. Use o parâmetro -s para treinar o modelo em um subconjunto das primeiras n amostras de seus dados de treinamento para acelerar o pré -processamento para depuração. Por exemplo, execute python tools/train.py -s 1000 para treinar nas primeiras 1000 amostras.

Os pesos do modelo treinado são salvos nos results/nn_models/ .

Treinando o modelo do zero

Coloque seu corpus de texto de treinamento em data/corpora_processed/train_processed_dialogs.txt .
Configure parâmetros de treinamento em cakechat/config.py . Consulte Configurações Descrição Para obter mais detalhes.
Considere a execução PYTHONHASHSEED=42 python tools/prepare_index_files.py para criar os arquivos de índice com tokens e condições a partir do corpus de treinamento. Certifique -se de definir a variável de ambiente PYTHONHASHSEED ; caso contrário, você poderá obter diferentes arquivos de índice para diferentes lançamentos do script. AVISO: Este script substitui os arquivos de índice de tokens originais data/tokens_index/t_idx_processed_dialogs.json e data/conditions_index/c_idx_processed_dialogs.json . Você deve executar apenas esse script, caso seu corpus seja grande o suficiente para conter todas as palavras que deseja que seu modelo entenda. Caso contrário, considere o ajuste fino do modelo pré-treinado, conforme descrito acima. Se você errou com arquivos de índice e deseja obter as versões padrão, exclua suas cópias e execute python tools/fetch.py Anew.
Considere executar python tools/train_w2v.py para construir a incorporação W2V do corpus de treinamento. AVISO: Este script substitui os pesos W2V originais que são armazenados em data/w2v_models . Você deve executar apenas esse script, caso seu corpus seja grande o suficiente para conter todas as palavras que deseja que seu modelo entenda. Caso contrário, considere o ajuste fino do modelo pré-treinado, conforme descrito acima. Se você errou com os arquivos W2V e deseja obter a versão padrão, exclua sua cópia de arquivo e execute python tools/fetch.py Anew.
Execute python tools/train.py .
1. Não se esqueça de definir CUDA_VISIBLE_DEVICES=<GPU_ID> Variável de ambiente (com <gpu_id> como na saída do comando nvidia-smi ) se você deseja usar a GPU. Por exemplo, CUDA_VISIBLE_DEVICES=0 python tools/train.py executará o processo de trem na 0ª GPU.
2. Use o parâmetro -s para treinar o modelo em um subconjunto das primeiras n amostras de seus dados de treinamento para acelerar o pré -processamento para depuração. Por exemplo, execute python tools/train.py -s 1000 para treinar nas primeiras 1000 amostras.
Você também pode definir IS_DEV=1 para ativar o "modo de desenvolvimento". Ele usa um número reduzido de parâmetros do modelo (diminuição das dimensões da camada oculta, tamanhos de entrada e saída das seqüências de token etc.) e executa o logbose de registro. Consulte as linhas de fundo do cakechat/config.py para obter a lista completa de parâmetros dev.

Os pesos do modelo treinado são salvos nos results/nn_models/ .

Trem distribuído

O contêiner do Docker, habilitado para GPU, suporta o trem distribuído em várias GPUs usando o Horovod.

Por exemplo, execute python tools/distributed_train.py -g 0 1 para começar o treinamento em 0 e 1 GPUs.

Cálculo das métricas de validação

Durante o treinamento, os seguintes conjuntos de dados são usados para validações de cálculo de métricas:

data/corpora_processed/val_processed_dialogs.txt (exemplo dummy, substitua pelos seus dados)-pelo conjunto de dados sensível ao contexto
data/quality/context_free_validation_set.txt -Para o conjunto de dados de validação sem contexto
data/quality/context_free_questions.txt -é usado para gerar respostas para registro e computação distinta-metrics
data/quality/context_free_test_set.txt - é usado para calcular métricas do modelo treinado, por exemplo, métricas de classificação

As métricas são armazenadas no cakechat/results/tensorboard e podem ser visualizadas usando o Tensorboard. Se você executar um contêiner do Docker a partir da imagem do Docker, habilitada para CPU ou GPU,, o servidor de tensorboard deve iniciar automaticamente e servir no http://localhost:6006 . Abra este link no seu navegador para ver os gráficos de treinamento.

Se você instalou os requisitos manualmente, inicie o Tensorboard Server primeiro, executando o seguinte comando do seu diretório raiz do Cakechat:

 mkdir -p results/tensorboard && tensorboard --logdir=results/tensorboard 2>results/tensorboard/err.log &

Depois disso, prossiga para http://localhost:6006 .

Testando o modelo treinado

Você pode executar as seguintes ferramentas para avaliar seu modelo treinado nos dados de teste (exemplo dummy, substitua pelos seus dados):

tools/quality/ranking_quality.py - calcula métricas de classificação de um modelo de diálogo
tools/quality/prediction_distinctness.py -calcula a metrics distinta de um modelo de diálogo
tools/quality/condition_quality.py - calcula métricas em diferentes subconjuntos de dados de acordo com o valor da condição
tools/generate_predictions.py - avalia o modelo. Gera previsões de um modelo de diálogo no conjunto de contextos de diálogo determinados e calcula métricas. Observe que você deve ter um modelo reverso no diretório data/nn_models se quiser usar modos de previsão "-Reranking"
tools/generate_predictions_for_condition.py - gera previsões para um determinado valor de condição

Executando o servidor Cakechat

HTTP-Server local

Execute um servidor que processa as solicitações HTTP com as mensagens de entrada fornecidas e retorna mensagens de resposta do modelo:

 python bin/cakechat_server.py

Especifique CUDA_VISIBLE_DEVICES=<GPU_ID> Variável de ambiente para executar o servidor em uma determinada GPU.

Não se esqueça de executar python tools/fetch.py antes de iniciar o servidor, se desejar usar nosso modelo pré-treinado.

Para garantir que tudo funcione bem, teste o modelo na seguinte conversa

- Oi, Eddie, o que foi?
- Não muito, e você?
- Bem obrigado. Você vai ao cinema amanhã?

Ao executar o comando:

 python tools/test_api.py -f 127.0.0.1 -p 8080 
    -c "Hi, Eddie, what's up?" 
    -c "Not much, what about you?" 
    -c "Fine, thanks. Are you going to the movies tomorrow?"

Você deve obter uma resposta significativa, por exemplo:

 {'response': "Of course!"}

Descrição da API HTTP-Server

/cakechat_api/v1/ações/get_Response

Os parâmetros JSON são:

Parâmetro	Tipo	Descrição
contexto	Lista de strings	Lista de mensagens anteriores do histórico de diálogo (máx. 3 é usado)
emoção	string, um de enum	Um dos {'neutro', 'raiva', 'alegria', 'medo', 'tristeza'}. Uma emoção para condicionar a resposta. Param opcional, se não especificado, 'neutro' é usado

Solicitar

 POST /cakechat_api/v1/actions/get_response
data: {
 'context': ['Hello', 'Hi!', 'How are you?'],
 'emotion': 'joy'
}

Resposta ok

 200 OK
{
  'response': 'I'm fine!'
}

Gunicorn http-server

Recomendamos o uso do Gunicorn para servir a API do seu modelo em escala de produção.

Instale Gunicorn: pip install gunicorn
Execute um servidor que processa HTTP-Queries com mensagens de entrada e retorna mensagens de resposta do modelo:

 cd bin && gunicorn cakechat_server:app -w 1 -b 127.0.0.1:8080 --timeout 2000

Telegram Bot

Você pode executar seu modelo Cakechat como um bot de telegrama:

Crie um bot de telegrama para obter o token de bot.
Execute python tools/telegram_bot.py --token <YOUR_BOT_TOKEN> e converse com ele no Telegram.

Visão geral do repositório

cakechat/dialog_model/ - contém gráfico computacional, procedimento de treinamento e outros utilitários de modelos
cakechat/dialog_model/inference/ - algoritmos para geração de respostas
cakechat/dialog_model/quality/ - código para cálculo e registro de métricas
cakechat/utils/ - Utilitários para processamento de texto, treinamento W2V, etc.
cakechat/api/ - funções para executar o servidor HTTP: configuração da API, manuseio de erros
tools/ - Scripts para treinamento, teste e avaliação do seu modelo

Ferramentas importantes

bin/cakechat_server.py -executa um servidor HTTP que retorna mensagens de resposta dos contextos de diálogo do modelo, dados e uma emoção. Consulte a seção Run para obter detalhes.
tools/train.py - treina o modelo em seus dados. Você pode usar a opção --reverse para treinar um modelo reverso usado em algoritmos de geração de resposta "-Reranking" para previsões mais precisas.
tools/prepare_index_files.py - prepara o índice para os tokens e condições mais comumente usados. Use este script antes de treinar o modelo do zero em seus próprios dados.
tools/quality/ranking_quality.py - calcula métricas de classificação de um modelo de diálogo.
tools/quality/prediction_distinctness.py -calcula a metrics distinta de um modelo de diálogo.
tools/quality/condition_quality.py - calcula métricas em diferentes subconjuntos de dados de acordo com o valor da condição.
tools/generate_predictions.py - avalia o modelo. Gera previsões de um modelo de diálogo no conjunto de contextos de diálogo determinados e calcula métricas. Observe que você deve ter um modelo reverso no diretório de results/nn_models se desejar usar os modos de previsão "*-Reranking".
tools/generate_predictions_for_condition.py - gera previsões para um determinado valor de condição.
tools/test_api.py -código de exemplo para enviar solicitações para um http-server em execução.
tools/fetch.py -Download dos arquivos de modelo e índice pré-treinados associados a ele.
tools/telegram_bot.py - Executa o Telegram Bot no topo do modelo treinado.

Configurações importantes de configuração

Todos os parâmetros de configuração para as etapas de arquitetura de rede, treinamento, previsão e log são definidas em cakechat/config.py . Alguns parâmetros de inferência usados em um servidor http são definidos em cakechat/api/config.py .

Arquitetura e tamanho de rede
- HIDDEN_LAYER_DIMENSION é o parâmetro principal que define o número de unidades ocultas em camadas recorrentes.
- WORD_EMBEDDING_DIMENSION e CONDITION_EMBEDDING_DIMENSION definem o número de unidades ocultas nas quais cada token/condição é mapeado.
- O número de unidades da camada de saída do decodificador é definido pelo número de tokens no dicionário no diretório tokens_index .
Algoritmo de decodificação:
- PREDICTION_MODE_FOR_TESTS define como as respostas do modelo são geradas. As opções são as seguintes:
  - Amostragem -A resposta é amostrada a partir de token de distribuição de saída. Para cada token, a transformação de temperatura é realizada antes da amostragem. Você pode controlar o valor da temperatura ajustando o parâmetro DEFAULT_TEMPERATURE .
  - Amostragem-Reranking -Múltiplos respostas de candidatos são geradas usando o procedimento de amostragem descrito acima. Depois disso, os candidatos são classificados de acordo com o MMI-Score ^[4], você pode sintonizar esse modo escolhendo SAMPLES_NUM_FOR_RERANKING e MMI_REVERSE_MODEL_SCORE_WEIGHT Parâmetros.
  - BeamSearch - Os candidatos são amostrados usando o algoritmo de pesquisa de feixe. Os candidatos são ordenados de acordo com sua pontuação de probabilidade de log, calculada pelo procedimento de pesquisa de feixe.
  - O BeamSearch-Reranking -o mesmo que acima, mas os candidatos são reordenados após a geração da mesma maneira que no modo de renomeação de amostragem.
Observe que existem outros parâmetros que afetam o processo de geração de resposta. Consulte REPETITION_PENALIZE_COEFFICIENT , NON_PENALIZABLE_TOKENS , MAX_PREDICTIONS_LENGTH .

Exemplo de uso de casos

Ao fornecer rótulos de condição adicionais nas entradas do conjunto de dados, você pode criar os seguintes modelos:

Um modelo de conversação neural baseado em persona-um modelo que permite condicionar respostas a um id de persona para torná-las lexicamente semelhantes ao estilo lingüístico da personalidade.
Modelo emocional semelhante a uma máquina-um modelo que permite que as respostas de condicionamento sobre diferentes emoções forneçam estilos emocionais (raiva, tristeza, alegria, etc.).
Modelo de geração de resposta neural consciente do tópico-um modelo que permite condicionar respostas em um determinado tópico para manter a conversa com consciência do tópico.

Para fazer uso dessas condições extras, consulte a seção treinando o modelo. Basta definir o campo "Condição" no conjunto de treinamento como um dos seguintes: ID persona , emoção ou rótulo de tópico , atualizar os arquivos de índice e iniciar o treinamento.

Referências

^[1] Um modelo de conversa neural baseada em persona
^[2] Máquina de bate -papo emocional: geração de conversas emocionais com memória interna e externa
^[3] Um codificador recorrente hierárquico para sugestão de consulta generativa com consciência de contexto
^[4] Uma função objetiva que promove a diversidade para modelos de conversação neural
^[5] Avaliação quantitativa de técnicas de simulação de usuário para sistemas de diálogo falado
^[6] Tópico Consciente da geração de resposta neural