download qa_match - qa_match download de código fonte

qa_match

Outro código-fonte

1.0.0

Baixar

Introdução ao projeto

QA_MATCH é uma ferramenta de correspondência de perguntas e respostas baseada em aprendizado profundo que suporta perguntas e respostas da base de conhecimento de estrutura de uma e duas camadas. O QA_MATCH suporta perguntas e respostas da base de conhecimento estrutural de uma camada de uma camada através do modelo de correspondência de intenções e suporta perguntas e respostas da base de conhecimento estrutural de duas camadas através dos resultados do modelo de classificação de domínio de fusão e do modelo de correspondência de intenção. O QA_MATCH também suporta a função pré-treinamento não supervisionada e, por meio de modelos de idiomas pré-treinados leves (SPTM, modelo simples pré-treinado) podem melhorar a eficácia de tarefas a jusante, como perguntas e respostas base do conhecimento.

Q&A da base de conhecimento

Nos cenários reais, a base de conhecimento é geralmente construída por meio de resumo manual, anotação, mineração de máquinas etc. A base de conhecimento contém um grande número de perguntas padrão, cada pergunta padrão tem uma resposta padrão e algumas perguntas estendidas. Chamamos essas perguntas estendidas para perguntas estendidas. Perguntas estendidas. Para uma base de conhecimento estrutural de uma camada que contém apenas questões padrão e perguntas de extensão, chamamos de intenção de perguntas padrão. Para uma base de conhecimento estrutural de duas camadas, cada problema padrão e seu problema estendido têm uma categoria, que chamamos de domínios, e um domínio contém várias intenções.

O QA_MATCH suporta a estrutura da base do conhecimento da seguinte maneira:

Estrutura da base de conhecimento

Para perguntas de entrada, o Qa_Match pode fornecer três respostas em combinação com a base de conhecimento:

Resposta única (identificada como a intenção específica do usuário)
Liste as respostas (identificadas como múltiplas intenções possíveis do usuário)
Rejeitar para identificar (nenhuma intenção específica do usuário foi identificada)

Sob as duas estruturas da base de conhecimento, existem diferenças no uso de Qa_match, que são explicadas abaixo:

Perguntas e perguntas e respostas automáticas com base na base de conhecimento da estrutura de duas camadas

Duas camadas de resultados de fusão

Para as perguntas e respostas da Base de Conhecimento da Base de Conhecimento da Estrutura de duas camadas, QA_MATCH primeiro classificará e identificará as perguntas do usuário em domínios e intenções e depois integrará os resultados dos dois para obter a verdadeira intenção e responder de acordo (respostas únicas, respostas de listar, respostas de rejeição). Por exemplo: Conforme mostrado no diagrama da estrutura da base de conhecimento na pergunta e resposta da base de conhecimento acima, temos uma base de conhecimento de estrutura de duas camadas, que inclui "informações" e "conta" dois campos. O campo "Informações" contém duas intenções: "Como publicar informações", "como excluir informações" e o campo "Conta" contém intenção: "Como cancelar a conta". Quando o usuário insere a pergunta: "Como publico uma postagem?

Os problemas de entrada são pontuados usando o modelo de classificação de domínio LSTM e o modelo de correspondência de intenção do DSSM, respectivamente. Por exemplo, o modelo de classificação de domínio é pontuado no máximo de 0,99 e é identificado como o campo "Informações", e o modelo de correspondência de intenção é pontuado no máximo de 0,98 e é identificado como a intenção de "como publicar informações". Como o rótulo correspondente com a pontuação mais alta do modelo de classificação de domínio é uma classe de informações, é julgada como um certo tipo de ramo.
Depois de inserir o julgamento como um determinado ramo de classificação, a pontuação mais alta do modelo de classificação de domínio é de 0,99 e o valor limite B1 (como B1 = 0,9) na tabela de perguntas e respostas da Base de Conhecimento da Estrutura de duas camadas. Desde 0,99> = B1, é considerado uma sub-ramo de "correspondência rigorosa de intenção do DSSM".
Depois de inserir a filial "rigorosa da correspondência de intenção do DSSM", compare a pontuação máxima do modelo de correspondência de intenção com o limite x1 (por exemplo x1 = 0,8) e x2 (por exemplo x2 = 0,95) e encontre 0,98> x2. Portanto, use a resposta correspondente às informações para publicar a resposta (as respostas de outras ramificações são semelhantes).

Perguntas e perguntas e respostas automáticas com base em uma base de conhecimento de estrutura de uma camada

Nos cenários reais, também encontraremos uma camada de perguntas e respostas da Base de Conhecimento Estrutural. O uso do modelo de correspondência de intenção do DSSM e o modelo de linguagem pré-treinado leve SPTM pode resolver esse tipo de problema. Comparação dos dois:

Modelo	Como usar	vantagem	falha
Modelo de correspondência de intenção dssm	O modelo de correspondência do DSSM corresponde diretamente	±	Incapaz de utilizar informações de contexto
Modelo de idioma pré-treinado leve SPTM	Modelo de linguagem LSTM/transformador pré-treinado + Modelo de correspondência de LSTM/transformador fino Tune	① Pode fazer pleno uso de dados pré-treinamento não supervisionados para melhorar o modelo de idioma do efeito pode ser usado para outras tarefas a jusante	① O pré-treinamento requer uma grande quantidade de dados sem rótulo ② A operação é mais complicada (são necessárias duas etapas para obter o modelo de correspondência)

Perguntas e respostas automáticas com base no modelo DSSM

Uma camada de fusão de resultado

Para as perguntas e respostas da Base de Conhecimento da Base de Conhecimento da Estrutura da Primeira camada, você só precisa usar o modelo de correspondência de intenção do DSSM para marcar as perguntas de entrada e comparar a pontuação mais alta da correspondência de intenções com X1 e X2 na figura acima para determinar o tipo de resposta (resposta única, resposta da lista, rejeição).

Perguntas e respostas automáticas com base no modelo SPTM

Introdução ao modelo de idioma pré-treinado leve (SPTM, modelo simples pré-treinado)

Considerando que geralmente há uma grande quantidade de dados não marcados no uso real, quando os dados da base de conhecimento são limitados, modelos de idiomas pré-treinados não supervisionados podem ser usados para melhorar a eficácia dos modelos correspondentes. Referindo-se ao processo de pré-treinamento BERT, em maio de 2019, desenvolvemos o modelo SPTM. Comparado com Bert, esse modelo melhorou principalmente três aspectos: primeiro, ele remove o NSP (previsão da próxima frase) com efeitos insignificantes, segundo, para melhorar o desempenho da inferência on -line, o transformador foi substituído pelo LSTM e o terceiro, para garantir que o efeito do modelo reduz a quantidade de parâmetros, também fornece um transformador com parâmetros compartilhados entre os blocos. O princípio do modelo é o seguinte:

Pré -processamento de dados

Ao pré-treinamento do modelo, os dados de treinamento precisam ser gerados usando frases únicas com etiqueta como conjunto de dados, e Bert é usado para construir a amostra: cada frase única é usada como uma amostra, 15% das palavras na sentença participam da previsão, 80% das palavras que participam da previsão são mascaradas, 10% são replicadas aleatoriamente.

Pré-treinamento

A estrutura do modelo do estágio de pré-treinamento é mostrada na figura abaixo:

Estrutura do modelo

Para melhorar a capacidade de expressão do modelo e reter informações mais superficiais, a rede residual BI-LSTM (LSTM residual) foi introduzida como o corpo do modelo. A rede normaliza a entrada de cada camada de BI-LSTM e a saída dessa camada, e o resultado é usado como entrada da próxima camada. Além disso, a última saída BI-LSTM da camada é usada como entrada de uma camada totalmente conectada. Após resumir e normalizá -lo com a saída da camada totalmente conectada, o resultado é usado como a saída de toda a rede.

O exemplo demorado de tarefas de pré-treinamento é mostrado na tabela a seguir:

Nome métrico	Valor indicador	Valor indicador	Valor indicador
Estrutura do modelo	LSTM	Transformador para compartilhar parâmetros	Transformador para compartilhar parâmetros
Tamanho pré -terenciado do conjunto de dados	10 milhões	10 milhões	10 milhões
Recursos pré-treinamento	10 Nvidia K40 / 12G Memória	10 Nvidia K40 / 12G Memória	10 Nvidia K40 / 12G Memória
Parâmetros de pré-treinamento	Etapa = 100000 / tamanho do lote = 128	Etapa = 100000 / tamanho do lote = 128/1 camadas / 12 cabeças	Etapa = 100000 / tamanho do lote = 128/12 camadas / 12 cabeças
Pré-treinamento demorado	8,9 horas	13,5 horas	32,9 horas
Tamanho do modelo pré -terenciado	81m	80,6m	121m

Processo de Pergunta e Resposta Automática do SPTM

Modelo de linguagem pré-treinado

Após a introdução do SPTM, para as perguntas e respostas da base de conhecimento da estrutura de primeira camada, as perguntas de entrada são pontuadas pela primeira vez usando o modelo de correspondência de intenções com base no modelo de ajuste fino do modelo de idioma e, em seguida, o tipo de resposta (resposta exclusiva, resposta da lista, rejeição) é determinada com base na mesma estratégia que o modelo de correspondência de intenção do DSSM.

Como usar

Introdução de dados

O formato do arquivo de dados (na pasta Data_Demo) que precisa ser usada é a seguinte. Para não vazar dados, codificamos o texto original do problema padrão e do problema estendido e, nos cenários de aplicação reais, basta preparar os dados no formato a seguir.

std_data: a correspondência entre a categoria e o problema padrão, incluindo três colunas: ID da categoria, ID de problema padrão e texto de problema padrão
pre_train_data: um conjunto de dados pré-treinado sem rótulo, cada linha é um pedaço de texto
Vocabulário: Dicionário de dados pré-treinado, cada linha é uma palavra (o dicionário deve conter <PAD> 、 `)
TRIN_DATA: Conjunto de treinamento, incluindo três colunas: ID de problema padrão, ID de problema estendido e texto de problema estendido
Valid_data: Conjunto de verificação, incluindo três colunas: ID da pergunta padrão, ID da pergunta estendida e texto da pergunta estendida
Test_data: Conjunto de testes, incluindo três colunas: ID de problema padrão, ID de problema estendido e texto de problema estendido

Os dados são separados por t, a codificação do problema é separada por espaços e as palavras são separadas por espaços. Observe que, no exemplo de dados deste projeto, o texto original é codificado e cada palavra é substituída por um número. Por exemplo, como o texto real correspondente a 205 19 90 417 41 44如何删除信息, e essa operação de codificação não é necessária quando realmente usada ; Se a estrutura da base de conhecimento for um nível, todos os IDs de categoria no arquivo std_data precisam ser definidos como __label__0 .

Processo de mineração semi-automático de base de conhecimento

O processo de mineração semi-automático da base de conhecimento é um conjunto de soluções semi-automáticas de mineração para bases de conhecimento construídas no processo de perguntas e respostas automáticas de correspondência de controle de qualidade (consulte a pergunta e resposta automáticas com base em uma estrutura de base de conhecimento de uma camada), que ajuda a melhorar a escala da base de conhecimento e a qualidade da base de conhecimento. Por um lado, melhora a capacidade de combinar online; Por outro lado, melhora a qualidade dos dados de treinamento de modelos offline e, assim, melhora o desempenho do modelo. O processo de mineração semi-automático da base de conhecimento pode ser usado para dois cenários: a mineração de partida a frio e a mineração iterativa após o lançamento do modelo. Para detalhes, consulte as instruções de mineração da base de conhecimento.

Como correr

Veja as instruções de operação para obter detalhes

Pontas

Como os rótulos correspondentes da amostra original são interrompidos aleatoriamente ao selecionar amostras negativas no modelo DSSM, os parâmetros do modelo precisam atender batch_size >= negitive_size , caso contrário, o modelo não poderá ser efetivamente treinado.
Modelo Método de seleção de parâmetros de fusão: A seleção atual de parâmetros é baseada em estatísticas. Primeiro, calcule o valor F1 do rótulo do modelo (como rejeição) correspondente a diferentes valores do mesmo parâmetro (como A1 na base de perguntas e respostas da base de conhecimento da estrutura de duas camadas) no conjunto de testes e, em seguida, selecione o valor correspondente ao valor F1 maior como o valor do parâmetro. For example: when selecting the final value of parameter a1 in the two-layer structure knowledge base Q&A diagram, firstly, the model label corresponding to different a1 candidate values will be obtained on the test set (such as rejection, non-rejection), and then calculate the f1 value based on the real label of the sample, and finally select the candidate value corresponding to the appropriate f1 value (accuracy/recall rate can be emphasized according to the project requirements) as the final value de A1.

Ambiente de corrida

 tensorflow 版本>r1.8 <r2.0, python3

Versão

v1.0: https://github.com/wuba/qa_match/tree/v1.0

v1.1: https://github.com/wuba/qa_match/tree/v1.1

v1.2: https://github.com/wuba/qa_match/tree/v1.2

v1.3: https://github.com/wuba/qa_match/tree/v1.3

Planejamento futuro

No futuro, continuaremos a otimizar e expandir os recursos do QA_MATCH, e o plano é abrir o código -fonte da seguinte maneira:

Atualmente, o TensorFlow foi lançado na versão 2.4. No futuro, lançaremos a versão TensorFlow 2.x ou a versão pytorch do QA_MATCH de acordo com nossas necessidades.

Como contribuir e questionar feedback

Esperamos sinceramente que os desenvolvedores nos dão opiniões e sugestões valiosas. Você pode escolher as seguintes maneiras de obter sugestões e perguntas de feedback para nós:

Enviar relações públicas ou emissão no github
Envie um e-mail para [email protected]

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-04-16
tamanho 2.18MB
Vindo de Github

Aplicativos Relacionados

Software de suporte IoT Aizhi·QA

2024-08-15
Combinação de reforma

2024-01-29
Versão mais recente do Jellipop Match

2024-01-19
Aplicativo de controle de qualidade de gerenciamento inteligente no local

2023-08-07
Partida de bloco

2023-07-07
Jogo Anipang

2023-04-10

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos