LIBERT Download - Download do código -fonte LIBERT

LIBERT

Código-Fonte de IA

1.0.0

Baixar

Libert - Bert de informação lexicamente

Este repositório contém o código associado ao seguinte artigo:

Modelos de pré-treinamento não supervisionados especializados para similaridade semântica no nível da palavra (Anne Lauscher, Ivan Vulić, Edoardo Maria Ponti, Anna Korhonen, Goran Glavaš) https://arxiv.org/pdf/1909.02339.pdf

Descrição do repositório

Modelo

O modelo é diferente do código BERT original da maneira como compartilha as incorporações. Para isso, usamos um escopo variável condicionado. Isso é implementado em

conditioned_scope.py
modeling.py Linha 179 com cond_scope(is_shared=shared_embeddings): ...

Procedimento de pré -treinamento

Geração de dados

Wikipedia

Treinamos Bert e Libert em um depósito da Wikipedia inglesa. Para isso, nós usamos

poc_pretraining_bert.sh
poc_create_pretraining_data.sh

Restrições de similaridade

As restrições lexico-semânticas foram dadas em um arquivo simples separado por espaço:

 en_zymosis en_fermentation
en_zymosis en_fermentation
en_zymosis en_fermenting
en_zymosis en_fermenting
en_zymosis en_zymolysis

O código necessário para pré -processar essas restrições é fornecido em preprocess_wn.py .

Dessas restrições, criamos os dados de entrada reais, amostrando exemplos negativos de um espaço de incorporação auxiliar (função create_data_syn_hyp_constraints )
Em seguida, criamos o arquivo .tfrecords (função write_input_data_syn_hyp_constraints )

Pré -treinamento real

Libert é pré -terenciado do zero através de duas classes de objetivos (1) os objetivos "padrão" de Bert, MLM e NSP, e (2) classificação de relações lexicais. Portanto, fornecemos o script de pré -treinamento em duas variantes de acordo:

run_pretraining_bert.py implementa apenas os objetivos padrão (para comparação ao longo do processo de treinamento com Bert)
run_pretraining_libert.py implementa os objetivos padrão mais o LRC

Isso é demonstrado em

poc_pretraining_bert.sh
pos_pretraining_libert.sh

Avaliação a jusante

COLA

Para executar tarefas simples de classificação e regressão, por exemplo, para avaliação na cola, nos referimos aos seguintes scripts:

run_classifier_libert.py
run_regression_libert.py

Adaptamos os scripts originais do Bert Tensorflow, de modo que o escopo variável corresponda aos nossos modelos, para que o modelo seja carregado corretamente. Esse comportamento é controlado por meio de um parâmetro adicional original_model . Além disso, adicionamos suporte para configurações de busca de grade hiperparâmetro por meio desses scripts.

Como chamar os scripts é demonstrado em

poc_finetuning_bert.sh
pos_finetuning_libert.sh

Para as previsões, nos referimos a

poc_predictions_bert.sh
pos_predictions_libert.sh

Simplificação lexical

Para a avaliação de simplificação lexical, usamos o código BERT-LS: https://github.com/qiang2100/bert-ls. Para isso, tivemos que portar os modelos para Pytorch, o que foi feito através do Transformers Libray (apenas adapte o código de uma maneira que ele carrega as variáveis da Libert correcidamente.

Download

O ponto de verificação Libert de 2 milhões de MLM+NSP Libert, que discutimos em nossos experimentos, está disponível para download aqui: https://drive.google.com/drive/folders/1ghvw7zdbgggqlnlgxxvohnjktdzbmpy?usp=Sharing.

Crédito

O código é baseado no código original do Bert Tensorflow em: https://github.com/google-research/bert

Outro

Cite o papel da seguinte forma:

 @misc{lauscher2019specializing,
    title={Specializing Unsupervised Pretraining Models for Word-Level Semantic Similarity},
    author={Anne Lauscher and Ivan Vulić and Edoardo Maria Ponti and Anna Korhonen and Goran Glavaš},
    year={2019},
    eprint={1909.02339},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}```

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-19
tamanho 89.55KB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos