LM LSTM CRF Download - LM LSTM CRF Código Fonte Download

LM LSTM CRF

Código-Fonte de IA

implemented most features

Baixar

LM-LSTM-CRF

Verifique nosso novo kit de ferramentas nerds

Inferência :
- Lightner : Inferência w. Modelos pré-treinados / treinados w. Quaisquer ferramentas a seguir, com eficiência .
Treinamento :
- LD-NET : modelos de trem de trem w. Representações contextualizadas eficientes.
- Vanillaner : Modelos de Treine Vanilla Ner w. incorporação pré-treinada.
Treinamento distante :
- Autoner : Modelos de trem de treinar as anotações linha por linha e obter desempenho competitivo.

Este projeto fornece ferramentas de rotulagem de sequência de alto desempenho, incluindo treinamento, avaliação e previsão.

Detalhes sobre o LM-LSTM-CRF podem ser acessados aqui, e a implementação é baseada na biblioteca Pytorch.

IMPORTANTE: Um bug grave foi encontrado na função bioes_to_span na implementação original, consulte os números relatados na seção de referência como desempenho preciso.

Os documentos estariam disponíveis aqui.

Links rápidos

Modelo
Instalação
Dados
Uso
Benchmarks
Modelo pré -terenciado

Notas modelo

Conforme visualizado acima, usamos o campo aleatório condicional (CRF) para capturar dependências do rótulo e adotar um LSTM hierárquico para alavancar as entradas de nível de char e no nível de palavras. A estrutura no nível do char é ainda mais guiada por um modelo de idioma, enquanto as incorporações de palavras pré-treinadas são alavancadas no nível da palavra. O modelo de idioma e o modelo de rotulagem de sequência são treinados ao mesmo tempo e ambos fazem previsões no nível da palavra. As redes de rodovias são usadas para transformar a saída do LSTM de nível de char em diferentes espaços semânticos, mediando essas duas tarefas e permitindo que o modelo de linguagem capacite a marcação de sequência.

Instalação

Para treinamento, uma GPU é fortemente recomendada para a velocidade. A CPU é suportada, mas o treinamento pode ser extremamente lento.

Pytorch

O código é baseado no Pytorch e suporta Pytorch 0.4 agora . Você pode encontrar instruções de instalação aqui.

Dependências

O código é escrito no Python 3.6. Suas dependências estão resumidas nos requirements.txt de arquivo.txt. Você pode instalar essas dependências como esta:

 pip3 install -r requirements.txt

Dados

Nós nos concentramos principalmente no conjunto de dados NER da Conll 2003, e o código toma seu formato original como entrada. No entanto, devido ao problema da licença, estamos restritos a distribuir esse conjunto de dados. Você deve conseguir obtê -lo aqui. Você também pode pesquisar on -line (por exemplo, github), alguém pode lançá -lo acidentalmente.

Formatar

Assumimos que o corpus é formatado da mesma forma que o conjunto de dados NER da Conll 2003. Mais especificamente, as linhas vazias são usadas como separadores entre as frases, e o separador entre os documentos é uma linha especial como abaixo.

 -DOCSTART- -X- -X- -X- O

Outras linhas contém palavras, rótulos e outros campos. A palavra deve ser o primeiro campo, o rótulo é o último e esses campos são separados pelo espaço . Por exemplo, as primeiras linhas na parte WSJ do corpus de etiqueta do PTB POS devem ser como o seguinte snippet.

 -DOCSTART- -X- -X- -X- O

Pierre NNP
Vinken NNP
, ,
61 CD
years NNS
old JJ
, ,
will MD
join VB
the DT
board NN
as IN
a DT
nonexecutive JJ
director NN
Nov. NNP
29 CD
. .

Uso

Aqui, fornecemos implementações para dois modelos, um é LM-LSTM-CRF e o outro é sua variante, LSTM-CRF , que contém apenas a estrutura e o CRF no nível da palavra. train_wc.py e eval_wc.py são scripts para LM-LSTM-CRF, enquanto train_w.py e eval_w.py são scripts para LSTM-CRF. Os usos desses scripts podem ser acessados pelo parâmetro -h , ou seja,

 python train_wc.py -h
python train_w.py -h
python eval_wc.py -h
python eval_w.py -h

Os comandos em execução padrão para marcação de NER e POS, e o NP Chunking são:

Nomeado Reconhecimento de Entidade (NER):

 python train_wc.py --train_file ./data/ner/train.txt --dev_file ./data/ner/testa.txt --test_file ./data/ner/testb.txt --checkpoint ./checkpoint/ner_ --caseless --fine_tune --high_way --co_train --least_iters 100

Marcação de parte da fala (POS):

 python train_wc.py --train_file ./data/pos/train.txt --dev_file ./data/pos/testa.txt --test_file ./data/pos/testb.txt --eva_matrix a --checkpoint ./checkpoint/pos_ --caseless --fine_tune --high_way --co_train

Frase substantiva (NP) Chunking:

 python train_wc.py --train_file ./data/np/train.txt.iobes --dev_file ./data/np/testa.txt.iobes --test_file ./data/np/testb.txt.iobes --checkpoint ./checkpoint/np_ --caseless --fine_tune --high_way --co_train --least_iters 100

Para outros conjuntos de dados ou tarefas, você pode tentar parar diferentes parâmetros, especialmente para um conjunto de dados menores, você pode definir pelo least_iters como um valor maior; E para algumas tarefas, se a velocidade da perda é muito lenta, convém aumentar lr .

Benchmarks

Aqui, comparamos o LM-LSTM-CRF com os recentes modelos de ponta no conjunto de dados de Chunking Conll 2000, o conjunto de dados NER Conll 2003 e a parte WSJ do conjunto de dados de marcação do PTB POS. Todas as experiências são realizadas em uma GPU GTX 1080.

Um bug grave foi encontrado na função bioes_to_span na implementação original, consulte os seguintes números como o desempenho preciso.

Ner

Quando os modelos são treinados apenas na parte WSJ do conjunto de dados de marcação do PTB POS, os resultados são resumidos como abaixo.

Modelo	Max (ACC)	Média (ACC)	Std (ACC)	Tempo (h)
LM-LSTM-CRF	91.35	91.24	0,12	4
-- Autoestrada	90.87	90.79	0,07	4
-Co-treino	91.23	90.95	0,34	2

POS

Quando os modelos são treinados apenas na parte WSJ do conjunto de dados de marcação do PTB POS, os resultados são resumidos como abaixo.

Modelo	Max (ACC)	Média (ACC)	Std (ACC)	Relatado (ACC)	Tempo (h)
Lample et al. 2016	97.51	97.35	0,09	N / D	37
Ma et al. 2016	97.46	97.42	0,04	97.55	21
LM-LSTM-CRF	97.59	97.53	0,03		16

Modelo pré -terenciado

Avaliação

Lançamos modelos pré-treinados nessas três tarefas. O arquivo do ponto de verificação pode ser baixado nos seguintes links. Observe que o modelo NER e o modelo de chunking (em breve) são treinados no conjunto de treinamento e no conjunto de desenvolvimento:

WSJ-PTB POS marcando	CONLL03 NER
Args	Args
Modelo	Modelo

Além disso, eval_wc.py é fornecido para carregar e executar esses pontos de verificação. Seu uso pode ser acessado pelo comando python eval_wc.py -h , e um exemplo de comando em execução é fornecido abaixo:

 python eval_wc.py --load_arg checkpoint/ner/ner_4_cwlm_lstm_crf.json --load_check_point checkpoint/ner_ner_4_cwlm_lstm_crf.model --gpu 0 --dev_file ./data/ner/testa.txt --test_file ./data/ner/testb.txt

Previsão

Para textos brutos anotados, seq_wc.py é fornecido para anotar texto não anotado. Seu uso pode ser acessado pelo comando python seq_wc.py -h , e um exemplo de comando em execução é fornecido abaixo:

 python seq_wc.py --load_arg checkpoint/ner/ner_4_cwlm_lstm_crf.json --load_check_point checkpoint/ner_ner_4_cwlm_lstm_crf.model --gpu 0 --input_file ./data/ner2003/test.txt --output_file output.txt

O formato de entrada é semelhante ao CONLL, mas cada linha é necessária para conter apenas um campo, token. Por exemplo, um arquivo de entrada pode ser:

 -DOCSTART-

But
China
saw
their
luck
desert
them
in
the
second
match
of
the
group
,
crashing
to
a
surprise
2-0
defeat
to
newcomers
Uzbekistan
.

e a saída correspondente é:

 -DOCSTART- -DOCSTART- -DOCSTART-

But <LOC> China </LOC> saw their luck desert them in the second match of the group , crashing to a surprise 2-0 defeat to newcomers <LOC> Uzbekistan </LOC> .

Referência

 @inproceedings{2017arXiv170904109L,
  title = "{Empower Sequence Labeling with Task-Aware Neural Language Model}", 
  author = {{Liu}, L. and {Shang}, J. and {Xu}, F. and {Ren}, X. and {Gui}, H. and {Peng}, J. and {Han}, J.}, 
  booktitle={AAAI},
  year = 2018, 
}

Expandir

Informações adicionais

Versão implemented most features
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-08
tamanho 159.69KB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
LM produção de página de confissão on-line PHP código-fonte versão embelezada versão oficial

2022-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos