Download de sentiment_analysis_fine_grain - sentiment_analysis_fine

sentiment_analysis_fine_grain

Código-Fonte de IA

1.0.0

Baixar

Introdução

Com este repositório, você poderá treinar classificação de vários rótulos com Bert,

Implante Bert para previsão on -line.

Você também pode encontrar o breve tutorial de como usar o Bert com chinês: Bert curto tutorial chinês

Você pode encontrar introdução ao sentimento de grãos finos de Ai Challenger

Idéias básicas

Adicione algo aqui.

Experimento em novos modelos

Para saber mais, verifique o modelo/bert_cnn_fine_grain_model.py

Desempenho

Modelo	TextCnn (sem-pré-fixação)	Textcnn (pré-train-finetuning)	Bert (base_model_zh)	Bert (base_model_zh, pré-trepagem no corpus)
Pontuação F1	0,678	0,685	Adicione um número aqui	Adicione um número aqui

Aviso: a pontuação F1 é relatada no conjunto de validação

Uso

Bert para Classificaito de Multi-Label [Dados para ajuste fino e pré-treinato]

 export BERT_BASE_DIR=BERT_BASE_DIR/chinese_L-12_H-768_A-12
export TEXT_DIR=TEXT_DIR
nohup python run_classifier_multi_labels_bert.py   
  --task_name=sentiment_analysis   
  --do_train=true   
  --do_eval=true  
  --data_dir=$TEXT_DIR   
  --vocab_file=$BERT_BASE_DIR/vocab.txt   
  --bert_config_file=$BERT_BASE_DIR/bert_config.json  
  --init_checkpoint=$BERT_BASE_DIR/bert_model.ckpt   
  --max_seq_length=512   
  --train_batch_size=4   
  --learning_rate=2e-5   
  --num_train_epochs=3   
  --output_dir=./checkpoint_bert &

1. Primeiro, você precisa baixar o modelo pré-treinado do Google e colocar em uma pasta (egbert_base_dir)

 chinese_L-12_H-768_A-12 from <a href='https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip'>bert</a>

2. Segundo, você precisa ter dados de treinamento (por exemplo, trens.TSV) e dados de validação (por exemplo, dev.tsv) e colocá -los em um

 folder(e.g.TEXT_DIR ). you can also download data from here <a href='https://pan.baidu.com/s/1ZS4dAdOIAe3DaHiwCDrLKw'>data to train bert for AI challenger-Sentiment Analysis</a>.
  
 it contains processed data you can run for both fine-tuning on sentiment analysis and pre-train with Bert. 
  
 it is generated by following this notebook step by step:
  
 preprocess_char.ipynb 
  
 you can generate data by yourself as long as data format is compatible with 
  
 processor SentimentAnalysisFineGrainProcessor(alias as sentiment_analysis); 


 data format:  label1,label2,label3t here is sentence or sentencest
 
 it only contains two columns, the first one is target(one or multi-labels), the second one is input strings.
  
 no need to tokenized.
 
 sample:"0_1,1_-2,2_-2,3_-2,4_1,5_-2,6_-2,7_-2,8_1,9_1,10_-2,11_-2,12_-2,13_-2,14_-2,15_1,16_-2,17_-2,18_0,19_-2 浦东五莲路站，老饭店福瑞轩属于上海的本帮菜，交通方便，最近又重新装修，来拨草了，饭店活动满188元送50元钱，环境干净，简单。朋友提前一天来预订包房也没有订到，只有大堂，五点半到店基本上每个台子都客满了，都是附近居民，每道冷菜量都比以前小，味道还可以，热菜烤茄子，炒河虾仁，脆皮鸭，照牌鸡，小牛排，手撕腊味花菜等每道菜都很入味好吃，会员价划算，服务员人手太少，服务态度好，要能团购更好。可以用支付宝方便"
 
 check sample data in ./BERT_BASE_DIR folder 

 for more detail, check create_model and SentimentAnalysisFineGrainProcessor from run_classifier.py

Modelo de Bert antes do treino com base no modelo de escala aberta e, em seguida, faça uma tarefa de classificação

gerar dados brutos: [Adicione algo aqui]
Tenha certeza de que cada linha é uma frase. Entre cada documento, há uma linha em branco.
Você pode encontrar dados gerados do arquivo zip.
```
 use write_pre_train_doc() from preprocess_char.ipynb 
```

gerar dados para o estágio pré-trep usando:

 export BERT_BASE_DIR=./BERT_BASE_DIR/chinese_L-12_H-768_A-12
nohup python create_pretraining_data.py 
--input_file=./PRE_TRAIN_DIR/bert_*_pretrain.txt 
--output_file=./PRE_TRAIN_DIR/tf_examples.tfrecord 
--vocab_file=$BERT_BASE_DIR/vocab.txt 
--do_lower_case=True 
--max_seq_length=512 
--max_predictions_per_seq=60 
--masked_lm_prob=0.15 
--random_seed=12345 
--dupe_factor=5 nohup_pre.out &

Modelo pré-treino com dados gerados:
python run_pretraining.py
afinação
python run_classifier.py

Textcnn

Baixe o arquivo de cache de análise de sentimentos (os tokens estão no nível da palavra)
Treine o modelo:
Python Train_cnn_fine_grain.py

 cache file of TextCNN model was generate by following steps from preprocess_word.ipynb. 
 
 it contains everything you need to run TextCNN.
 
 it include: processed train/validation/test set; vocabulary of word; a dict map label to index. 
 
 take train_valid_test_vocab_cache.pik and put it under folder of preprocess_word/
 
 raw data are also included in this zip file.

Textcnn pré-treino

Textcnn pré-treino com modelo de linguagem mascarada
Python Train_cnn_lm.py
Ajuste fino para textcnn
Python Train_cnn_fine_grain.py

Implante Bert para previsão online

 with session and feed style you can easily deploy BERT.

Previsão online com Bert, verifique mais daqui

Referência

Representações bidirecionais de codificadores de transformadores para entendimento de idiomas
Google-Research/Bert
Pengshuang/AI-Comp
AI Challenger 2018
Redes neurais convolucionais para classificação de frases

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-06
tamanho 3.31MB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos