download sentiment_analysis_fine_grain - download kode sumber sentiment_analysis_fine

sentiment_analysis_fine_grain

Kode Sumber AI

1.0.0

Unduh

Perkenalan

Dengan repositori ini, Anda akan dapat melatih klasifikasi multi-label dengan Bert,

Menyebarkan Bert untuk prediksi online.

Anda juga dapat menemukan tutorial singkat tentang cara menggunakan Bert dengan tutorial Cina: Bert Short Chinese

Anda dapat menemukan pengantar sentimen biji -bijian halus dari AI Challenger

Ide Dasar

Tambahkan sesuatu di sini.

Bereksperimen pada model baru

Untuk lebih lanjut, periksa model/Bert_CNN_FINE_GRAIN_MODEL.PY

Pertunjukan

Model	Textcnn (no-pretrain)	Textcnn (finetuning pretrain)	Bert (base_model_zh)	Bert (base_model_zh, pra-kereta di corpus)
Skor F1	0.678	0.685	Tambahkan nomor di sini	Tambahkan nomor di sini

PEMBERITAHUAN: Skor F1 dilaporkan pada set validasi

Penggunaan

Bert untuk Multi-Labeliton [data untuk fine-tuning dan pra-kereta]

 export BERT_BASE_DIR=BERT_BASE_DIR/chinese_L-12_H-768_A-12
export TEXT_DIR=TEXT_DIR
nohup python run_classifier_multi_labels_bert.py   
  --task_name=sentiment_analysis   
  --do_train=true   
  --do_eval=true  
  --data_dir=$TEXT_DIR   
  --vocab_file=$BERT_BASE_DIR/vocab.txt   
  --bert_config_file=$BERT_BASE_DIR/bert_config.json  
  --init_checkpoint=$BERT_BASE_DIR/bert_model.ckpt   
  --max_seq_length=512   
  --train_batch_size=4   
  --learning_rate=2e-5   
  --num_train_epochs=3   
  --output_dir=./checkpoint_bert &

1. Pertama, Anda perlu mengunduh model pra-terlatih dari Google, dan meletakkan ke folder (egbert_base_dir)

 chinese_L-12_H-768_A-12 from <a href='https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip'>bert</a>

2.Secondly, Anda perlu memiliki data pelatihan (misalnya train.tsv) dan data validasi (misalnya dev.tsv), dan letakkan di bawah a

 folder(e.g.TEXT_DIR ). you can also download data from here <a href='https://pan.baidu.com/s/1ZS4dAdOIAe3DaHiwCDrLKw'>data to train bert for AI challenger-Sentiment Analysis</a>.
  
 it contains processed data you can run for both fine-tuning on sentiment analysis and pre-train with Bert. 
  
 it is generated by following this notebook step by step:
  
 preprocess_char.ipynb 
  
 you can generate data by yourself as long as data format is compatible with 
  
 processor SentimentAnalysisFineGrainProcessor(alias as sentiment_analysis); 


 data format:  label1,label2,label3t here is sentence or sentencest
 
 it only contains two columns, the first one is target(one or multi-labels), the second one is input strings.
  
 no need to tokenized.
 
 sample:"0_1,1_-2,2_-2,3_-2,4_1,5_-2,6_-2,7_-2,8_1,9_1,10_-2,11_-2,12_-2,13_-2,14_-2,15_1,16_-2,17_-2,18_0,19_-2 浦东五莲路站，老饭店福瑞轩属于上海的本帮菜，交通方便，最近又重新装修，来拨草了，饭店活动满188元送50元钱，环境干净，简单。朋友提前一天来预订包房也没有订到，只有大堂，五点半到店基本上每个台子都客满了，都是附近居民，每道冷菜量都比以前小，味道还可以，热菜烤茄子，炒河虾仁，脆皮鸭，照牌鸡，小牛排，手撕腊味花菜等每道菜都很入味好吃，会员价划算，服务员人手太少，服务态度好，要能团购更好。可以用支付宝方便"
 
 check sample data in ./BERT_BASE_DIR folder 

 for more detail, check create_model and SentimentAnalysisFineGrainProcessor from run_classifier.py

Model Bert Pra-Pelatihan Berdasarkan Model Terbuka, Lalu Lakukan Tugas Klasifikasi

menghasilkan data mentah: [tambahkan sesuatu di sini]
Pastikan setiap baris adalah kalimat. Di antara setiap dokumen ada garis kosong.
Anda dapat menemukan data yang dihasilkan dari file zip.
```
 use write_pre_train_doc() from preprocess_char.ipynb 
```

menghasilkan data untuk tahap pra-kereta menggunakan:

 export BERT_BASE_DIR=./BERT_BASE_DIR/chinese_L-12_H-768_A-12
nohup python create_pretraining_data.py 
--input_file=./PRE_TRAIN_DIR/bert_*_pretrain.txt 
--output_file=./PRE_TRAIN_DIR/tf_examples.tfrecord 
--vocab_file=$BERT_BASE_DIR/vocab.txt 
--do_lower_case=True 
--max_seq_length=512 
--max_predictions_per_seq=60 
--masked_lm_prob=0.15 
--random_seed=12345 
--dupe_factor=5 nohup_pre.out &

Model pra-pelatihan dengan data yang dihasilkan:
Python run_pretraining.py
fine-tuning
Python run_classifier.py

Textcnn

Unduh File Cache Analisis Sentimen (Token berada di level Word)
Latih modelnya:
python train_cnn_fine_grain.py

 cache file of TextCNN model was generate by following steps from preprocess_word.ipynb. 
 
 it contains everything you need to run TextCNN.
 
 it include: processed train/validation/test set; vocabulary of word; a dict map label to index. 
 
 take train_valid_test_vocab_cache.pik and put it under folder of preprocess_word/
 
 raw data are also included in this zip file.

Textcnn Pra-Train

Textcnn pra-pelatihan dengan model bahasa bertopeng
python train_cnn_lm.py
Fine-tuning untuk Textcnn
python train_cnn_fine_grain.py

Menyebarkan Bert untuk prediksi online

 with session and feed style you can easily deploy BERT.

Prediksi online dengan Bert, periksa lebih banyak dari sini

Referensi

Representasi enkoder dua arah dari transformator untuk pemahaman bahasa
Google-Research/Bert
Pengshuang/AI-Comp
AI Challenger 2018
Jaringan Saraf Konvolusional untuk Klasifikasi Kalimat

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-06
ukuran 3.31MB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua