Unduh text segmentation - Unduh Kode Sumber text segmentation

text segmentation

Kode sumber lainnya

1.0.0

Unduh

Segmentasi teks sebagai tugas belajar yang diawasi

Repositori ini berisi kode dan bahan tambahan yang diperlukan untuk melatih dan mengevaluasi model seperti yang dijelaskan dalam segmentasi teks kertas sebagai tugas pembelajaran yang diawasi

Downalod membutuhkan sumber daya

Wiki-727K, set data Wiki-50:

https://www.dropbox.com/sh/k3jh0fjbyr0gw0a/aadzad9sdtrbnvs1qlcjy5cza?dl=0

Word2Vec:

https://drive.google.com/a/audioburst.com/uc?export=download&confirm=zrin&id=0b7xkcwpi5kdynlnuttlss21pqmm

Isi jalur yang relevan di configGenerator.py, dan jalankan skrip (git repositori termasuk dataset choi)

Menciptakan lingkungan:

 conda create -n textseg python=2.7 numpy scipy gensim ipython 
source activate textseg
pip install http://download.pytorch.org/whl/cu80/torch-0.3.0-cp27-cp27mu-linux_x86_64.whl 
pip install tqdm pathlib2 segeval tensorboard_logger flask flask_wtf nltk
pip install pandas xlrd xlsxwriter termcolor

Bagaimana cara menjalankan proses pelatihan?

 python run.py --help

Contoh:

 python run.py --cuda --model max_sentence_embedding --wiki

Bagaimana cara mengevaluasi model terlatih (pada dataset wiki-727/choi)?

 python test_accuracy.py  --help

Contoh:

 python test_accuracy.py --cuda --model <path_to_model> --wiki

Cara Membuat Dataset Wikipedia Baru:

 python wiki_processor.py --input <input> --temp <temp_files_folder> --output <output_folder> --train <ratio> --test <ratio>

Input adalah jalur lengkap ke tempat pembuangan wikipedia, suhu adalah jalur ke folder file sementara, dan output adalah jalur ke dataset Wikipedia yang baru dihasilkan.

Dump Wikipedia dapat diunduh dari URL berikut:

https://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-19
ukuran 5.04MB
Berasal dari Github

Aplikasi Terkait

Teks Dengan Yesus Cina

2023-08-23
Teks Dengan Yesus

2023-08-17
Teks Dengan Yesus versi Cina

2023-08-17
Teks atau Mati

2023-07-03
RTE (Editor Teks Kaya) ASP.NET

2011-05-25
Pertukaran Tautan Teks PHP

2009-04-29

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua