Unduh KoBART - Unduh Kode Sumber KoBART

KoBART

Kode Sumber AI

1.0.0

Unduh

? Kobart

? Kobart
- Cara menginstal
- Data
- Tokenizer
- Model
  - Pertunjukan
    - Klasifikasi atau regresi
    - Peringkasan
- Demo
- Contoh
- Melepaskan
- Kontak
- Lisensi

Bart ( B ransformers dan uton -r egrerasif ) dipelajari dalam bentuk autoencoder , yang menambahkan noise ke beberapa teks input dan mengembalikannya sebagai teks asli. Bart Korea ( Kobart ) adalah model bahasa encoder-decoder Korea yang telah dipelajari tentang teks Korea 40GB atau lebih menggunakan fungsi Text Infilling yang digunakan dalam makalah. Ini mendistribusikan KoBART-base yang diturunkan.

Bart

Cara menginstal

pip install git+https://github.com/SKT-AI/KoBART#egg=kobart

Data

Data	# kalimat
Wiki Korea	5m
Corpus lainnya	0.27b

Selain wikipedia Korea, berbagai data seperti berita, buku, dan semua kuda V1.0 (percakapan, berita, ...) digunakan untuk pembelajaran model.

Tokenizer

Belajar dengan Character BPE tokenizer dalam paket tokenizers .

Ukuran vocab adalah 30.000 dan ditambahkan emotikon dan emoji, yang sering digunakan untuk percakapan, dan kemampuan pengakuan token dinaikkan.

?, :) ,?, (-: -) :-)

Selain itu, kami telah mendefinisikan token yang tidak digunakan seperti <unused0> ke <unused99> sehingga mereka dapat didefinisikan secara bebas sesuai dengan subtasks yang diperlukan.

 > >> from kobart import get_kobart_tokenizer
> >> kobart_tokenizer = get_kobart_tokenizer ()
> >> kobart_tokenizer . tokenize ( "안녕하세요. 한국어 BART 입니다.?:)l^o" )
[ '▁안녕하' , '세요.' , '▁한국어' , '▁B' , 'A' , 'R' , 'T' , '▁입' , '니다.' , '?' , ':)' , 'l^o' ]

Model

Model	# Params	Jenis	# lapisan	# kepala	ffn_dim	Hidden_dims
`KoBART-base`	124m	Encoder	6	16	3072	768
		Decoder	6	16	3072	768

 > >> from transformers import BartModel
> >> from kobart import get_pytorch_kobart_model , get_kobart_tokenizer
> >> kobart_tokenizer = get_kobart_tokenizer ()
> >> model = BartModel . from_pretrained ( get_pytorch_kobart_model ())
> >> inputs = kobart_tokenizer ([ '안녕하세요.' ], return_tensors = 'pt' )
> >> model ( inputs [ 'input_ids' ])
Seq2SeqModelOutput ( last_hidden_state = tensor ([[[ - 0.4418 , - 4.3673 ,  3.2404 ,  ...,  5.8832 ,  4.0629 ,  3.5540 ],
         [ - 0.1316 , - 4.6446 ,  2.5955 ,  ...,  6.0093 ,  2.7467 ,  3.0007 ]]],
       grad_fn = < NativeLayerNormBackward > ), past_key_values = (( tensor ([[[[ - 9.7980e-02 , - 6.6584e-01 , - 1.8089e+00 ,  ...,  9.6023e-01 , - 1.8818e-01 , - 1.3252e+00 ],

Pertunjukan

Klasifikasi atau regresi

	NSMC (ACC)	Korsts (Spearman)	Tanya pasangan (ACC)
-----------------------------------------
Kobart-base	90.24	81.66	94.34

Peringkasan

Pembaruan Terjadwal *

Demo

Demo Ringkasan

Contoh di atas adalah hasil meringkas artikel ZDNET.

Contoh

Klasifikasi NSMC
Kobart chitchhatbot
Ringkasan Kobart
Terjemahan Kobart
Legalqa menggunakan kalimat kobart
Generasi Pertanyaan Kobart

Jika Anda memiliki contoh yang menarik menggunakan Kobart, silakan PR!

Melepaskan

V0.5.1
- Panduan Pernyataan Default'Import '
V0.5
- Unduh file besar dari aws s3
V0.4
- Perbarui Binary Model
V0.3
- Masalah token <unk> menghilang karena pembicaraan yang lebih bagus
V0.2
- Pembaruan Model KoBART (Sampel Efektif Meningkatkan)
- Semua versi 모두의 말뭉치
- Modifikasi Bug Downloader
- Dukungan Instalasi pip

Kontak

Harap unggah masalah terkait KoBART di sini.

Lisensi

KoBART dirilis di bawah lisensi modified MIT . Jika Anda menggunakan model dan kode, silakan ikuti konten lisensi. Spesialis lisensi dapat ditemukan di file LICENSE .

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-10
ukuran 144.9KB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua