تنزيل KoBART - تنزيل رمز المصدر KoBART

KoBART

كود الذكاء الاصطناعي

1.0.0

تنزيل

؟ كوبارت

؟ كوبارت
- كيفية التثبيت
- بيانات
- رمز
- نموذج
  - أداء
    - التصنيف أو الانحدار
    - تلخيص
- العروض التوضيحية
- أمثلة
- يطلق
- جهات الاتصال
- رخصة

يتم تعلم BART ( B idirectional و ug - r egrerassive t- ransformers) في شكل autoencoder ، مما يضيف ضوضاء إلى بعض نص الإدخال ويعيده كنص أصلي. الكوري بارت ( Kobart ) هو نموذج لغة encoder-decoder كوري تم تعلمه حول النص الكوري البالغ 40 جيجابايت أو أكثر باستخدام وظيفة ضوضاء Text Infilling المستخدمة في الورقة. هذا يوزع KoBART-base المشتقة.

بارت

كيفية التثبيت

pip install git+https://github.com/SKT-AI/KoBART#egg=kobart

بيانات

بيانات	# من الجمل
ويكي الكورية	5M
مجموعة أخرى	0.27B

بالإضافة إلى ويكيبيديا الكورية ، تم استخدام بيانات مختلفة مثل الأخبار والكتب وجميع خيول V1.0 (المحادثة ، الأخبار ، ...) للتعلم النموذجي.

رمز

تعلمت مع Character BPE tokenizer في حزمة tokenizers .

حجم vocab هو 30،000 ويتم إضافة الرموز والرموز التعبيرية ، والتي تستخدم غالبًا للمحادثات ، ويتم رفع قدرة التعرف على الرمز المميز.

؟ ، :) ،؟ ، (-: -) :-)

بالإضافة إلى ذلك ، قمنا بتعريف الرموز غير المستخدمة مثل <unused0> إلى <unused99> بحيث يمكن تعريفها بحرية وفقًا subtasks اللازمة.

 > >> from kobart import get_kobart_tokenizer
> >> kobart_tokenizer = get_kobart_tokenizer ()
> >> kobart_tokenizer . tokenize ( "안녕하세요. 한국어 BART 입니다.?:)l^o" )
[ '▁안녕하' , '세요.' , '▁한국어' , '▁B' , 'A' , 'R' , 'T' , '▁입' , '니다.' , '?' , ':)' , 'l^o' ]

نموذج

نموذج	# من المعلمات	يكتب	# من الطبقات	# من الرؤوس	FFN_DIM	hidden_dims
`KoBART-base`	124m	تشفير	6	16	3072	768
		فك التشفير	6	16	3072	768

 > >> from transformers import BartModel
> >> from kobart import get_pytorch_kobart_model , get_kobart_tokenizer
> >> kobart_tokenizer = get_kobart_tokenizer ()
> >> model = BartModel . from_pretrained ( get_pytorch_kobart_model ())
> >> inputs = kobart_tokenizer ([ '안녕하세요.' ], return_tensors = 'pt' )
> >> model ( inputs [ 'input_ids' ])
Seq2SeqModelOutput ( last_hidden_state = tensor ([[[ - 0.4418 , - 4.3673 ,  3.2404 ,  ...,  5.8832 ,  4.0629 ,  3.5540 ],
         [ - 0.1316 , - 4.6446 ,  2.5955 ,  ...,  6.0093 ,  2.7467 ,  3.0007 ]]],
       grad_fn = < NativeLayerNormBackward > ), past_key_values = (( tensor ([[[[ - 9.7980e-02 , - 6.6584e-01 , - 1.8089e+00 ,  ...,  9.6023e-01 , - 1.8818e-01 , - 1.3252e+00 ],

أداء

التصنيف أو الانحدار

	NSMC (ACC)	كورستس (سبيرمان)	زوج أسئلة (ACC)
-------------------------------------
Kobart-base	90.24	81.66	94.34

تلخيص

التحديث المجدول *

العروض التوضيحية

موجز العرض التوضيحي

المثال أعلاه هو نتيجة لتلخيص مقالة ZDNET.

أمثلة

تصنيف NSMC
Kobart Chitchatbot
تلخيص كوبارت
ترجمة كوبارت
LegalQa باستخدام الجملة Kobart
جيل أسئلة كوبارت

إذا كان لديك مثال مثير للاهتمام باستخدام Kobart ، يرجى PR!

يطلق

v0.5.1
- دليل بيانات Default'import
v0.5
- قم بتنزيل ملفات كبيرة من aws s3
v0.4
- تحديث نموذج ثنائي
v0.3
- مسألة الرمز المميز <unk> تختفي بسبب الحديث عن علة
v0.2
- تحديث نموذج KoBART (يتحسن عينة فعالية)
- جميع إصدارات 모두의 말뭉치
- تعديل أخطاء التنزيل
- pip دعم تثبيت

جهات الاتصال

يرجى تحميل القضايا المرتبطة بـ KoBART هنا.

رخصة

يتم إصدار KoBART تحت رخصة modified MIT . إذا كنت تستخدم النماذج والرمز ، فيرجى اتباع محتوى الترخيص. يمكن العثور على أخصائيي الترخيص في ملف LICENSE .

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-10
الحجم 144.9KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل