huozi Download - تنزيل رمز المصدر huozi

huozi

شفرة المصدر الأخرى

Release huozi 3.5

تنزيل

نموذج كبير عالمي من النوع المنقول

؟ تجديد

[2024-09-12] نشر الإصدار 3.5 من النوع المنقول
[2024-02-09] نشر النسخة المقلدة من النوع 3.5 ومجموعة البيانات الصينية MT-bench
[2023-08-06] نشر إصدارات من النوع 1.0 المنقولة والنوع المنقول 2.0
[2023-05-04] صدر "تقرير أبحاث ChatGpt" ؛ الاختبار الداخلي لنموذج كبير من النوع

؟ جدول المحتويات

الفصل	يوضح
؟ ‍ ‍ ‍ open Open Source List	قائمة مشاريع المصادر المفتوحة في هذا المستودع
مقدمة نموذج	مقدمة موجزة للهيكل وعملية التدريب لنموذج النوع المنقول
؟ تنزيل النموذج	رابط تنزيل نموذج النوع المنقول
التفكير النموذج	أمثلة على استنتاج نموذج النوع المنقاذ ، بما في ذلك عملية استخدام أطر الاستدلال مثل VLLM و Llama.cpp و Ollama.
؟ أداء النموذج	أداء نموذج النوع المنقول على مهام التقييم السائدة
؟ توليد عينة	أمثلة على تأثير التوليد الفعلي لنموذج النوع المنقول

؟ ‍ ‍ ‍ open Open Source List

النوع المنقول 3.5 : [وزن النموذج]
- Movable Type 3.5 هو نموذج جديد يعمل على تحسين الأداء بناءً على النوع 3.0 المنقح و Mixtral-8x7B الصيني.
نوع متحرك 3.0 : [وزن النموذج] [العرض التوضيحي عبر الإنترنت]
- Movable Type 3.0 هو نموذج خبير مختلط متفرق يدعم سياق 32 كيلو ، مع المعرفة الصينية والإنجليزية الغنية وقدرات التفكير الرياضي القوي وقدرات توليد الكود. النسخة الأقدم من Movable Type 3.0 لديها امتثال وأمن قيادة أقوى.
مقاعد البدلاء الصينية : [مجموعة البيانات]
- مجموعة البيانات هذه هي النسخة الصينية لمجموعة بيانات تقييم قدرة الحوار الإنجليزي. أنه يحتوي على سلسلة من أسئلة الحوار متعددة الدورات ، تم تصحيح كل منها بعناية ويتم إجراء تعديلات ضرورية للتكيف مع السياق الصيني.
"تقرير أبحاث ChatGpt" : [PDF]
- نظم معهد هاربين لمعالجة اللغة الطبيعية في معالجة اللغة الطبيعية العديد من المعلمين وزملاء الدراسة لكتابة هذا التقرير البحثي ، ومنح ChatGPT مقدمة مفصلة وملخص من المبادئ التقنية وسيناريوهات التطبيق والتطوير المستقبلي والجوانب الأخرى.
النوع المنقول 2.0 : [وزن النموذج] [بيانات RLHF]
- استنادًا إلى النوع 1.0 المنقول ، يتم تحسين جودة الاستجابات النموذجية من خلال التعلم التعزيز (RLHF) مع التعليقات البشرية ، مما يجعلها أكثر تمشيا مع التفضيلات البشرية. بالمقارنة مع الإصدار السابق ، تم تحسين متوسط الطول بشكل كبير ، والقدرة على اتباع التعليمات أقوى والمنطق أكثر وضوحًا.
- 16.9k العلامات اليدوية لبيانات التفضيل ، يمكن استخدام الرد من نموذج النوع المنقاذ ، لتدريب نماذج المكافآت.
النوع المنقول 1.0 : [وزن النموذج]
- استنادًا إلى نموذج Bloom ، فإن النموذج الذي تم الحصول عليه من خلال التدريب على تعليمات التثبيت على حوالي 15 مليار رمز له امتثال تعليمات أقوى وأمن أفضل.

مقدمة نموذج

أحرز نموذج اللغة على نطاق واسع (LLM) تقدمًا كبيرًا في مجال معالجة اللغة الطبيعية وأظهر إمكاناته القوية في مجموعة واسعة من سيناريوهات التطبيق. لم تجتذب هذه التكنولوجيا اهتمامًا واسع النطاق من المجتمع الأكاديمي ، ولكنها أصبحت أيضًا موضوعًا ساخنًا في هذه الصناعة. في مقابل هذه الخلفية ، أطلق مركز الحوسبة الاجتماعية واسترجاع المعلومات لمعهد هاربين للتكنولوجيا (HIT -SCIR) مؤخرًا أحدث إنجاز - من النوع 3.5 المنقول ، ملتزمًا بتوفير المزيد من الاحتمالات والخيارات للبحث والتطبيق العملي لمعالجة اللغة الطبيعية.

النوع Movable Type 3.5 هو نموذج تم الحصول عليه عن طريق مزيد من تحسين الأداء استنادًا إلى النوع 3.0 المنقول و Mixtral-8x7B الصيني. يدعم النوع 3.5 المنقذ سياقًا طويلًا 32 ألفًا ، ويرث القدرات الشاملة القوية للنوع 3.0 المنقولة ، ويحقق تحسينات في الأداء في العديد من الجوانب مثل المعرفة الصينية والإنجليزية ، والمنطق الرياضي ، وتوليد الكود ، وقدرات الامتثال للتعليم ، وأمن المحتوى ، وما إلى ذلك.

مهم

قد لا يزال نموذج سلسلة Type Movable يولد ردود مضللة تحتوي على أخطاء واقعية أو محتوى ضار يحتوي على التحيز/التمييز. يرجى توخي الحذر من تحديد المحتوى الذي تم إنشاؤه واستخدامه وعدم نشر المحتوى الضار الذي تم إنشاؤه على الإنترنت.

يرجى الاطلاع على الوثائق الخاصة بالنوع 1.0 المنقولة والنوع 2.0 المنقول هنا. يرجى الاطلاع هنا للحصول على الوثائق على نوع Movable Type 3.0 و MT-BECK الصيني.

هيكل النموذج

Sovable Type 3.5 هو نموذج خبير مختلط متفرق (SMOE) ، تحتوي كل طبقة خبراء على 8 FFNs ، ويتم تنشيط كل حساب أمامي بشكل قاطع بواسطة أعلى 2. يحتوي النوع 3.5 المنقح على ما مجموعه 46.7B. بفضل خصائص التنشيط المتفرقة ، يجب تنشيط المعلمة 13B فقط أثناء التفكير الفعلي ، مما يحسن فعليًا من كفاءة الحوسبة وسرعة المعالجة.

عملية التدريب

خضع النوع 3.5 المنقح خطوات متعددة للتدريب ، كما هو موضح في الشكل أدناه:

عملية التدريب هي:

[قائمة الكلمات الصينية التدريب التدريجي قبل التدريب]: نظرًا لأن قائمة الكلمات mixtral-8x7b لا تدعم الصينية ، فإن كفاءة الترميز والفك الشفية للصينيين منخفضة ، مما يحد من التطبيق العملي في السيناريوهات الصينية. لقد أجرينا أولاً تدريبات تدريبية متزايدة لقائمة الكلمات الصينية استنادًا إلى Mixtral-8x7B ، والتي حسنت بشكل كبير من كفاءة ترميز ونزطاف النموذج بشكل كبير ، وتمكين النموذج من الحصول على قدرات قوية من الصينية وقدرات الفهم. لدينا أوزان نموذجية مفتوحة ورمز التدريب في مستودع رمز الصينيين-8x7B.
[تدريب من النوع 3 3.0]: نحن نتحمله على حوالي 300000 سطر من بيانات التعليمات بناءً على صينية ميكسترال -8x7b وحصلوا على نموذج 3.0 من النوع المحرك. تم شرح مجموعة البيانات المستخدمة هنا. يرث النوع 3.0 المتحرك المعرفة الصينية والإنجليزية الغنية بالنموذج الأساسي ولديها أداء قوي في مهام مثل التفكير الرياضي وتوليد الكود. بعد ضبط التعليمات ، حقق Movable Type 3.0 أيضًا تحسينات كبيرة في إمكانات امتثال الأوامر والأمان.
[صقل مجموعة بيانات من النوع 1.0 المتحرك]: حاولنا ضبط صينية-ميكسترال -8 × 7B مع مجموعة بيانات النوع 1.0 المنقولة. تم أداء نقطة التفتيش الوسيطة 1 التي تم الحصول عليها بشكل ممتاز في المعرفة الصينية والإنجليزية (مثل C-Eval و Cmmlu و MMLU وغيرها من المهام) ، وحتى تجاوز النوع 3.0 المنقولة. ومع ذلك ، فإن هذا النموذج يتخلف عن إمكانية التحريك من النوع 3.0 من حيث إمكانيات الامتثال للتعليمات والأمان.
[تعزيز القدرة على امتثال التعليمات]: في ضوء أوجه القصور في نقطة التفتيش الوسيطة 1 من حيث قدرة امتثال التعليمات ، قدمنا مجموعات بيانات إضافية لتقوية. علاوة على ذلك ، وفقًا لتجربة Longxu Dou et al. ، استخدمنا تقنية BPE Tropout خلال عملية التدريب لزيادة متانة النموذج إلى التعليمات. هذا التدريب العملية يحصل على نقطة تفتيش وسيطة 2 .
[النموذج الانصهار]: نشير إلى طريقة yiming Cui et al. لدمج نقطة التفتيش الوسيطة 1 ، ونماذج التفتيش الوسيطة 2 ونماذج Type Type 3.0 المنقولة لإنشاء نقطة تفتيش وسيطة 3 .
[النموذج التدريبي بعد الانصهار]: استنادًا إلى النموذج المنصهر ، قمنا بزيادة ضبط التعليمات وأخيراً أطلقنا نوعًا من النوع 3.5. قامت هذه النسخة بتحسين معارفها الصينية والإنجليزية ، وقدرات الامتثال للأمور والاستجابات الأمنية.

؟ تنزيل النموذج

اسم النموذج	حجم الملف	تنزيل عنوان	ملاحظة
Huozi3.5	88 جيجابايت	؟ Huggingface موديلات	النموذج الكامل من النوع 3.5
Huozi3.5-Ckpt-1	88 جيجابايت	؟ Huggingface موديلات	النوع المنقول 3.5 نقطة تفتيش وسيطة 1
Huozi3.5-Ckpt-2	88 جيجابايت	؟ Huggingface موديلات	النوع المنقول 3.5 نقطة تفتيش وسيطة 2
Huozi3.5-Ckpt-3	88 جيجابايت	؟ Huggingface موديلات	النوع المنقول 3.5 نقطة تفتيش وسيطة 3

إذا كنت ترغب في ضبط النوع 3.5 أو الصيني-mixtral-8x7b ، فيرجى الرجوع إلى رمز التدريب هنا.

التفكير النموذج

بداية سريعة

يستخدم Type Type 3.5 Movable Type the Chatml تنسيق proft ، والتنسيق هو:

 <|beginofutterance|>系统
{system prompt}<|endofutterance|>
<|beginofutterance|>用户
{input}<|endofutterance|>
<|beginofutterance|>助手
{output}<|endofutterance|>

رمز المثال للتفكير باستخدام Type Type 3.5 هو كما يلي:

 # quickstart.py

import torch
from transformers import AutoModelForCausalLM , AutoTokenizer

model_id = "HIT-SCIR/huozi3.5"

tokenizer = AutoTokenizer . from_pretrained ( model_id )
model = AutoModelForCausalLM . from_pretrained (
    model_id ,
    attn_implementation = "flash_attention_2" ,
    torch_dtype = torch . bfloat16 ,
    device_map = "auto" ,
)

text = """<|beginofutterance|>系统
你是一个智能助手<|endofutterance|>
<|beginofutterance|>用户
请你用python写一段快速排序的代码<|endofutterance|>
<|beginofutterance|>助手
"""

inputs = tokenizer ( text , return_tensors = "pt" ). to ( 0 )

outputs = model . generate (
    ** inputs ,
    eos_token_id = 57001 ,
    temperature = 0.8 ,
    top_p = 0.9 ,
    max_new_tokens = 2048 ,
)
print ( tokenizer . decode ( outputs [ 0 ], skip_special_tokens = False ))

يدعم Movable Type 3.5 جميع النظم الإيكولوجية النموذجية لـ Mixtral ، بما في ذلك المحولات ، VLLM ، Llama.cpp ، Ollama ، واجهة المستخدم على شبكة الإنترنت من توليد النص والأطر الأخرى.

إذا كانت لديك مشكلات في الشبكة أثناء تنزيل النموذج الخاص بك ، فيمكنك استخدام نقاط التفتيش التي نقدمها على ModelsCope.

استدلال نموذج المحولات + توليد تدفق

تدعم المحولات إضافة قوالب الدردشة لـ Tokenizer ويدعم توليد البث. رمز العينة كما يلي:

 # example/transformers-stream/stream.py

import torch
from transformers import AutoModelForCausalLM , AutoTokenizer , TextStreamer

model_id = "HIT-SCIR/huozi3.5"

model = AutoModelForCausalLM . from_pretrained (
    model_id ,
    attn_implementation = "flash_attention_2" ,
    torch_dtype = torch . bfloat16 ,
    device_map = "auto" ,
)

tokenizer = AutoTokenizer . from_pretrained ( model_id )
tokenizer . chat_template = """{% for message in messages %}{{'<|beginofutterance|>' + message['role'] + ' n ' + message['content']}}{% if (loop.last and add_generation_prompt) or not loop.last %}{{ '<|endofutterance|>' + ' n '}}{% endif %}{% endfor %}
{% if add_generation_prompt and messages[-1]['role'] != '助手' %}{{ '<|beginofutterance|>助手n ' }}{% endif %}"""

chat = [
    { "role" : "系统" , "content" : "你是一个智能助手" },
    { "role" : "用户" , "content" : "请你用python写一段快速排序的代码" },
]

inputs = tokenizer . apply_chat_template (
    chat ,
    tokenize = True ,
    add_generation_prompt = True ,
    return_tensors = "pt" ,
). to ( 0 )

stream_output = model . generate (
    inputs ,
    streamer = TextStreamer ( tokenizer , skip_prompt = True , skip_special_tokens = True ),
    eos_token_id = 57001 ,
    temperature = 0.8 ,
    top_p = 0.9 ,
    max_new_tokens = 2048 ,
)

موديلات الاستدلال نموذج

تشبه واجهة ModelsCope إلى حد كبير المحولات ، فقط استبدل المحولات بنطاق النموذج:

 # example/modelscope-generate/generate.py

import torch
- from transformers import AutoModelForCausalLM, AutoTokenizer
+ from modelscope import AutoTokenizer, AutoModelForCausalLM

model_id = "HIT-SCIR/huozi3.5"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    attn_implementation="flash_attention_2",
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

text = """<|beginofutterance|>系统
你是一个智能助手<|endofutterance|>
<|beginofutterance|>用户
请你用python写一段快速排序的代码<|endofutterance|>
<|beginofutterance|>助手
"""

inputs = tokenizer(text, return_tensors="pt").to(0)

outputs = model.generate(
    **inputs,
    eos_token_id=57001,
    temperature=0.8,
    top_p=0.9,
    max_new_tokens=2048,
)
print(tokenizer.decode(outputs[0], skip_special_tokens=False))

VLLM تسريع الاستدلال

يدعم النوع 3.5 المتغير تنفيذ تسريع الاستدلال من خلال VLLM ، ويكون رمز العينة كما يلي:

 # example/vllm-generate/generate.py

from vllm import LLM , SamplingParams

prompts = [
    """<|beginofutterance|>系统
你是一个智能助手<|endofutterance|>
<|beginofutterance|>用户
请你用python写一段快速排序的代码<|endofutterance|>
<|beginofutterance|>助手
""" ,
]

sampling_params = SamplingParams (
    temperature = 0.8 , top_p = 0.95 , stop_token_ids = [ 57001 ], max_tokens = 2048
)
llm = LLM (
    model = "HIT-SCIR/huozi3.5" ,
    tensor_parallel_size = 4 ,
)
outputs = llm . generate ( prompts , sampling_params )

for output in outputs :
    prompt = output . prompt
    generated_text = output . outputs [ 0 ]. text
    print ( generated_text )

نشر خادم Openai API

يمكن نشر نوع الصنف 3.5 كخدمة تدعم بروتوكول Openai API ، والذي يتيح استدعاء نوع الصنف 3.5 مباشرة من خلال API Openai.

الإعداد البيئي:

$ pip install vllm openai

ابدأ الخدمة:

$ python -m vllm.entrypoints.openai.api_server --model /path/to/huozi3.5/checkpoint --served-model-name huozi --chat-template template.jinja --tensor-parallel-size 8 --response-role 助手 --max-model-len 2048

إرسال الطلبات باستخدام Openai API:

 # example/openai-api/openai-client.py

from openai import OpenAI

openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"

client = OpenAI (
    api_key = openai_api_key ,
    base_url = openai_api_base ,
)

chat_response = client . chat . completions . create (
    model = "huozi" ,
    messages = [
        { "role" : "系统" , "content" : "你是一个智能助手" },
        { "role" : "用户" , "content" : "请你用python写一段快速排序的代码" },
    ],
    extra_body = { "stop_token_ids" : [ 57001 ]},
)
print ( "Chat response:" , chat_response . choices [ 0 ]. message . content )

فيما يلي رمز عينة يستخدم Openai API + Gradio + Streaming:

 # example/openai-api/openai-client-gradio.py

from openai import OpenAI
import gradio as gr

openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"

client = OpenAI (
    api_key = openai_api_key ,
    base_url = openai_api_base ,
)


def predict ( message , history ):
    history_openai_format = [
        { "role" : "系统" , "content" : "你是一个智能助手" },
    ]
    for human , assistant in history :
        history_openai_format . append ({ "role" : "用户" , "content" : human })
        history_openai_format . append ({ "role" : "助手" , "content" : assistant })
    history_openai_format . append ({ "role" : "用户" , "content" : message })
    models = client . models . list ()

    stream = client . chat . completions . create (
        model = models . data [ 0 ]. id ,
        messages = history_openai_format ,
        temperature = 0.8 ,
        stream = True ,
        extra_body = { "repetition_penalty" : 1 , "stop_token_ids" : [ 57001 ]},
    )

    partial_message = ""
    for chunk in stream :
        partial_message += chunk . choices [ 0 ]. delta . content or ""
        yield partial_message


gr . ChatInterface ( predict ). queue (). launch ()

التفكير الكمي

تنسيق gguf

تم تصميم تنسيق GGUF لتحميل وتوفير النماذج بسرعة. يتم إطلاقه بواسطة فريق Llama.cpp وهو مناسب للأطر مثل llama.cpp ، Ollama ، إلخ

خطوة 1 إعداد البيئة

أولاً ، تحتاج إلى تنزيل الكود المصدري لـ llama.cpp. نحن نقدم الجهاز الفرعي من llama.cpp في المستودع. تم اختبار هذا الإصدار من llama.cpp ويمكن أن يستنتج بنجاح:

$ git clone --recurse-submodules https://github.com/HIT-SCIR/huozi
$ cd examples/llama.cpp

يمكنك أيضًا تنزيل أحدث إصدار من رمز المصدر llama.cpp:

$ git clone https://github.com/ggerganov/llama.cpp.git
$ cd llama.cpp

ثم يجب تجميعها. هناك اختلافات دقيقة في أوامر التجميع اعتمادًا على منصة الأجهزة الخاصة بك:

$ make  # 用于纯CPU推理
$ make LLAMA_CUBLAS=1  # 用于GPU推理
$ LLAMA_METAL=1 make  # 用于Apple Silicon，暂未经过测试

تحويل تنسيق الخطوة 2 (اختياري)

يجب أن يكون الأمر التالي في llama.cpp/ directory:

 # 转换为GGUF格式
$ python convert.py --outfile /path/to/huozi-gguf/huozi3.5.gguf /path/to/huozi3.5
# 进行GGUF格式的q4_0量化
$ quantize /path/to/huozi-gguf/huozi3.5.gguf /path/to/huozi-gguf/huozi3.5-q4_0.gguf q4_0

الخطوة 3 ابدأ في العقل

يجب أن يكون الأمر التالي في llama.cpp/ directory:

$ main -m /path/to/huozi-gguf/huozi3.5-q4_0.gguf --color --interactive-first -c 2048 -t 6 --temp 0.2 --repeat_penalty 1.1 -ngl 999 --in-prefix " <|beginofutterance|>用户n " --in-suffix " <|endofutterance|>n<|beginofutterance|>助手" -r " <|endofutterance|> "

تشير المعلمة -ngl إلى عدد طبقات التفريغ إلى وحدة معالجة الرسومات. يمكن أن يؤدي تقليل هذه القيمة إلى تخفيف ضغط ذاكرة فيديو GPU. بعد اختبارنا الفعلي ، يحتوي النموذج الكمي Q2_K على تفريغ من 16 طبقة ، ويمكن تقليل استخدام الذاكرة إلى 9.6 جيجابايت ، والتي يمكنها تشغيل النموذج على وحدات معالجة الرسومات المستهلك:

$ main -m /path/to/huozi-gguf/huozi3.5-q2_k.gguf --color --interactive-first -c 2048 -t 6 --temp 0.2 --repeat_penalty 1.1 -ngl 16 --in-prefix " <|beginofutterance|>用户n " --in-suffix " <|endofutterance|>n<|beginofutterance|>助手" -r " <|endofutterance|> "

لمزيد من المعلمات main ، يمكنك الرجوع إلى الوثائق الرسمية لـ llama.cpp.

استخدم إطار عمل Ollama للتفكير ، يمكنك الرجوع إلى تعليمات ReadMe من Ollama.

؟ أداء النموذج

لتقييم القدرة الشاملة للنماذج الكبيرة ، استخدمنا مجموعة بيانات التقييم التالية لتقييم النوع 3.5 المنقص على التوالي:

C-Eval: مجموعة شاملة لتقييم النموذج الأساسي الصيني. أنه يحتوي على 13،948 سؤال متعدد الخيارات ، يغطي 52 موضوعًا مختلفًا وأربعة مستويات صعوبة.
CMMLU: معيار التقييم الصيني الشامل مخصص لتقييم المعرفة وقدرة النماذج اللغوية في السياق الصيني ، تغطي 67 موضوعًا من التخصصات الأساسية إلى المستويات المهنية المتقدمة.
Gaokao: تهدف مجموعة بيانات من أسئلة امتحان القبول في الكلية الصينية إلى توفير إطار تقييم يتوافق مع البشر ، ويقيم بشكل حدسي وكفاءة فهم اللغة وقدرة التفكير المنطقي للنماذج الكبيرة.
MMLU: مجموعة بيانات تقييم اللغة الإنجليزية التي تحتوي على 57 مهمة متعددة ، تغطي الرياضيات الابتدائية ، التاريخ الأمريكي ، علوم الكمبيوتر ، القانون ، وما إلى ذلك ، مع صعوبة في تغطية مستوى المدرسة الثانوية إلى مستوى الخبراء. إنها واحدة من مجموعات بيانات تقييم LLM الرئيسية في الوقت الحاضر.
Hellaswag: مجموعة بيانات تقييم NLI صعبة للغاية باللغة الإنجليزية. يتطلب كل سؤال فهمًا عميقًا للسياق ولا يمكن الإجابة عليه بناءً على الحس السليم.
GSM8K: مجموعة بيانات من مشاكل تطبيق الرياضيات في المدارس الابتدائية عالية الجودة التي تتطلب 2 إلى 8 خطوات لحلها. يتضمن الحل بشكل أساسي استخدام العمليات الحسابية الأساسية التي يمكن استخدامها لتقييم قدرة التفكير الرياضي متعدد الخطوات.
Humaneval: مجموعة بيانات من 164 مشاكل البرمجة الأصلية التي تقيّم فهم اللغة والخوارزميات والقدرات الرياضية البسيطة من خلال قياس الصواب الوظيفي للبرامج التي تم إنشاؤها من سلاسل المستندات.
MT-BENCED: يتم استخدام مجموعة مفتوحة من الأسئلة الإنجليزية ، بما في ذلك 80 مهام محادثة متعددة الجولات ، لتقييم إمكانات محادثة chatbots متعددة الدورات وامتثال الأوامر ، وتسجيل استجابات النماذج من خلال الحكم النموذجي الكبير (GPT-4).
MT-bench-ZH: نستخدم مجموعة الأسئلة الصينية التي ترجمتها مقاعد البلاد ، وكل مجموعة من الأسئلة تم تصحيحها يدويًا وتعديلها بشكل مناسب في السياق الصيني. لقد فتحنا مصدر بيانات MT-bench-ZH هنا.
سلامة MT-bench: مجموعات بيانات الأمان التي تم بناؤها يدويًا ، بما في ذلك العنف والمواد الإباحية والحساسية وغيرها من محتوى المخاطر. مجموعة البيانات هذه هي مجموعة بيانات مغلقة.

ينشط النوع 3.5 المتحرك فقط 13B المعلمات عند الاستدلال. يوضح الجدول التالي نتائج النماذج الصينية من النوع 3.5 المتحرك ومقاييس 13B الأخرى والإصدار القديم من النوع المتحرك في كل مجموعة بيانات تقييم:

نحن نستخدم 5 طلقات في C-Eval و Cmmlu و MMLU ، ويستخدم GSM8K 4 طلقات ، Hellaswag و Humaneval استخدام 0 طلقة ، ويستخدم Humaneval مؤشر تمرير@1. وكانت جميع الاختبارات استراتيجية الجشع.
نحن نستخدم OpenCompass كإطار التقييم وتجزئة الالتزام هو 4C87E77. يقع رمز المراجعة هنا.
في تقييم الأداء للنوع 3.0 المنقول ، استخدمنا طريقة تقييم النموذج الأساسي في Humaneval بشكل غير صحيح ، وتم تحديث نتائج التقييم الصحيحة في الجدول أعلاه.

وفقًا لنتائج الاختبار في الجدول أعلاه ، حقق النوع 3.5 متحرك تحسنًا مستقرًا نسبيًا في الأداء مقارنة بالنوع 3.0 المنقولة ، وتم تعزيز المعرفة الصينية والإنجليزية ، والتفكير الرياضي ، وتوليد الكود ، وقدرة الامتثال للتعليمات الصينية ، وأمن المحتوى الصيني من النوع 3.5 المنقول.

؟ توليد عينة

فيما يلي تأثير توليد النوع 3.5 المنقول على مجموعة تقييم MT-bench-ZH:

بروتوكول مفتوح المصدر

يخضع استخدام رمز مصدر المستودع هذا لاتفاقية ترخيص المصدر المفتوح Apache 2.0.

نوع الهاتف المحمول متاح تجاريا. إذا كنت تستخدم نموذج النوع المتحرك أو مشتقاته لأغراض تجارية ، فيرجى الاتصال بالمرخص على النحو التالي للتسجيل والتقدم للحصول على إذن كتابي من المرخص: الاتصال بالبريد الإلكتروني: [email protected].

اقتباس

نموذج نوع متحرك

@misc{huozi,
    author = {Huozi-Team}.
    title = {Huozi: Leveraging Large Language Models for Enhanced Open-Domain Chatting}
    year = {2024},
    publisher = {GitHub},
    journal = {GitHub repository}
    howpublished = { url {https://github.com/HIT-SCIR/huozi}}
}

تاريخ النجوم

يوسع

معلومات إضافية

الإصدار Release huozi 3.5
النوع شفرة المصدر الأخرى
وقت التحديث 2025-04-18
الحجم 12.39MB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل