Unduh Grimoire - Unduh Kode Sumber Grimoire

Grimoire

Kode sumber lainnya

1.0.0

Unduh

Bahasa Inggris | 中文简体

Grimoire adalah semua yang Anda butuhkan untuk meningkatkan LLMS

Tingkatkan kemampuan model bahasa kecil menggunakan grimoires.

Isi

Perkenalan
Struktur proyek
Mulai
Hasil
Hubungi kami
Todos
Kutipan

Perkenalan

In-Context Learning (ICL) adalah salah satu metode utama untuk meningkatkan kinerja model bahasa besar pada tugas-tugas tertentu dengan memberikan satu set beberapa contoh pertanyaan dan jawaban jawaban. Namun, kemampuan ICL dari berbagai jenis model menunjukkan variasi yang signifikan karena faktor -faktor seperti arsitektur model, volume data pembelajaran, dan ukuran parameter. Secara umum, semakin besar ukuran parameter model dan semakin luas data pembelajaran, semakin kuat kemampuan ICL -nya. Dalam makalah ini, kami mengusulkan metode SLEICL (Strong LLM Enhanced ICL) yang involves learning from examples using strong language models and then summarizing and transferring these learned skills to weak language models for inference and application.

Ini memastikan stabilitas dan efektivitas ICL. Dibandingkan dengan secara langsung memungkinkan model bahasa yang lemah untuk belajar dari contoh cepat, SLEICL mengurangi kesulitan ICL untuk model ini. Eksperimen kami, yang dilakukan pada hingga delapan dataset dengan lima model bahasa, menunjukkan bahwa model bahasa yang lemah mencapai peningkatan yang konsisten dibandingkan kemampuan nol-shot atau beberapa-shot mereka sendiri menggunakan metode SLEICL. Beberapa model bahasa yang lemah bahkan melampaui kinerja GPT4-1106-preview (Zero-shot) dengan bantuan SLEICL.

Struktur proyek

Proyek ini diatur ke dalam beberapa direktori dan modul utama. Berikut gambaran struktur proyek:

 .
├── archived      # Store the grimoire and hard samples used in our experiment.
├── assets        # Store project assets, such as images, diagrams, or any visual elements used to enhance the presentation and understanding of the project.
├── configs       # Store configuration files.
├── core          # Core codebase.
│   ├── data      # Data processing module.
│   ├── evaluator # Evaluator module.
│   └── llm       # Load Large Language Models (LLMs) module.
├── data          # Store datasets and data processing scripts.
├── external      # Store the Grimoire Ranking model based on the classifier approach.
├── outputs       # Store experiment output files.
├── prompts       # Store text files used as prompts when interacting with LLMs.
├── stats         # Store experiment statistical results.
└── tests         # Store test code or unit tests.

Mulai

Klon Repositori.
- git clone https://github.com/IAAR-Shanghai/Grimoire.git && cd Grimoire
Bersiaplah untuk lingkungan Conda.
- conda create -n grimoire python=3.8.18
- conda activate grimoire
Instal dependensi Python dan proses data.
- chmod +x setup.sh
- ./setup.sh
Konfigurasikan
- LLMS di Configs/llm.yaml.
- Eksperimen dalam configs/experiment.yaml.
- Jika perlu mereproduksi percobaan kami, Anda dapat memuat grimoire dan sampel keras yang digunakan dalam percobaan ini ke jalur saat ini menggunakan perintah berikut: cp -r ./archived/.cache ./ .
Lihatlah eksperimen.py untuk melihat cara menjalankan eksperimen.
Jalankan Analyst.py untuk menganalisis hasil yang disimpan dalam outputs .

Catatan: Mengenai penyebaran LLMS, kami juga memberikan beberapa tutorial referensi.

Hasil

Hubungi kami

Untuk pertanyaan, umpan balik, atau saran apa pun, silakan buka masalah GitHub. Anda dapat menjangkau melalui masalah GitHub.

Todos

Klik saya untuk menampilkan semua Todos

Tulis setup.sh terpadu untuk mengimplementasikan instalasi dependensi Python dan implementasi embed.py dan compute_similarity.py ;
Memberikan tutorial sederhana tentang penyebaran model VLLM;
Memuat model besar langsung dari huggingface ;
Tambahkan item yang dapat dikonfigurasi dalam experiment.yaml ;
Lingkungan dan kode eksperimental dikemas berdasarkan Docker, yang nyaman bagi para peneliti untuk digunakan dan digunakan dengan cepat;

Kutipan

 @article{Grimoire,
      title={Grimoire is All You Need for Enhancing Large Language Models}, 
      author={Ding Chen and Shichao Song and Qingchen Yu and Zhiyu Li and Wenjin Wang and Feiyu Xiong and Bo Tang},
      journal={arXiv preprint arXiv:2401.03385},
      year={2024},
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-05
ukuran 4.5MB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua