xmc.dspy download - unduhan kode sumber xmc.dspy

xmc.dspy

Kode Sumber AI

1.0.0

Unduh

Infer-Retrieve-Rank: Pembelajaran dalam konteks untuk klasifikasi multi-label yang ekstrem

Sumber daya:

[Jan'23] Utas pengumuman kertas & utas pengumuman kode
[Jan'23] Pembelajaran dalam konteks untuk makalah klasifikasi multi-label ekstrem

Infer-Retrieve-Rank (IRAA) adalah program generik dan modular yang menentukan interaksi antara model bahasa pretrained dan retriever untuk menyelesaikan tugas klasifikasi multi-label secara efisien dengan jumlah kelas yang ekstrem (≥10.000 kelas). Menggunakan hanya ≅ 50 contoh input berlabel, Irera dapat dioptimalkan untuk mencapai kinerja canggih, meskipun tidak diatasi. Optimalisasi ini umumnya melibatkan memiliki model bahasa guru yang kuat (misalnya GPT4) menyelesaikan tugas dan mengumpulkan instruksi atau demonstrasi yang membantu model bahasa siswa yang lebih efisien (misalnya LLAMA-2) menyelesaikan tugas dengan lebih baik. Pengguna dapat dengan mudah menentukan bagian mana dari program yang diimplementasikan menggunakan LMS mana, untuk mencapai keseimbangan sempurna antara biaya dan kinerja.

Tujuan Irera adalah dengan mudah berlaku untuk berbagai tugas yang melibatkan kesimpulan dengan model bahasa dan pengambilan. Untuk tujuan ini, pelepasan repositori ini (i) Logika Infer-Retrieve-Rank, (ii) permintaan yang diperlukan untuk mengadaptasi Irera ke domain tertentu dan (iii) teknik optimasi untuk meningkatkan kinerja. Semua ini dimungkinkan melalui model pemrograman DSPY.

Panggilan LM dari hasil kami di -cache, artinya Anda dapat mereproduksi menjalankan kami tanpa membayar sendiri biaya inferensi sendiri.

Daftar isi

Instalasi
Memuat data
Kompilasi dan jalankan
Berlaku untuk tugas baru
Menulis Program Kustom
Berkontribusi
Kutipan

1) Instalasi

Buat lingkungan conda:

 conda create -n xmc python=3.10
conda activate xmc

Instal DSPY. Pekerjaan kami bergantung pada cabang eksperimental DSPY.

 git clone -b irera --single-branch https://github.com/stanfordnlp/dspy.git
cd dspy/
git checkout 802f2d5f26c1a64d8aad6adbd8b4394b9c4bb743
pip install .
cd ..

Pasang sisa persyaratan:

 pip install -r requirements.txt

(Opsional) Mengatur model jika Anda berencana untuk melakukan lari baru

Semua panggilan LM untuk mereproduksi lari kami di -cache. Namun, jika Anda ingin menjalankan panggilan baru, Anda harus mengatur model OpenAI dan lokal.

Atur tombol API OpenAI Anda:

 export OPENAI_API_KEY=<your-key>

Untuk model lokal (misalnya LLAMA-2), atur antarmuka generasi teks lokal (TGI) melalui langkah-langkah ini. Pastikan untuk mengarahkan bidang url di lm_config.json ke server TGI Anda.

2) Muat data

Muat data dan cache yang diperlukan untuk mereproduksi hasil kami.

 bash scripts/load_data.sh
bash scripts/load_cache.sh

3) Kompilasi dan jalankan

Semua kompilasi IRera berjalan dari makalah kami dapat direproduksi dengan menjalankan bash scripts/compile_left_to_right.sh atau bash scripts/run_left_to_right.sh . Kami menyediakan status program yang dihasilkan di results_precompiled/ sehingga Anda dapat memuat program Irera yang dikompilasi.

Muat Irera yang dikompilasi untuk ESCO_TECH dan evaluasi:

 python run_irera.py 
    --dataset_name esco_tech 
    --state_path ./results_precompiled/esco_tech_infer-retrieve-rank_00/program_state.json 
    --lm_config_path ./lm_config.json 
    --do_validation 
    --do_test

Kompilasi Irera Anda sendiri di Esco_tech dan evaluasi:

 python compile_irera.py 
    --dataset_name esco_tech 
    --ontology_name esco 
    --prior_path ./data/esco/esco_priors.json 
    --ontology_path ./data/esco/skills_en_label.txt 
    --infer_signature_name infer_esco 
    --rank_signature_name rank_esco 
    --retriever_model_name sentence-transformers/all-mpnet-base-v2 
    --infer_student_model_name llama-2-13b-chat 
    --infer_teacher_model_name gpt-3.5-turbo-instruct 
    --rank_student_model_name gpt-4-1106-preview 
    --rank_teacher_model_name gpt-4-1106-preview 
    --infer_compile_metric_name rp10 
    --rank_compile_metric_name rp10 
    --prior_A 0 
    --rank_topk 50 
    --do_validation 
    --do_test 
    --optimizer_name left-to-right 
    --lm_config_path ./lm_config.json

Argumen baris perintah dijelaskan dalam file masing -masing.

Jika Anda ingin mempercepat berjalan, Anda dapat menggunakan multithreading (peringatan: ini kadang -kadang dapat mengacaukan caching).

 export DSP_NUM_THREADS=8

Hasil dari run_irera.py sedikit berbeda dari compile_irera.py , kemungkinan besar karena bug kecil dalam memuat dan menyimpan model. Kami mengambil hasil compile_irera.py sebagai hasil resmi yang kami laporkan di koran.

4) berlaku untuk tugas baru

Untuk menerapkan Irera ke tugas baru, Anda minimal perlu menambahkan dataset baru dan menulis tanda tangan khusus

A) Menambahkan dataset baru

Logika pemuatan data didefinisikan dalam src/data_loaders . Setiap loader harus secara minimal mengembalikan validasi dan pengujian DataFrame, di mana setiap baris memiliki bidang 'text' (yang merupakan string ) dan bidang 'label' (yang merupakan list strings ).

compile_irera mengharapkan file .txt di mana setiap baris adalah label, melalui argumen --ontology_path . Label-label ini tidak dapat berisi koma, karena saat ini istirahat yang menanamkan label dalam daftar yang dipisahkan koma. Pastikan label tidak memiliki ruang trailing. Via --prior_path Kamus perlu disuplai label peta mana yang menjadi probabilitas.

B) Menulis tanda tangan khusus

Tanda tangan memberi tahu modul pembelajaran dalam konteks seperti apa tugasnya dan seperti apa input dan output. Anda dapat menganggapnya sebagai prompt nol-shot minimal untuk tugas tersebut. Semua tanda tangan didefinisikan dalam src/programs/signatures.py , tambahkan tanda tangan baru Anda di sini.

Untuk menambahkan tanda tangan baru, subclass sederhana dspy.Signature dengan bidang dan deskripsi khusus Anda. Tambahkan kelas baru Anda ke Kamus supported_signatures di bagian bawah src/programs/signatures.py sehingga dapat diakses di seluruh kode.

C) Menambahkan metrik baru

Metrik mentah didefinisikan dalam src/metrics.py dan dibungkus dengan logika DSPY di src/evaluators.py . Saat menambahkan metrik, pastikan untuk menambahkannya ke kamus supported_metrics di bagian bawah src/evaluators.py sehingga dapat digunakan di seluruh kode.

5) Menulis Program Kustom

Tujuan Irera adalah menjadi modular dan mudah berlaku untuk tugas -tugas baru. Untuk mengubah Irera, Anda minimal perlu menulis logika khusus untuk modul (baru) menulis pengoptimal khusus yang mem -bootstrap program Anda.

A) Menulis logika khusus

Infer-retrieve-rank didefinisikan dalam src/programs/infer_retrieve_rank.py . Ini diinisialisasi dengan konfigurasi, didefinisikan dalam src/programs/config.py . Anda dapat menulis program baru atau memanipulasi perilaku Irera dengan mengubah kode Python dalam metode forward .

Saat Anda memperkenalkan hyperparameter baru, pastikan untuk menambahkan ini ke konfigurasi yang Anda gunakan. Kalau tidak, ini tidak akan disimpan dan dimuat.

B) Menulis pengoptimal khusus

Strategi optimasi didefinisikan dalam src/optimizer.py . Saat menambahkan pengoptimal baru, pastikan untuk menambahkannya ke kamus supported_optimizers di bagian bawah file, sehingga dapat diakses di seluruh kode.

Saat ini, pengoptimal mengetahui modul mana yang dimiliki program yang harus dioptimalkan. Ini perlu diselesaikan sehingga strategi optimasi dapat diterapkan secara fleksibel pada program yang berbeda.

6) berkontribusi

Saya senang mengambil kolaborasi! Jangan ragu untuk menghubungi saya di email yang ditentukan di koran, atau dengan membuka masalah atau menarik permintaan di halaman GitHub. Berikut adalah beberapa masalah yang dapat kami kerjakan:

Riset:

Menggabungkan definisi label, sinonim, dan hierarki untuk meningkatkan kinerja
Menerapkan Irera sebagai sistem rekomendasi (repositori klasifikasi ekstrem memiliki banyak tugas seperti itu)
Tambahkan strategi ensembling ke Irera untuk meningkatkan kinerja (baik program ensembling dan ensembling modul yang berbeda dalam program -program tersebut)
Tambahkan strategi chunking / ringkasan untuk menangani input panjang secara efisien
Mengoptimalkan berbagai bagian program untuk metrik yang berbeda untuk meningkatkan kinerja ujung ke ujung (misalnya mengoptimalkan infer-retrieve untuk penarikan tinggi@50 dan menggunakan peringkat untuk meningkatkan penarikan@10)
Cari tahu cara menggunakan label penggunaan terbaik untuk output program ke pengawasan bootstrap pada langkah -langkah program menengah untuk optimasi yang lebih baik
Pilih LMS / Retriever terbaik secara otomatis dari Huggingface untuk mengimplementasikan modul yang diberikan (Autoirera)

Rekayasa Perangkat Lunak:

7) Kutipan

Dapatkan pemberitahuan tentang pekerjaan di masa depan dengan mengikuti @kareldoostrlnck di Twitter.

Jika Anda menemukan repo ini bermanfaat atau menggunakan peringkat infer-retrieve dalam pekerjaan Anda, silakan kutip kami:

 @article{d2024context,
  title={In-Context Learning for Extreme Multi-Label Classification},
  author={D'Oosterlinck, Karel and Khattab, Omar and Remy, Fran{c{c}}ois and Demeester, Thomas and Develder, Chris and Potts, Christopher},
  journal={arXiv preprint arXiv:2401.12178},
  year={2024}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-07-03
ukuran 15.68MB
Berasal dari Github

Aplikasi Terkait

Lib.Net.Http.WebPush

2024-11-10
TAKUT 3

2022-09-05
Pembangun MASSA

2022-08-29
TIPU

2022-08-20
KOMA

2022-08-11
ZAR

2022-07-30

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
promptl

Kode Sumber AI

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua