mixture of experts - mixture of experts

mixture of experts

ular piton

1.0.0

Unduh

Campuran Lapisan Pakar Jarang Terpagar untuk Pytorch

Repositori ini berisi implementasi ulang pytorch dari lapisan MOE yang jarang yang dijelaskan dalam kertas jaringan saraf yang sangat besar untuk Pytorch.

 from moe import MoE
import torch

# instantiate the MoE layer
model = MoE ( input_size = 1000 , output_size = 20 , num_experts = 10 , hidden_size = 66 , k = 4 , noisy_gating = True )

X = torch . rand ( 32 , 1000 )

#train
model . train ()
# forward
y_hat , aux_loss = model ( X )

# evaluation

model . eval ()
y_hat , aux_loss = model ( X )

Persyaratan

Untuk menginstal persyaratan yang dijalankan:

pip install -r requirements.py

Contoh

example.py file.py berisi contoh kerja minimal yang menggambarkan cara melatih dan mengevaluasi lapisan MOE dengan input dan target dummy. Untuk menjalankan contoh:

python example.py

CONFAR 10 Contoh

File cifar10_example.py berisi contoh kerja minimal dari dataset CIFAR 10. Ini mencapai akurasi 39% dengan hyper-parameter sewenang-wenang dan tidak sepenuhnya konvergen. Untuk menjalankan contoh:

python cifar10_example.py

Digunakan oleh

FastMoe: Sistem pelatihan campuran-ekspert yang cepat implementasi ini digunakan sebagai implementasi Pytorch referensi untuk pelatihan GPU tunggal.

Ucapan Terima Kasih

Kode ini didasarkan pada implementasi TensorFlow yang dapat ditemukan di sini.

Mengutip

 @misc{rau2019moe,
    title={Sparsely-gated Mixture-of-Experts PyTorch implementation},
    author={Rau, David},
    journal={https://github.com/davidmrau/mixture-of-experts},
    year={2019}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe ular piton
Waktu Pembaruan 2025-07-12
ukuran 19.54KB
Berasal dari Github

Aplikasi Terkait

Seni Perang

2024-11-14
Jalur Titan

2024-09-17
Negara Bagian Sur

2024-08-19
Jalanan Nakal

2024-02-21
Perusahaan Pahlawan: Tales of Valor

2022-09-04
Zaman Mitologi: Kisah Naga

2022-08-29

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ToDo Co

ular piton

1.0.0
Python Portfolio

ular piton
Alat bagan data sumber terbuka Redash v24.10.0

ular piton

24.10.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua