llama dfdx
1.0.0
Repo ini berisi model bahasa Llama 7B yang populer, sepenuhnya diimplementasikan dalam bahasa pemrograman karat!
Menggunakan tensor DFDX dan akselerasi CUDA.
Ini berjalan llama langsung di F16, yang berarti tidak ada akselerasi perangkat keras pada CPU. Menggunakan CUDA sangat disarankan.
Berikut adalah model 7B yang berjalan pada GPU A10:

sudo apt install git-lfsgit lfs install .git clone https://huggingface.co/decapoda-research/llama-7b-hfgit clone https://huggingface.co/decapoda-research/llama-13b-hfgit clone https://huggingface.co/decapoda-research/llama-65b-hfpython3.x -m venv <my_env_name> Untuk membuat lingkungan virtual Python, di mana x adalah versi python yang Anda sukaisource <my_env_name>binactivate (atau <my_env_name>Scriptsactivate If On Windows) untuk mengaktifkan lingkunganpip install numpy torchpython convert.py untuk mengonversi bobot model menjadi format yang dapat dimengerti: a. Llama 7B: python convert.py b. Llama 13B: python convert.py llama-13b-hf c. Llama 65B: python convert.py llama-65b-hf Anda dapat mengkompilasi dengan perintah karat normal:
Dengan cuda:
cargo build --release -F cudaTanpa Cuda:
cargo build --releaseDengan Default Args:
./target/release/llama-dfdx --model < model-dir > generate " <prompt> "
./target/release/llama-dfdx --model < model-dir > chat
./target/release/llama-dfdx --model < model-dir > file < path to prompt file >Untuk melihat perintah/arg kustom apa yang dapat Anda gunakan:
./target/release/llama-dfdx --help