Быстрое введение в модели крупных языков (теоретическое обучение и практика тонкой настройки)
Пожалуйста, используйте файл requirements.txt для установки пакета зависимостей Python:
pip install -r requirements.txtКак правило, версии драйвера GPU и CUDA необходимы для удовлетворения установленных версий Pytorch и Tensorflow.
Самые недавно выпущенные модели с крупными языками используют более новую версию Pytorch v2.0+, которая, по мнению Pytorch, официально считает 11,8 и сопоставленными версиями драйверов GPU. Для получения подробной информации, пожалуйста, обратитесь к запрашиваемой версии CUDA Minimum, предоставленной Pytorch.
Короче говоря, рекомендуется напрямую установить текущую последнюю версию CUDA 12.3. Для получения подробной информации, пожалуйста, обратитесь к официальному пакету установки NVIDIA.
После завершения установки используйте директиву nvidia-smi чтобы просмотреть версию:
nvidia-smiFri Mar 1 11:16:55 2024
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 529.08 Driver Version: 529.08 CUDA Version: 12.0 |
| -------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
| ===============================+======================+====================== |
| 0 NVIDIA GeForce ... WDDM | 00000000:01:00.0 Off | N/A |
| N/A 45C P8 6W / 30W | 0MiB / 4096MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
| ============================================================================= |
+-----------------------------------------------------------------------------+Чтобы использовать API OpenAI, вам нужно получить ключ API от консоли OpenAI. Как только у вас есть ключ, вы можете установить его как переменную среды:
Для таких систем на основе UNIX, как Ubuntu или MacOS, вы можете запустить следующую команду в терминале:
export OPENAI_API_KEY= '你的-api-key 'Для Windows вы можете использовать следующую команду в командной строке:
set OPENAI_API_KEY=你的-api-keyО требованиях, вы можете скачать его в соответствии с ситуацией
pip install -r requirements.txtСтроительство среды развития включает в себя несколько частей
Miniconda - это инструмент управления средой Python, который можно использовать для создания и управления несколькими средами Python. Это легкая альтернатива Anaconda и не включает никаких инструментов IDE. Miniconda может загрузить пакет установки с официального сайта. Вы также можете скачать его с сайта Mirror:
# 下载 Miniconda 安装包
$ wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 也可以使用curl命令下载
$ curl -O https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 安装 Miniconda
$ bash Miniconda3-latest-Linux-x86_64.shВо время процесса установки необходимо ответить на некоторые вопросы, такие как путь установки, будь то добавление Miniconda в переменные среды и т. Д. После завершения установки необходимо перезапустить терминал, чтобы переменная среды вступила в силу.
Вы можете использовать следующую команду, чтобы убедиться, что Miniconda успешно установлена:
$ conda --versionФайлы конфигурации Miniconda хранятся в ~/.condarc. Вы можете изменить их вручную, ссылаясь на документ, или вы можете использовать команду конфигурации Conda для их изменения.
# 配置清华镜像
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
$ conda config --set show_channel_urls yes
# 查看~/.condarc配置
$ conda config --show-sources
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: True # 安装mamba
$ conda install -n base -c conda-forge mamba
# 安装micromamba
$ conda install -n base -c conda-forge micromambaЗатем вы можете использовать команду Mamba или Micromamba вместо команды Conda.
# 创建虚拟环境,指定 Python 版本为 3.11
(base) $ conda create -n transformers python=3.11
# 激活 openai 环境
$ conda activate transformersЕсли ниже нет особого описания, все они будут выполнены в недавно созданной среде Openai здесь.
Jupyter Lab - это интерактивная среда разработки, которая может работать в браузере. Он поддерживает различные языки программирования, включая Python, R, Julia и т. Д. Jupyter Lab предоставляется Conda-Forge. Сначала настройте изображение, а затем установите его, используя следующую команду:
(transformers) $ conda install jupyterlabОбъятие лиц Transformers-это инструментарий для обработки естественного языка, основанный на Pytorch и Tensorflow, который предоставляет большое количество предварительно обученных моделей, которые можно использовать для выполнения различных задач NLP. Обнимающиеся трансформаторы лица могут быть установлены через Conda:
(transformers) $ conda install -c huggingface transformersУстановка документация: обнимание трансформаторов лица
Трансформаторы должны использовать TensorFlow для фактической модели. Следующая команда устанавливает версии процессора и графического процессора TensorFlow:
(transformers) $ pip install tensorflowЕсли вы используете Mac, вы можете установить металлический плагин для чипа M1/M2, и вы также можете попробовать некоторые меньшие модели:
(transformers) $ pip install tensorflow-metalУстановка документация:
Трансформеры должны использовать Pytorch для фактической модели. Используемые источники изображений Pytorch и Conda-Forge были настроены на предыдущем этапе. Вы можете использовать следующую команду для установки версии Pytorch, соответствующей версии CUDA:
# Linux
# CUDA 11.8
(transformers) $ conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c nvidia
# CUDA 12.1
(transformers) $ conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c nvidia
# Mac
(transformers) $ conda install pytorch::pytorch torchvision torchaudioУстановка документация: Pytorch
При обработке изображений, аудио и других данных необходимо использовать другие зависимости, включая:
(transformers) $ conda install tqdm iprogress ffmpeg ffmpeg-python pillowЖелаю вам прогресса в учебе