Schnelle Einführung in große Sprachmodelle (theoretisches Lernen und Feinabstimmungspraxis)
Bitte verwenden Sie die Datei requirements.txt -Datei für die Installation des Python -Abhängigkeitspakets:
pip install -r requirements.txtIm Allgemeinen müssen die GPU -Treiber- und CUDA -Versionen die installierten Versionen von Pytorch und TensorFlow erfüllen.
Die meisten neu veröffentlichten großsprachigen Modelle verwenden die neuere Pytorch v2.0+ -Version, von der Pytorch offiziell glaubt, dass sie 11,8 sind und die GPU -Treiberversionen übereinstimmen. Weitere Informationen finden Sie in der von Pytorch angeforderten Antwort der CUDA -Mindestversion.
Kurz gesagt, es wird empfohlen, die aktuelle neueste CUDA 12.3 -Version direkt zu installieren. Weitere Informationen finden Sie im offiziellen NVIDIA -Installationspaket.
Verwenden Sie nach Abschluss der Installation nvidia-smi Direktive, um die Version anzuzeigen:
nvidia-smiFri Mar 1 11:16:55 2024
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 529.08 Driver Version: 529.08 CUDA Version: 12.0 |
| -------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
| ===============================+======================+====================== |
| 0 NVIDIA GeForce ... WDDM | 00000000:01:00.0 Off | N/A |
| N/A 45C P8 6W / 30W | 0MiB / 4096MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
| ============================================================================= |
+-----------------------------------------------------------------------------+Um die OpenAI -API zu verwenden, müssen Sie einen API -Schlüssel aus der OpenAI -Konsole erhalten. Sobald Sie den Schlüssel haben, können Sie ihn als Umgebungsvariable festlegen:
Für UNIX-basierte Systeme wie Ubuntu oder MacOS können Sie den folgenden Befehl im Terminal ausführen:
export OPENAI_API_KEY= '你的-api-key 'Für Windows können Sie den folgenden Befehl in der Eingabeaufforderung verwenden:
set OPENAI_API_KEY=你的-api-keyIn Bezug auf Anforderungen können Sie es gemäß der Situation herunterladen
pip install -r requirements.txtEntwicklungsumfeldkonstruktion umfasst mehrere Teile
Miniconda ist ein Tool für das Umgebungsmanagement von Python, mit dem mehrere Python -Umgebungen erstellt und verwaltet werden können. Es ist eine leichte Alternative zu Anaconda und enthält keine IDE -Tools. Miniconda kann das Installationspaket von der offiziellen Website herunterladen. Sie können es auch von der Mirror -Website herunterladen:
# 下载 Miniconda 安装包
$ wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 也可以使用curl命令下载
$ curl -O https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 安装 Miniconda
$ bash Miniconda3-latest-Linux-x86_64.shWährend des Installationsprozesses müssen einige Fragen beantwortet werden, wie z. B. der Installationspfad, ob Miniconda zu Umgebungsvariablen usw. Nach Abschluss der Installation mininal eingestuft werden, muss das Terminal neu gestartet werden, um die Umgebungsvariablen in Kraft zu setzen.
Sie können den folgenden Befehl verwenden, um zu überprüfen, ob Miniconda erfolgreich installiert ist:
$ conda --versionMiniconda -Konfigurationsdateien werden in ~/.condarc gespeichert. Sie können sie manuell ändern, indem Sie sich auf das Dokument beziehen, oder Sie können den Conda -Konfigurationsbefehl verwenden, um sie zu ändern.
# 配置清华镜像
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
$ conda config --set show_channel_urls yes
# 查看~/.condarc配置
$ conda config --show-sources
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: True # 安装mamba
$ conda install -n base -c conda-forge mamba
# 安装micromamba
$ conda install -n base -c conda-forge micromambaDann können Sie den Befehl mamba oder micromamba anstelle des Conda -Befehls verwenden.
# 创建虚拟环境,指定 Python 版本为 3.11
(base) $ conda create -n transformers python=3.11
# 激活 openai 环境
$ conda activate transformersWenn es nachstehend keine besondere Beschreibung gibt, werden alle in der neu erstellten OpenAI -Umgebung hier durchgeführt.
Jupyter Lab ist eine interaktive Entwicklungsumgebung, die in einem Browser ausgeführt werden kann. Es unterstützt eine Vielzahl von Programmiersprachen, darunter Python, R, Julia usw. Jupyter Lab wird von Conda-forge bereitgestellt. Bitte konfigurieren Sie zuerst das Bild und installieren Sie es dann mit dem folgenden Befehl:
(transformers) $ conda install jupyterlabSugging Face Transformers ist ein Toolkit für natürliche Sprachverarbeitung, das auf Pytorch und Tensorflow basiert, das eine große Anzahl vorgebildeter Modelle bietet, mit denen eine Vielzahl von NLP-Aufgaben ausgeführt werden können. Umarmende Gesichtstransformatoren können über Conda installiert werden:
(transformers) $ conda install -c huggingface transformersInstallationsdokumentation: Umarmende Gesichtstransformatoren
Transformatoren müssen den Tensorflow für das tatsächliche Modellminimieren verwenden. Der folgende Befehl installiert die CPU- und GPU -Versionen von TensorFlow:
(transformers) $ pip install tensorflowWenn Sie einen Mac verwenden, können Sie das Metall-Plug-In für den M1/M2-Chip installieren und auch einige kleinere Modelle ausprobieren:
(transformers) $ pip install tensorflow-metalInstallationsdokumentation:
Transformatoren müssen Pytorch für das tatsächliche Modellminimieren verwenden. Die verwendeten Pytorch- und Conda-Forge-Bildquellen wurden im vorherigen Schritt konfiguriert. Sie können den folgenden Befehl verwenden, um die Pytorch -Version zu installieren, die der CUDA -Version entspricht:
# Linux
# CUDA 11.8
(transformers) $ conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c nvidia
# CUDA 12.1
(transformers) $ conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c nvidia
# Mac
(transformers) $ conda install pytorch::pytorch torchvision torchaudioInstallationsdokumentation: Pytorch
Bei der Verarbeitung von Bildern, Audio- und anderen Daten müssen andere Abhängigkeiten verwendet werden, einschließlich:
(transformers) $ conda install tqdm iprogress ffmpeg ffmpeg-python pillowIch wünsche Ihnen Fortschritte in Ihrem Studium