การแนะนำอย่างรวดเร็วเกี่ยวกับแบบจำลองภาษาขนาดใหญ่ (การเรียนรู้เชิงทฤษฎีและการฝึกฝนการปรับแต่ง)
โปรดใช้ไฟล์ requirements.txt สำหรับการติดตั้งแพ็คเกจการพึ่งพา Python:
pip install -r requirements.txtโดยทั่วไปต้องใช้ไดรเวอร์ GPU และรุ่น CUDA เพื่อให้ตรงกับรุ่น Pytorch และ Tensorflow ที่ติดตั้ง
รุ่นภาษาขนาดใหญ่ที่เพิ่งเปิดตัวใหม่ส่วนใหญ่ใช้รุ่น Pytorch v2.0+ รุ่นใหม่ซึ่ง Pytorch เชื่ออย่างเป็นทางการคือ 11.8 และรุ่นไดรเวอร์ GPU ที่ตรงกับ สำหรับรายละเอียดโปรดดูรุ่นขั้นต่ำที่ร้องขอ CUDA ที่ร้องขอโดย Pytorch
ในระยะสั้นขอแนะนำให้ติดตั้งรุ่น CUDA 12.3 ล่าสุดโดยตรง สำหรับรายละเอียดโปรดดูแพ็คเกจการติดตั้ง Nvidia อย่างเป็นทางการ
หลังจากการติดตั้งเสร็จสมบูรณ์ให้ใช้ nvidia-smi Directive เพื่อดูเวอร์ชัน:
nvidia-smiFri Mar 1 11:16:55 2024
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 529.08 Driver Version: 529.08 CUDA Version: 12.0 |
| -------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
| ===============================+======================+====================== |
| 0 NVIDIA GeForce ... WDDM | 00000000:01:00.0 Off | N/A |
| N/A 45C P8 6W / 30W | 0MiB / 4096MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
| ============================================================================= |
+-----------------------------------------------------------------------------+ในการใช้ OpenAI API คุณจะต้องได้รับคีย์ API จากคอนโซล OpenAI เมื่อคุณมีคีย์คุณสามารถตั้งค่าเป็นตัวแปรสภาพแวดล้อม:
สำหรับระบบที่ใช้ UNIX เช่น Ubuntu หรือ MacOS คุณสามารถเรียกใช้คำสั่งต่อไปนี้ในเทอร์มินัล:
export OPENAI_API_KEY= '你的-api-key 'สำหรับ Windows คุณสามารถใช้คำสั่งต่อไปนี้ในพรอมต์คำสั่ง:
set OPENAI_API_KEY=你的-api-keyเกี่ยวกับข้อกำหนดคุณสามารถดาวน์โหลดได้ตามสถานการณ์
pip install -r requirements.txtการก่อสร้างสภาพแวดล้อมการพัฒนารวมถึงหลายส่วน
Miniconda เป็นเครื่องมือการจัดการสภาพแวดล้อม Python ที่สามารถใช้ในการสร้างและจัดการสภาพแวดล้อม Python หลายแห่ง มันเป็นทางเลือกที่มีน้ำหนักเบาสำหรับ Anaconda และไม่รวมเครื่องมือ IDE ใด ๆ Miniconda สามารถดาวน์โหลดแพ็คเกจการติดตั้งได้จากเว็บไซต์ทางการ นอกจากนี้คุณยังสามารถดาวน์โหลดได้จากเว็บไซต์ Mirror:
# 下载 Miniconda 安装包
$ wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 也可以使用curl命令下载
$ curl -O https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 安装 Miniconda
$ bash Miniconda3-latest-Linux-x86_64.shในระหว่างกระบวนการติดตั้งคำถามบางข้อต้องได้รับคำตอบเช่นเส้นทางการติดตั้งไม่ว่าจะเพิ่ม miniconda ลงในตัวแปรสภาพแวดล้อม ฯลฯ หลังจากการติดตั้งเสร็จสิ้นเทอร์มินัลจะต้องเริ่มต้นใหม่เพื่อให้ตัวแปรสภาพแวดล้อมมีผล
คุณสามารถใช้คำสั่งต่อไปนี้เพื่อตรวจสอบว่ามีการติดตั้ง Miniconda สำเร็จแล้ว:
$ conda --versionไฟล์การกำหนดค่า Miniconda ถูกเก็บไว้ใน ~/.CondArc คุณสามารถแก้ไขได้ด้วยตนเองโดยอ้างถึงเอกสารหรือคุณสามารถใช้คำสั่ง conda config เพื่อแก้ไขได้
# 配置清华镜像
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
$ conda config --set show_channel_urls yes
# 查看~/.condarc配置
$ conda config --show-sources
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: True # 安装mamba
$ conda install -n base -c conda-forge mamba
# 安装micromamba
$ conda install -n base -c conda-forge micromambaจากนั้นคุณสามารถใช้คำสั่ง mamba หรือ micromamba แทนคำสั่ง conda
# 创建虚拟环境,指定 Python 版本为 3.11
(base) $ conda create -n transformers python=3.11
# 激活 openai 环境
$ conda activate transformersหากไม่มีคำอธิบายพิเศษด้านล่างพวกเขาทั้งหมดจะดำเนินการในสภาพแวดล้อม OpenAI ที่สร้างขึ้นใหม่ที่นี่
Jupyter Lab เป็นสภาพแวดล้อมการพัฒนาแบบโต้ตอบที่สามารถทำงานในเบราว์เซอร์ รองรับภาษาการเขียนโปรแกรมที่หลากหลายรวมถึง Python, R, Julia ฯลฯ Jupyter Lab จัดทำโดย Conda-Forge โปรดกำหนดค่ารูปภาพก่อนจากนั้นติดตั้งโดยใช้คำสั่งต่อไปนี้:
(transformers) $ conda install jupyterlabHugging Face Transformers เป็นชุดเครื่องมือประมวลผลภาษาธรรมชาติที่ใช้ Pytorch และ Tensorflow ซึ่งให้รุ่นก่อนที่ได้รับการฝึกอบรมจำนวนมากซึ่งสามารถใช้ในการทำงาน NLP ที่หลากหลาย Hugging Face Transformers สามารถติดตั้งผ่าน Conda:
(transformers) $ conda install -c huggingface transformersเอกสารการติดตั้ง: Hugging Face Transformers
หม้อแปลงต้องใช้ TensorFlow สำหรับการใช้เหตุผลแบบจำลองจริง คำสั่งต่อไปนี้ติดตั้ง CPU และ GPU เวอร์ชัน TensorFlow:
(transformers) $ pip install tensorflowหากคุณใช้ Mac คุณสามารถติดตั้งปลั๊กอินโลหะสำหรับชิป M1/M2 และคุณสามารถลองรุ่นเล็ก ๆ ได้:
(transformers) $ pip install tensorflow-metalเอกสารการติดตั้ง:
หม้อแปลงต้องใช้ Pytorch สำหรับการใช้เหตุผลแบบจำลองจริง แหล่งที่มาของภาพ Pytorch และ Conda Forge ที่ใช้ได้รับการกำหนดค่าในขั้นตอนก่อนหน้า คุณสามารถใช้คำสั่งต่อไปนี้เพื่อติดตั้งเวอร์ชัน pytorch ที่สอดคล้องกับเวอร์ชัน CUDA:
# Linux
# CUDA 11.8
(transformers) $ conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c nvidia
# CUDA 12.1
(transformers) $ conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c nvidia
# Mac
(transformers) $ conda install pytorch::pytorch torchvision torchaudioเอกสารการติดตั้ง: pytorch
เมื่อประมวลผลภาพเสียงและข้อมูลอื่น ๆ จะต้องใช้การพึ่งพาอื่น ๆ รวมถึง::
(transformers) $ conda install tqdm iprogress ffmpeg ffmpeg-python pillowขอให้คุณก้าวหน้าในการศึกษาของคุณ