ผู้เขียน: Diaoule Diallo, Roxanne El Baff, Dominik Opitz, Oliver Bensch, Peer Schütt
ผู้เขียนที่เกี่ยวข้อง: Peer Schütt (Peer.schuett ที่ DLR.DE)
ในบทช่วยสอนนี้คุณจะได้เรียนรู้เทคนิคล่าสุดในด้านวิศวกรรมที่รวดเร็ววิธีการคัดท้ายโมเดลภาษาขนาดใหญ่ (LLMS) อย่างมีประสิทธิภาพโดยใช้การเพิ่มการดึง (RAG) และ Toolformer ซึ่งเป็นวิธีการล่าสุดในการเสริมสร้าง LLM ด้วยข้อมูลจากเครื่องมือภายนอก คุณจะสามารถตั้งค่าโมเดล LLM ในพื้นที่ของคุณเองและใช้เทคนิคเหล่านี้เพื่อสุ่มตัวอย่างงาน เป็นการดีที่คุณสามารถใช้ความรู้นี้ได้ทันทีเพื่อรับมือกับความท้าทายของคุณเองไม่ว่าจะเป็นในการวิจัยหรือการบริหาร
บทช่วยสอนนี้จัดทำขึ้นสำหรับ WAW ML 2024
แต่ละชิ้นส่วนบทช่วยสอนแต่ละชิ้นมีโฟลเดอร์เฉพาะพร้อมคำแนะนำ การสอนมีการวางแผนที่จะแล้วเสร็จในสี่ขั้นตอน:
เราจะใช้ LM Studio (https://lmstudio.ai/) เราให้คำแนะนำการติดตั้ง PDF LM_STUDIO_INSTALL_INSTRUCT.PDF การแนะนำสั้น ๆ เกี่ยวกับ LM Studio และคำอธิบายของรุ่นที่เราต้องการใช้ โปรดอ่าน PDF ดาวน์โหลดรุ่น LLM ที่ระบุและมี LM Studio ขึ้นและทำงาน สำหรับบางส่วนของการสอนคุณสามารถใช้ Mistral API เพื่อให้ได้ประสิทธิภาพที่ดีขึ้น แต่นี่เป็นตัวเลือกที่เป็นตัวเลือก หากคุณต้องการใช้สิ่งนั้นลงทะเบียนที่นี่ (https://docs.mistral.ai/getting-started/quickstart/#account-setup) แต่ทุกส่วนสามารถทำได้ด้วย LM Studio
นอกจากนี้เรายังให้ requirements.txt พร้อมแพ็คเกจ Python ที่จำเป็นทั้งหมด ด้วยสิ่งนั้นคุณสามารถสร้างสภาพแวดล้อม conda/mamba สำหรับการสอน:
conda init powershell # only for Windows users - requires terminal restart
conda activate
mamba create -n waw_ml python=3.10 # mamba/conda depending on what you use
conda activate waw_ml
pip install -r requirements.txt