llm augmentation
1.0.0
大型語言模型在幾乎每個領域都擁有令人難以置信的知識。在此項目中,我們將探討使用自定義數據和調用功能的能力增強LLM的方法,最終目標是提高其針對特定域相關任務的性能。
該存儲庫包含與LLM擴增項目(W24)每週課程一致的教程筆記本。這些筆記本旨在提供我們將要探索的技術和概念的動手體驗。
首先,只需克隆存儲庫,然後在本地開發環境中使用筆記本。如果您的當地環境有挑戰性,請使用雲筆記本電腦,例如Google Colab或Kaggle。
| 星期 | 日期 | 每週主題 | 客觀的 |
|---|---|---|---|
| 1 | 2/11 | 設置,LLMS介紹和嵌入 | - |
| 2 | 2/18 | 向量數據庫和檢索增強發電(RAG) | - |
| - | - | 春假 | - |
| 3 | 3/10 | 功能通話和蘭鏈 | 形式組 |
| 4 | 3/17 | 發展時間 | - |
| 5 | 3/24 | 發展時間 | - |
| 6 | 3/31 | 簡化建造前端 | 小組檢查點應得 |
| 7 | 4/7 | 發展時間 | - |
| 8 | 4/14 | 最終博覽會準備 | 最終可交付應付 |
| - | - | 最終項目博覽會(4/19) | 介紹應得 |
API鍵是該項目的重要組成部分。每個人都將獲得OpenAI API鍵,如果需要,可以根據要求提供其他密鑰。
要在您的開發環境中使用API鍵,請將它們設置為系統環境變量,或在本地文件夾中創建.env文件,然後在此處設置API密鑰環境變量。以下是.env文件的示例,而Python代碼從文件中摘下API鍵。
您的.env文件應查看以下內容:
# .env
OPENAI_API_KEY = your_api_key
OTHER_API_KEYS = ...
...要將環境變量從.env提取到代碼中,您將需要使用dotenv python庫。
from dotenv import load_dotenv
import os
load_dotenv ()上述單元格運行後,將.env變量的所有環境變量加載到筆記本環境變量中。要在必要時提取這些環境變量,請使用os.getenv("OPENAI_API_KEY") 。
使用openai時,設置API鍵應該看起來像這樣:
import openai
openai . api_key = os . getenv ( "OPENAI_API_KEY" )使用langchain時, load_dotenv()應該足夠,因為Langchain會自動尋找具有適當名稱的環境變量。如果沒有,請執行以下操作:
X_API_KEY = os . getenv ( "API_KEY_NAME" )
# then, pass the API KEY variable where necessary請勿將API鍵將API密鑰編碼到您的代碼中,也不要將.env文件包含在git commit中。