Большие языковые модели имеют невероятную широту знаний практически в каждой области. В этом проекте мы рассмотрим методы для увеличения LLM с помощью пользовательских данных и возможности вызывать функции, что конечная цель-улучшить их производительность для конкретных задач, связанных с доменом.
Этот репозиторий содержит учебные тетради, соответствующие еженедельным урокам проекта по увеличению LLM (W24). Ноутбуки предназначены для обеспечения практического опыта с технологиями и концепциями, которые мы будем изучать.
Чтобы начать, просто клонируйте репозиторий и используйте ноутбуки в вашей местной среде разработки. Если ваша местная среда оказывается сложной задачей, используйте тетради, такие как Google Colab или Kaggle.
| Неделя | Дата | Еженедельная тема | Цель |
|---|---|---|---|
| 1 | 2/11 | Настройка, вступление в LLMS и Entgdings | - |
| 2 | 2/18 | Векторные базы данных и получение добычи (RAG) (RAG) | - |
| - | - | Весенние каникулы | - |
| 3 | 3/10 | Функция вызова и Langchain | Форма группы |
| 4 | 3/17 | Время развития | - |
| 5 | 3/24 | Время развития | - |
| 6 | 3/31 | Строительство фронта | Групповая контрольная точка причитается |
| 7 | 4/7 | Время развития | - |
| 8 | 4/14 | Окончательная выставка подготовка | Окончательный результат |
| - | - | Окончательная экспозиция проекта (4/19) | Презентация |
Ключи API являются неотъемлемой частью проекта. Каждому будет предоставлено открытые ключи API, а другие ключи могут быть доступны по запросу, если это необходимо для результатов.
Чтобы использовать клавиши API в вашей среде разработки, установите их в качестве переменных системной среды, либо создайте файл .env в вашей локальной папке и установите там переменные среды API. Ниже приведен пример файла .env и кода Python, вытаскивающего ключ API из файла.
Ваш файл .env должен выглядеть:
# .env
OPENAI_API_KEY = your_api_key
OTHER_API_KEYS = ...
... Чтобы вывести переменные среды из .env в ваш код, вы захотите использовать библиотеку Python dotenv , как так.
from dotenv import load_dotenv
import os
load_dotenv () Как только вышеуказанная ячейка запускается, все переменные среды от переменной .env загружаются в переменные ноутбука. Чтобы вытащить эти переменные среды, где это необходимо, используйте os.getenv("OPENAI_API_KEY") .
При использовании openai настройка клавиши API должен выглядеть так:
import openai
openai . api_key = os . getenv ( "OPENAI_API_KEY" ) При использовании langchain должен быть достаточно load_dotenv() , так как Langchain автоматически ищет переменные среды с соответствующим именем. Если нет, сделайте следующее:
X_API_KEY = os . getenv ( "API_KEY_NAME" )
# then, pass the API KEY variable where necessary Не жесткой кодировки клавиш API в свой код или включайте файл .env в коммит GIT.