Скачать stark - Скачать stark исходный код

stark

Другой исходный код

1.0.0

Скачать

Stark: Benderking LLM -поиск на основе текстовых и реляционных знаний

НОВОСТИ

[Октябрь 2024] Таблица лидеров: мы строим официальную таблицу лидеров на Hunggingface и призываем к представлениям!
[Октябрь 2024 г.] Государственная бумага, готовая к камере! Мы добавляем несколько моделей поиска, включая BM25, Colbertv2, Gritlm.
[Сентябрь 2024] Старк принимается в 2024 году набора данных Neurips & Bendal Track!
[Jun 2024] Мы делаем наш эталон в качестве пакета PIP Stark-Qa. Вы можете прямо сейчас загрузить данные из пакета!
[Июнь 2024 г.] Мы мигрируем наши данные, чтобы обнять лицо! Вам не нужно ничего менять, данные будут автоматически загружены.
[Май 2024 г.] Мы дополнили наш эталон с помощью трех высококачественных наборов данных, созданных человеком, которые открыты для доступа. Смотрите более подробную информацию в нашем обновленном Arxiv!
[9 мая 2024 г.] Мы выпускаем Stark Skb Explorer, интерактивный интерфейс для вас, чтобы исследовать наши базы знаний!
[7 мая 2024 г.] Мы представляем Старк на ежегодном собрании Стэнфорда в Стэнфорде в 2024 году и 2024 году Стэнфордской конференции по науке о данных.
[5 мая 2024 года] Старк был зарегистрирован на MarketPost и 智源社区 Baai. Спасибо, что написали о нашей работе!
[21 апреля 2024 г.] Мы выпускаем эталон Stark.

Что такое Старк?

Stark-это крупномасштабный полуструктурированный эталон поиска по текстовым и реляционным базам знаний, охватывающий приложения для поиска продуктов, поиска в академических документах и запросов на биомедицины.

Показывая разнообразные, естественные и практические запросы, которые требуют контекстных рассуждений, Stark устанавливает новый стандарт для оценки реальных систем поиска, основанных на LLMS, и представляет значительные проблемы для будущих исследований.

Проверьте наш сайт для получения дополнительной информации!

Данные о контроле

1) Установка ENV

От PIP (рекомендуется)

С Python> = 3,8 и <3.12

pip install stark-qa

Из источника

Создайте Conda Env с Python> = 3,8 и <3.12 и установите необходимые пакеты в requirements.txt .

conda create -n stark python=3.11
conda activate stark
pip install -r requirements.txt

2) Загрузка данных

 from stark_qa import load_qa , load_skb

dataset_name = 'amazon'

# Load the retrieval dataset
qa_dataset = load_qa ( dataset_name )
idx_split = qa_dataset . get_idx_split ()

# Load the semi-structured knowledge base
skb = load_skb ( dataset_name , download_processed = True , root = None )

Корневой аргумент для load_skb указывает местоположение для хранения данных SKB. С значением по умолчанию None , данные будут храниться в кэше HurgingFace.

Данные задачи поиска

Пары ответов на вопрос для задачи поиска будут автоматически загружены в data/{dataset}/stark_qa по умолчанию. Мы предоставили официальное разделение в data/{dataset}/split .

Данные о базах знаний

Есть два способа загрузить данные базы знаний:

(Рекомендуется) Мгновенная загрузка: данные базы знаний всех трех тестов будут автоматически загружены и загружены при настройке download_processed=True .
Данные процесса от RAW: Мы также предоставили весь наш код предварительной обработки для прозрачности. Следовательно, вы можете обработать необработанные данные с нуля с помощью настройки download_processed=False . В этом случае Stark-Primekg занимает около 5 минут, чтобы загрузить и загрузить обработанные данные. Stark-Amazon и Stark-Mag могут потребоваться около часа, чтобы обработать необработанные данные.

3) Оценка на эталон

Если вы запускаете Eval, вы можете установить следующие пакеты:

pip install llm2vec gritlm bm25

Наша оценка требует включения документов узла в candidate_emb_dict.pt , который является словарным node_id -> torch.Tensor . Запросы встраивания будут автоматически сгенерированы, если они не будут доступны. Вы можете либо запустить следующий скрипт Python для загрузки запросов и встроенных документов, сгенерированных text-embedding-ada-002 . (Мы предоставляем их, чтобы вы могли сразу забежать на нашем эталоне.)
```
python emb_download.py --dataset amazon --emb_dir emb/
```
Или вы можете запустить следующий код, чтобы самостоятельно генерировать запрос или документы. Например,
```
python emb_generate.py --dataset amazon --mode query --emb_dir emb/ --emb_model text-embedding-ada-002
```
- dataset : один из amazon , mag или prime .
- mode : Содержание в Enced, один из query или doc (узлы документов).
- emb_dir : каталог для хранения вставки.
- emb_model : название LLM для генерации встроений, таких как text-embedding-ada-002 voyage-large-2-instruct text-embedding-3-large GritLM/GritLM-7B McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp
- См. emb_generate.py для других аргументов.
Запустите сценарий Python для оценки. Например,
```
python eval.py --dataset amazon --model VSS --emb_dir emb/ --output_dir output/ --emb_model text-embedding-ada-002 --split test --save_pred 
```
```
python eval.py --dataset amazon --model VSS --emb_dir emb/ --output_dir output/ --emb_model GritLM/GritLM-7B --split test-0.1 --save_pred 
```
```
python eval.py --dataset amazon --model LLMReranker --emb_dir emb/ --output_dir output/ --emb_model text-embedding-ada-002 --split human_generated_eval --llm_model gpt-4-1106-preview --save_pred
```
Ключевые аргументы:
- dataset : набор данных для оценки, один из amazon , mag или prime .
- model : модель, которая должна быть оценена, одна из BM25 , Colbertv2 , VSS , MultiVSS , LLMReranker .
  - Пожалуйста, укажите имя модели встроения с аргументом --emb_model .
  - Если вы используете LLMReranker , укажите имя LLM с аргументом --llm_model .
  - Укажите клавиши API в командной строке
```
 export ANTHROPIC_API_KEY=YOUR_API_KEY
```
    или
```
 export OPENAI_API_KEY=YOUR_API_KEY
export OPENAI_ORG=YOUR_ORGANIZATION
```
    или
```
 export VOYAGE_API_KEY=YOUR_API_KEY
```
- emb_dir : каталог для хранения вставки.
- split : разделение для оценки, один из train , val , test , test-0.1 (10% случайная выборка) и human_generated_eval (для оценки в наборе данных запросов, генерируемого человеком).
- output_dir : каталог для хранения результатов оценки.
- surfix : укажите, когда хранятся встраивания в папке doc{surfix} или query{surfix} , например, _no_compact,

Ссылка

Пожалуйста, рассмотрите возможность ссылаться на нашу газету, если вы используете наш контрольный показатель или код в своей работе:

 @inproceedings{wu24stark,
    title        = {STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases},
    author       = {
        Shirley Wu and Shiyu Zhao and 
        Michihiro Yasunaga and Kexin Huang and 
        Kaidi Cao and Qian Huang and 
        Vassilis N. Ioannidis and Karthik Subbian and 
        James Zou and Jure Leskovec
    },
    booktitle    = {NeurIPS Datasets and Benchmarks Track},
    year         = {2024}
}

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-04-17
размер 3.27MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

stark

Stark: Benderking LLM -поиск на основе текстовых и реляционных знаний

НОВОСТИ

Что такое Старк?

Данные о контроле

1) Установка ENV

От PIP (рекомендуется)

Из источника

2) Загрузка данных

Данные задачи поиска

Данные о базах знаний

3) Оценка на эталон

Ссылка

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express