ดาวน์โหลด stark - ดาวน์โหลดซอร์สโค้ด stark

stark

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

สตาร์ค: การเปรียบเทียบ LLM ดึงข้อมูลบนฐานความรู้เชิงข้อความและเชิงสัมพันธ์

ข่าว

[ต.ค. 2024] ลีดเดอร์บอร์ด: เราสร้างกระดานผู้นำอย่างเป็นทางการบน HunggingFace และเรากำลังเรียกร้องให้ส่ง!
[ต.ค. 2024] กระดาษพร้อมกล้องหมดแล้ว! เราเพิ่มโมเดลการดึงข้อมูลหลายแบบรวมถึง BM25, Colbertv2, Gritlm
[ก.ย. 2024] สตาร์คได้รับการยอมรับจากชุดข้อมูล Neurips และ Benchmark Track!
[มิ.ย. 2024] เราทำให้เกณฑ์มาตรฐานของเราเป็นแพ็คเกจ PIP Stark-Qa คุณสามารถโหลดข้อมูลโดยตรงจากแพ็คเกจได้ทันที!
[มิ.ย. 2024] เราอพยพข้อมูลของเราเพื่อกอดหน้า! คุณไม่จำเป็นต้องเปลี่ยนแปลงอะไรข้อมูลจะถูกดาวน์โหลดโดยอัตโนมัติ
[พฤษภาคม 2024] เราได้เพิ่มเกณฑ์มาตรฐานของเราด้วยชุดข้อมูลการสืบค้นที่มนุษย์สร้างขึ้นคุณภาพสูงสามชุดซึ่งเปิดให้เข้าถึงได้ ดูรายละเอียดเพิ่มเติมใน arxiv ที่อัปเดตของเรา!
[9 พฤษภาคม 2024] เราเปิดตัว Stark SKB Explorer ซึ่งเป็นอินเทอร์เฟซแบบโต้ตอบเพื่อให้คุณสำรวจฐานความรู้ของเรา!
[7 พฤษภาคม 2024] เรานำเสนอสตาร์คในการประชุม บริษัท ในเครือสแตนฟอร์ดประจำปี 2567 และการประชุมวิทยาศาสตร์ข้อมูลสแตนฟอร์ดปี 2567
[5 พฤษภาคม 2024] สตาร์คถูกรายงานเกี่ยวกับ Marketpost และ智源社区 Baai ขอบคุณที่เขียนเกี่ยวกับงานของเรา!
[21 เม.ย. 2024] เราเปิดตัวเกณฑ์มาตรฐานสตาร์ค

สตาร์คคืออะไร?

สตาร์คเป็นเกณฑ์มาตรฐานการดึงข้อมูลกึ่งโครงสร้างขนาดใหญ่เกี่ยวกับฐานความรู้เชิงข้อความและเชิงสัมพันธ์ครอบคลุมแอปพลิเคชันในการค้นหาผลิตภัณฑ์การค้นหากระดาษวิชาการและการสอบถามทางชีวการแพทย์

นำเสนอการสืบค้นที่หลากหลายเป็นธรรมชาติและเป็นจริงที่ต้องใช้การใช้เหตุผลเฉพาะบริบทโดย Stark กำหนดมาตรฐานใหม่สำหรับการประเมินระบบการดึงข้อมูลในโลกแห่งความเป็นจริงซึ่งขับเคลื่อนโดย LLMS และนำเสนอความท้าทายที่สำคัญสำหรับการวิจัยในอนาคต

ตรวจสอบเว็บไซต์ของเราเพื่อดูภาพรวมเพิ่มเติม!

เข้าถึงข้อมูลมาตรฐาน

1) การตั้งค่า Env

จาก PIP (แนะนำ)

ด้วย Python> = 3.8 และ <3.12

pip install stark-qa

จากแหล่งกำเนิด

สร้าง conda env ด้วย python> = 3.8 และ <3.12 และติดตั้งแพ็คเกจที่ต้องการใน requirements.txt

conda create -n stark python=3.11
conda activate stark
pip install -r requirements.txt

2) การโหลดข้อมูล

 from stark_qa import load_qa , load_skb

dataset_name = 'amazon'

# Load the retrieval dataset
qa_dataset = load_qa ( dataset_name )
idx_split = qa_dataset . get_idx_split ()

# Load the semi-structured knowledge base
skb = load_skb ( dataset_name , download_processed = True , root = None )

อาร์กิวเมนต์รูทสำหรับ load_skb ระบุตำแหน่งเพื่อจัดเก็บข้อมูล SKB ด้วยค่าเริ่มต้น None ข้อมูลจะถูกเก็บไว้ในแคช HuggingFace

ข้อมูลของงานดึง

คู่คำถามคำตอบสำหรับงานดึงข้อมูลจะถูกดาวน์โหลดโดยอัตโนมัติใน data/{dataset}/stark_qa โดยค่าเริ่มต้น เราให้การแยกอย่างเป็นทางการใน data/{dataset}/split

ข้อมูลฐานความรู้

มีสองวิธีในการโหลดข้อมูลฐานความรู้:

(แนะนำ) การดาวน์โหลดทันที: ข้อมูลฐานความรู้ของมาตรฐานทั้งสามจะถูกดาวน์โหลดและโหลด โดยอัตโนมัติ เมื่อตั้งค่า download_processed=True
ข้อมูลกระบวนการจาก RAW: เรายังให้รหัสการประมวลผลล่วงหน้าทั้งหมดของเราเพื่อความโปร่งใส ดังนั้นคุณสามารถประมวลผลข้อมูลดิบได้ตั้งแต่เริ่มต้นผ่านการตั้งค่า download_processed=False ในกรณีนี้ Stark-Primekg ใช้เวลาประมาณ 5 นาทีในการดาวน์โหลดและโหลดข้อมูลที่ประมวลผล Stark-Amazon และ Stark-Mag อาจใช้เวลาประมาณหนึ่งชั่วโมงในการประมวลผลจากข้อมูลดิบ

3) การประเมินผล

หากคุณกำลังใช้งาน Eval คุณสามารถติดตั้งแพ็คเกจต่อไปนี้:

pip install llm2vec gritlm bm25

การประเมินผลของเราต้องการการฝังเอกสารโหนดลงใน candidate_emb_dict.pt ซึ่งเป็นพจนานุกรม node_id -> torch.Tensor Embeddings แบบสอบถามจะถูกสร้างขึ้นโดยอัตโนมัติหากไม่มี คุณสามารถเรียกใช้สคริปต์ Python ต่อไปนี้เพื่อดาวน์โหลด embeddings แบบสอบถามและเอกสารฝังตัวที่สร้างขึ้นโดย text-embedding-ada-002 (เราให้พวกเขาเพื่อให้คุณสามารถวิ่งตามมาตรฐานของเราได้ทันที)
```
python emb_download.py --dataset amazon --emb_dir emb/
```
หรือคุณสามารถเรียกใช้รหัสต่อไปนี้เพื่อสร้างแบบสอบถามหรือเอกสารฝังตัวด้วยตัวเอง เช่น
```
python emb_generate.py --dataset amazon --mode query --emb_dir emb/ --emb_model text-embedding-ada-002
```
- dataset : หนึ่งใน amazon , mag หรือ prime
- mode : เนื้อหาที่จะฝังหนึ่งใน query หรือ doc (เอกสารโหนด)
- emb_dir : ไดเรกทอรีเพื่อจัดเก็บการฝังตัว
- emb_model : ชื่อ LLM เพื่อสร้างการฝังตัวเช่น text-embedding-ada-002 , text-embedding-3-large ,, voyage-large-2-instruct , GritLM/GritLM-7B , McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp
- ดู emb_generate.py สำหรับอาร์กิวเมนต์อื่น ๆ
เรียกใช้สคริปต์ Python สำหรับการประเมินผล เช่น
```
python eval.py --dataset amazon --model VSS --emb_dir emb/ --output_dir output/ --emb_model text-embedding-ada-002 --split test --save_pred 
```
```
python eval.py --dataset amazon --model VSS --emb_dir emb/ --output_dir output/ --emb_model GritLM/GritLM-7B --split test-0.1 --save_pred 
```
```
python eval.py --dataset amazon --model LLMReranker --emb_dir emb/ --output_dir output/ --emb_model text-embedding-ada-002 --split human_generated_eval --llm_model gpt-4-1106-preview --save_pred
```
คีย์ args:
- dataset : ชุดข้อมูลเพื่อประเมินหนึ่งใน amazon , mag หรือ prime
- model : แบบจำลองที่จะได้รับการประเมินหนึ่งใน BM25 , Colbertv2 , VSS , MultiVSS , LLMReranker
  - โปรดระบุชื่อของแบบจำลองการฝังด้วยอาร์กิวเมนต์ --emb_model
  - หากคุณใช้ LLMReranker โปรดระบุชื่อ LLM พร้อมอาร์กิวเมนต์ --llm_model
  - ระบุปุ่ม API ในบรรทัดคำสั่ง
```
 export ANTHROPIC_API_KEY=YOUR_API_KEY
```
    หรือ
```
 export OPENAI_API_KEY=YOUR_API_KEY
export OPENAI_ORG=YOUR_ORGANIZATION
```
    หรือ
```
 export VOYAGE_API_KEY=YOUR_API_KEY
```
- emb_dir : ไดเรกทอรีเพื่อจัดเก็บการฝังตัว
- split : การแยกเพื่อประเมินหนึ่งใน train , val , test , test-0.1 (ตัวอย่างสุ่ม 10%) และ human_generated_eval (เพื่อประเมินในชุดข้อมูลการสืบค้นมนุษย์ที่สร้างขึ้น)
- output_dir : ไดเรกทอรีเพื่อจัดเก็บเอาต์พุตการประเมินผล
- surfix : ระบุเมื่อ embeddings ที่เก็บไว้ในโฟลเดอร์ doc{surfix} หรือ query{surfix} , เช่น _no_compact,

อ้างอิง

โปรดพิจารณาอ้างถึงบทความของเราหากคุณใช้เกณฑ์มาตรฐานหรือรหัสในงานของคุณ:

 @inproceedings{wu24stark,
    title        = {STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases},
    author       = {
        Shirley Wu and Shiyu Zhao and 
        Michihiro Yasunaga and Kexin Huang and 
        Kaidi Cao and Qian Huang and 
        Vassilis N. Ioannidis and Karthik Subbian and 
        James Zou and Jure Leskovec
    },
    booktitle    = {NeurIPS Datasets and Benchmarks Track},
    year         = {2024}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-17
ขนาด 3.27MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด