ดาวน์โหลด HPT - ดาวน์โหลดซอร์สโค้ด HPT

HPT

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

HPT - เปิดโมเดลภาษาขนาดใหญ่หลายรูปแบบ

Hyper-Pretrained Transformers (HPT) เป็นกรอบ LLM แบบหลายรูปแบบใหม่จาก Hypergai และได้รับการฝึกฝนสำหรับแบบจำลองภาษาวิสัยทัศน์ที่สามารถเข้าใจทั้งอินพุตที่เป็นข้อความและภาพ HPT ได้รับผลลัพธ์ที่มีการแข่งขันสูงด้วยโมเดลที่ล้ำสมัยบนเกณฑ์มาตรฐาน LLM ที่หลากหลาย พื้นที่เก็บข้อมูลนี้มีการใช้งานรหัสการอนุมานโอเพ่นซอร์สเพื่อทำซ้ำผลการประเมินผลของ HPT บนมาตรฐานที่แตกต่างกัน

ปล่อย

[6/06] ปล่อย HPT 1.5 Edge รุ่นโอเพนซอร์ซล่าสุดของเราที่เหมาะกับอุปกรณ์ขอบ แม้จะมีขนาด (<5b), Edge แสดงให้เห็นถึงความสามารถที่น่าประทับใจในขณะที่มีประสิทธิภาพมาก HPT 1.5 Edge มีให้บริการต่อสาธารณะใน [HuggingFace Repository] โปรดอ่าน [โพสต์บล็อกทางเทคนิค] ของเราสำหรับรายละเอียดเพิ่มเติม
[5/03] HPT 1.5 Air , LLM 8B Multimodal Open-Sourced ที่ดีที่สุดของเราพร้อม Llama 3. สร้างขึ้นด้วย Meta Llama 3, Air HPT 1.5 ที่มีความสามารถสูงของเรา HPT Air 1.5 ได้ผลลัพธ์ที่ดีที่สุดในบรรดารุ่น <10b ในเกณฑ์มาตรฐานที่ท้าทาย (MMMU, สมเด็จพระสันตะปาปา, Seed-I และอื่น ๆ ) HPT 1.5 Air มีให้บริการในที่สาธารณะใน [HuggingFace Repository] โปรดอ่าน [โพสต์บล็อกทางเทคนิค] ของเราสำหรับรายละเอียดเพิ่มเติม
[3/16] HPT 1.0 Air ออกมาซึ่งเป็นแบบจำลองที่มีประสิทธิภาพมากที่สุดของเราในฐานะโซลูชันที่คุ้มค่าซึ่งสามารถแก้ปัญหาการมองเห็นและภาษาที่หลากหลาย HPT 1.0 Air เป็นแบบสาธารณะและได้รับผลลัพธ์ที่ล้ำสมัยในทุกรุ่น LLM แบบโอเพนซอร์ซที่มีขนาดใกล้เคียงกันหรือเล็กกว่าในเกณฑ์มาตรฐาน MMMU ที่ท้าทาย โปรดอ่าน [โพสต์บล็อกทางเทคนิคของเรา] และ [HuggingFace Repository] สำหรับรายละเอียดเพิ่มเติม

เราเปิดตัว HPT 1.5 Edge เป็นโมเดลโอเพ่นซอร์สล่าสุดของเราที่เหมาะกับอุปกรณ์ขอบ แม้จะมีขนาด (<5b), Edge แสดงให้เห็นถึงความสามารถที่น่าประทับใจในขณะที่มีประสิทธิภาพมาก เราปล่อย HPT 1.5 Edge ต่อสาธารณะที่ HuggingFace และ GitHub ภายใต้ใบอนุญาต Apache 2.0

สารบัญ

ภาพรวมของโมเดล acchitecture
เริ่มต้นอย่างรวดเร็ว
- การติดตั้ง
- เตรียมโมเดล
- การสาธิต
การประเมินผล
เกณฑ์มาตรฐาน
แบบจำลองที่ใช้แล้ว
ข้อจำกัดความรับผิดชอบและการใช้งานที่รับผิดชอบ
ติดต่อเรา
ใบอนุญาต
กิตติกรรมประกาศ

ภาพรวมของโมเดล acchitecture

เริ่มต้นอย่างรวดเร็ว

การติดตั้ง

 pip install -r requirements.txt
pip install -e .

เตรียมโมเดล

คุณสามารถดาวน์โหลดน้ำหนักรุ่นจาก HF ลงใน [เส้นทางท้องถิ่น] ของคุณและตั้งค่า global_model_path เป็น [เส้นทางท้องถิ่น] ของคุณในไฟล์กำหนดค่าโมเดล:

 git lfs install
git clone https://huggingface.co/HyperGAI/HPT1_5-Edge [Local Path]

นอกจากนี้คุณยังสามารถตั้งค่ากลยุทธ์อื่น ๆ ในไฟล์กำหนดค่าที่แตกต่างจากการตั้งค่าเริ่มต้นของเรา

การสาธิต

หลังจากตั้งค่าไฟล์ config แล้วให้เปิดการสาธิตแบบจำลองเพื่อทดลองใช้อย่างรวดเร็ว:

 python demo/demo.py --image_path [Image]  --text [Text]  --model [Config]

ตัวอย่าง:

 python demo/demo.py --image_path demo/einstein.jpg  --text 'What is unusual about this image?'  --model hpt-edge-1-5

การประเมินผล

เปิดตัวแบบจำลองสำหรับการประเมินผล:

 torchrun --nproc-per-node=8 run.py --data [Dataset] --model [Config]

ตัวอย่างสำหรับ HPT 1.5 Edge:

 torchrun --nproc-per-node=8 run.py --data MMMU_DEV_VAL --model hpt-edge-1-5

เกณฑ์มาตรฐาน

สำหรับ HPT 1.5 Edge

ผลลัพธ์ส่วนใหญ่ที่นำเสนอนั้นมาจากรายงานดั้งเดิมของแบบจำลองในขณะที่เอกสารอื่น ๆ มาจากการประเมินค่า phi-3-vision ซึ่งเราทำเครื่องหมายด้วยเครื่องหมายดอกจัน (*)
ผลการวัดผลของ HPT1.5 Air และ HPT1.0 อยู่ในไดเรกทอรีสินทรัพย์

แบบจำลองที่ใช้แล้ว

HPT 1.5 Edge

Pretrained LLM: PHI-3-MINI-4K-Instruct
Pretraned Visual encoder: Siglip-SO400m-Patch14-384

HPT 1.5 Air

Pretrained LLM: LLAMA3-8B-Instruct
Pretraned Visual encoder: Siglip-SO400m-Patch14-384

HPT 1.0 Air

pretrained llm: yi-6b-chat
ตัวเข้ารหัสภาพที่ได้รับการฝึกฝนมาก่อน: คลิป-ขนาดใหญ่-แพทช์ 14-336

ข้อจำกัดความรับผิดชอบและการใช้งานที่รับผิดชอบ

โปรดทราบว่า HPT Air เป็นการเปิดตัวแบบเปิดอย่างรวดเร็วของเราเพื่ออำนวยความสะดวกในการวิจัย AI ที่เปิดกว้างและรับผิดชอบการพัฒนาชุมชน มันไม่มีกลไกการกลั่นกรองใด ๆ และไม่รับประกันผลลัพธ์ของพวกเขา เราหวังว่าจะมีส่วนร่วมกับชุมชนในการสร้างแบบจำลองให้ความเคารพอย่างประณีตเพื่ออนุญาตให้มีการรับเลี้ยงบุตรบุญธรรมในการใช้งานจริงในแอปพลิเคชันในโลกแห่งความเป็นจริงที่ต้องใช้ผลลัพธ์ที่ได้รับการดูแล

ติดต่อเรา

ติดต่อ: [email protected]
ติดตามเราบน Twitter
ติดตามเราที่ LinkedIn
เยี่ยมชมเว็บไซต์ของเราเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับเรา

ใบอนุญาต

โครงการนี้เปิดตัวภายใต้ใบอนุญาต Apache 2.0 บางส่วนของโครงการนี้มีรหัสและรูปแบบจากแหล่งอื่น ๆ ซึ่งอยู่ภายใต้ใบอนุญาตของตนและคุณต้องใช้ใบอนุญาตที่เกี่ยวข้องหากคุณต้องการใช้เพื่อวัตถุประสงค์ทางการค้า

กิตติกรรมประกาศ

รหัสการประเมินผลสำหรับการใช้งานการสาธิตนี้ถูกขยายออกไปตามโครงการ VLMevalkit นอกจากนี้เรายังขอขอบคุณ OpenAI สำหรับการเปิดตัวโมเดล Visual Encoder ของพวกเขา, 01.AI, Meta และ Microsoft สำหรับการเปิดแหล่งภาษาขนาดใหญ่ของพวกเขา

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-08
ขนาด 2.57MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด