OpenNMT py Download - OpenNMT py Source Source Download

OpenNMT py

โค้ดแหล่งที่มา AI

v3.5.1

ดาวน์โหลด

ประกาศ: OpenNMT-PY ไม่ได้รับการสนับสนุนอย่างแข็งขันอีกต่อไป

เราเริ่มโครงการใหม่ที่มีอยู่ใน GitHub

มันเป็นแบบแยกของ OpenNMT-PY ในแง่ของคุณสมบัติ แต่เราได้ปรับปรุงสิ่งต่าง ๆ มากมาย

eole จัดการ NMT, LLM, encoders รวมถึงแนวคิดใหม่ของตัวประมาณค่าภายในโมเดล NMT ดูโพสต์นี้และข่าวนี้

หากคุณเป็นนักพัฒนาให้สลับทันที หากคุณเป็นผู้ใช้เท่านั้นเราจะเผยแพร่เวอร์ชัน PY-PI แรกในไม่ช้า

OpenNMT-PY: การแปลระบบประสาทโอเพ่นซอร์สและรูปแบบภาษา (ขนาดใหญ่)

OpenNMT-PY เป็นรุ่น Pytorch ของโครงการ OpenNMT ซึ่งเป็นกรอบการแปลของเครื่องประสาทโอเพนซอร์ซ (MIT) (และอื่น ๆ !) มันถูกออกแบบมาให้วิจัยเป็นมิตรเพื่อลองแนวคิดใหม่ ๆ ในการแปลการสร้างแบบจำลองภาษาการสรุปและงาน NLP อื่น ๆ อีกมากมาย บาง บริษัท ได้พิสูจน์แล้วว่ารหัสนั้นพร้อมที่จะผลิต

เรารักการมีส่วนร่วม! โปรดดูปัญหาที่ทำเครื่องหมายด้วยแท็กยินดีต้อนรับ

ก่อนที่จะมีปัญหาให้แน่ใจว่าคุณได้อ่านข้อกำหนดและตัวอย่างเอกสารฉบับเต็ม

เว้นแต่จะมีข้อผิดพลาดโปรดใช้ฟอรัมหรือ Gitter เพื่อถามคำถาม

สำหรับผู้เริ่มต้น:

มี tuto ทีละขั้นตอนและอธิบาย (ขอบคุณ Yasmin Moslem): การสอน

โปรดลองอ่านและ/หรือติดตามก่อนที่จะหาปัญหามือใหม่

มิฉะนั้นคุณสามารถดูขั้นตอน QuickStart ได้

ใหม่:

คุณจะต้องมี pytorch v2 ที่ดีกว่า v2.2 ซึ่งแก้ไขปัญหา scaled_dot_product_attention บางอย่าง
การสนับสนุน LLM กับตัวแปลงสำหรับ: llama (+ mistral), Openllama, Redpajama, MPT-7B, Falcon
รองรับปริมาณ 8 บิตและ 4 บิตพร้อมกับอะแดปเตอร์ LORA โดยมีหรือไม่มีจุดตรวจ
คุณสามารถ FINETUNE 7B และ 13B รุ่นบน RTX 24GB เดียวพร้อมปริมาณ 4 บิต
การอนุมานสามารถถูกบังคับใน 4/8 บิตโดยใช้การหาปริมาณเลเยอร์เดียวกันกับในการปรับระดับ
Tensor Parallelism เมื่อโมเดลไม่พอดีกับหน่วยความจำของ GPU หนึ่งตัว (ทั้งการฝึกอบรมและการอนุมาน)
เมื่อโมเดลของคุณถูก finetuned คุณสามารถเรียกใช้การอนุมานด้วย OpenNMT-PY หรือเร็วขึ้นด้วย CTRANSLATE2
สคริปต์การประเมินผล MMLU ดูผลลัพธ์ที่นี่

สำหรับ USEcases ทั้งหมดรวมถึง NMT ตอนนี้คุณสามารถใช้หลายทางแทนที่จะเป็นความสนใจแบบหลายหัว (เร็วขึ้นในการฝึกอบรมและการอนุมาน) และลบอคติออกจากเชิงเส้นทั้งหมด (QKV รวมถึงโมดูล Feedforward)

หากคุณใช้ OpenNMT-PY เวอร์ชันก่อนหน้าคุณสามารถตรวจสอบการเปลี่ยนแปลงหรือการเปลี่ยนแปลงที่แตกหัก

บทเรียน:

วิธีการทำซ้ำ Vicuna ด้วย 7B หรือ 13B LLAMA (หรือ Open Llama, MPT-7B, Redpajama) รูปแบบภาษา: Tuto Vicuna
วิธีการ finetune NLLB-200 ด้วยชุดข้อมูลของคุณ: tuto finetune NLLB-200
วิธีสร้างเซิร์ฟเวอร์ REST OPENNMT-PY อย่างง่าย: TUTO REST
วิธีสร้างเว็บอินเตอร์เฟสอย่างง่าย: Tuto Streamlit
ทำซ้ำการทดลอง wmt17 en-de: wmt17 ende

การตั้งค่า

ใช้นักเทียบท่า

เพื่ออำนวยความสะดวกในการตั้งค่าและการทำซ้ำรูปภาพ Docker บางภาพจะมีให้บริการผ่าน GitHub Container Registry: https://github.com/opennmt/opennmt-py/pkgs/container/opennmt-py

คุณสามารถปรับเวิร์กโฟลว์และสร้างภาพของคุณเองขึ้นอยู่กับความต้องการเฉพาะโดยใช้ build.sh และ Dockerfile ในไดเรกทอรี docker ของ repo

 docker pull ghcr.io/opennmt/opennmt-py:3.4.3-ubuntu22.04-cuda12.1

ตัวอย่าง OneLiner เพื่อเรียกใช้คอนเทนเนอร์และเปิดเปลือกทุบตีภายใน

 docker run --rm -it --runtime=nvidia ghcr.io/opennmt/opennmt-py:test-ubuntu22.04-cuda12.1

หมายเหตุ: คุณต้องมีชุดเครื่องมือคอนเทนเนอร์ NVIDIA (เดิมชื่อ NVIDIA-DOCKER) ที่ติดตั้งเพื่อใช้ประโยชน์จากคุณสมบัติ CUDA/GPU อย่างถูกต้อง

ขึ้นอยู่กับความต้องการของคุณคุณสามารถเพิ่มธงต่างๆ:

-p 5000:5000 เพื่อส่งต่อพอร์ตที่เปิดออกจากคอนเทนเนอร์ของคุณไปยังโฮสต์ของคุณ
-v /some/local/directory:/some/container/directory เพื่อติดตั้งไดเรกทอรีท้องถิ่นบางตัวไปยังไดเรกทอรีคอนเทนเนอร์บางตัว;
--entrypoint some_command เพื่อเรียกใช้คำสั่งเฉพาะบางส่วนเป็นจุดเข้าคอนเทนเนอร์ (แทนที่จะเป็นเชลล์ทุบตีเริ่มต้น);

การติดตั้งในพื้นที่

Opennmt-py ต้องการ:

Python> = 3.8
pytorch> = 2.0 <2.2

ติดตั้ง OpenNMT-py จาก pip :

pip install OpenNMT-py

หรือจากแหล่งที่มา:

git clone https://github.com/OpenNMT/OpenNMT-py.git
cd OpenNMT-py
pip install -e .

หมายเหตุ: หากคุณพบ MemoryError ในระหว่างการติดตั้งให้ลองใช้ pip กับ --no-cache-dir

(ไม่บังคับ) คุณสมบัติขั้นสูงบางอย่าง (เช่นรุ่นที่ผ่านการฝึกอบรมหรือการแปลงเฉพาะ) ต้องการแพ็คเกจเพิ่มเติมคุณสามารถติดตั้งได้ด้วย:

pip install -r requirements.opt.txt

การติดตั้งด้วยตนเองของการพึ่งพาบางอย่าง

ขอแนะนำให้ Apex มีประสิทธิภาพที่รวดเร็ว (โดยเฉพาะอย่างยิ่งตัวเพิ่มประสิทธิภาพแบบดั้งเดิม Fusedadam และ FusedRmsnorm)

git clone https://github.com/NVIDIA/apex
cd apex
pip3 install -v --no-build-isolation --config-settings --build-option= " --cpp_ext --cuda_ext --deprecated_fused_adam --xentropy --fast_multihead_attn " ./
cd ..

ความสนใจแฟลช:

ณ เดือนตุลาคม 2023 Flash Attention 1 ได้รับการอัปสตรีมไปยัง Pytorch V2 แต่ขอแนะนำให้ใช้ Flash Attention 2 กับ V2.3.1 สำหรับการรองรับความสนใจของหน้าต่างเลื่อน

เมื่อใช้ตำแหน่งปกติ position_encoding=True หรือโรตารี่กับ max_relative_positions=-1 opennmt-py จะพยายามใช้เส้นทาง dot-product ที่ดีที่สุด

หากคุณต้องการใช้ความสนใจของแฟลชคุณต้องติดตั้งด้วยตนเองก่อน:

pip install flash-attn --no-build-isolation

หากไม่ได้ติดตั้งแฟลชความสนใจ 2 เราจะใช้ F.scaled_dot_product_attention จาก pytorch 2.x

เมื่อใช้ max_relative_positions > 0 หรือ alibi max_relative_positions=-2 opennmt-py จะใช้รหัสดั้งเดิมสำหรับการคูณเมทริกซ์

Flash Attention และ F.scaled_dot_product_attention เร็วขึ้นเล็กน้อยและบันทึกหน่วยความจำ GPU บางส่วน

awq:

หากคุณต้องการเรียกใช้การอนุมานหรือสร้างปริมาณแบบจำลอง AWQ คุณจะต้องใช้ AutoAWQ

สำหรับ AutoAWQ: PIP ติดตั้ง autoAwq

เอกสารและคำถามที่พบบ่อย

เอกสาร HTML เต็มรูปแบบ

คำถามที่พบบ่อย

กิตติกรรมประกาศ

OpenNMT-PY ดำเนินการเป็นโครงการโอเพนซอร์ซที่ทำงานร่วมกัน โครงการถูกบ่มโดย Systran และ Harvard NLP ในปี 2559 ใน Lua และส่งไปยัง Pytorch ในปี 2560

ผู้ดูแลปัจจุบัน (ตั้งแต่ปี 2561):

François Hernandez Vincent Nguyen (Seedfall)

การอ้างอิง

หากคุณใช้ OpenNMT-PY สำหรับงานวิชาการโปรดอ้างอิงเอกสารสาธิตระบบเริ่มต้นที่เผยแพร่ใน ACL 2017:

 @misc{klein2018opennmt,
      title={OpenNMT: Neural Machine Translation Toolkit}, 
      author={Guillaume Klein and Yoon Kim and Yuntian Deng and Vincent Nguyen and Jean Senellart and Alexander M. Rush},
      year={2018},
      eprint={1805.11462},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v3.5.1
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-07
ขนาด 88.81MB
มาจาก Github

แอปที่เกี่ยวข้อง

sentinel1 orbits py

2024-11-08
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด