transfer nlp ดาวน์โหลด - transfer nlp ดาวน์โหลด

transfer nlp

ซอร์สโค้ดอื่น ๆ

Make PyTorch an optional dependency

ดาวน์โหลด

ยินดีต้อนรับสู่ Transfer NLP Library กรอบการทำงานที่สร้างขึ้นบน Pytorch เพื่อส่งเสริมการทดลองที่ทำซ้ำและถ่ายโอนการเรียนรู้ใน NLP

คุณสามารถมีภาพรวมของ API ระดับสูงในสมุดบันทึก Colab นี้ซึ่งแสดงวิธีการใช้เฟรมเวิร์กในหลาย ๆ ตัวอย่าง ตัวอย่างที่ใช้ DL ทั้งหมดในสมุดบันทึกเหล่านี้ฝังการตรวจสอบการฝึกอบรม Tensorboard ในเซลล์!

สำหรับตัวอย่างของการฝึกอบรมแบบจำลองก่อนหน้านี้เราให้การสอนแบบเรียกใช้งานสั้น ๆ เกี่ยวกับ bertclassifier finetuning ในสมุดบันทึก colab นี้

ตั้งค่าสภาพแวดล้อมของคุณ

 mkvirtualenv transfernlp
workon transfernlp

git clone https://github.com/feedly/transfer-nlp.git
cd transfer-nlp
pip install -r requirements.txt

เพื่อใช้การถ่ายโอน NLP เป็นห้องสมุด:

 # to install the experiment builder only
pip install transfernlp
# to install Transfer NLP with PyTorch and Transfer Learning in NLP support
pip install transfernlp[torch]

หรือ

 pip install git+https://github.com/feedly/transfer-nlp.git

เพื่อให้ได้สถานะล่าสุดก่อนที่จะออกใหม่

เพื่อใช้การถ่ายโอน NLP พร้อมตัวอย่างที่เกี่ยวข้อง:

 git clone https://github.com/feedly/transfer-nlp.git
pip install -r requirements.txt

เอกสาร

เอกสาร API และภาพรวมของห้องสมุดสามารถดูได้ที่นี่

ตัวจัดการการทดลองที่ทำซ้ำได้

แกนกลางของไลบรารีทำจากตัวสร้างการทดลอง: คุณกำหนดวัตถุต่าง ๆ ที่การทดสอบของคุณต้องการและตัวโหลดการกำหนดค่าสร้างพวกเขาในวิธีที่ดี สำหรับการวิจัยที่ทำซ้ำได้และการศึกษาการระเหยง่ายห้องสมุดจะบังคับใช้การใช้ไฟล์การกำหนดค่าสำหรับการทดลอง เนื่องจากผู้คนมีรสนิยมที่แตกต่างกันสำหรับสิ่งที่ถือเป็นไฟล์การทดลองที่ดีห้องสมุดอนุญาตให้มีการทดลองที่กำหนดไว้ในหลายรูปแบบ:

พจนานุกรม Python
JSON
ยม
Toml

ใน Transfer-NLP ไฟล์กำหนดค่าการทดลองมีข้อมูลที่จำเป็นทั้งหมดเพื่อกำหนดการทดสอบทั้งหมด นี่คือที่ที่คุณจะแทรกชื่อของส่วนประกอบต่าง ๆ การทดลองของคุณจะใช้พร้อมกับพารามิเตอร์ไฮเปอร์พารามิเตอร์ที่คุณต้องการใช้ Transfer-NLP ใช้ประโยชน์จากการผกผันของรูปแบบการควบคุมซึ่งช่วยให้คุณสามารถกำหนดคลาส / เมธอด / ฟังก์ชั่นใด ๆ ที่คุณต้องการคลาส ExperimentConfig จะสร้าง DictionNary และติดตั้งวัตถุของคุณตามลำดับ

ในการใช้คลาสของคุณเองภายใน Transfer-NLP คุณต้องลงทะเบียนโดยใช้ @register_plugin Decorator แทนที่จะใช้รีจิสทรีที่แตกต่างกันสำหรับแต่ละส่วนประกอบ (โมเดลตัวโหลดข้อมูล vectorizers, Optimizers, ... ) มีการใช้รีจิสทรีเดียวเท่านั้นที่นี่เพื่อบังคับใช้การปรับแต่งทั้งหมด

หากคุณใช้การถ่ายโอน NLP เป็นการพึ่งพา dev เท่านั้นคุณอาจต้องการใช้มันอย่างประกาศเฉพาะและโทรลง register_plugin() บนวัตถุที่คุณต้องการใช้เมื่อเวลาทำงานทดลอง

นี่คือตัวอย่างของวิธีที่คุณสามารถกำหนดการทดสอบในไฟล์ YAML:

 data_loader:
  _name: MyDataLoader
  data_parameter: foo
  data_vectorizer:
    _name: MyVectorizer
    vectorizer_parameter: bar

model:
  _name: MyModel
  model_hyper_param: 100
  data: $data_loader

trainer:
  _name: MyTrainer
  model: $model
  data: $data_loader
  loss:
    _name: PyTorchLoss
  tensorboard_logs: $HOME/path/to/tensorboard/logs
  metrics:
    accuracy:
      _name: Accuracy

วัตถุใด ๆ สามารถกำหนดได้ผ่านคลาสวิธีการหรือฟังก์ชันที่ได้รับพารามิเตอร์ _name ตามด้วยพารามิเตอร์ของตัวเอง การทดลองจะถูกโหลดและอินสแตนซ์โดยใช้ ExperimentConfig(experiment=experiment_path_or_dict)

ข้อควรพิจารณาบางประการ:

พารามิเตอร์ค่าเริ่มต้นสามารถข้ามไปในไฟล์การทดลอง
หากวัตถุถูกใช้ในสถานที่ต่าง ๆ คุณสามารถอ้างอิงได้โดยใช้สัญลักษณ์ $ ตัวอย่างเช่นที่นี่วัตถุ trainer จะใช้อินสแตนซ์ data_loader ที่อื่น ไม่จำเป็นต้องสั่งซื้อวัตถุ
สำหรับเส้นทางคุณอาจต้องการใช้ตัวแปรสภาพแวดล้อมเพื่อให้เครื่องอื่นสามารถเรียกใช้การทดลองของคุณ ในตัวอย่างก่อนหน้านี้คุณจะเรียกใช้เช่น ExperimentConfig(experiment=yaml_path, HOME=Path.home()) เพื่อสร้างอินสแตนซ์การทดลองและแทนที่ $HOME โดยเส้นทางของเครื่องจักรของคุณ
อินสแตนซ์การกำหนดค่าอนุญาตให้ตั้งค่าที่ซับซ้อนใด ๆ ที่มีคำสั่ง / รายการซ้อนกัน

คุณสามารถดูการทดสอบสำหรับตัวอย่างการตั้งค่าการทดลองที่ตัวโหลด config สามารถสร้างได้ นอกจากนี้เรายังให้การทดลองที่รันได้ใน experiments/

ถ่ายโอนการเรียนรู้ใน NLP: ผู้ฝึกสอน Pytorch ที่ยืดหยุ่น

สำหรับการทดลองการเรียนรู้อย่างลึกซึ้งเรามี BaseIgniteTrainer ใน transfer_nlp.plugins.trainers.py เทรนเนอร์พื้นฐานนี้จะใช้แบบจำลองและข้อมูลบางอย่างเป็นอินพุตและเรียกใช้ท่อฝึกอบรมทั้งหมด เราใช้ประโยชน์จากห้องสมุด Pytorch-Ignite เพื่อตรวจสอบเหตุการณ์ในระหว่างการฝึกอบรม (การบันทึกตัวชี้วัดบางอย่างการจัดการอัตราการเรียนรู้รูปแบบจุดตรวจสอบ ฯลฯ ... ) บันทึก Tensorboard ยังรวมอยู่ในตัวเลือกคุณจะต้องระบุเส้นทางพารามิเตอร์ Simple tensorboard_logs ในไฟล์ config จากนั้นเพียงเรียกใช้ tensorboard --logdir=path/to/logs ในเทอร์มินัลและคุณสามารถตรวจสอบการทดลองของคุณในขณะที่กำลังฝึกอบรม! Tensorboard มาพร้อมกับยูทิลิตี้ที่ดีมากเพื่อติดตามบรรทัดฐานของน้ำหนักโมเดลของคุณฮิสโตแกรมการแจกแจงการแสดงภาพการฝังตัว ฯลฯ ดังนั้นเราขอแนะนำให้ใช้มันจริงๆ

เราให้บริการคลาส SingleTaskTrainer ซึ่งคุณสามารถใช้สำหรับการตั้งค่าภายใต้การดูแลใด ๆ ที่เกี่ยวข้องกับงานเดียว เรากำลังทำงานในคลาส MultiTaskTrainer เพื่อจัดการกับการตั้งค่างานที่หลากหลายและ SingleTaskFineTuner สำหรับการตั้งค่าแบบจำลองขนาดใหญ่

ใช้เคส

นี่คือกรณีการใช้งานเล็กน้อยสำหรับการถ่ายโอน NLP:

คุณมีคลาส / วิธีการ / ฟังก์ชั่นทั้งหมดของคุณพร้อม การถ่ายโอน NLP ช่วยให้วิธีที่สะอาดในการรวมศูนย์การโหลดและดำเนินการทดลองของคุณ
คุณมีคลาสทั้งหมดของคุณ แต่คุณต้องการเปรียบเทียบการตั้งค่าการกำหนดค่าที่หลากหลาย: คลาส ExperimentRunner อนุญาตให้เรียกใช้ชุดการทดลองของคุณตามลำดับและสร้างการรายงานส่วนบุคคล (คุณต้องใช้วิธี report ของคุณในคลาส ReporterABC ที่กำหนดเอง)
คุณต้องการทดลองกับโมเดลการเรียนรู้อย่างลึกซึ้ง แต่คุณรู้สึกว่ารหัสหม้อต้มทั้งหมดในโครงการ SOTA รุ่น GitHub Transfer NLP ส่งเสริมการแยกวัตถุสำคัญเพื่อให้คุณสามารถมุ่งเน้นไปที่การใช้ Module Pytorch และให้ผู้ฝึกสอนจัดการกับส่วนการฝึกอบรม (ในขณะที่ยังคงควบคุมพารามิเตอร์การฝึกอบรมส่วนใหญ่ผ่านไฟล์การทดลอง)
คุณต้องการทดลองใช้กลยุทธ์การฝึกอบรมขั้นสูง แต่คุณสนใจแนวคิดมากกว่ารายละเอียดการใช้งาน เรากำลังดำเนินการปรับปรุงผู้ฝึกสอนขั้นสูงเพื่อให้ง่ายต่อการลองใช้ความคิดใหม่ ๆ สำหรับการตั้งค่าหลายงานกลยุทธ์การปรับจูนหรือรูปแบบการปรับแบบจำลอง

การรวมเข้าด้วยกัน

ในขณะที่ทดลองกับโมเดล / ข้อมูลของคุณเองการฝึกอบรมอาจใช้เวลาพอสมควร หากต้องการได้รับการแจ้งเตือนเมื่อการฝึกอบรมของคุณเสร็จสิ้นหรือขัดข้องคุณสามารถใช้ห้องสมุดง่าย ๆ Knockknock โดยคนที่ HuggingFace ซึ่งเพิ่มมัณฑนากรที่เรียบง่ายให้กับฟังก์ชั่นการทำงานของคุณเพื่อแจ้งให้คุณทราบผ่านทางหย่อนอีเมล ฯลฯ

วัตถุประสงค์บางอย่างที่จะไปถึง:

รวมถึงตัวอย่างที่ใช้แบบจำลองที่ทันสมัย
รวมถึงคุณสมบัติทางภาษากับโมเดล
ทดลองกับ RL สำหรับงานต่อเนื่อง
รวมงานตรวจสอบเพื่อพยายามทำความเข้าใจคุณสมบัติที่เรียนรู้โดยแบบจำลอง

การรับทราบ

ห้องสมุดได้รับแรงบันดาลใจจากการอ่าน "การประมวลผลภาษาธรรมชาติด้วย Pytorch" โดย Delip Rao และ Brian McMahan การทดลองใน experiments การสร้างคำศัพท์และการฝังตัวเพื่อนบ้านที่ใกล้ที่สุดจะถูกนำหรือดัดแปลงจากรหัสที่ให้ไว้ในหนังสือ

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน Make PyTorch an optional dependency
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-19
ขนาด 2.61MB
มาจาก Github

แอปที่เกี่ยวข้อง

Parameter Efficient Transfer Learning Benchmark

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด