ที่เก็บนี้มีรหัสและทรัพยากรทั้งหมดที่เกี่ยวข้องกับวิทยานิพนธ์หลักของฉันในหัวข้อ
"การสร้างแบบจำลองภาษาประสาทที่เกิดขึ้นซ้ำ - การใช้การเรียนรู้การถ่ายโอนเพื่อดำเนินการประโยครังสีที่สมบูรณ์"
บทคัดย่อ: ได้รับแรงบันดาลใจจากประโยชน์ที่อาจเกิดขึ้นจากระบบที่เร่งกระบวนการเขียนรายงานรังสีเรานำเสนอแบบจำลองภาษาเครือข่ายประสาทที่เกิดขึ้นซ้ำสำหรับการสร้างแบบจำลองภาษารังสี เราแสดงให้เห็นว่าแบบจำลองภาษาประสาทที่เกิดขึ้นอีกสามารถใช้ในการสร้างรายงานรังสีที่น่าเชื่อถือและตรวจสอบว่าประสิทธิภาพของพวกเขาสามารถปรับปรุงได้อย่างไรโดยใช้การทำให้เป็นมาตรฐานขั้นสูงและเทคนิคการเริ่มต้น นอกจากนี้เรายังศึกษาการใช้การเรียนรู้การถ่ายโอนเพื่อสร้างแบบจำลองภาษาเฉพาะหัวข้อ
ข้อมูลดั้งเดิมที่ใช้ในวิทยานิพนธ์เป็นความลับ ดังนั้นที่เก็บนี้จึงมีรหัสเวอร์ชันที่ทำงานบนชุดข้อมูล Penn TreeBank ที่นี่
ในการเรียกใช้รหัสคุณจะต้องประมวลผลข้อมูลล่วงหน้าก่อน รายละเอียดเพิ่มเติมเกี่ยวกับเรื่องนี้สามารถพบได้ในโฟลเดอร์ SRC/Data/
โดยการปรับไฟล์กำหนดค่าคุณสมบัติต่อไปนี้สามารถทดสอบได้:
วิทยานิพนธ์และสไลด์สามารถพบได้ในโฟลเดอร์ รายงาน
├── LICENSE
├── README.md <- The top-level README
├── data
│ ├── raw <- Original PTB files
│ ├── training_files <- Preprocessed PTB word ids
│ └── embeddings <- word embeddings
│ │
│ ├── fasttext
│ └── word2vec
│
├── models <- Trained and serialized models
│ ├── checkpoints <- Model checkpoints
│ └── tensorboard <- Tensorboard logs
│
├── reports <- Thesis and presentation slides
│
├── requirements.txt <- The requirements file for reproducing the analysis environment
│
├── src <- Source code for use in this project.
│ │
│ ├── __init__.py <- Makes src a Python module
│ │
│ ├── main.py <- main file for training, testing, etc.
│ │
│ ├── config_ptb.yamp <- config file, specifying model params
│ │
│ ├── data <- scripts to preprocess data
│ │ │
│ │ ├── README.md
│ │ ├── preprocess_ptb.py
│ │ └── inverse_dict.py
│ │
│ ├── embeddings <- scripts to train word embeddings
│ │ │
│ │ ├── README.md
│ │ ├── fasttext.py
│ │ └── word2vec.py
│ │
│ ├── models <- Scripts to train models and then use trained models to make predictions
│ │ │
│ │ └── ptb_basic_model.py
│ │
│ └── visualization <- Scripts to create exploratory and results oriented visualizations
│ │
│ ├── README.md
│ └── visualize_embeddings.py
│
└──
โครงการตามเทมเพลตโครงการ CookieCutter Data Science #CookieCutterDatascience