يحتوي هذا المستودع على جميع التعليمات البرمجية والموارد المتعلقة بأطروحتي الرئيسية حول الموضوع
"نمذجة اللغة العصبية المتكررة - باستخدام التعلم النقل لأداء إكمال الجملة الإشعاعية"
الخلاصة: بدافع من الفوائد المحتملة للنظام الذي يسرع عملية كتابة التقارير الإشعاعية ، نقدم نموذج لغة الشبكة العصبية المتكررة لنمذجة اللغة الإشعاعية. نوضح أنه يمكن استخدام نماذج اللغة العصبية المتكررة لإنتاج تقارير إشعاعية مقنعة والتحقيق في كيفية تحسين أدائها باستخدام تقنيات التنظيم والتهيئة المتقدمة. علاوة على ذلك ، ندرس استخدام التعلم النقل لإنشاء نماذج لغة خاصة بالموضوع.
البيانات الأصلية المستخدمة في الأطروحة سرية. لذلك ، يتميز هذا المستودع بإصدار من الكود الذي يتم تشغيله على مجموعة بيانات Penn TreeBank المتوفرة هنا.
لتشغيل الرمز ، سيتعين عليك معالجة البيانات مسبقًا أولاً. يمكن العثور على مزيد من التفاصيل حول هذا في المجلد SRC/DATA/
عن طريق تكييف ملف التكوين ، يمكن اختبار الميزات التالية:
يمكن العثور على الأطروحة والشرائح في مجلد التقارير
├── LICENSE
├── README.md <- The top-level README
├── data
│ ├── raw <- Original PTB files
│ ├── training_files <- Preprocessed PTB word ids
│ └── embeddings <- word embeddings
│ │
│ ├── fasttext
│ └── word2vec
│
├── models <- Trained and serialized models
│ ├── checkpoints <- Model checkpoints
│ └── tensorboard <- Tensorboard logs
│
├── reports <- Thesis and presentation slides
│
├── requirements.txt <- The requirements file for reproducing the analysis environment
│
├── src <- Source code for use in this project.
│ │
│ ├── __init__.py <- Makes src a Python module
│ │
│ ├── main.py <- main file for training, testing, etc.
│ │
│ ├── config_ptb.yamp <- config file, specifying model params
│ │
│ ├── data <- scripts to preprocess data
│ │ │
│ │ ├── README.md
│ │ ├── preprocess_ptb.py
│ │ └── inverse_dict.py
│ │
│ ├── embeddings <- scripts to train word embeddings
│ │ │
│ │ ├── README.md
│ │ ├── fasttext.py
│ │ └── word2vec.py
│ │
│ ├── models <- Scripts to train models and then use trained models to make predictions
│ │ │
│ │ └── ptb_basic_model.py
│ │
│ └── visualization <- Scripts to create exploratory and results oriented visualizations
│ │
│ ├── README.md
│ └── visualize_embeddings.py
│
└──
المشروع بناءً على قالب مشروع علوم بيانات CookieCutter. #CookieCutterDataScience