Скачать PyTorchText - PyTorchText исходный код скачать

中文用户请查看 readme-Zh.md

Это решение для конкурса Machine Learning Zhihu Machine Learning 2017. Мы выиграли чемпиона из 963 команд.

1. Установка

Установить pytorch от pytorch.org (Python 2, Cuda)
Установите другие детективы:
```
pip2 install -r requirements.txt
```

Вам может понадобиться tf.contrib.keras.preprocessing.sequence.pad_sequences для предварительной обработки данных.

Начните Visdom для визуализации:
```
python2 -m visdom.server
```

2. Предварительная обработка данных

Измените путь данных в соответствующем файле

2.1 Файл WordVector -> файл Numpy

python scripts/data_process/embedding2matrix.py main char_embedding.txt char_embedding.npz 
python scripts/data_process/embedding2matrix.py main word_embedding.txt word_embedding.npz

2.2 Набор вопросов -> файл Numpy

Это потребляет память, убедитесь, что у вас есть память больше 32 г.

python scripts/data_process/question2array.py main question_train_set.txt train.npz
python scripts/data_process/question2array.py main question_eval_set.txt test.npz

2.3 этикетка -> json

python scripts/data_process/label2id.py main question_topic_train_set.txt labels.json

2.4 Данные валидации

python scripts/data_process/get_val.py

3. Обучение

Изменить config.py для пути модели

Путь к моделям, которые мы использовали:

CNN: models/MultiCNNTextBNDeep.py
Rnn (LSTM): models/LSTMText.py
Rcnn: models/RCNN.py
Начало: models/CNNText_inception.py
FASTTEXT: models/FastText3.py

3.1 Trian Model без проверки данных

 # LSTM char
python2 main.py main --max_epoch=5 --plot_every=100 --env= ' lstm_char ' --weight=1 --model= ' LSTMText '  --batch-size=128  --lr=0.001 --lr2=0 --lr_decay=0.5 --decay_every=10000  --type_= ' char '   --zhuge=True --linear-hidden-size=2000 --hidden-size=256 --kmax-pooling=3   --num-layers=3  --augument=False

# LSTM word
python2 main.py main --max_epoch=5 --plot_every=100 --env= ' lstm_word ' --weight=1 --model= ' LSTMText '  --batch-size=128  --lr=0.001 --lr2=0.0000 --lr_decay=0.5 --decay_every=10000  --type_= ' word '   --zhuge=True --linear-hidden-size=2000 --hidden-size=320 --kmax-pooling=2  --augument=False

#  RCNN char
python2 main.py main --max_epoch=5 --plot_every=100 --env= ' rcnn_char ' --weight=1 --model= ' RCNN '  --batch-size=128  --lr=0.001 --lr2=0 --lr_decay=0.5 --decay_every=5000  --title-dim=1024 --content-dim=1024  --type_= ' char ' --zhuge=True --kernel-size=3 --kmax-pooling=2 --linear-hidden-size=2000 --debug-file= ' /tmp/debugrcnn ' --hidden-size=256 --num-layers=3 --augument=False

# RCNN word
main.py main --max_epoch=5 --plot_every=100 --env= ' RCNN-word ' --weight=1 --model= ' RCNN '  --zhuge=True --num-workers=4 --batch-size=128 --model-path=None --lr2=0 --lr=1e-3 --lr-decay=0.8  --decay-every=5000  --title-dim=1024 --content-dim=512  --kernel-size=3 --debug-file= ' /tmp/debugrc '  --kmax-pooling=1 --type_= ' word ' --augument=False
# CNN word
 python main.py main --max_epoch=5 --plot_every=100 --env= ' MultiCNNText ' --weight=1 --model= ' MultiCNNTextBNDeep '  --batch-size=64  --lr=0.001 --lr2=0.000 --lr_decay=0.8 --decay_every=10000  --title-dim=250 --content-dim=250    --weight-decay=0 --type_= ' word ' --debug-file= ' /tmp/debug '  --linear-hidden-size=2000 --zhuge=True  --augument=False

# inception word
python2 main.py main --max_epoch=5 --plot_every=100 --env= ' inception-word ' --weight=1 --model= ' CNNText_inception '  --zhuge=True --num-workers=4 --batch-size=512 --model-path=None --lr2=0 --lr=1e-3 --lr-decay=0.8  --decay-every=2500 --title-dim=1200 --content-dim=1200 --type_= ' word ' --augument=False                                                   
# inception char
python2 main.py main --max_epoch=5 --plot_every=100 --env= ' inception-char ' --weight=1 --model= ' CNNText_inception '  --zhuge=True --num-workers=4 --batch-size=512 --model-path=None --lr2=0 --lr=1e-3 --lr-decay=0.8  --decay-every=2500 --title-dim=1200 --content-dim=1200 --type_= ' char '   --augument=False

# FastText3 word
python2 main.py main --max_epoch=5 --plot_every=100 --env= ' fasttext3-word ' --weight=5 --model= ' FastText3 ' --zhuge=True --num-workers=4 --batch-size=512  --lr2=1e-4 --lr=1e-3 --lr-decay=0.8  --decay-every=2500 --linear_hidden_size=2000 --type_= ' word '  --debug-file=/tmp/debugf --augument=False

В большинстве случаев счет может быть увеличен Finetune. например:

python2 main.py main --max_epoch=2 --plot_every=100 --env= ' LSTMText-word-ft ' --model= ' LSTMText '  --zhuge=True --num-workers=4 --batch-size=256 --model-path=None --lr2=5e-5 --lr=5e-5 --decay-every=5000 --type_= ' word '  --model-path= ' checkpoints/LSTMText_word_0.409196378421 '

3.2 модели поезда с расширением данных

Добавить --augument в учебную команду.

3.3 баллы

модель	счет
Cnn_word	0,4103
Rnn_word	0,4119
Rcnn_word	0,4115
Ineptin_word	0,4109
FASTTEXT_WORD	0,4091
Rnn_char	0,4031
Rcnn_char	0,4037
Начало_чар	0,4024
Rcnn_word_aug	0,41344
Cnn_word_aug	0,41051
Rnn_word_aug	0,41368
Incetpion_word_aug	0,41254
Fasttext3_word_aug	0,40853
CNN_CHAR_AUG	0,38738
Rcnn_char_aug	0,39854

С модельным ансамблем он может получить до 0,433.

4 тестируйте и отправьте

4.1 Тест

Модель: Включите LSTMText , RCNN , MultiCNNTextBNDeep , FastText3 , CNNText_inception
PATH MODEL: путь к предварительному модели
Результат-Пат: где сохранить модель
Val: проверьте набор Val или набор тестирования ..

 # LSTM
python2 test.1.py main --model= ' LSTMText '  --batch-size=512  --model-path= ' checkpoints/LSTMText_word_0.411994005382 ' --result-path= ' /data_ssd/zhihu/result/LSTMText0.4119_word_test.pth '  --val=False --zhuge=True

python2 test.1.py main --model= ' LSTMText '  --batch-size=256 --type_=char --model-path= ' checkpoints/LSTMText_char_0.403192339135 ' --result-path= ' /data_ssd/zhihu/result/LSTMText0.4031_char_test.pth '  --val=False --zhuge=True
 
# RCNN
python2 test.1.py main --model= ' RCNN '  --batch-size=512  --model-path= ' checkpoints/RCNN_word_0.411511574999 ' --result-path= ' /data_ssd/zhihu/result/RCNN_0.4115_word_test.pth '  --val=False --zhuge=True

python2 test.1.py main --model= ' RCNN '  --batch-size=512  --model-path= ' checkpoints/RCNN_char_0.403710422571 ' --result-path= ' /data_ssd/zhihu/result/RCNN_0.4037_char_test.pth '  --val=False --zhuge=True

# DeepText

python2 test.1.py main --model= ' MultiCNNTextBNDeep '  --batch-size=512  --model-path= ' checkpoints/MultiCNNTextBNDeep_word_0.410330780091 ' --result-path= ' /data_ssd/zhihu/result/DeepText0.4103_word_test.pth '  --val=False --zhuge=True
# more to go ...

4.2 Ансамбль

См. notebooks/val_ensemble.ipynb и notebooks/test_ensemble.ipynb для получения более подробной информации

5 основных файлов

main.py : main (для обучения)
config.py : файл config
test.1.py : для теста
data/ : для загрузчика данных
scripts/ : для предварительной обработки данных
utils/ : включая рассчитайте оценку и обертку для визуализации.
models/ : модели
- models/BasicModel : базовая модель для моделей.
- models/MultiCNNTextBNDeep : CNN
- models/LSTMText : RNN
- models/RCNN : rcnn
- models/CNNText_inception
- models/MultiModelALL和models/MultiModelAll2
- Другая модель
rep.py : код для воспроизведения.
del/ : Методы терпят неудачу или не используются.
notebooks/ : записные книжки.

Предварительная модель

https://pan.baidu.com/s/1mjvtjgs passwd: tayb

Расширять

PyTorchText

中文用户请查看 readme-Zh.md

1. Установка

2. Предварительная обработка данных

2.1 Файл WordVector -> файл Numpy

2.2 Набор вопросов -> файл Numpy

2.3 этикетка -> json

2.4 Данные валидации

3. Обучение

3.1 Trian Model без проверки данных

3.2 модели поезда с расширением данных

3.3 баллы

4 тестируйте и отправьте

4.1 Тест

4.2 Ансамбль

5 основных файлов

Предварительная модель

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express