Скачать deep_qa - deep_qa исходный код скачать

deep_qa

Другой исходный код

1.0.0

Скачать

Устарел

Deepqa строится на вершине кера. Мы решили, что Pytorch - лучшая платформа для исследований НЛП. Мы переписываем Deepqa в библиотеку Pytorch под названием Allennlp. Там больше не будет развития Deepqa. Но мы очень взволнованы Allennlp - если вы делаете глубокое обучение для обработки естественного языка, вы должны проверить это!

Deepqa

Deepqa-это библиотека для выполнения задач NLP высокого уровня с глубоким обучением, особенно сфокусированным на различных видах ответа на вопросы. Deepqa строится на вершине керас и Tensorflow и может рассматриваться как интерфейс для этих систем, который облегчает NLP.

В частности, эта библиотека предоставляет следующие преимущества по сравнению с простыми керами / Tensorflow:

Легко получить NLP прямо в Deepqa.
- В керах существует множество проблем, связанных с последовательностями заполнения и маскировки, которые не обрабатываются хорошо в основном коде кераса, и у нас есть хорошо проверенный код, который делает правильные вещи для, например, вычисления внимания над последовательностями с мягкими, накладывая все тренировочные экземпляры к одинаковым длину (возможно, динамически путем, чтобы минимизировать вычислительные вычисления, которые были построены по всему, или распределяются по текстам, или распределяются в нескольких направлениях, которые раздаются, или распределяют, или распределяют, и раздаются, что они в нескольких разгромах.
- Deepqa обеспечивает хороший, последовательный API вокруг создания моделей NLP. Этот API имеет функциональность вокруг обработки экземпляров данных, встраивания слов и/или символов, легко получая различные виды кодеров предложений и так далее. Это облегчает строительные модели для задач NLP высокого уровня.
Deepqa обеспечивает чистый интерфейс для обучения, проверки и отладки моделей Keras. Легко экспериментировать с вариантами модельного семейства, просто изменив некоторые параметры в файле JSON. Например, подробности того, как представлены слова, либо с фиксированными векторами перчатки, тонкими настройками word2vec векторов, либо сознанием тех, у кого CNN на уровне символов, все указаны в параметрах в файле JSON, а не в вашем фактическом коде. Это делает тривиальным переключение деталей вашей модели на основе данных, с которыми вы работаете.
Deepqa содержит ряд современных моделей, особенно сосредоточенных на системах ответа вопросов (хотя мы также занимались моделями для других задач). Фактический код модели для этих систем обычно составляет 50 строк или меньше.

Запуск Deepqa

Настройка среды разработки

Deepqa построен с использованием Python 3. Самый простой способ настроить совместимую среду - использовать Conda. Это создаст виртуальную среду с точной версией Python, используемой для разработки, а также все зависимости, необходимые для запуска Deepqa.

Скачать и установить Conda.
Создайте среду Conda с Python 3.
```
 conda create -n deep_qa python=3.5
```
Теперь активируйте среду Conda.
```
 source activate deep_qa
```
Установите требуемые зависимости.
```
 ./scripts/install_requirements.sh
```
Установите PYTHONHASHSEED для повторяемых экспериментов.
```
 export PYTHONHASHSEED=2157
```

Теперь вы должны иметь возможность проверить свою установку с помощью pytest -v . Поздравляю! Теперь у вас есть среда разработки для Deep_QA, которая использует TensorFlow с поддержкой процессора. (Для поддержки графического процессора см. Tepend.txt для получения информации о том, как установить tensorflow-gpu ).

Использование Deepqa в качестве исполняемого

Чтобы обучить или оценить модель, используя клон репозитория DeepQA, рекомендуемой точкой входа является использование сценария run_model.py . Первым аргументом этого скрипта является файл параметров, описанный ниже ниже. Второй аргумент определяет поведение, либо обучение модели, либо оценивая обученную модель с тестовым набором данных. Текущие достоверные варианты для второго аргумента являются train и test (пропуск аргумента - это то же самое, что и проезжающий train ).

Файлы параметров указывают используемый класс модели, модели гиперпараметров, сведения об обучении, файлы данных, детали генератора данных и многие другие вещи. Вы можете увидеть пример файлов параметров в каталоге примеров. Вы можете получить некоторое представление о том, какие параметры доступны, просмотрев документацию.

На самом деле обучение модели потребует входных файлов, которые вам необходимо предоставить. У нас есть библиотека компаньонов, Deepqa Experiments, которая изначально была разработана для производства входных файлов и запуска экспериментов, и может использоваться для создания необходимых файлов данных для большинства задач, для которых у нас есть модели. Мы движемся к тому, чтобы поместить код обработки данных непосредственно в DeepQA, так что эксперименты DeepQA не являются необходимыми, но на данный момент получение файлов обучающих данных в правильном формате наиболее легко выполнять с экспериментами DeepQA.

Использование Deepqa в качестве библиотеки

Если вы используете Deepqa в качестве библиотеки в своем собственном коде, все равно будет простым запускать вашу модель. Вместо использования сценария run_model.py для проведения обучения/оценки, вы можете сделать это самостоятельно:

 from deep_qa import run_model, evaluate_model, load_model, score_dataset

# Train a model given a json specification
run_model("/path/to/json/parameter/file")


# Load a model given a json specification
loaded_model = load_model("/path/to/json/parameter/file")
# Do some more exciting things with your model here!


# Get predictions from a pre-trained model on some test data specified in the json parameters.
predictions = score_dataset("/path/to/json/parameter/file")
# Compute your own metrics, or do beam search, or whatever you want with the predictions here.


# Compute Keras' metrics on a test dataset, using a pre-trained model.
evaluate_model("/path/to/json/parameter/file", ["/path/to/data/file"])

Остальные руководящие принципы использования, примеры и т. Д. Составляют такие же, как при работе в клоне репозитория.

Реализация ваших собственных моделей

Чтобы реализовать новую модель в Deepqa, вам необходимо подключить TextTrainer . Есть документация о том, что необходимо для этого; См. В частности, раздел абстрактных методов. Для простого примера полнофункциональной модели см. Простой теги последовательности, который имеет около 20 строк реального кода реализации.

Чтобы тренировать, загружать и оценить модели, которые вы написали сами, просто передайте дополнительный аргумент в области вышеуказанных функций и удалите параметр model_class из вашей спецификации JSON. Например:

 from deep_qa import run_model
from .local_project import MyGreatModel

# Train a model given a json specification (without a "model_class" attribute).
run_model("/path/to/json/parameter/file", model_class=MyGreatModel)

Если вы выполняете новую задачу или новый вариант задачи с другой спецификацией ввода/вывода, вам, вероятно, также необходимо реализовать тип Instance . Instance обрабатывает чтение данных из файла и преобразование их в массивы Numpy, которые можно использовать для обучения и оценки. Это должно произойти только один раз для каждой спецификации ввода/вывода.

Внедренные модели

Deepqa имеет реализацию современных методов для различных задач. Вот несколько из них:

Понимание прочитанного

Внимательный читатель, от учебных машин до чтения и понимания Германа и других
Занятый читатель внимания от закрытого внимания читателей для понимания текста,
Двунаправленный поток внимания, от двунаправленного потока внимания для понимания машины,

Логическое следствие

Разлагаемое внимание, от разложения модели внимания для вывода естественного языка,

Наборы данных

Этот код обеспечивает легкие эксперименты со следующими наборами данных:

Научные вопросы начальной школы AI2 (без диаграмм)
Набор данных для детских книг Facebook
Набор данных Facebook Babi
Набор данных Newsqa
Стэнфордский набор ответов на вопрос (команда)
Кто сделал то, что набор данных

Обратите внимание, что код обработки данных для большей части этого в настоящее время живет в экспериментах Deepqa.

Внося

Если вы используете этот код и думаете, что что -то может быть улучшено, запросы на вытягивание очень приветствуются. Открытие проблемы тоже в порядке, но мы можем ответить гораздо быстрее, чтобы привлечь запросы.

Участники

Мэтт Гарднер
Марк Нейман
Нельсон Лю.
Pradeep Dasigi (первоначальный автор этой кодовой базы)

Лицензия

Этот код выпускается в соответствии с условиями лицензии Apache 2.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-04-15
размер 448.16KB
От Github

Связанные приложения

Программное обеспечение Aizhi·QA для поддержки Интернета вещей

2024-08-15
Приложение QA для интеллектуального управления на месте

2023-08-07
Глубокое поле

2023-07-07
Игра Глубокий охотник

2023-07-03
Дип Ди

2022-08-30
Глубокая Руна

2022-07-25

deep_qa

Устарел

Deepqa

Запуск Deepqa

Настройка среды разработки

Использование Deepqa в качестве исполняемого

Использование Deepqa в качестве библиотеки

Реализация ваших собственных моделей

Внедренные модели

Понимание прочитанного

Логическое следствие

Наборы данных

Внося

Участники

Лицензия

Программное обеспечение Aizhi·QA для поддержки Интернета вещей

Приложение QA для интеллектуального управления на месте

Глубокое поле

Игра Глубокий охотник

Дип Ди

Глубокая Руна

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express