Скачать pytorch a3c - pytorch a3c Скачать исходный код

pytorch a3c

Питон

1.0.0

Скачать

Pytorch-A3c

Это реализация Pytorch Asynchronous Advantage Actor Critic Critic (A3C) из «асинхронных методов для глубокого обучения подкреплению».

Эта реализация вдохновлена стартовым агентом Вселенной. В отличие от стартового агента, он использует оптимизатор с общей статистикой, как в исходной статье.

Пожалуйста, используйте этот Bibtex, если вы хотите привести этот репозиторий в своих публикациях:

 @misc{pytorchaaac,
  author = {Kostrikov, Ilya},
  title = {PyTorch Implementations of Asynchronous Advantage Actor Critic},
  year = {2018},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/ikostrikov/pytorch-a3c}},
}

A2C

Я настоятельно рекомендую проверить сихронную версию и другие алгоритмы: Pytorch-A2C-Ppo-Acttr.

По моему опыту, A2C работает лучше, чем A3C, а ACKTR лучше, чем они обоих. Кроме того, PPO является отличным алгоритмом для непрерывного контроля. Таким образом, я рекомендую сначала попробовать A2C/PPO/ACKTR и использовать A3C только в том случае, если вам это нужно конкретно по некоторым причинам.

Также прочитайте блог Openai для получения дополнительной информации.

Вклад

Взносы очень приветствуются. Если вы знаете, как сделать этот код лучше, не стесняйтесь отправлять запрос на тягу.

Использование

 # Works only wih Python 3.
python3 main.py --env-name " PongDeterministic-v4 " --num-processes 16

Этот код запускает оценку в отдельном потоке в дополнение к 16 процессам.

Результаты

С 16 процессами он сходится для Pongdeterministic-V4 за 15 минут.

Для BreakoutDeterministic-V4 занимает более нескольких часов.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Питон
Время обновления 2025-07-12
размер 187.55KB
От Github

Связанные приложения

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

pytorch a3c

Pytorch-A3c

A2C

Вклад

Использование

Результаты

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

pytorch image models

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

Инструмент диаграмм данных с открытым исходным кодом Redash v24.10.0

Google Dorks

shepherd

mongo express