ACME는 간단하고 효율적이며 읽기 쉬운 에이전트를 노출시키기 위해 노력하는 RL (Rinforcement Learning) 빌딩 블록의 라이브러리입니다. 이 에이전트는 가장 먼저 참조 구현으로 사용하고 알고리즘 성능을위한 강력한 기준을 제공합니다. 그러나, ACME에 의해 노출 된 기준선 에이전트는 또한 새로운 연구를위한 출발 블록으로 사용될 수있는 충분한 유연성과 단순성을 제공해야한다. 마지막으로, ACME의 빌딩 블록은 에이전트를 여러 스케일 (예 : 단일 스트림 대 분산 에이전트)로 실행할 수있는 방식으로 설계되었습니다.
시작하는 가장 빠른 방법은 예제 서브 디렉토리에있는 자세한 작업 코드 예제를 살펴 보는 것입니다. 이들은 여러 가지 다른 에이전트를 인스턴스화하고 다양한 환경 내에서 실행하는 방법을 보여줍니다. 단일 에이전트를 사용하는 데 더 빠르게 다이빙하려면 QuickStart 노트북을 참조하십시오. 에이전트의 내부 구성에 대한 자세한 내용은 튜토리얼 노트에서 찾을 수 있습니다. 마지막으로, 전체 설명 ACME 및 그 기본 구성 요소는 문서를 참조하여 찾을 수 있습니다. 디자인 결정의 배후에 대한 더 많은 배경 정보와 세부 사항은 기술 보고서에서 찾을 수 있습니다.
참고 : ACME는 가장 먼저 연구원을 위해 연구원이 작성한 RL 연구의 프레임 워크입니다. 우리는 매일 우리 자신의 작업에 사용합니다. 따라서 우리는 모든 것을 잘 작동하는 순서로 유지하기 위해 모든 시도를 할 것이지만, 때때로 상황이 깨질 수 있습니다. 그러나 그렇다면 우리는 가능한 빨리 고치기 위해 최선을 다할 것입니다!
올라가고 빠르게 실행하려면 아래 단계를 따르십시오.
표준 파이썬 환경에 ACME를 설치할 수 있지만 Python 가상 환경을 사용하여 종속성을 관리하는 것이 좋습니다 . 이는 버전 충돌을 피하고 일반적으로 설치 프로세스를보다 쉽게 만드는 데 도움이됩니다.
python3 -m venv acme
source acme/bin/activate
pip install --upgrade pip setuptools wheel 핵심 dm-acme 라이브러리를 직접 설치할 수 있지만 설치에 포함 된 종속성 세트는 최소화됩니다. 특히, 포함 된 에이전트를 실행하려면 에이전트에 따라 JAX 또는 Tensorflow도 필요합니다. 결과적으로 이러한 구성 요소를 설치하는 것이 좋습니다.
pip install dm-acme[jax,tf]마지막으로 몇 가지 예제 환경 (체육관, DM_Control 및 Bsuite 포함)을 설치하려면 :
pip install dm-acme[envs] GitHub에서 설치 : ACME의 블리 지드 버전을 실행하는 데 관심이 있다면 ACME GitHub 리포지토리를 복제 한 다음 기본 디렉토리 ( setup.py 있는 위치)에서 다음 명령을 실행하여 수행 할 수 있습니다.
pip install .[jax,tf,testing,envs]작업에서 ACME를 사용하는 경우 업데이트 된 기술 보고서를 인용하십시오.
@article { hoffman2020acme ,
title = { Acme: A Research Framework for Distributed Reinforcement Learning } ,
author = {
Matthew W. Hoffman and Bobak Shahriari and John Aslanides and
Gabriel Barth-Maron and Nikola Momchev and Danila Sinopalnikov and
Piotr Sta'nczyk and Sabela Ramos and Anton Raichuk and
Damien Vincent and L'eonard Hussenot and Robert Dadashi and
Gabriel Dulac-Arnold and Manu Orsini and Alexis Jacq and
Johan Ferret and Nino Vieillard and Seyed Kamyar Seyed Ghasemipour and
Sertan Girgin and Olivier Pietquin and Feryal Behbahani and
Tamara Norman and Abbas Abdolmaleki and Albin Cassirer and
Fan Yang and Kate Baumli and Sarah Henderson and Abe Friesen and
Ruba Haroun and Alex Novikov and Sergio G'omez Colmenarejo and
Serkan Cabi and Caglar Gulcehre and Tom Le Paine and
Srivatsan Srinivasan and Andrew Cowie and Ziyu Wang and Bilal Piot and
Nando de Freitas
} ,
year = { 2020 } ,
journal = { arXiv preprint arXiv:2006.00979 } ,
url = { https://arxiv.org/abs/2006.00979 } ,
}