determined
v0.38.0

确定是一个多合一的深度学习平台,与Pytorch和Tensorflow兼容。
它需要:

确定的主要组成部分是Python库,命令行接口(CLI)和Web UI。
使用Python库使您现有的Pytorch或Tensorflow代码与确定的兼容。
您可以通过将代码组织成基于类的API来做到这一点:
from determined . pytorch import PyTorchTrial
class YourExperiment ( PyTorchTrial ):
def __init__ ( self , context ):
...或仅通过核心API使用您想要的功能:
import determined as det
with det . core . init () as core_context :
...您可以使用CLI来:
det deploy local cluster-up
det deploy aws up
det experiment create gpt.yaml .使用YAML文件配置从分布式培训到超参数调整的所有内容:
resources :
slots_per_trial : 8
priority : 1
hyperparameters :
learning_rate :
type : double
minval : .0001
maxval : 1.0
searcher :
name : adaptive_asha
metric : validation_loss
smaller_is_better : true 使用Web UI查看损失曲线,超参数图,代码和配置快照,模型注册表,群集利用率,调试日志,性能分析报告等。

安装CLI:
pip install determined然后使用det deploy在本地或AWS和GCP等云服务上启动确定的群集。
有关安装详细信息,请访问有关环境的“群集部署指南:
熟悉示例文件夹和确定示例存储库中的30多个示例确定。
如果您需要帮助,想提交错误报告,或者只是想了解有关确定的最新消息,请加入确定的社区!
[email protected] 。撰稿人指南
Apache V2