
v1.8.1发行后,OpenPAI进入了稳定模式,没有计划发布重大功能。为了节省维护工作,我们更改了存储库以读取模式。有关协作,请直接联系Repo Admin。
随着v1.0的发布,OpenPAI正在改用更强大,更强大,更轻巧的体系结构。 OpenPAI也变得越来越模块化,因此可以轻松地定制和扩展该平台以适合新需求。 OpenPAI还提供了许多AI用户友好的功能,使最终用户和管理员更容易完成每日AI任务。
| |
该平台结合了成熟的设计,该设计在微软的大规模生产环境中具有良好的往绩。
OpenPAI是一个完整的堆栈解决方案。 OpenPAI不仅支持本地,混合动力或公共云部署,而且还支持针对试用用户的单箱部署。
流行AI框架的预建码头。易于包括异质硬件。支持分布式培训,例如分布式张力流。
OpenPAI是最完整的解决方案,用于深度学习,支持虚拟群集,与Kubernetes Eco-System兼容,一个集群的完整培训管道等。OpenPAI以模块化的方式进行了架构:可以在适当的情况下插入不同的模块。这是OpenPAI的架构,突出了该平台的技术创新。
OpenPAI管理计算资源,并针对深度学习进行了优化。通过Docker Technology,计算硬件是用软件解耦的,因此可以易于运行分布式作业,使用不同的深度学习框架进行切换或在一致的环境上运行其他类型的作业。
由于OpenPai是一个平台,因此通常有两个不同的角色:
OpenPAI为群集用户和管理员提供端到端手册。
管理手册是集群管理员的综合指南,涵盖(但不限于)以下内容:
安装和升级。安装基于Kubespray,这是系统要求。 OpenPAI提供了一个安装指南,以促进安装。
如果您正在考虑从较旧版本升级到最新的v1.0.0,请参阅下表以进行v0.14.0和v1.0.0之间的简短比较。有关升级注意事项的更多详细信息可以找到升级指南。
v0.14.0 | v1.0.0 | |
|---|---|---|
| 建筑学 | Kubernetes + Hadoop纱 | Kubernetes |
| 调度程序 | 纱线调度程序 | hived / k8s默认 |
| 工作编排 | 纱线框架发射器 | 框架控制器 |
| 宁静的API | V1 + V2 | 纯V2 |
| 贮存 | 团队储存插件 | PV/PVC存储共享 |
| 市场 | 市场v2 | OpenPaimarketplace |
| SDK | Python | JavaScript /打字稿 |
如果部署期间有任何问题,请检查安装常见问题解答并首先进行故障排除。如果尚未涵盖,请参阅此处提出问题或提交问题。
基本集群管理。通过Web-portal和命令行工具paictl ,管理员可以完成集群管理,例如添加(或删除)节点,监视节点和服务以及Storages设置和权限控制。
用户和组管理。管理员可以轻松管理用户和组。
警报管理。管理员可以自定义警报规则和操作。
定制。管理员可以通过插件自定义集群。管理员还可以升级(或降级)单个组件(例如REST服务器)来解决自定义的应用程序需求。
用户手册是针对群集用户的指导,他们可以在OpenPAI上训练和执行深度学习(和其他)任务。
工作提交和监视。快速启动教程是学习如何在OpenPAI上培训模型的良好开始。这里还有更多示例和支持多个主流框架(开箱即用的Docker图像)。 OpenPAI还为良好的辩论性和高级工作功能提供支持。
数据管理。用户可以在其工作中使用群集配置的存储和自定义存储。群集配置的存储量已经很好地集成且易于在作业中配置(请参阅此处)。
协作与共享。 OpenPAI为团队和组织中的合作提供了设施。群集配置的存放者由团队(组)组织。用户可以轻松地在市场上分享他们的作品(例如作业),在市场上,其他人可以通过一键单击发现和繁殖(克隆)。
除WebPortal外,OpenPAI还提供VS代码扩展名和命令行工具(预览)。 VS代码扩展是OpenPAI的友好,基于GUI的客户工具,强烈建议您使用。这是Visual Studio代码的扩展。它可以提交作业,在本地模拟工作,管理多个OpenPAI环境等等。
使用v1.0.0版本,OpenPAI开始使用更模块化的组件设计,并将代码结构与7个独立的密钥组件存储库一起重新组织为1个主仓库。 PAI是主要存储库,7个组件存储库是:
针对开放性和进步最先进的技术,微软研究(MSR)和Microsoft软件技术中心(STCA)也发布了其他开源项目。
该项目欢迎贡献和建议。大多数捐款要求您同意撰写贡献者许可协议(CLA),宣布您有权并实际上授予我们使用您的贡献的权利。有关详细信息,请访问https://cla.microsoft.com。
当您提交拉动请求时,CLA机器人将自动确定您是否需要提供CLA并适当装饰PR(例如,标签,评论)。只需按照机器人提供的说明即可。您只需要使用我们的CLA在所有存储库中进行一次。
该项目采用了Microsoft开源的行为代码。有关更多信息,请参见《行为守则常见问题守则》或与其他问题或评论联系[email protected]。
我们正在研究一系列主要功能改进和重构,任何熟悉这些功能的人都可以在相应的问题票中加入设计评论和讨论。
OpenPAI的关键目的是支持学术界和行业的高度多样化的要求。 OpenPAI完全开放:它在MIT许可下。这使得OpenPAI在评估各种研究思想中特别有吸引力,其中包括但不限于组件。
OpenPAI以开放式模型运行。它最初是由Microsoft Research(MSR)和Microsoft软件技术中心(STCA)平台团队设计和开发的。我们很高兴能拥有北京大学,西亚北大学,智格大学,中国科学技术大学以及上海Inesa ai Innovation Center(Shaiic)加入了我们,共同开发了该平台。非常欢迎学术界和工业的贡献。