Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
linfj 69b131a1aa | 3 months ago | |
---|---|---|
admin-portal | 4 months ago | |
build | 7 months ago | |
controller/nodeagent | 3 years ago | |
deploy | 4 months ago | |
inference-server/pytorch-server | 2 years ago | |
openai-portal | 3 months ago | |
server | 4 months ago | |
.drone.yml | 2 years ago | |
.gitignore | 3 years ago | |
.golangci.yaml | 4 months ago | |
LICENSE | 3 years ago | |
Makefile | 1 year ago | |
logo.png | 3 years ago | |
readme.md | 1 year ago | |
readme_en.md | 1 year ago |
Octopus是一款面向多计算场景的一站式融合计算平台。平台主要针对AI、HPC等场景的计算与资源管理的需求来设计,向算力使用用户提供了对数据、算法、镜像、模型与算力等资源的管理与使用功能,方便用户一站式构建计算环境,实现计算。同时,向集群管理人员提供了集群资源管理与监控,计算任务管理与监控等功能,方便集群管理人员对整体系统进行操作与分析。
Octopus平台底层基于容器编排平台Kubernetes ,充分利用容器敏捷、轻量、隔离等特点来实现计算场景多样性的需求。
详细文档请参考这里。
Octopus具有如下特点:
Octopus适合在如下场景中使用:
Octopus管理计算资源并针对AI、HPC等场景的计算任务进行优化。通过镜像与容器技术(Docker)实现计算硬件与软件解耦,从而轻松切换不同计算环境中。
由于Octopus的使用用户通常有两种不同的角色:
Octopus 为集群用户和管理员提供端到端的手册。
与集群管理员相关的文档包括如下:
集群部署指南: 此部分主要提供的内容包括:集群依赖环境与组件的准备与安装、Octopus系统部署指南以及后续系统的升级说明等,以方便安装维护。详细内容请参考这里 。
集群管理手册: 此部分主要介绍集群管理员通过管理系统页面入口进入Octopus管理系统后可进行的操作,主要功能说明包括:平台监控、资源管理、用户管理、机时管理、数据管理、算法管理以及开发与训练管理等功能。详细内容请参考这里 。
与集群用户相关的文档主要如下:
详细贡献指南请参考这里 。
面向多计算场景的一站式融合计算平台
CSS Go Markdown Vue Text other
Dear OpenI User
Thank you for your continuous support to the Openl Qizhi Community AI Collaboration Platform. In order to protect your usage rights and ensure network security, we updated the Openl Qizhi Community AI Collaboration Platform Usage Agreement in January 2024. The updated agreement specifies that users are prohibited from using intranet penetration tools. After you click "Agree and continue", you can continue to use our services. Thank you for your cooperation and understanding.
For more agreement content, please refer to the《Openl Qizhi Community AI Collaboration Platform Usage Agreement》