Apulis AI Platform Installer
一.部署整体流程介绍
二.部署执行链路
Installer.sh -> Sync files -> Check Env -> Init Env(install docker, k8s, etc, ingress, kubeflow) -> Setup nfs -> Setup Harbor -> Deploy aiarts -> Preset models&datasets -> Test Platform -> Backup conf
三.部署实操作
使用root执行安装脚本,安装日志默认放在 /var/log/apulis_installation.log
apt install -y git \
&& git clone -b develop https://gitee.com/apulisplatform/installer.git \
&& cd installer \
&& bash install.sh | tee /var/log/apulis_installation-$(date "+%Y%m%d%H%M%S").log
2.进入安装包目录
cd /home/installationytungsingle
3.执行install.sh 主安装脚本配置
bash install.sh,需要用户填写内部业务网IP,public-ip,domainame,输出如下:
root@apulis:~/InstallationYTung# bash install.sh
请输入业务网卡的ip地址:内部业务网IP
#-ip格式正确
您输入的业务网ip为:内部IP
Do you want to configure PublicNetworkIp? [yes/no] yes (如果是云vm部署配置了public-ip选择yes)
Do you want to configure Domainame? [yes/no] yes (如果是配置了domainame选择yes)
>#You deploy pattern:public network and domainame
请输入public-ip地址:public-ip
#-public-ip格式正确
请输入域名: domainame
4.部署完成
看到如下输出内容,平台部署完成
#>>>>>>-deploy finish-----------------------------------------------------------
#>>>>>>-Platform login information:
Public-ip:****** Private-address:****** Domainame:******
UserName:admin Password:Wwjpfb
Platform data dir:/data/nfs/pvc
四.平台重置
1.上层AiArts重置
- 执行applyrm.sh 删除kubernetes AiArts集群应用pod,此操作不删除数据
- 再执行apply.sh 重启AiArts集群应用pod
2.全平台重置
*** 注意:全平台重置会将整个平台进行清除,请做好关键数据的备份*
*** 在执行remove.sh是会有 2个提示信息*
- 是否保留平台数据nfs存储(数据路径默认在/data/nfs/pvc)
- 是否备份PostgresSql数据库(安装目录下的postgres_backup.sql)
GPU驱动安装说明
从NVIDIA官网下载相应的驱动到服务器本地
i) dpkg -i nvidia-diag-driver-local-repo-ubuntu1804-410.129_1.0-1_amd64.deb’ for Ubuntu ii)
apt-get updateiii)
apt-get install cuda-driversiv)
reboot`