# 环境部署 ## 系统安装 **系统镜像推荐内核版本为5.10:** [**配套系统版本配套表**](https://www.hiascend.com/hardware/compatibility) ### 修改本机网址 根据服务器外壳上地址修改,修改为服务器外壳上ibmc地址最后一位加1: ![alt text](1image-4.png) 浏览器输入`192.168.1.9`进入ibmc web页面 ### 添加raid **系统管理→存储管理→添加** ![alt text](1image-3.png) >**RAID级别:** >- RAID 0可以提供更快的数据传输速度和更高的系统性能,但不适合存储关键数据。 >- RAID 1可以用额外的磁盘提供冗余备份,写入性能较低 >- [详细参考](https://support.huawei.com/enterprise/zh/doc/EDOC1100048779/3ceb5467) ### 1. 打开虚拟控制台 **首页→启动虚拟控制台→HTML5集成远程控制台(共享)** ![alt text](1image-5.png) ### 2. 准备系统镜像 选择镜像⽂件,当“连接”显示为“断开”后,表示虚拟光驱已连接到服务器。 ![alt text](1image-6.png) 光驱加载启动 ![alt text](1image-7.png) 重启服务器(强制重启) ![alt text](1image-8.png) 3. 安装系统 引导界⾯选择 “Try or Install Ubuntu Server” ![alt text](1image-9.png) 具体系统安装以及配置网络流程参考下面链接(Ubuntu22.04/open Euler等): [安装界面指引-供参考](https://support.huawei.com/enterprise/zh/ascend-computing/atlas-800t-a2-pid-254184887?category=installation-upgrade) ### 挂载硬盘 #### 1. `fdisk -l` 列出系统中所有磁盘分区信息,帮助用户了解当前磁盘的使用情况。 #### 2. `mkfs.ext4 /dev/nvme0n1` 将 `/dev/nvme0n1` 设备格式化为 `ext4` 文件系统。`ext4` 是一种高性能的文件系统,适用于存储大量数据。 #### 3. `mkdir /home/model/` 创建一个名为 `/home/model/` 的目录,用于后续挂载磁盘分区。 #### 4. `mount /dev/nvme0n1 /home/model/` 将 `/dev/nvme0n1` 设备挂载到 `/home/model/` 目录,使其可以被系统访问。 #### 5. `vim /etc/fstab` 使用 `vim` 编辑器打开 `/etc/fstab` 文件。`/etc/fstab` 是一个配置文件,用于定义系统启动时自动挂载的文件系统。 #### 6. `/dev/nvme0n1 /home/models ext4 defaults 0 0` 在 `/etc/fstab` 文件中添加一行配置,空格隔开,确保 `/dev/nvme0n1` 设备在系统启动时自动挂载到 `/home/models` 目录,根据`mount`信息里的文件系统类型写入对应的文件系统,例如 `ext4` ,并采用默认挂载选项。 #### 注意事项 - 在执行这些命令时,请确保有足够的权限(通常需要 `root` 权限)。 - 在编辑 `/etc/fstab` 文件时,需谨慎操作,避免错误配置导致系统启动失败。 ## 获取软件包 ### 在线获取 **自检安装的操作系统应与产品兼容** [兼容查询](https://www.hiascend.com/hardware/compatibility) ![alt text](1image-1.png) **建议安装最新版本包** ```shell # 更新yum yum update # 安装wget yum install wget # 获取驱动/固件包 wget http://39.171.244.84:30011/drivers/HDK 24.1.RC3/Ascend-hdk-910b-npu-firmware_7.5.0.1.129.run wget http://39.171.244.84:30011/drivers/HDK 24.1.RC3/Ascend-hdk-910b-npu-driver_24.1.rc3_linux-aarch64 # 获取CANN包 wget http://39.171.244.84:30011/cann_toolkit/Ascend-cann-toolkit_8.0.T63_linux-aarch64.run wget http://39.171.244.84:30011/cann_kernels/Ascend-cann-kernels-910b_8.0.T63_linux-aarch64.run ``` 配置pip源:`pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple` 配置apt或yum源`sudo nano /etc/apt/sources.list` ``` deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse ``` **获取有问题请咨询华为工程师** ### 离线获取 **APT下载依赖包** ```bash # 下载指定包及其所有依赖(以 gcc 为例) apt-get download $( for i in {gcc}; do apt-cache depends --recurse \ --no-recommends \ --no-suggests \ --no-conflicts \ --no-breaks \ --no-replaces \ --no-enhances $i \ | grep "^\w" | sort -u done ) # 说明: # 1. `{gcc}` 可替换为其他包名(如 `{curl,vim}`) # 2. 生成的 .deb 文件会保存在当前目录 ``` **干净的环境先装好包** `pip freeze --all > requirements.txt` `pip download -r requirements.txt -d package -i https://pypi.tuna.tsinghua.edu.cn/simple` 其中`package`是目录名 **无网环境下** `pip install --no-index --find-links=package -r requirements.txt` ## 安装驱动固件 [**查看机器硬件配套表**](http://39.171.244.84:30011/package_dependencies/Ascend%20HDK%2024.1.RC3.xlsx) [**获取驱动固件24年RC3版本**](http://39.171.244.84:30011/drivers/HDK%2024.1.RC3/) >* 首次安装场景:硬件设备刚出厂时未安装驱动,或者硬件设备前期安装过驱动固件但是当前已卸载,上述场景属于首次安装场景,需按照`“驱动 > 固件”`的顺序安装驱动固件。 >* 覆盖安装场景:硬件设备前期安装过驱动固件且未卸载,当前要再次安装驱动固件,此场景属于覆盖安装场景,需按照`“固件 > 驱动”`的顺序安装固件驱动。 ```shell #添加HwHiAiUser groupadd HwHiAiUser useradd -g HwHiAiUser -d /home/HwHiAiUser -m HwHiAiUser -s /bin/bash # 增加包的可执行权限(可以将包放在同一目录下对该目录增加权限) chmod +x Ascend-hdk-xxx-npu-driver_xxx_linux-aarch64.run chmod +x Ascend-hdk-xxx-npu-firmware_xxx.run # 安装固件 ./Ascend-hdk-xxx-npu-firmware_xxx.run –full # 安装驱动 ./Ascend-hdk-xxx-npu-driver_xxx_linux-aarch64.run --full --install-for-all ``` ### 检查驱动是否安装成功 执行`npu-smi info` 回显如下说明安装成功 ![alt text](1image.png) ## 安装docker及docker-runtime ```shell # 安装docker yum install docker-ce docker-ce-cli containerd.io # 获取docker-runtime包 wget https://gitee.com/ascend/mind-cluster/releases/download/v6.0.0/Ascend-docker-runtime_6.0.0_linux-aarch64.run # 添加权限 chmod +x Ascend-docker-runtime_6.0.0_linux-aarch64.run #安装docker-runtime ./Ascend-docker-runtime_6.0.0_linux-aarch64.run --install # 启动docker systemctl daemon-reload && systemctl restart docker ```