帮助与文档

我们为你提供丰富、详尽的使用指南以及产品文档

GPU主机

为了满足用户对高性能计算的需求,特推出GPU主机给有需求的用户试用,用户可以在青云控制台上进行GPU资源的申请和使用。

GPU主机特性:

1、GPU资源灵活配置。

用户可以自定义GPU主机的类型,CPU/MEM,GPU资源,可以新创建主机,也可以对已有主机进行GPU资源的绑定。

2、高配置GPU。

GPU卡采用NVIDIA Tesla P100,单台主机可配置2张GPU卡,单机单浮点峰值计算能力最多可达20Tflops,且无虚拟化性能损耗。

GPU主机使用步骤

一、创建GPU主机

GPU主机和创建普通主机的步骤是相同的,选择超高性能型主机,可以根据需要选择GPU的数量,即可创建GPU主机。

GPU主机用户可以根据需要选择使用的操作系统,推荐使用Ubuntu Server 16.04.4 LTS 64bit。GPU主机的驱动和CUDA需要自行配置。下面以Ubuntu Server 16.04.4 LTS 64bit为例,讲解配置过程。

经过测试,CUDA 8.0 和 CUDA 9.1 配合其内置驱动,分别为 375.26 (CUDA 8.0) 和 387.26 (CUDA 9.1) ,均可正常工作,其他版本驱动暂无法正常工作,请依据您的需求选择一个 CUDA 版本。 只需下载并安装 CUDA 即可,无需单独安装驱动之后再安装 CUDA 。

(1) 安装前准备工作: CUDA 安装需要 gcc 和 make 的支持,先安装 gcc 和 make

sudo apt-get update
sudo apt-get install gcc make

可选: 安装32位库支持

sudo dpkg --add-architecture i386
sudo apt-get update
sudo apt-get install libc6:i386 libstdc++6:i386

(2) 下载 CUDA: CUDA 8.0 下载地址: https://developer.nvidia.com/cuda-80-ga2-download-archive CUDA 9.1 下载地址: https://developer.nvidia.com/cuda-downloads

请选择 runfile(local) 方式安装,CUDA 8.0 需要下载 Base Installer 和 Patch 2 (Released Jun 26, 2017) , CUDA 9.1 需要下载 Base Installer , Patch 1 (Released Jan 25, 2018), Patch 2 (Released Feb 27, 2018) 和 Patch 3 (Released Mar 5, 2018)。下载后按照日期顺序先后安装。

CUDA 8.0 下载界面:

CUDA 9.1 下载界面:

按照下载页面的说明,依次 sudo sh 对应的 run 文件进行安装。 (3) 验证安装 安装完成后,先运行 nvidia-smi 查看显卡信息及驱动版本,确认驱动安装成功。

在本文的安装过程中,必须确认驱动版本为 375.26 (CUDA 8.0) 和 387.26 (CUDA 9.1)。

运行一个 CUDA 计算测试例程,确认 CUDA 正常工作(安装 CUDA 时,会安装对应的例程,在安装过程中提示的文件夹可找到,默认为/home/ubuntu/NVIDIA_CUDA-9.1_Samples)。

cd /home/ubuntu/NVIDIA_CUDA-9.1_Samples/0_Simple/matrixMul
make
./matrixMul

如果CUDA正常工作,将会输出结果 PASS 并测量性能指标。

以上步骤完成后,CUDA 已正常工作,可以继续安装 cuDNN 和深度学习框架。

二、通过Deep Learning App创建

Deep Learning On QingCloud 是一款预配置的深度学习开发环境,主要用于AI开发和模型训练。其上搭载了多款主流的深度学习框架,可以配合GPU资源加速计算。

创建Deep Learning App时可选择主机规格以及GPU卡数量,具体使用文档请参考: https://appcenter-docs.qingcloud.com/user-guide/apps/docs/DeepLearning/