阿里云GPU云服务器常见问题及官方资料解答汇总
阿里云基于EGS平台推出了GPU云服务器,在提供GPU加速能力的同时,保留了与普通ECS实例一致的使用体验。您在创建ECS实例时,选择企业级异构计算规格即可。下面是阿里云GPU云服务器的一些常见问题及官方资料解答汇总,以供大家参考和了解阿里云GPU云服务器。https://upload-images.jianshu.io/upload_images/19316870-89ac6ae874620015.png
<div class="image-caption">阿里云gpu云服务器图.png
<h2>什么是GPU云服务器</h2>
阿里云GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。产品详情链接:https://www.aliyun.com/product/ecs/gpu
<h2>GPU云服务器概念</h2>
<table>
<thead>
<tr>
<th>名词</th>
<th>说明</th>
</tr>
</thead>
<tbody>
<tr>
<td>GPU</td>
<td>图形处理器(Graphics Processing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。</td>
</tr>
<tr>
<td>EGS</td>
<td>弹性GPU服务(Elastic GPU Service)。阿里云弹性计算和GPU高速的并行异构的加速器的组合服务,兼具弹性计算的特点和GPU的加速能力。</td>
</tr>
<tr>
<td>CUDA</td>
<td>NVIDIA推出的通用并行计算架构,帮助您使用NVIDIA GPU解决复杂的计算问题。</td>
</tr>
<tr>
<td>cuDNN</td>
<td>NVIDIA推出的用于深度神经网络的GPU加速库。</td>
</tr>
<tr>
<td>AIACC-Training</td>
<td>阿里云自研的AI加速器,可以显著提升训练性能。</td>
</tr>
<tr>
<td>AIACC-Inference</td>
<td>阿里云自研的AI加速器,可以显著提升推理性能。</td>
</tr>
<tr>
<td>FastGPU</td>
<td>阿里云推出的人工智能计算任务构建工具,提供便捷的接口和命令行,供您在阿里云IaaS资源上构建人工智能计算任务。</td>
</tr>
<tr>
<td>cGPU</td>
<td>隔离GPU资源,实现多个容器共用一张显卡。</td>
</tr>
</tbody>
</table>
<h2>为什么选择GPU云服务器</h2>
阿里云GPU云服务器是基于GPU与CPU应用的计算服务器。GPU在执行复杂的数学和几何计算方面有着独特的优势,特别是在浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。GPU的功能特性如下:
[*]拥有大量擅长处理大规模并发计算的算术逻辑单元(Arithmetic and Logic Unit,即ALU)。
[*]能够支持多线程并行的高吞吐量运算。
[*]逻辑控制单元相对简单。
下表为您介绍GPU云服务器与自建GPU服务器的区别。
<table>
<thead>
<tr>
<th>对比项</th>
<th>GPU云服务器</th>
<th>GPU自建服务器</th>
<th>对比项</th>
</tr>
</thead>
<tbody>
<tr>
<td>灵活性</td>
<td>能够快速开通一台或多台GPU云服务器实例。实例规格(vCPU和内存)支持灵活变更,并且支持在线升降配。带宽升降自由。</td>
<td>服务器购买周期长。服务器规格固定,无法灵活变更。带宽一次性购买,无法自由升降。</td>
<td>灵活性</td>
</tr>
<tr>
<td>易用性</td>
<td>Web在线管理,简单方便。内置主流的操作系统,Windows正版激活,且支持在线更换操作系统。GPU驱动可以在购买时一并安装,方便快捷。</td>
<td>没有在线管理工具,维护困难。需用户自备操作系统,自行安装及更换。GPU驱动需要自行购买安装。</td>
<td>易用性</td>
</tr>
<tr>
<td>容灾备份</td>
<td>三副本数据设计,单份损坏可在短时间内快速恢复。硬件故障事故中可快速自动恢复。</td>
<td>用户自行搭建,使用普通存储设备,价格高昂。数据损坏需用户修复。</td>
<td>容灾备份</td>
</tr>
<tr>
<td>安全性</td>
<td>能够有效阻止MAC欺骗和ARP攻击。并防护DDoS攻击,可进行流量清洗和黑洞。享有端口入侵扫描、挂马扫描、漏洞扫描等附加服务。</td>
<td>很难阻止MAC欺骗和ARP攻击。清洗和黑洞设备需要另外购买,价格昂贵。普遍存在漏洞挂马和端口扫描等问题。</td>
<td>安全性</td>
</tr>
<tr>
<td>成本</td>
<td>支持包年包月及按量付费两种购买方式,可灵活选择适合您业务场景的付费方式。按需购买,无需一次性大量投入。</td>
<td>无法按需购买,必须为业务峰值满配。一次性投入巨大,闲置浪费严重。</td>
<td>成本</td>
</tr>
</tbody>
</table>
<h2>购买阿里云GPU云服务器最新优惠政策</h2>
首次购买GPU云服务器如下配置包月4折,半年3.5折,1/2年3折,限1次,限1-3台(折扣不含带宽,系统盘,数据盘):
(1)gn6v(8核32G/32核128G/64核256G/82核336G)
(2)gn6i(4核15G/8核31G/16核62G/24核93G/40核155G/48核186G/96核372G)
(3)vgn6i、vgn6i-vws(4核32G/10核46G)
活动直达:点此进入阿里云服务器新人特惠活动,GPU新用户专享包年低至3折起。
<h2>阿里云GPU云服务器产品优势</h2>
1、高弹性
提供系列化的规格族,分钟级创建GPU实例,支持水平扩容和垂直变配。
2、高性能高安全性
支持GPUDirect,GPU之间点对点通信。GPU可以直接通过NVLink总线互联通信,具备高带宽低时延的特点,无需CPU干预。多租户间弹性GPU安全隔离 ,并通过Hypervisor授权和管理。允许灵活配置多块GPU实现互相高速通信的同时,还具备隔离带来的安全性。
3、易部署
和阿里云生态深度融合,您可以轻松搭配其他阿里云产品构建应用,例如搭配OSS、NAS等产品满足存储要求,搭配EMR进行深度学习数据预处理等。支持云原生(阿里云Kubernetes),交付更加便捷。
4、易监控
提供全面的GPU监控数据,包括GPU、实例和分组维度,免去您的运维压力。
<h2>阿里云GPU云服务器计费方式</h2>
GPU云服务器的计费相关功能和云服务器ECS一致,其中,计算资源(vCPU和内存)、镜像、块存储、公网带宽以及快照等资源涉及计费。常见的计费方式如下所示:
[*]包年包月:按一定时长购买资源,先付费后使用。
[*]按量付费:按需开通和释放资源,先使用后付费。
[*]抢占式实例:通过竞价模式抢占库存充足的计算资源,相对按量付费实例有一定的折扣,但是存在回收机制。
[*]预留实例券:搭配按量付费实例使用的抵扣券,承诺使用指定配置的实例(包括实例规格、地域可用区等),以折扣价抵扣计算资源的账单。
[*]节省计划:搭配按量付费实例使用的折扣权益计划,承诺使用稳定数量的资源(以元/小时为单位衡量),以折扣价抵扣计算资源、系统盘等资源的账单。
[*]存储容量单位包:搭配按量付费存储产品使用的资源包,承诺使用指定容量的存储资源,以折扣价抵扣块存储、NAS、OSS等资源的账单。
一台GPU实例包括计算资源(vCPU和内存)、镜像、块存储等资源,其中涉及计费的GPU资源如下表所示。
<table>
<thead>
<tr>
<th>计费项</th>
<th>计费说明</th>
<th>计费方式</th>
<th>转换计费方式</th>
<th>计费标准</th>
</tr>
</thead>
<tbody>
<tr>
<td>计算资源(vCPU和内存)</td>
<td>即实例规格涉及的计算资源费用(包括vCPU和内存)。</td>
<td>包年包月按量付费按量付费+预留实例券抢占式实例按量付费+节省计划</td>
<td>包年包月转按量付费按量付费转包年包月</td>
<td>实例规格计费</td>
</tr>
<tr>
<td>镜像</td>
<td>根据镜像类型以及使用情况决定是否收费。例如,公共镜像、自定义镜像、共享镜像或镜像市场镜像的计费情况也有所区别。</td>
<td>包年包月按量付费按量付费+预留实例券</td>
<td>不支持</td>
<td>镜像计费</td>
</tr>
<tr>
<td>块存储</td>
<td>云盘:根据单价、云盘容量和使用时长收取费用,并且创建云盘的方式不同会影响支持的计费方式。本地盘:与特定实例规格绑定的本地盘,不支持单独购买,且费用已计入实例规格费用。</td>
<td>包年包月按量付费存储容量单位包按量付费+节省计划</td>
<td>转换云盘计费方式包年包月转按量付费按量付费转包年包月</td>
<td>块存储计费</td>
</tr>
<tr>
<td>公网带宽</td>
<td>使用固定公网IP访问公网时,仅收取公网出网带宽费用。使用弹性公网IP(EIP)或NAT网关访问公网时,弹性公网IP(EIP)和NAT网关是需要独立购买。</td>
<td>按固定带宽计费按使用流量计费</td>
<td>转换公网带宽计费方式</td>
<td>公网带宽计费</td>
</tr>
<tr>
<td>快照</td>
<td>快照的计费项目包括快照、快照复制以及快照极速可用。计费时会按快照容量和存储时长收取费用。</td>
<td>快照的计费项目包括快照、快照复制以及快照极速可用。计费时会按快照容量和存储时长收取费用。</td>
<td>不支持</td>
<td>快照计费</td>
</tr>
</tbody>
</table>
<h2>阿里云GPU云服务器应用场景</h2>
1、直播实时视频转码
阿里云异构GPU和FPGA服务器重点支持2019年天猫双11狂欢夜直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务天猫双11狂欢夜当天直播业务4K、2K、1080P等各个分辨率的转码。其中FPGA H.265高清编码、720P节省带宽21.6?GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过流量洪峰。异构GPU云服务器还参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。异构FPGA图片转码业务则以3K+片的超大集群,为淘宝图片空间提供高达数百万QPS的处理能力,承担了双十一淘宝图片85?流量,预计节省计算成本3亿。
2、AI训练
gn6v和gn6e具有优异的通用GPU计算加速能力,适合为深度学习提供加速引擎。
gn6v和gn6e实例分别配备具有16 GB显存和32 GB显存的NVIDIA V100 GPU计算卡,单节点可提供高达1000TFLOPS的混合精度计算能力。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。
3、AI推理
gn6i具有优异的AI推理能力。
gn6i实例基于配备NVIDIA Tesla T4 GPU计算卡,单精度浮点计算能力最高可达8.1 TFLOPS,int8定点运算处理能力最高可达130 TOPS,支持混合精度,满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75 W,具有极高的性能功耗比。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化您的部署操作。
4、云游戏、云网吧和云端图形工作站
vgn6i和gn6i均采用基于Turing架构的NVIDIA Tesla T4 GPU加速器,具有极佳的图形计算能力。vgn6i提供分片虚拟化后的虚拟GPU,支持T4 GPU计算能力的1/2、1/4、1/8,并提供极佳的3D图像渲染能力,适用于云游戏、云网吧等场景。vgn6i和gn6i实例可以结合云桌面产品提供云端图形工作站服务,应用于影视动画设计、工业设计、医疗成像、高性能计算的结果呈现等场景。
<h2>阿里云GPU云服务器使用限制</h2>
GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的使用限制。使用云服务器ECS有下列限制:
[*]仅弹性裸金属服务器和超级计算集群支持二次虚拟化,其他规格族不支持安装虚拟化软件和二次虚拟化。
[*]不支持声卡应用。
[*]不支持直接加载外接硬件设备(如硬件加密狗、U盘、外接硬盘、银行UKey等),您可以尝试软件加密狗或者动态口令二次验证等。
[*]不支持多播协议。如果需要使用多播,建议改为使用单播点对点方式。
[*]日志服务不支持32位Linux系统云服务器。
[*]如果云服务器需要备案,则云服务器有购买要求,且每台ECS实例可申请的备案服务号数量有限。
[*]部分软件或应用的许可证(License)需要与云服务器的硬件信息绑定。当云服务器进行迁移操作时可能会引起硬件信息的变更,进而导致License失效。
<h2>阿里云GPU云服务器实例规格族有哪些?</h2>
1、GPU计算型
[*]GPU计算型实例规格族gn7s
[*]GPU计算型实例规格族gn7e
[*]GPU计算型实例规格族gn7i
[*]GPU计算型实例规格族gn7
[*]GPU计算型实例规格族gn6i
[*]GPU计算型实例规格族gn6e
[*]GPU计算型实例规格族gn6v
[*]GPU计算型弹性裸金属服务器实例规格族ebmgn7e
[*]GPU计算型弹性裸金属服务器实例规格族ebmgn7i
[*]GPU计算型弹性裸金属服务器实例规格族ebmgn7
[*]GPU计算型弹性裸金属服务器实例规格族ebmgn6ia
[*]GPU计算型弹性裸金属服务器实例规格族ebmgn6e
[*]GPU计算型弹性裸金属服务器实例规格族ebmgn6v
[*]GPU计算型弹性裸金属服务器实例规格族ebmgn6i
[*]GPU计算型超级计算集群实例规格族sccgn7ex
[*]GPU计算型超级计算集群实例规格族sccgn6e
[*]GPU计算型超级计算集群实例规格族sccgn6
2、GPU虚拟化型
[*]GPU虚拟化型实例规格族sgn7i-vws(共享CPU)
[*]GPU虚拟化型实例规格族vgn7i-vws
[*]GPU虚拟化型实例规格族vgn6i
[*]GPU虚拟化型实例规格族vgn5i
3、异构服务型
[*]异构服务型实例规格族video-enhance
[*]异构服务型实例规格族video-trans
页:
[1]