达川屯宏 发表于 2024-10-5 22:54:54

阿里云高性能计算实例规格族特点、适用场景介绍

阿里云高性能计算实例规格族是的阿里云服务器ECS的架构之一,主要应用于各种需要超高性能、网络和存储能力的应用场景,例如人工智能、机器学习、科学计算、地质勘探、气象预报等场景。高性能计算实例规格族有高性能计算优化型实例规格族hpc8ae、高性能计算优化型实例规格族hpc7ip、计算型超级计算集群实例规格族sccc7等。下面是阿里云高性能计算实例规格族特点、适用场景介绍。



https://upload-images.jianshu.io/upload_images/19316870-449fe34bceb0049e.png



<h2>一、阿里云高性能计算实例规格族有哪些?</h2>
目前高性能计算实例规格族的云服务器有10个实例规格,实例名称如下:

[*]高性能计算优化型实例规格族hpc8ae
[*]高性能计算优化型实例规格族hpc7ip
[*]高性能计算优化型实例规格族hpc6id
[*]通用型超级计算集群实例规格族sccg7
[*]计算型超级计算集群实例规格族sccc7
[*]高主频计算型超级计算集群实例规格族scchfc6
[*]高主频通用型超级计算集群实例规格族scchfg6
[*]高主频内存型超级计算集群实例规格族scchfr6
[*]高主频型超级计算集群实例规格族scch5
[*]GPU计算型超级计算集群实例规格族sccgn7ex

架构特点:高性能计算在弹性裸金属服务器基础上,加入高速RDMA(Remote Direct Memory Access)互联支持,大幅提升网络性能,提高大规模集群加速比。在提供高带宽、低延迟优质网络的同时,还具备弹性裸金属服务器的所有优点。
适用场景:主要用于高性能计算和人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用场景。可以满足超高性能、网络和存储能力的要求。
<h2>二、高性能计算优化型实例规格族hpc8ae实例特点、适用场景</h2>

1、hpc8ae实例的特点如下:
hpc8ae实例专为工业仿真、EDA(Electronic Design Automation)仿真、地质勘探、气象预报、分子动力学模拟等计算和网络密集的紧密耦合的HPC工作负载而设计。提供高达3.75 GHz的最新的第四代EPYC?(Genoa)处理器、64 Gbps的eRDMA节点间网络带宽以及增强的内存带宽能力。

[*]

计算:
处理器与内存配比为1:4
处理器:3.4 GHz主频的AMD EPYCTM Genoa处理器,单核睿频最高3.75 GHz,计算性能稳定
不支持开启超线程配置
[*]

存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘
[*]

网络:
支持IPv4、IPv6
支持ERI(Elastic RDMA Interface)
与操作系统的兼容性说明:仅支持经过验证和性能优化的操作系统,包括Centos 7.9 64位、Alibaba Cloud Linux 2.1903 LTS 64位和Alibaba Cloud Linux 3.2104 LTS 64位。

2、hpc8ae实例适用场景:

[*]工业仿真中计算流体动力学(Computational Fluid Dynamics,CFD)、有限元分析(Finite Element Analysis,FEA)
[*]EDA仿真
[*]地质勘探
[*]气象预报
[*]分子动力学模拟
[*]其他高性能计算场景

3、hpc8ae实例包括的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
<th>eRDMA网络(Gbit/s)</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.hpc8ae.32xlarge</td>
<td>64</td>
<td>256</td>
<td>64</td>
<td>64</td>
</tr>
</tbody>
</table>
<h2>三、高性能计算优化型实例规格族hpc7ip实例特点、适用场景</h2>

1、hpc7ip实例的特点如下:
hpc7ip专为芯片设计等需要大量内存容量的HPC工作负载而设计。依托第三代神龙架构,提供稳定可预期的超高性能。同时通过芯片快速路径加速手段,完成存储、网络性能以及计算稳定性的数量级提升。提供高达1:32的超大处理器与内存配比,搭配Intel傲腾持久内存介质,极大幅度降低内存型应用单GiB内存的成本。

[*]

计算:
处理器与内存(内存+持久内存)配比约为1:32。
处理器:采用第三代Intel? Xeon?可扩展处理器(Ice Lake),基频2.7 GHz,全核睿频3.5 GHz,计算性能稳定。
不支持开启超线程配置。
[*]

存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘
[*]

网络:
支持IPv4、IPv6
超高网络收发包PPS能力

与操作系统的兼容性说明:仅支持经过验证和性能优化的操作系统,包括Centos 7.9 64位、Alibaba Cloud Linux 2.1903 LTS 64位和Alibaba Cloud Linux 3.2104 LTS 64位。
2、hpc7ip实例适用场景:

[*]芯片设计
[*]其他高性能计算场景

3、hpc7ip实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.hpc7ip.32xlarge</td>
<td>64</td>
<td>2048</td>
<td>64</td>
</tr>
</tbody>
</table>
<h2>四、高性能计算优化型实例规格族hpc6id实例特点、适用场景</h2>

1、hpc6id实例的特点如下:
hpc6id专为芯片设计等需要大量内存容量和本地数据访问的HPC工作负载而设计。依托第三代神龙架构,提供稳定可预期的超高性能。同时通过芯片快速路径加速手段,完成存储、网络性能以及计算稳定性的数量级提升。提供超大内存和2块3.8 TB本地数据盘,降低内存和数据受限应用的使用成本。

[*]

计算:
处理器与内存配比约为1:38
处理器:Intel? Xeon?可扩展处理器(Cascade Lake),基频 3.1 GHz,全核睿频3.5 GHz,计算性能稳定
不支持开启超线程配置
[*]

存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘


[*]网络:
支持IPv4、IPv6
超高网络收发包PPS能力

与操作系统的兼容性说明:仅支持经过验证和性能优化的操作系统,包括Centos 7.9 64位、Alibaba Cloud Linux 2.1903 LTS 64位和Alibaba Cloud Linux 3.2104 LTS 64位。
2、hpc6id实例适用场景:

[*]芯片设计
[*]地震油藏和结构模拟
[*]其他高性能计算场景

3、hpc6id实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>本地存储(GB)</th>
<th>网络带宽(Gbit/s)</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.hpc6id.20xlarge</td>
<td>40</td>
<td>1536</td>
<td>2 * 3840</td>
<td>32</td>
</tr>
</tbody>
</table>
<h2>五、通用型超级计算集群实例规格族sccg7实例特点、适用场景</h2>
1、sccg7实例的特点如下:

[*]计算:
处理器与内存配比为1:4
处理器:2.9 GHz主频的Intel ? Xeon ? Platinum 8369(Ice lake),全核睿频3.5 GHz


[*]存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘


[*]网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信

2、sccg7实例适用场景:

[*]大规模机器学习训练
[*]大规模高性能科学计算和仿真计算
[*]大规模数据分析、批量计算、视频编码

3、sccg7实例包括的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>vCPU</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
<th>网络收发包PPS</th>
<th>RoCE网络(Gbit/s)</th>
<th>多队列</th>
<th>弹性网卡</th>
<th>单网卡私有IPv4地址数</th>
<th>单网卡IPv6地址数</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.sccg7.32xlarge</td>
<td>128</td>
<td>64</td>
<td>512</td>
<td>100</td>
<td>2400万</td>
<td>200</td>
<td>8</td>
<td>32</td>
<td>10</td>
<td>10</td>
</tr>
</tbody>
</table>
<h2>六、计算型超级计算集群实例规格族sccc7实例特点、适用场景</h2>
1、sccc7实例的特点如下:

[*]

计算:
处理器与内存配比为1:2
处理器:2.9 GHz主频的Intel ? Xeon ? Platinum 8369(Ice lake),全核睿频3.5 GHz
[*]

存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘
[*]

网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信

2、sccc7实例适用场景:

[*]大规模机器学习训练
[*]大规模高性能科学计算和仿真计算
[*]大规模数据分析、批量计算、视频编码

3、sccc7实例的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>vCPU</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
<th>网络收发包PPS</th>
<th>RoCE网络(Gbit/s)</th>
<th>多队列</th>
<th>弹性网卡</th>
<th>单网卡私有IPv4地址数</th>
<th>单网卡IPv6地址数</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.sccc7.32xlarge</td>
<td>128</td>
<td>64</td>
<td>256</td>
<td>100</td>
<td>2400万</td>
<td>200</td>
<td>8</td>
<td>32</td>
<td>10</td>
<td>10</td>
</tr>
</tbody>
</table>
<h2>七、高主频计算型超级计算集群实例规格族scchfc6实例特点、适用场景</h2>
1、scchfc6实例的特点如下:

[*]

计算:
处理器与内存配比为1:2.4
处理器:3.1 GHz主频的Intel ? Xeon ? Platinum 8269(Cascade Lake),全核睿频3.5 GHz
[*]

存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘
[*]

网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信

2、scchfc6实例适用场景:

[*]大规模机器学习训练
[*]大规模高性能科学计算和仿真计算
[*]大规模数据分析、批量计算、视频编码

3、scchfc6实例的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>vCPU</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
<th>网络收发包PPS</th>
<th>RoCE网络(Gbit/s)</th>
<th>多队列</th>
<th>弹性网卡</th>
<th>单网卡私有IP</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.scchfc6.20xlarge</td>
<td>80</td>
<td>40</td>
<td>192</td>
<td>30</td>
<td>600万</td>
<td>50</td>
<td>8</td>
<td>32</td>
<td>10</td>
</tr>
</tbody>
</table>
<h2>八、高主频通用型超级计算集群实例规格族scchfg6实例特点、适用场景</h2>
1、scchfg6实例的特点如下:

[*]

计算:
处理器与内存配比为1:4.8
处理器:3.1 GHz主频的Intel ? Xeon ? Platinum 8269(Cascade Lake),全核睿频3.5 GHz
[*]

存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘
[*]

网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信

2、scchfg6实例适用场景:

[*]大规模机器学习训练
[*]大规模高性能科学计算和仿真计算
[*]大规模数据分析、批量计算、视频编码

3、scchfg6实例的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>vCPU</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
<th>网络收发包PPS</th>
<th>RoCE网络(Gbit/s)</th>
<th>多队列</th>
<th>弹性网卡</th>
<th>单网卡私有IP</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.scchfg6.20xlarge</td>
<td>80</td>
<td>40</td>
<td>384</td>
<td>30</td>
<td>600万</td>
<td>50</td>
<td>8</td>
<td>32</td>
<td>10</td>
</tr>
</tbody>
</table>
<h2>九、高主频内存型超级计算集群实例规格族scchfr6实例特点、适用场景</h2>
1、scchfr6实例的特点如下:

[*]

计算:
处理器与内存配比为1:9.6
处理器:3.1 GHz主频的Intel ? Xeon ? Platinum 8269(Cascade Lake),全核睿频3.5 GHz
[*]

存储:
均为I/O优化实例
仅支持ESSD云盘、ESSD AutoPL云盘、SSD云盘和高效云盘
[*]

网络:
支持IPv6
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信

2、scchfr6实例适用场景:

[*]大规模机器学习训练
[*]大规模高性能科学计算和仿真计算
[*]大规模数据分析、批量计算、视频编码

3、scchfr6实例的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>vCPU</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
<th>网络收发包PPS</th>
<th>RoCE网络(Gbit/s)</th>
<th>多队列</th>
<th>弹性网卡</th>
<th>单网卡私有IP</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.scchfr6.20xlarge</td>
<td>80</td>
<td>40</td>
<td>768</td>
<td>30</td>
<td>600万</td>
<td>50</td>
<td>8</td>
<td>32</td>
<td>10</td>
</tr>
</tbody>
</table>
<h2>十、高主频型超级计算集群实例规格族scch5实例特点、适用场景</h2>
1、scch5实例的特点如下:

[*]

计算:
处理器与内存配比为1:3
处理器:3.1 GHz主频的Intel ? Xeon ? Gold 6149(Skylake)
[*]

存储:
均为I/O优化实例
仅支持SSD云盘和高效云盘
[*]

网络:
同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信

2、scch5实例适用场景:

[*]大规模机器学习训练
[*]大规模高性能科学计算和仿真计算
[*]大规模数据分析、批量计算、视频编码

3、scch5实例的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>vCPU</th>
<th>物理内核</th>
<th>内存(GiB)</th>
<th>网络带宽(Gbit/s)</th>
<th>网络收发包PPS</th>
<th>RoCE网络(Gbit/s)</th>
<th>多队列</th>
<th>弹性网卡</th>
<th>单网卡私有IP</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.scch5.16xlarge</td>
<td>64</td>
<td>32</td>
<td>192</td>
<td>10</td>
<td>450万</td>
<td>50</td>
<td>8</td>
<td>32</td>
<td>10</td>
</tr>
</tbody>
</table>
<h2>十一、GPU计算型超级计算集群实例规格族sccgn7ex实例特点、适用场景</h2>

1、sccgn7ex实例的特点如下:
sccgn7ex是阿里云为了面对日益增长的大规模AI训练需求开发的高带宽超算集群实例。多台裸金属服务器之间采用第三代RDMA SCC网络互联,支持800 G的互联带宽。您可以根据训练需求弹性选择线上集群数量,快速满足大规模AI参数训练的需求。

[*]

计算:
支持NVSwitch,算力高达312T(TF32)
处理器与内存配比为1:8
处理器:采用第三代Intel ? Xeon ? 8369可扩展处理器(Ice lake),基频2.9 GHz,全核睿频3.5 GHz,支持PCIe 4.0接口
[*]

存储:
I/O优化实例
仅支持ESSD云盘和ESSD AutoPL云盘
[*]

网络:
支持IPv6
仅支持专有网络VPC
超高网络性能,2400万PPS网络收发包能力
sccgn7ex实例间支持800 Gbit/s的互联带宽(4 * 双口100 Gbit/s RDMA),支持GPUDirect,每颗GPU直连一个100 Gbit/s网口


2、sccgn7ex实例适用场景:
超大规模AI训练场景
3、sccgn7ex实例的实例规格及指标数据
<table>
<thead>
<tr>
<th>实例规格</th>
<th>vCPU</th>
<th>内存(GiB)</th>
<th>GPU显存(GB)</th>
<th>网络带宽(Gbit/s)</th>
<th>网络收发包PPS</th>
<th>RoCE网络(Gbit/s)</th>
<th>多队列(主网卡/辅助网卡)</th>
<th>弹性网卡</th>
<th>单网卡私有IPv4地址数</th>
<th>单网卡IPv6地址数</th>
</tr>
</thead>
<tbody>
<tr>
<td>ecs.sccgn7ex.32xlarge</td>
<td>128</td>
<td>1024</td>
<td>80 GB * 8</td>
<td>64</td>
<td>2400万</td>
<td>800</td>
<td>Dec-32</td>
<td>32</td>
<td>15</td>
<td>15</td>
</tr>
</tbody>
</table>

购买之前,推荐在阿里云小站平台领取云产品通用代金券,学生用户可在阿里云权益中心领取300元无门槛优惠券,在购买的时候可使用代金券或者优惠券获得满减优惠。



https://upload-images.jianshu.io/upload_images/19316870-a6758eb6ce5d0d09.png

<div class="image-caption">云小站代金券图.png
页: [1]
查看完整版本: 阿里云高性能计算实例规格族特点、适用场景介绍