CloudSigma GPU即服务

Preslav Dobrev2023-08-16 · 1 min read

CloudSigma 允许客户向其虚拟机添加 GPU，并使用能够满足最苛刻工作负载的高性能、高性价比计算。CloudSigma 的 GPU 产品的核心是专为 HPC、AI 和数据分析优化的 NVIDIA A100 Tensor Core GPU。A100 的性能超越了 NVIDIA TESLA V100，并具有 AI 应用可以充分利用的新特性。我们允许客户在直通（passthrough）模式下轻松构建 NVIDIA A100 优化的 VM，以便 VM 实例能够直接控制 GPU 及其内置显存。

使用场景

在云端运行的计算密集型应用的增长推动了近期 GPU 加速云计算的爆发式增长。这些应用包括 AI 深度学习训练和推理、数据分析、科学计算、基因组学、图形渲染和游戏等。从纵向扩展 AI 训练和科学计算，到横向扩展推理应用，再到实现实时对话式 AI，GPU 提供了必要的动力，以加速在云端运行的众多复杂且不可预测的工作负载。

NVIDIA A100 Tensor Core GPU 代表了巨大的飞跃，为各种规模的 AI、数据分析和 HPC 提供了前所未有的加速。得益于 NVIDIA Ampere 架构，A100 提供了比上一代高出多达 20 倍的性能。CloudSigma 提供了 80GB 显存版本，拥有超过每秒 2 太字节 (TB/s) 的全球最快带宽，可运行最大的模型和数据集。

NVIDIA GPU 是助力 AI 的领先计算引擎之一，可为 AI 训练和推理工作负载提供显著的加速。此外，NVIDIA GPU 还加速了多种类型的 HPC 和数据分析应用及系统，将数据转化为洞察。

AI 和 HPC
利用 GPU 加速，更快速、更高效地训练复杂的机器学习模型。应对数据密集型任务，并在 AI 驱动的创新中取得突破。NVIDIA AI Enterprise 是一款端到端的云原生 AI 和数据分析软件套件，经过优化，可使任何组织都能使用 AI。它已获得在公共云上部署的认证，并包含全球企业级支持，以确保 AI 项目顺利进行。A100 允许研究人员快速交付实际成果，并大规模部署解决方案到生产环境中。

深度学习训练
训练 AI 模型需要强大的计算能力和可扩展性。带有 Tensor Float (TF32) 的 NVIDIA A100 Tensor Core 在无需更改任何代码的情况下，可提供比 NVIDIA Volta 高出多达 20 倍的性能，并且通过自动混合精度 and FP16 还能进一步提升 2 倍。

像 BERT 这样的训练工作负载，可以通过 2,048 个 A100 GPU 在不到一分钟的时间内大规模解决，创下了解决时间的世界纪录。

对于具有海量数据表的最大模型（如深度学习推荐模型 (DLRM)），A100 80GB 每个节点可达到高达 1.3 TB 的统一内存，并提供比 A100 40GB 高出多达 3 倍的吞吐量。

NVIDIA 在 MLPerf 中处于领先地位，在业界广泛的 AI 训练基准测试中创下了多项性能纪录。

深度学习推理
A100 引入了突破性的功能来优化推理工作负载。它加速了从 FP32 到 INT4 的全范围精度。多实例 GPU (MIG) 技术允许在单个 A100 上同时运行多个网络，以实现最佳的计算资源利用率。此外，结构化稀疏性支持在 A100 其他推理性能提升的基础上，还能提供多达 2 倍的性能提升。

在像 BERT 这样最先进的对话式 AI 模型上，A100 的推理吞吐量比 CPU 加速高达 249 倍。

在受批量大小限制的最复杂模型（如用于自动语音识别的 RNN-T）上，A100 80GB 增加的显存容量使每个 MIG 的大小翻倍，并提供比 A100 40GB 高出多达 1.25 倍的吞吐量。

NVIDIA 市场领先的性能在 MLPerf 推理中得到了证实。A100 带来了 20 倍的性能提升，进一步巩固了这一领先地位。

高性能计算
为了解锁下一代发现，科学家们依靠模拟来更好地了解我们周围的世界。

NVIDIA A100 引入了双精度 Tensor Core，实现了自 GPU 问世以来 HPC 性能的最大飞跃。凭借 80GB 的极速 GPU 显存，研究人员在 A100 上可以将原本需要 10 小时的双精度模拟缩短至 4 小时以内。HPC 应用程序可以利用 TF32，在单精度、稠密矩阵乘法运算中实现高达 11 倍的吞吐量提升。

对于具有最大数据集的 HPC 应用程序，A100 80GB 的额外显存可在材料模拟软件 Quantum Espresso 中提供高达 2 倍的吞吐量提升。这种海量显存和前所未有的显存带宽使 A100 80GB 成为下一代工作负载的理想平台。

高性能数据分析
数据科学家需要能够分析、可视化海量数据集并将其转化为洞察。但横向扩展解决方案往往会因为数据集分散在多台服务器上而陷入困境。

配备 A100 的加速服务器提供了应对这些工作负载所需的计算能力——海量显存、超过 2 TB/秒的显存带宽，以及通过 NVIDIA® NVLink® 和 NVSwitch™ 实现的可扩展性。结合 InfiniBand、NVIDIA Magnum IO™ 和 RAPIDS™ 开源库套件（包括用于 GPU 加速数据分析的 RAPIDS Accelerator for Apache Spark），NVIDIA 数据中心平台以空前的性能和效率水平加速了这些庞大的工作负载。

在大数据分析基准测试中，A100 80GB 带来的洞察获取速度比 A100 40GB 提升了 2 倍，使其非常适合数据集规模呈爆炸式增长的新兴工作负载。

科学模拟： 加速科学研究和模拟，在物理、化学和环境科学领域实现更快的洞察和发现。

媒体与娱乐： 以闪电般的速度渲染高分辨率图形、视频和动画。在不牺牲质量的前提下，为您的观众提供卓越的视觉体验。

金融建模： 以无与伦比的速度分析庞大的数据集并进行复杂的金融建模，为明智的决策提供关键洞察。

Preslav Dobrev

作者 · CloudSigma

Preslav Dobrev 是 CloudSigma 的创意设计师，专注于通过传统和创新营销渠道打造一致的企业形象。他擅长将艺术愿景与战略营销相融合，创造具有影响力的品牌叙事。

CloudSigma GPU即服务

Preslav Dobrev

评论