CloudSigma GPU en tant que service

Preslav Dobrev2023-08-16 · 6 min read

CloudSigma permet à ses clients d'ajouter des GPU à leurs machines virtuelles et d'utiliser un calcul haute performance et rentable capable de répondre aux charges de travail les plus exigeantes. Le cœur de l'offre GPU de CloudSigma est le GPU NVIDIA A100 Tensor Core, optimisé pour le HPC, l'IA et l'analyse de données. L'A100 surpasse le NVIDIA TESLA V100 et dispose de nouvelles fonctionnalités dont les applications d'IA peuvent pleinement tirer parti. Nous permettons à nos clients de créer facilement des machines virtuelles optimisées NVIDIA A100 en mode passthrough, de sorte que les instances de VM ont un contrôle direct sur le ou les GPU et leur mémoire intégrée.

Cas d'usage

La croissance des applications gourmandes en calcul s'exécutant dans le cloud a entraîné l'explosion récente du cloud computing accéléré par GPU. Ces applications comprennent l'entraînement et l'inférence du deep learning en IA, l'analyse de données, le calcul scientifique, la génomique, le rendu graphique et le jeu vidéo, pour n'en citer que quelques-unes. De la mise à l'échelle de l'entraînement de l'IA et du calcul scientifique à la distribution des applications d'inférence, en passant par l'activation de l'IA conversationnelle en temps réel, les GPU fournissent la puissance nécessaire pour accélérer de nombreuses charges de travail complexes et imprévisibles s'exécutant dans le cloud.

Le GPU NVIDIA A100 Tensor Core représente un pas de géant en avant, offrant une accélération sans précédent pour l'IA, l'analyse de données et le HPC à toutes les échelles. Propulsé par l'architecture NVIDIA Ampere, l'A100 offre des performances jusqu'à 20 fois supérieures à celles de la génération précédente. CloudSigma met à disposition la version avec 80 Go de mémoire, offrant la bande passante la plus rapide au monde à plus de 2 téraoctets par seconde (To/s) pour exécuter les modèles et les ensembles de données les plus volumineux.

Les GPU NVIDIA figurent parmi les principaux moteurs de calcul alimentant l'IA en offrant des accélérations significatives pour les charges de travail d'entraînement et d'inférence de l'IA. De plus, les GPU NVIDIA accélèrent de nombreux types d'applications et de systèmes de HPC et d'analyse de données, transformant les données en informations exploitables.

IA et HPC
Entraînez des modèles de machine learning complexes plus rapidement et plus efficacement grâce à l'accélération par GPU. Attaquez-vous aux tâches gourmandes en données et réalisez des percées dans l'innovation axée sur l'IA.NVIDIA AI Enterprise est une suite logicielle d'IA et d'analyse de données de bout en bout, native pour le cloud, optimisée pour permettre à toute organisation d'utiliser l'IA. Elle est certifiée pour un déploiement sur le cloud public et comprend un support d'entreprise mondial pour maintenir les projets d'IA sur la bonne voie. L'A100 permet aux chercheurs d'obtenir rapidement des résultats concrets et de déployer des solutions en production à grande échelle.

ENTRAÎNEMENT AU DEEP LEARNING
L'entraînement des modèles d'IA nécessite une puissance de calcul et une évolutivité massives. Les cœurs Tensor NVIDIA A100 avec Tensor Float (TF32) offrent des performances jusqu'à 20 fois supérieures à celles du NVIDIA Volta sans aucune modification de code, et un boost supplémentaire de 2 fois grâce à la précision mixte automatique et au FP16.

Une charge de travail d'entraînement comme BERT peut être résolue à grande échelle en moins d'une minute par 2 048 GPU A100, un record mondial pour le temps de résolution.

Pour les modèles les plus volumineux dotés de tables de données massives, comme les modèles de recommandation de deep learning (DLRM), l'A100 80 Go atteint jusqu'à 1,3 To de mémoire unifiée par nœud et offre un débit jusqu'à 3 fois supérieur à celui de l'A100 40 Go.

Le leadership de NVIDIA dans MLPerf, établissant de multiples records de performance dans le benchmark de référence de l'industrie pour l'entraînement de l'IA.

INFÉRENCE DE DEEP LEARNING
L'A100 introduit des fonctionnalités révolutionnaires pour optimiser les charges de travail d'inférence. Il accélère une gamme complète de précisions, du FP32 à l'INT4. La technologie Multi-Instance GPU (MIG) permet à plusieurs réseaux de fonctionner simultanément sur un seul A100 pour une utilisation optimale des ressources de calcul. De plus, la prise en charge de la sparsité structurelle offre des performances jusqu'à 2 fois supérieures, en plus des autres gains de performance d'inférence de l'A100.

Sur les modèles d'IA conversationnelle de pointe comme BERT, l'A100 accélère le débit d'inférence jusqu'à 249 fois par rapport aux processeurs.

Sur les modèles les plus complexes limités par la taille des lots, comme le RNN-T pour la reconnaissance vocale automatique, la capacité de mémoire accrue de l'A100 80 Go double la taille de chaque MIG et offre un débit jusqu'à 1,25 fois supérieur à celui de l'A100 40 Go.

Les performances de pointe de NVIDIA sur le marché ont été démontrées dans MLPerf Inference. L'A100 apporte des performances 20 fois supérieures pour étendre encore ce leadership.

CALCUL HAUTE PERFORMANCE
Pour réaliser des découvertes de nouvelle génération, les scientifiques se tournent vers les simulations afin de mieux comprendre le monde qui nous entoure.

NVIDIA A100 introduit des Tensor Cores en double précision pour offrir le plus grand bond en avant en matière de performances HPC depuis l'introduction des GPU. Avec 80 Go de la mémoire GPU la plus rapide, les chercheurs peuvent réduire une simulation en double précision de 10 heures à moins de quatre heures sur l'A100. Les applications HPC peuvent exploiter TF32 pour obtenir un débit jusqu'à 11X supérieur pour les opérations de multiplication de matrices denses en simple précision.

Pour les applications HPC avec les ensembles de données les plus volumineux, la mémoire supplémentaire de l'A100 80 Go offre une augmentation de débit allant jusqu'à 2X avec Quantum Espresso, une simulation de matériaux. Cette mémoire massive et cette bande passante mémoire sans précédent font de l'A100 80 Go la plateforme idéale pour les charges de travail de nouvelle génération.

ANALYSE DE DONNÉES HAUTE PERFORMANCE
Les data scientists doivent être capables d'analyser, de visualiser et de transformer des ensembles de données massifs en informations exploitables. Mais les solutions scale-out sont souvent ralenties par des ensembles de données dispersés sur plusieurs serveurs.

Les serveurs accélérés équipés d'A100 fournissent la puissance de calcul nécessaire — une mémoire massive, plus de 2 To/s de bande passante mémoire et une évolutivité avec NVIDIA® NVLink® et NVSwitch™ — pour faire face à ces charges de travail. Combinée à InfiniBand, NVIDIA Magnum IO™ et la suite de bibliothèques open-source RAPIDS™, y compris le RAPIDS Accelerator pour Apache Spark pour l'analyse de données accélérée par GPU, la plateforme de centre de données NVIDIA accélère ces immenses charges de travail à des niveaux de performance et d'efficacité sans précédent.

Sur un benchmark d'analyse de big data, l'A100 80 Go a fourni des résultats avec une augmentation de 2X par rapport à l'A100 40 Go, ce qui le rend idéalement adapté aux charges de travail émergentes dont la taille des ensembles de données explose.

SIMULATIONS SCIENTIFIQUES : Accélérez la recherche et les simulations scientifiques, permettant d'obtenir plus rapidement des informations et des découvertes en physique, en chimie et en sciences de l'environnement.

MÉDIAS ET DIVERTISSEMENT : Rendez des graphiques, des vidéos et des animations haute résolution à la vitesse de l'éclair. Offrez des expériences visuelles exceptionnelles à votre public sans compromettre la qualité.

MODÉLISATION FINANCIÈRE : Analysez de vastes ensembles de données et réalisez des modélisations financières complexes à une vitesse inégalée, fournissant des informations cruciales pour une prise de décision éclairée.

Preslav Dobrev

Auteur · CloudSigma

Preslav Dobrev est un designer créatif chez CloudSigma, axé sur une identité commerciale cohérente à travers des canaux marketing traditionnels et innovants. Il excelle à fusionner la vision artistique avec le marketing stratégique pour créer des récits de marque percutants.

CloudSigma GPU en tant que service

Preslav Dobrev

Commentaires