CloudSigma GPU-as-a-Service

Preslav Dobrev2023-08-16 · 5 min read

Η CloudSigma επιτρέπει στους πελάτες να προσθέτουν GPUs στις εικονικές τους μηχανές και να χρησιμοποιούν υπολογιστική ισχύ υψηλής απόδοσης και οικονομικά αποδοτική, η οποία μπορεί να ανταποκριθεί στους πιο απαιτητικούς φόρτους εργασίας. Η καρδιά της προσφοράς GPU της CloudSigma είναι η NVIDIA A100 Tensor Core GPU, βελτιστοποιημένη για HPC, AI και ανάλυση δεδομένων. Η A100 υπερέχει της NVIDIA TESLA V100 και διαθέτει νέα χαρακτηριστικά που οι εφαρμογές AI μπορούν να εκμεταλλευτούν πλήρως. Επιτρέπουμε στους πελάτες να δημιουργούν εύκολα βελτιστοποιημένες VMs NVIDIA A100 σε λειτουργία passthrough, έτσι ώστε τα VM instances να έχουν άμεσο έλεγχο στις GPU/s και την ενσωματωμένη μνήμη τους.

Περιπτώσεις χρήσης

Η ανάπτυξη εφαρμογών έντασης υπολογισμών που εκτελούνται στο cloud έχει οδηγήσει στην πρόσφατη έκρηξη του υπολογιστικού νέφους με επιτάχυνση GPU. Αυτές οι εφαρμογές περιλαμβάνουν εκπαίδευση και εξαγωγή συμπερασμάτων (inference) βαθιάς μάθησης AI, ανάλυση δεδομένων, επιστημονικούς υπολογισμούς, γονιδιωματική, απόδοση γραφικών (rendering) και gaming, για να αναφέρουμε μόνο μερικές. Από την κλιμάκωση της εκπαίδευσης AI και των επιστημονικών υπολογισμών έως την επέκταση των εφαρμογών inference και την ενεργοποίηση συνομιλητικής AI σε πραγματικό χρόνο, οι GPUs παρέχουν την απαραίτητη ισχύ για την επιτάχυνση πολυάριθμων πολύπλοκων και απρόβλεπτων φόρτων εργασίας που εκτελούνται στο cloud.

Η NVIDIA A100 Tensor Core GPU αντιπροσωπεύει ένα τεράστιο άλμα προς τα εμπρός, προσφέροντας πρωτοφανή επιτάχυνση για AI, ανάλυση δεδομένων και HPC σε κάθε κλίμακα. Με την υποστήριξη της NVIDIA Ampere Architecture, η A100 παρέχει έως και 20X υψηλότερη απόδοση από την προηγούμενη γενιά. Η CloudSigma διαθέτει την έκδοση μνήμης 80GB, με το ταχύτερο εύρος ζώνης στον κόσμο με πάνω από 2 terabytes ανά δευτερόλεπτο (TB/s) για την εκτέλεση των μεγαλύτερων μοντέλων και συνόλων δεδομένων.

Οι NVIDIA GPUs συγκαταλέγονται στις κορυφαίες υπολογιστικές μηχανές που τροφοδοτούν το AI, παρέχοντας σημαντικές επιταχύνσεις για φόρτους εργασίας εκπαίδευσης και inference AI. Επιπλέον, οι NVIDIA GPUs επιταχύνουν πολλούς τύπους εφαρμογών και συστημάτων HPC και ανάλυσης δεδομένων, μετατρέποντας τα δεδομένα σε χρήσιμες πληροφορίες.

AI και HPC
Εκπαιδεύστε πολύπλοκα μοντέλα μηχανικής μάθησης ταχύτερα και πιο αποτελεσματικά με επιτάχυνση GPU. Αντιμετωπίστε εργασίες έντασης δεδομένων και επιτύχετε καινοτομίες στην τεχνολογία που καθοδηγείται από το AI.Το NVIDIA AI Enterprise είναι μια ολοκληρωμένη (end-to-end), cloud-native σουίτα λογισμικού AI και ανάλυσης δεδομένων, βελτιστοποιημένη για να επιτρέπει σε οποιονδήποτε οργανισμό να χρησιμοποιεί AI. Είναι πιστοποιημένη για ανάπτυξη στο δημόσιο cloud και περιλαμβάνει παγκόσμια εταιρική υποστήριξη για τη διατήρηση των έργων AI σε τροχιά. Η A100 επιτρέπει στους ερευνητές να παρέχουν γρήγορα αποτελέσματα στον πραγματικό κόσμο και να αναπτύσσουν λύσεις στην παραγωγή σε κλίμακα.

ΕΚΠΑΙΔΕΥΣΗ ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ
Η εκπαίδευση μοντέλων AI απαιτεί τεράστια υπολογιστική ισχύ και επεκτασιμότητα. Οι NVIDIA A100 Tensor Cores με Tensor Float (TF32) παρέχουν έως και 20X υψηλότερη απόδοση σε σχέση με την NVIDIA Volta με μηδενικές αλλαγές κώδικα και μια πρόσθετη ώθηση 2X με αυτόματη μικτή ακρίβεια (mixed precision) και FP16.

Ένας φόρτος εργασίας εκπαίδευσης όπως το BERT μπορεί να επιλυθεί σε κλίμακα σε λιγότερο από ένα λεπτό από 2.048 GPUs A100, ένα παγκόσμιο ρεκόρ για τον χρόνο επίλυσης.

Για τα μεγαλύτερα μοντέλα με τεράστιους πίνακες δεδομένων, όπως τα μοντέλα συστάσεων βαθιάς μάθησης (DLRM), η A100 80GB φτάνει έως και 1.3 TB ενοποιημένης μνήμης ανά κόμβο και προσφέρει έως και 3X αυξημένη απόδοση (throughput) σε σχέση με την A100 40GB.

Η ηγετική θέση της NVIDIA στο MLPerf, σημειώνοντας πολλαπλά ρεκόρ απόδοσης στο σημείο αναφοράς (benchmark) ολόκληρου του κλάδου για την εκπαίδευση AI.

ΕΞΑΓΩΓΗ ΣΥΜΠΕΡΑΣΜΑΤΩΝ (INFERENCE) ΒΑΘΙΑΣ ΜΑΘΗΣΗΣ
Η A100 εισάγει πρωτοποριακά χαρακτηριστικά για τη βελτιστοποίηση των φόρτων εργασίας inference. Επιταχύνει ένα πλήρες εύρος ακρίβειας από FP32 έως INT4. Η τεχνολογία Multi-Instance GPU (MIG) επιτρέπει σε πολλαπλά δίκτυα να λειτουργούν ταυτόχρονα σε μια ενιαία A100 για βέλτιστη χρήση των υπολογιστικών πόρων. Και η υποστήριξη δομικής αραιότητας (structural sparsity) προσφέρει έως και 2X μεγαλύτερη απόδοση επιπλέον των άλλων κερδών απόδοσης inference της A100.

Σε υπερσύγχρονα μοντέλα συνομιλητικής AI όπως το BERT, η A100 επιταχύνει την απόδοση (throughput) του inference έως και 249X σε σχέση με τους επεξεργαστές (CPUs).

Στα πιο πολύπλοκα μοντέλα που περιορίζονται από το μέγεθος παρτίδας (batch-size), όπως το RNN-T για αυτόματη αναγνώριση ομιλίας, η αυξημένη χωρητικότητα μνήμης της A100 80GB διπλασιάζει το μέγεθος κάθε MIG και προσφέρει έως και 1.25X υψηλότερη απόδοση (throughput) σε σχέση με την A100 40GB.

Η κορυφαία στην αγορά απόδοση της NVIDIA αποδείχθηκε στο MLPerf Inference. Η A100 προσφέρει 20X μεγαλύτερη απόδοση για να επεκτείνει ακόμη περισσότερο αυτή την ηγετική θέση.

ΥΠΟΛΟΓΙΣΤΙΚΗ ΥΨΗΛΩΝ ΕΠΙΔΟΣΕΩΝ
Για να ξεκλειδώσουν ανακαλύψεις επόμενης γενιάς, οι επιστήμονες στρέφονται στις προσομοιώσεις για να κατανοήσουν καλύτερα τον κόσμο γύρω μας.

Η NVIDIA A100 εισάγει Tensor Cores διπλής ακρίβειας για να προσφέρει το μεγαλύτερο άλμα στην απόδοση HPC από την εισαγωγή των GPUs. Με 80GB της ταχύτερης μνήμης GPU, οι ερευνητές μπορούν να μειώσουν μια προσομοίωση διπλής ακρίβειας 10 ωρών σε λιγότερο από τέσσερις ώρες στην A100. Οι εφαρμογές HPC μπορούν να αξιοποιήσουν το TF32 για να επιτύχουν έως και 11X υψηλότερη απόδοση για λειτουργίες πολλαπλασιασμού πυκνών πινάκων απλής ακρίβειας.

Για τις εφαρμογές HPC με τα μεγαλύτερα σύνολα δεδομένων, η πρόσθετη μνήμη της A100 80GB προσφέρει έως και 2X αύξηση της απόδοσης με το Quantum Espresso, μια προσομοίωση υλικών. Αυτή η τεράστια μνήμη και το πρωτοφανές εύρος ζώνης μνήμης καθιστούν την A100 80GB την ιδανική πλατφόρμα για φόρτους εργασίας επόμενης γενιάς.

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΥΨΗΛΩΝ ΕΠΙΔΟΣΕΩΝ
Οι επιστήμονες δεδομένων πρέπει να είναι σε θέση να αναλύουν, να οπτικοποιούν και να μετατρέπουν τεράστια σύνολα δεδομένων σε χρήσιμες πληροφορίες. Ωστόσο, οι λύσεις scale-out συχνά επιβραδύνονται από σύνολα δεδομένων που είναι διάσπαρτα σε πολλούς διακομιστές.

Οι επιταχυνόμενοι διακομιστές με A100 παρέχουν την απαιτούμενη υπολογιστική ισχύ—τεράστια μνήμη, πάνω από 2 TB/sec εύρος ζώνης μνήμης και επεκτασιμότητα με NVIDIA® NVLink® και NVSwitch™ —για την αντιμετώπιση αυτών των φόρτων εργασίας. Σε συνδυασμό με το InfiniBand, το NVIDIA Magnum IO™ και τη σουίτα βιβλιοθηκών ανοιχτού κώδικα RAPIDS™, συμπεριλαμβανομένου του RAPIDS Accelerator for Apache Spark για ανάλυση δεδομένων με επιτάχυνση GPU, η πλατφόρμα data center της NVIDIA επιταχύνει αυτούς τους τεράστιους φόρτους εργασίας σε πρωτοφανή επίπεδα απόδοσης και αποτελεσματικότητας.

Σε μια δοκιμή αξιολόγησης (benchmark) ανάλυσης μεγάλων δεδομένων, η A100 80GB παρείχε αποτελέσματα με 2X αύξηση σε σχέση με την A100 40GB, καθιστώντας την ιδανική για αναδυόμενους φόρτους εργασίας με ραγδαία αυξανόμενα μεγέθη συνόλων δεδομένων.

ΕΠΙΣΤΗΜΟΝΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ: Επιταχύνετε την επιστημονική έρευνα και τις προσομοιώσεις, επιτρέποντας ταχύτερη εξαγωγή συμπερασμάτων και ανακαλύψεων στη φυσική, τη χημεία και την περιβαλλοντική επιστήμη.

MEDIA ΚΑΙ ΨΥΧΑΓΩΓΙΑ: Πραγματοποιήστε απόδοση (render) γραφικών υψηλής ανάλυσης, βίντεο και κινούμενων σχεδίων με αστραπιαία ταχύτητα. Προσφέρετε εξαιρετικές οπτικές εμπειρίες στο κοινό σας χωρίς συμβιβασμούς στην ποιότητα.

ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ ΜΟΝΤΕΛΟΠΟΙΗΣΗ: Αναλύστε τεράστια σύνολα δεδομένων και εκτελέστε σύνθετη χρηματοοικονομική μοντελοποίηση με απαράμιλλη ταχύτητα, παρέχοντας κρίσιμες πληροφορίες για τη λήψη τεκμηριωμένων αποφάσεων.

Preslav Dobrev

Συγγραφέας · CloudSigma

Ο Preslav Dobrev είναι Δημιουργικός Σχεδιαστής στην CloudSigma, με εστίαση στη συνεπή επιχειρηματική ταυτότητα μέσω παραδοσιακών και καινοτόμων καναλιών μάρκετινγκ. Διαθέτει την ικανότητα να συνδυάζει το καλλιτεχνικό όραμα με το στρατηγικό μάρκετινγκ για τη δημιουργία εντυπωσιακών αφηγήσεων επωνυμίας.

CloudSigma GPU-as-a-Service

Preslav Dobrev

Σχόλια