Κατά το ετήσιο συνέδριο GTC 2017, η Nvidia αποκάλυψε και επίσημα την νέα της αρχιτεκτονική, που προσωρινά δεν αντικαθιστά άμεσα την Pascal, ονόματι Volta.

Η νέα GPU της Nvidia είναι το πρώτο chip στον κόσμο που κατασκευάζεται με στην λιθογραφία 12nm FinFET της TSMC.

Κύριος στόχος την Nvidia δεν είναι η αγορά των γραφικών, μιάς και εκεί η Pascal καλά κρατεί, αλλα η ταχέως αναπτυσσόμενες αγορές της Τεχνητής Νοημοσύνης και της Μηχανικής Μάθησης.

Με την GV100, έχουμε να κάνουμε με την μεγαλύτερη GPU που έχει υπάρξει ποτέ, και απο πλευράς αριθμού transistor και απο πλευράς έκτασης chip. Αριθμεί 21,1 δισεκατομμύρια trasistor και καταλαμβάνει έκταση 815mm^2. Ήταν υπο ανάπτυξη για 3 χρόνια παράλληλα με τις υπόλοιπες GPU της Nvidia και είναι αρχιτεκτονικής CUDA 7ης γενίας. Τα 21,1 δις transistor μεταφράζονται σε 5375 CUDA Cores.

Το chip είναι χωρισμένο σε 6 GPC (Graphics Processing Cluster) το καθένα απο τα οποία έχει 895 CUDA Cores. Κάθε GPC είναι επιπλέον διαχωρισμένο σε 14 SMU (Streaming Multiprocessor Unit) και κάθε SMU διαθέτει 64 CUDA Cores. Και οι 5376 CUDA Cores μπορούν να χρησιμοποιηθούν είτε για πράξεις FP32 είναι για INT32. Όταν πρόκειτε για αριθμούς 64 bit είτε FP64 είναι INT64, τότε οι CUDA Cores δουλεύουν σε ζευγάρια και έχουμε 2688 επεξεργαστικές μονάδες.

Στην μεριά της μνήμης, έχουμε 8 ελεγκτές μνήμης πλάτους 512 bit έκαστος, για συνολικό πλάτος διαύλου μνήμης στο chip 4096 bit. Ο δίαυλος αυτός συνδέεται με VRAM 16GB τεχνολογίας HBM2 @ 878 MHz για συνολικό μέγιστο ρυθμό μεταγωγής 900 GB/s. Ο κάθε ένας απο του ελεγκτές μνήμης συνδέεται με 768 MB L2 Cache φτάνοντας το συνολικό μέγεθος στα 6 ΜΒ.

Streaming Multiprocessor

Οι SM της Volta προσφέρουν μικρότερες καθυστερήσεις κατα την εκτέλεση εντολών και την κλήση δεδομένων απο την μνήμη cache σε σχέση με προηγούμενες αρχιτεκτονικές. Επιπλέον ενσωματώνει νέα καλούδια για εργασίες μηχανικής μάθησης και τεχνητής νοημοσύνης.

Μία από αυτές είναι οι επεξεργαστικές μονάδες Tensor Cores μικτής ακρίβειας FP16/32 που είναι ειδικά σχεδιασμένες για αριθμητική πινάκων, που χρησιμοποιείται πολύ στην μηχανική μάθηση και στα νευρωνικά δίκτυα.

Ακόμα μια αλλαγή που παρατηρούμε σε σχέση με την Pascal είναι ότι η Volta πλέον μπορεί να εκτελεί πράξεις INT32 και FP32 ταυτόχρονα λόγω του διαχωρισμού των CUDA Cores, κάτι που η Pascal αδυνατεί να πράξει. Επιπλέον οι μαθηματικές πράξεις FMA πλέον χρειάζονται 4 κύκλους ρολογιού αντί για 6.

Nvidia Tensor Cores: Τα νευρωνικά δίκτυα στο προσκήνιο

Οι επεξεργαστικές μονάδες Tensor Cores είναι η απάντηση της Nvidia στην όλο και αυξανόμενη χρήση των GPU για εκπαίδευση νευρωνικών δικτύων. Μίας και η εν λόγω διαδικασία χρησιμοποιεί κατά κόρων πράξεις μεταξύ πινάκων, αυτό που δημιούργησε είναι μια ξεχωριστή επεξεργαστική μονάδα ειδικά γι’ αυτό τον σκοπό.

Διαθεσιμότητα, Τιμή και Πρώτες Εντυπώσεις

Η πρώτη εφαρμογή της Volta GPU θα έχει το όνομα Tesla V100 και θα πρόκειται για μια κάρτα επιτάχυνσης για επαγγελματικά περιβάλλοντα. Τιμή δεν έχει ανακοινωθεί επίσης, αλλά αν κρίνουμε απο το μέγεθος της GPU και μόνο και το πόσο χαμηλά yields μπορεί να βγάλει ένα τόσο μεγάλο chip, τότε περιμένουμε μια τιμή της τάξης των μερικών χιλιάδων €. Όπως προαναφέρθηκε, η GPU δεν προορίζεται για τον μέσο χρήστη ως μια απλή κάρτα γραφικών. Και γι’ αυτό δεν έχουμε να κάνουμε με τον αντικαταστάτη της Pascal, αλλά με την απάντηση της Nvidia την ολοένα και αυξανόμενη αγορά της τεχνητής νοημοσύνης. Και όλα δείχνουν ότι η Nvidia κέρδισε των πρώτο γύρο των εντυπώσεων.

Πηγές:

[1] WCCFTech

[2] PCWorld

[3] Anandtech

[4] Wikipedia

Ανδρέας Μανίτσας
Ανδρέας Μανίτσας

Φοιτητής στο ΤΜΠΤ ΠΔΜ. Λάτρης της τεχνολογίας με ειδίκευση στο hardware. Φανατικός οπαδός όλων των μορφών μηχανοκίνητου αθλητισμού.