Μελέτη απόδοσης συστήματος PIM (Process in Memory) ως προς την υλοποίηση πολλαπλασιασμού αραιών μητρώων επί διάνυσμα SPMV
Study of PIM (Process in Memory) system performance regarding Sparse Matrix-Vector Multiplication SPMV implementation

Προβολή/ Άνοιγμα
Περίληψη
Η υπολογιστική απόδοση αποτελεί διαχρονικά κρίσιμο ζήτημα στον πολλαπλασιασμό μεγάλων αραιών μητρώων με διανύσματα (Sparse Matrix–Vector Multiplication, SPMV), καθώς ο χρόνος εκτέλεσης αυξάνεται σημαντικά όσο μεγαλώνει το μέγεθος και η πολυπλοκότητα των δεδομένων. Το πρόβλημα καθίσταται εντονότερο στην περίπτωση αραιών μητρώων που περιέχουν στοιχεία κινητής υποδιαστολής διπλής ακρίβειας (64-bit double precision). Η αρχιτεκτονική και ο τρόπος λειτουργίας των κεντρικών μονάδων επεξεργασίας (CPU) συχνά δεν επαρκούν για την αποδοτική εκτέλεση τέτοιων πράξεων σε αποδεκτούς χρόνους. Αντιθέτως, οι μονάδες επεξεργασίας γραφικών (GPU), αξιοποιώντας τον υψηλό βαθμό παραλληλισμού που προσφέρουν, αποτελούν καθιερωμένη λύση για την επιτάχυνση αντίστοιχων υπολογιστικών εργασιών.
Σκοπός της παρούσας εργασίας είναι η μελέτη και αξιολόγηση μιας εναλλακτικής αρχιτεκτονικής επεξεργασίας τύπου Process-In-Memory (PIM), η οποία, πέραν της υποστήριξης παράλληλων υπολογισμών, ενσωματώνει τη μονάδα επεξεργασίας και τη μνήμη στο ίδιο ολοκληρωμένο κύκλωμα. Με τον τρόπο αυτό επιδιώκεται η μείωση των καθυστερήσεων που προκύπτουν από τη μεταφορά δεδομένων μεταξύ επεξεργαστή και μνήμης.
Για τον σκοπό αυτό, πραγματοποιείται σύγκριση της απόδοσης ενός PIM συστήματος με εκείνη μιας GPU. Ειδικότερα, μετράται ο χρόνος εκτέλεσης του πολλαπλασιασμού αραιού μητρώου με τυχαίο διάνυσμα για δώδεκα διαφορετικά αραιά μητρώα, αξιοποιώντας δύο διακριτές τεχνικές λειτουργίας για το σύστημα PIM. Τα πειράματα ενσωματώνονται σε πραγματική επιστημονική εφαρμογή που αφορά την προσομοίωση δικτύων βιολογικών νευρώνων.
Τα αποτελέσματα της μελέτης υποδεικνύουν ότι, παρότι η αρχιτεκτονική PIM παρουσιάζει θεωρητικά πλεονεκτήματα, απαιτούνται περαιτέρω βελτιώσεις ώστε η συγκεκριμένη τεχνολογία να καταστεί πλήρως αξιοποιήσιμη σε απαιτητικές επιστημονικές εφαρμογές.

