Εφαρμογή και ανάλυση στην αναγνώριση εικόνων με τη χρήση «Coral Tensor Processing Unit»
Performance analysis of the accelerator "Coral Tenser Processing Unit" in picture recognition
Bachelor Dissertation
Συγγραφέας
Φωτόπουλος, Ιωάννης
Ημερομηνία
2024-09Επιβλέπων
Δουληγέρης, ΧρήστοςΠροβολή/ Άνοιγμα
Λέξεις κλειδιά
Coral TPU ; Neural network ; Artificial intelligence ; Machine learning ; Object recognition ; Artificial neural networks ; Complex neural structures ; Training algorithms ; Machine learning accelerators ; Tensor Flow Lite ; TPU technologyΠερίληψη
Η Τεχνητή Νοημοσύνη είναι ένας από τους ταχύτερα αναπτυσσόμενους τομείς στην επιστήμη της Πληροφορικής. Το πρόβλημα που λύνει η συγκεκριμένη εργασία εντάσσεται στην περιοχή την σύγχρονων νευρωνικών δικτύων Τα σύγχρονα νευρωνικά δίκτυα διαχειρίζονται διεργασίες με μεγάλη πολυπλοκότητα και για αυτό απαιτούν μεγάλη υπολογιστική ισχύ. Οι σύγχρονοι επεξεργαστές γενικού σκοπού «δυσκολεύονται» να επιτύχουν επαρκείς και ικανοποιητικές αποδόσεις. Η Google ανέπτυξε τις Tensor Processing Units (TPUs) για να επιταχύνει την εκτέλεση εφαρμογών Τεχνητής Νοημοσύνης τόσο σε κέντρα δεδομένων όσο και σε λοιπές εφαρμογές, εκπληρώνοντας αυτό τον σκοπό. Σε αυτή τη πτυχιακή εργασία, ασχολούμαστε με τον Edge TPU. Το Edge TPU είναι ένα μικρό ολοκληρωμένο κύκλωμα που επιτρέπει την ανάπτυξη εφαρμογών ΤΝ “at the edge”. Το Edge TPU είναι ικανό να εκτελεί τέσσερα (4) τρισεκατομμύρια πράξεις ανά δευτερόλεπτο, χρησιμοποιώντας 2 Watt ισχύος. Ωστόσο, η αρχιτεκτονική και το σύνολο εντολών τέτοιων επιταχυντών ΤΝ, εμφανίζουν διάφορες προκλήσεις και περιορισμούς. Πραγματοποιήσαμε bench marking στο TPU, με έτοιμα μοντέλα που παρέχει η Google, με στόχο να αξιολογήσουμε τις δυνατότητές του. Τα αποτελέσματα που προέκυψαν αποκαλύπτουν σημαντική επιτάχυνση για το Google Edge TPU σε σύγκριση με τους επεξεργαστές BCM 2837 (Raspberry Pi 3, A+), AMD Ryzen 5 3500U. Συνολικά, επιτυγχάνεται σημαντική επιτάχυνση μεγάλου μεγέθους συνελικτικών νευρωνικών δικτύων και απλών τεχνητών νευρωνικών δικτύων. Το Edge TPU παρέχει έως και 10 φορές καλύτερη απόδοση από τον BCM 2837 και 7 φορές μεγαλύτερη απόδοση από τον AMD Ryzen 5 3500U.