1. Dez 2018

Implementierung neuronaler Netze auf FPGAs – Teil 2/2

Deep Learning für jedermann

Implementierung neuronaler Netze auf FPGAs – Teil 2/2

Welche Rolle spielen FPGAs bei Deep Learning? Im ersten Teil ging es um die Vorzüge der Technologie und das Ausführen trainierter CNN im Vergleich zu GPUs/CPUs. Dieses Mal geht es nun um die Implementierung auf FPGAs.

An analysis of Deep Neural Network Models for Pratical Applications (Alfredo Canziani, Adam Paszke, Eugenio Culurciello, 2017). (Bild: Silicon Software GmbH)

An analysis of Deep Neural Network Models for Pratical Applications (Alfredo Canziani, Adam Paszke, Eugenio Culurciello, 2017). (Bild: Silicon Software GmbH)

Die Rechenleistung von FPGAs hat sich in einem Maße entwickelt, die das Wachstum von herkömmlichen Prozessoren deutlich überflügelt. Der Produktionsprozess von FPGAs wird aktuell von 16 auf 7nm umgestellt, das heißt eine Vervielfachung der Logikreserven um den Faktor 10. Mit der Umstellung auf 3nm in ca. fünf Jahren wird sogar ein Faktor 100 im Vergleich zu heute erreicht. Dadurch lassen sich komplexe Algorithmen implementieren und Objekte in einem Bild automatisch klassifizieren. Um die bei vielen Deep Learning Anwendungen geforderte hohe Rechengeschwindigkeit zusammen mit einer hohen Durchsatzrate und Treffgenauigkeit zu erzielen sowie für die Implementierung großer Netze sind allerdings auch leistungsfähigere FPGAs notwendig. Für die in der Produktion erforderlichen Verarbeitungsgeschwindigkeiten stehen bereits Hochleistungs-Framegrabber und eingebettete Bildverarbeitungsgeräte wie Kameras und Sensoren mit größeren FPGAs zur Verfügung. Mit umfangreicheren FPGA-Ressourcen lassen sich komplexere Architekturen und damit auch Anwendungen verarbeiten. Die höhere Datenbandbreite ermöglicht eine Verarbeitung eines Gesamtbildes oder zusätzliche Bildvor- und -nachverarbeitung auf dem FPGA. Sie ist ausreichend hoch, um z.B. den kompletten Datenausgang einer GigE Vision Kamera mit Deep Learning zu analysieren.

Verarbeitung von Gesamtern, Videos und Signalen in Echtzeit mit FPGAs unter Visual Applets. (Bild: Silicon Software GmbH)

Verarbeitung von Gesamtern, Videos und Signalen in Echtzeit mit FPGAs unter Visual Applets. (Bild: Silicon Software GmbH)

FPGA-Ressourcen optimieren

Die Bearbeitungsmöglichkeiten im FPGA stehen im direkten Zusammenhang mit den verfügbaren Logikressourcen. Diese können für die algorithmische Beschreibung, aber auch für aufwändige Implementierungsmethoden, Rechentiefen oder höhere Bandbreiten über die Vervielfachung des Rechenkerns eingesetzt werden. Für Deep Learning gibt es unterschiedliche Methoden, Ressourcen einzusparen ohne die Qualität der Klassifizierung zu beeinträchtigen. Eine Methode ist die Skalierung der Bilder, die den internen Datendurchfluss reduziert. Erfahrungswerte haben gezeigt, dass die Rechentiefe sich nur marginal auf die spätere Erkennungsgenauigkeit durchschlägt. Die Reduktion von 32Bit auf 8Bit und von Floating Point auf Fixed Point / Integer ermöglicht dem FPGA, seine stark eingesparten Ressourcen in größere Netzarchitekturen zu investieren. Die höhere Rechengenauigkeit einer 32Bit Floating Point GPU ist für die Deep Learning Inference von geringer Bedeutung, erreichen doch 8Bit Fixed Point FPGAs eine ausreichend präzise Erkennungsgenauigkeit für die meisten Deep Learning Anwendungen bei zu vernachlässigender Fehlertoleranz. Bei Anforderungen nach besonders präziser Rechengenauigkeit lässt sich auf einem größeren FPGA als Ressourcenkompromiss auch 16Bit Fixed Point implementieren. Typische Aufgabenstellung in der Bildverarbeitung ist die Erkennung von Defekten. Sind die Fehlerklassen bekannt, lassen sie sich anhand von Defektbildern aus der Produktion antrainieren. Hingegen bei unbekannten Bildern und der Anforderung, jede Abweichung zu erkennen, werden die Prüfstücke mit einem Golden Master verglichen. In jedem dieser Fälle sind meist kleine Netze einzusetzen, die Fehlerklassen und deren Varianten detektieren. AlexNet, SqueezeNet oder MobileNet sind typische Vertreter hierfür. Diese sind als Basis für spezifische Anpassungen und Verbesserungen der Netzarchitektur für die individuelle Anwendung einsetzbar. Nach dem Training folgt die FPGA-Implementierung für die Inference, das heißt eine weitere Möglichkeit, Ressourcen zu optimieren und die Klassifizierungsqualität zu erhöhen. Im Verhältnis zwischen Erkennungsgenauigkeit, Implementierungsgröße und Rechengeschwindigkeit bzw. Bandbreite werden bei Machine Vision vorrangig kleine, schnelle Netze eingesetzt.

Themen:

inVISION 6 2018 | Fachartikel

Martin Cassel, Redakteur, Silicon Software GmbH

Silicon Software GmbH

Das könnte Sie auch Interessieren

Bild: Cognex Corporation

Bild: Cognex Corporation

Cognex Zahlen Q1/24

Cognex Zahlen Q1/24

Der Umsatz von Cognex stieg um +5% gegenüber Q1-23 (Q1/24: 211Mio. USD; Q1/23 201Mio. USD).

Bild: MIPI Alliance

Bild: MIPI Alliance

MIPI Automotive Fachvortrags-Reihe

MIPI Automotive Fachvortrags-Reihe

Die MIPI Alliance veranstaltet am 15. und 16. Mai die „MIPI Automotive Webinar Series“.

Bild: hema electronic GmbH

Bild: hema electronic GmbH

Hema Visioneers Award geht in die nächste Runde

Hema Visioneers Award geht in die nächste Runde

Erstmals wurde bei der Embedded World der Hema Visioneers Award verliehen.

Bild: Hamamatsu Photonics Europe GmbH

Bild: Hamamatsu Photonics Europe GmbH

Kooperation Hamamatsu und Quantum Machines

Kooperation Hamamatsu und Quantum Machines

Quantum Machines (QM) kündigt die Integration seiner Hochgeschwindigkeitskamera-Schnittstelle Observe mit Hamamatsus ORCA-Quest-Kameras an.

Bild: TeDo Verlag GmbH

Bild: TeDo Verlag GmbH

Robot Vision Webinar

Robot Vision Webinar

Am Dienstag den 28. Mai findet ab 14 Uhr das inVISION TechTalks Webinar ‚Robot Vision‘ statt. Dort stellen IDS (Machine Vision for Robotics – Technologies & Applications) und Roboception (Intelligent 3D robot vision plattform for end-users and distributors).

EMVA 1288 Standard Online Training

EMVA 1288 Standard Online Training

Am 18. Juni sowie am 3. Dezember findet ein dreitägiger Online-Kurs zur Norm 1288 der European Machine Vision Association (EMVA) statt. Ziel des Trainingskurses ist u.a. die vertiefte Kenntnis über die Grundlagen der neuen Version 4.0 sowie das Sammeln von praktischen Erfahrungen.

Bild: Mahr GmbH

Bild: Mahr GmbH

Mahr Innovation Days 2024

Mahr Innovation Days 2024

Am 12. bis 13. Juni findet in Göttingen bei Mahr die Innovation Days 2024 statt. Dabei stellt die Firma zahlreiche Neuheiten zur Oberflächenmessung und Messtechnik vor und gibt an beiden Tagen in zahlreichen Vorträgen einen Überblick über aktuelle Trends und Produkte.

Bild: Edmund Optics Ltd

Bild: Edmund Optics Ltd

Edmund Innovation Summit

Edmund Innovation Summit

Am 13. Juni findet der Innovation Summit von Edmund Optics in Veldhoven (Niederlande) statt. Dabei werden ‚Trends, Developments and Applications in Machine Vision & Lasers Optics‘ vorgestellt.

Bild: Fraunhofer IOF

Bild: Fraunhofer IOF

Seminar „Optische 3D-Messtechnik“

Seminar „Optische 3D-Messtechnik“

Das Fraunhofer IOF veranstaltet am 12. und 14. Juni in Jena das Seminar „Optische 3D-Messtechnik für die Qualitätssicherung in der Produktion“.

Zusammenarbeit Sick und Aicadium

Zusammenarbeit Sick und Aicadium

Sick und Aicadium geben eine Partnerschaft zur Bereitstellung von KI-gestützten industriellen Computer-Vision-Lösungen in Singapur und Südostasien bekannt.

Bild: AIM-Deutschland e.V.

Bild: AIM-Deutschland e.V.

Stabile Auto ID-Branche

Stabile Auto ID-Branche

Trotz anhaltender Krisen bleiben die Ergebnisse des halbjährlichen AIM-Trendbarometer für das 2. Halbjahr 2023 nach wie vor konstant.

Bild: IFR International Federation of Robotics

Bild: IFR International Federation of Robotics

US-Wirtschaft investiert verstärkt in Industrie-Roboter

US-Wirtschaft investiert verstärkt in Industrie-Roboter

Die Zahl der Roboter-Installationen in den USA ist 2023 auf insgesamt 44.303 Einheiten angestiegen – ein Plus von 12% im Vergleich zum Vorjahr.