Heterogen oder homogen?

Allgemein

Heterogen oder homogen?

Prozessoren und Architekturen für die Highspeed-IBV

Bei einem Formel-1-Rennen muss jedes Detail stimmen, damit das eigene Auto als Sieger ins Ziel kommt. Die ‚Echtzeitbedingungen‘ sind dabei klar definiert. Und wie sieht es bei einem Bildverarbeitungssystem aus? Aus einem Megapixel mit 50fps werden in neuen Anwendungen ‚plötzlich‘ 4MP. Mit 87fps übertragen steigt die Datenrate von 50MB/s auf 1.094MB/s, das heißt um einen Faktor von fast 22.
Hinzu kommen komplexere Algorithmen, da die Anforderungen an Robustheit und Intelligenz von Bildverarbeitungslösungen zunehmen und oft Voraussetzung für die Akzeptanz sind. Angenommen die Mathematik ist mit dem Faktor vier dabei, so steigt der Bedarf an Rechenleistung um den Faktor 88. Die Prozessoren werden zwar schneller, aber abhängig vom Prozessorhersteller waren die Leistungssteigerungen der letzten Jahre nicht so, wie das Mooresche Gesetz vermuten ließe. Somit gibt es genügend Gründe, über die Auswahl von Prozessoren und Architekturen ein paar Worte zu verlieren.

Die richtige Architekur?

Homogene Architekturen skalieren Prozessoren gleichen Typs. Ein Beispiel sind im Servermarkt die Intel-Xeon-Prozessoren, bei denen z.B. zwei Prozessoren auf einem Motherboard arbeiten. Auch High-Performance-Computer werden überwiegend homogen aufgebaut. Bei heterogenen Architekturen wird je nach Aufgabenstellung der Prozessortyp gemischt. Beispiele hierfür sind:

• Mehr-Kern-Prozessoren mit z.B. vier ARM- und acht DSP-Prozessoren (z.B. Texas Instruments)
• FPGAs bestehend aus FPGA- und ARM-Prozessor(en) (Altera, Xilinx)
• x86-PC mit einem FPGA als Coprozessor auf dem Framegrabber
• x86-PC mit einer GPU-Karte
• x86-Prozessoren mit CPU und GPU (z.B. AMD)
• Mehr-Kern-ARM mit GPU (z.B. NVidea)

Fragt man Chip-Experten, so sagen diese, dass eine auf Performance und niedrigem Stromverbrauch getrimmte Architektur nur heterogen machbar ist. Dies ist auch logisch, da Prozessoren unterschiedliche Eigenschaften haben, auf denen Betriebssysteme und Algorithmen unterschiedlich schnell ablaufen. So ist ein ARM-Kern gut für Linux OS geeignet, nutzt jedoch für die Codierung von Bilddaten in einer IP-Kamera seinen DSP-Nachbarn. Ein x86-Prozessor ist schnell und läuft mit mehreren Betriebssystemen. Soll aber aus der Anwendung ein kompakter Sensor werden, so geht dieser Prozessortyp thermisch auf K.O. Fragt man dagegen Softwareentwickler, so träumen diese von homogenen Strukturen, einem Compiler, der automatisch alle Aufgaben intelligent verteilt und dabei robuste Programme erzeugt. Jedoch klappt es bei den heute überwiegend eingesetzten Mehr-Kern-Prozessoren im Alltag oft genug nicht, dass Compiler, OS und Prozessor automatisch perfekt harmonieren. Und dann noch ein heterogenes System?

Verrechnung hoher Datenraten

Die Aufgabe bei Highspeed-Anwendungen ist es in der Regel, die Kameradaten in Echtzeit zu verrechnen. 87fps sind in heutigen Maschinen eher Mittelklasse, schnell müssen auch mal 200fps verrechnet werden. 1GByte/s ‚wegzurechnen‘ ist jedoch eine Herausforderung, bei der die Gesamtkosten nicht in die Höhe schnellen dürfen. 1GB/s=1GP/s, das heißt für jedes Pixel steht im Mittel die Zeit von 1ns zur Verfügung. Wird der Prozessor mit z.B. 3GHz getaktet, so darf die Anwendung nur drei Prozessorzyklen rechnen. Abseits möglicher Flaschenhälse auf den Datenbussen oder Speichern sind drei Zyklen quasi nichts. Daher müssen Ideen her, damit die hohe Datenrate beherrscht wird. Im Folgenden sollen kurz verschiedene Varianten bewertet werden:

FPGA-x86: Sozusagen der klassische Ansatz; FPGAs rechnen parallel, programmiert in VHDL und parametriert über ein blockbasiertes Werkzeug. Mehr Code bedeutet größere und damit teurere FPGAs sowie langes Kompilieren. Er ist gut geeignet, wenn die Vorverarbeitung und damit die Reduktion der Bilddaten nicht häufig geändert werden muss. Dies ist aber bei den heutigen flexiblen Maschinen immer seltener der Fall.

x86-GPU: Die GPUs sind sehr schnell, aber nicht für jeden Algorithmus geeignet. Manche Bibliotheken (z.B. Halcon) unterstützen GPUs. Ansonsten erfolgt die Programmierung in Cuda oder Open CL. Sehr leistungsstarke GPUs benötigen viel Strom und müssen daher aktiv gekühlt werden. Aufgrund ihrer Herkunft sind sie i. Allg. nicht langzeitverfügbar. Anders sieht es bei in CPUs integrierten GPUs aus. Diese bringen nicht die Performance einer Grafikkarten-GPU, könnten aber einen Kompromiss darstellen. Für Bildverarbeitung ausgelegte Embedded-Rechner gibt es inzwischen mit CPU-GPU-Verbund.

Dual-Mehr-Kern-DSPs: Neueste Prozessoren mit bis zu acht DSP-Kernen – inkl. starker Gleitkomma-Rechenleistung – können eine Lösung sein, zumal sie per Prozessor-Highspeed-Interface auch mehrfach auf dem Board vorhanden sein können. Für das oben genannte Beispiel mit 1GP/s bedeutet dies: Verteilt auf zweimal acht Kerne sind es pro Kern 62,5MB/s an Datenrate. Programmiert wird in C++ mit einer Eclipse-basierten Entwicklungsumgebung. Ergänzend gibt es die Prozessoren in Kombination mit Zwei-Kern-x86-Prozessoren.

FPGA-ARM: Da der ARM innerhalb eines FPGAs nicht die komplexen Aufgaben übernehmen kann, muss die Rechenleistung im FPGA stattfinden mit den dafür geschilderten Vor- und Nachteilen. Es können kompakte Systeme aufgebaut werden. Bei 1GPixel/Sekunde wird es aber stark von der FPGA-Größe abhängig sein, ob der Ansatz auch funktioniert.

Mehrfach x86: Per PCIe können x86-Prozessoren/-PCs verbunden werden, entwickelt wird dann auf mehreren Maschinen. Allerdings muss der Datenaustausch organisiert und programmiert werden. Insgesamt wird der Systemaufbau mächtig und stromhungrig. Vorteilhaft ist aber, dass alles mit den typischen Microsoft-Werkzeugen entwickelt wird.

Weitere Information

Thematik: Allgemein Ausgabe: inVISION 1 2015, inVISION 5 2014

Zur Firmenwebsite

MEHR ZUM THEMA

Bild: Wenzel Group GmbH & Co. KG

Neuer CTO bei Wenzel

Bild: ©Titolino/stock.adobe.com / Excelitas Technologies Corp.

Widefield Microscope Systems for Micro-LED Display Inspection

Aiming for Uniformity

Bild: Optrion SA

Phenna Group kauft Optrion

Bild: Uli Regenscheit / Messe Stuttgart

Kostenfreie Tickets für die VISION 2026

Es dauert zwar noch ein paar Monate, bis die VISION 2026 (6. bis 8. Oktober, Stuttgart) ihre Tore öffnet, aber die inVISION möchte Ihnen bereits jetzt die Möglichkeit…

Weiterlesen: Kostenfreie Tickets für die VISION 2026
Bild: Aaeon Technology Inc.

Zusammenarbeit zwischen Aaeon und DeepX

Aaeon und das südkoreanische Halbleiterunternehmen DeepX haben auf der Computex Taipei 2026 eine Absichtserklärung über eine dreijährige Produktions- und Entwicklungspartnerschaft unterzeichnet.

Weiterlesen: Zusammenarbeit zwischen Aaeon und DeepX
Bild: Vision Ventures GmbH & Co. KG

20 Millionen Euro für Invisix

Das niederländische Halbleiter-Messtechnikunternehmen Invisix hat eine überzeichnete Seed-Finanzierungsrunde über 20Mio.€ abgeschlossen.

Weiterlesen: 20 Millionen Euro für Invisix
Bild: Association for Advancing Automation (A3)

Advanced Vision & AI Conference 2026 angekündigt

Die Konferenz ‚Advanced Vision & AI Conference 2026‘ findet vom 22. bis 24. September statt und bringt Fachleute aus den Bereichen Maschinenbildverarbeitung, Computer Vision und KI-gesteuerte Automatisierung in…

Weiterlesen: Advanced Vision & AI Conference 2026 angekündigt
Bild: InfraTec GmbH

Online-Event ‚Thermography for Industrial Automation‘

Am Mittwoch, dem 26. August, findet von 10:00 bis 12:00 Uhr MEZ das kostenlose Online-Event ‚Thermography for Industrial Automation‘ in englischer Sprache statt.Vorgestellt wird, wie Infrarot-Thermografie in automatisierten…

Weiterlesen: Online-Event ‚Thermography for Industrial Automation‘

Inspection Connection erweitert Vertriebspartnerschaft

Inspection Connection hat mit Vermon NDT eine nicht-exklusive Vertriebsvereinbarung für Frankreich, Deutschland und Italien geschlossen.

Weiterlesen: Inspection Connection erweitert Vertriebspartnerschaft
Basler mit sehr starkem ersten Quartal

Die Auftragseingänge der Basler AG stiegen im Q1/26 gegenüber dem Vorjahr mit +64% auf 85,6Mio.€,…

Weiterlesen: Basler mit sehr starkem ersten Quartal

Neues Führungsteam bei Framos

Framos führt eine Co-CEO-Struktur ein, die von Dr. Andreas Franz und Dr. Frederik Schönebeck geleitet wird.

Weiterlesen: Neues Führungsteam bei Framos
Technologie Tag in Esslingen

Mahr lädt am 7. und 8. Juli zum Technologie Tag in Esslingen ein.

Weiterlesen: Technologie Tag in Esslingen

VDMA-Tagung zu Qualitätsmanagement in der digitalen Transformation

Auf der VDMA-Tagung Qualitätsmanagement stehen die Integration neuer Technologien und Managementsysteme im Maschinenbau im Mittelpunkt.

Weiterlesen: VDMA-Tagung zu Qualitätsmanagement in der digitalen Transformation
CHII 2026: Industrielle hyperspektrale Bildgebung nimmt Fahrt auf

Hyperspectral Progress

Von KI-gestützter Anomalieerkennung und fortschrittlichen Sensortechnologien bis hin zu biomedizinischer Diagnostik und Defense-Anwendungen: Die CHII 2026 brachte internationale Experten zusammen, um aktuelle…

Weiterlesen: Hyperspectral Progress
Camera Evaluation for Linux

How did your company come to be founded, and what do you aim to achieve with it? It was born out of…

Weiterlesen: Camera Evaluation for Linux
Photometric Stereo Vision at Breakneck Speed

Precise Synchronisation

MSTVision has developed a photometric stereo line-scan camera solution that enables highly precise synchronisation of multiple illumination channels using just one single…

Weiterlesen: Precise Synchronisation