KI, aber mal anders

Erweiterung des B&R Vision Portfolios um Deep-OCR und KI-Vision

Schon lange hat B&R die Bildverarbeitung in seine Steuerungswelt integriert. Auf der SPS 2023 stellt die Firma zahlreiche weitere Vision Neuheiten zu Deep-OCR, Global Context - Anomaly Detection sowie einen integrierten Flash Controller für externe LED-Beleuchtungen vor. Welche zahlreichen Vorteile sich dadurch für den Maschinenanwender ergeben, hat Andreas Waldl, Produktmanager Integrated Machine Vision bei B&R Industrial Automation, der inVISION verraten.
Bild 1 | Stabile Schrifterkennung mit Deep-OCR, selbst bei inhomogenem Hintergrund: Erkennung eines Mindesthaltbarkeitsdatums und der Produktionslosnummer auf einer Aluminiumdose mit starken Spiegelungen.
Bild 1 | Stabile Schrifterkennung mit Deep-OCR, selbst bei inhomogenem Hintergrund: Erkennung eines Mindesthaltbarkeitsdatums und der Produktionslosnummer auf einer Aluminiumdose mit starken Spiegelungen.Bild: B&R Industrial Automation GmbH

Zur letzten SPS hat B&R die Erweiterung seiner Kooperation mit MVTec um den AI-Prozessor-Hersteller Hailo bekannt gegeben. Als erste Anwendung haben Sie seinerzeit eine Deep-OCR-Entwicklung auf Ihrer Smart Camera in Aussicht gestellt. Wie ist hier der aktuelle Status?

Andreas Waldl: Die Entwicklung des Deep-OCR ist bereits abgeschlossen und das Produkt seit Anfang September verfügbar. Das Resultat hat nicht nur die ersten Kunden, sondern auch uns selbst positiv überrascht. Dass die Qualität der Zeichenerkennung bei unterschiedlichen Schriftarten hervorragend ist, davon konnten wir uns ja bereits bei der Designentscheidung überzeugen, dass aber auch starke Grauwertschwankungen im Hintergrund, minimaler Kontrast und schlechte Druckqualität so problemlos weggesteckt werden, war in dieser Form nicht zu erwarten.

Die Fehlstellen an der Holzoberfläche (l.) werden durch die Heatmap (r.) klar hervorgehoben. Die Qualitätsrelevanz des Defekts kann mit nachgelagerten regelbasierten Algorithmen fein adjustiert werden.
Die Fehlstellen an der Holzoberfläche (l.) werden durch die Heatmap (r.) klar hervorgehoben. Die Qualitätsrelevanz des Defekts kann mit nachgelagerten regelbasierten Algorithmen fein adjustiert werden. Bild: B&R Industrial Automation GmbH

Wie sieht es dabei mit der Geschwindigkeit aus?

Das Deep-Learning-Netzwerk schafft das Lesen einer Zeile, trotz minimaler Verlustleistung im Chip, bereits ab ca. 25ms. Das ist durchaus schnell und lässt bei vielen Anwendungen auch noch ausreichend Platz für zusätzliche Aufgabenstellungen, die auf der Smart Camera verarbeitet werden können.

Bild 2 und 3 | Die Fehlstellen an der Holzoberfläche (l.) werden durch die Heatmap (r.) klar hervorgehoben. Die Qualitätsrelevanz des Defekts kann mit nachgelagerten regelbasierten Algorithmen fein adjustiert werden.
Bild 2 und 3 | Die Fehlstellen an der Holzoberfläche (l.) werden durch die Heatmap (r.) klar hervorgehoben. Die Qualitätsrelevanz des Defekts kann mit nachgelagerten regelbasierten Algorithmen fein adjustiert werden. Bild: B&R Industrial Automation GmbH

Ich gehe davon aus, dass sich B&R aber nicht nur mit OCR beschäftigt. Gibt es mittlerweile auch weitere (AI-)Projekte?

Wir arbeiten aktuell an der AI-gestützten Erkennung von Anomalien. Genauer gesagt an Global Context – Anomaly Detection. Hier haben wir bereits erfolgreich die ersten Proof of Concepts (PoC) mit Kunden abgeschlossen und stellen das Produkt erstmalig auf der SPS 2023 vor. Die Serienverfügbarkeit der Lösung ist bereits für das erste Halbjahr 2024 geplant.

Ist KI nicht möglicherweise zu komplex für den klassischen Automatisierungsanwender mit nur begrenzter Vision-Erfahrung?

Anomaly Detection unterscheidet sich in der Anwendung kaum von herkömmlicher Bildverarbeitung, wenn es richtig eingesetzt und im Kontext der Automatisierung in eine integrierte Bildverarbeitung eingebunden wird. Die Komplexität fängt dann an, wenn Netzwerke nachtrainiert werden müssen, sei es, weil es für eine eindeutige Unterscheidung zusätzliches Bildmaterial benötigt wird oder sich Gut-/Schlecht-Ergebnisse zu sehr überschneiden. Ein Problem ist auch, dass regelbasierte Algorithmen und Deep Learning häufig ein Entweder/Oder und kein Sowohl-als-auch sind oder im besten Fall nur nebeneinander existieren. B&R geht hier einen Schritt weiter und ermöglicht dem Anwender die volle Freiheit, diese zwei Ansätze zu kombinieren – sowohl im Pre- als im Post-Processing.

Dass der Weg den B&R eingeschlagen hat Nachahmer findet, zeigt nur, dass der große Mehrwert, der in einer integrierten Bildverarbeitung steckt, langsam, aber sicher erkannt wird. 

Andreas Waldl, B&R
Dass der Weg den B&R eingeschlagen hat Nachahmer findet, zeigt nur, dass der große Mehrwert, der in einer integrierten Bildverarbeitung steckt, langsam, aber sicher erkannt wird. Andreas Waldl, B&RBild: B&R Industrial Automation GmbH

Was verstehen sie darunter?

Nehmen wir als Beispiel das Global Context – Anomaly-Detection-Netzwerk. Dieses generiert als Ergebnis einen Anomalie-Score und eine Heatmap, also quasi die Landkarte, auf der die Anomalien zu sehen sind. Typischerweise wird bei der Evaluierung eines trainierten Netzwerks versucht, durch Gut- und Schlechtbilder einen passenden Schwellwert zu definieren, der eine eindeutige Unterscheidung ermöglicht. Häufig gibt es hier aber die bereits erwähnte Überlappung, was die Angelegenheit kompliziert macht. Durch Analyse der false positive und false negative Ergebnisse und einem neuerlichen Review der Trainingsdaten sowie einem abschließenden neuen Training wird dann üblicherweise versucht, einen robusten Schwellwert zu erhalten, was nicht immer möglich ist.

Und was macht B&R hier anders?

B&R stellt zwar auch diese AI-generierten Scores zur Verfügung, ermöglicht jedoch parallel, die Heatmap mit regelbasierten Algorithmen zu bewerten. So kann mit sehr einfachen und verständlichen Parametern eine Unterscheidung zwischen sehr großen oder sehr stark ausgeprägten Abweichungen erfolgen. Das Kriterium einer Bewertung kann aber auch einfach die Anzahl vieler kleiner Abweichungen oder deren Mittelwert in sensiblen Bereichen sein. Damit reduziere ich nicht nur die Komplexität beim Training des Deep-Learning-Netzwerks. Diese Vorgehensweise ermöglicht auch eine nachvollziehbare Skalierung der Fehlerschwelle und erhöht damit deutlich die Effizienz einer Maschine. Das ist etwa der Fall, wenn bei einem bestimmten Produkt beispielsweise Abweichung A kein Problem ist oder fertigungstechnisch gar nicht ausgeschlossen werden kann, während Abweichung B entscheidend die Qualität beeinflusst. Eine ausschließlich auf den Anomalie-Score beschränkte Bewertung würde dagegen unnötigen Ausschuss produzieren. Eine zusätzliche Bewertung mit regelbasierten Algorithmen ist nicht nur leichter nachvollziehbar und zur Laufzeit einfach adaptierbar, sondern ermöglicht auch eine regelbasierte Klassifizierung von Ergebnissen in verschiedenen Qualitätsklassen.

Mittlerweile beschäftigen sich auch andere SPS-Hersteller mit der Integration der Bildverarbeitung in die Steuerungswelt, d.h. die SPS- und Vision-Welten wachsen immer weiter zusammen?

Ja, und das ist gut so. Dass der Weg den B&R eingeschlagen hat Nachahmer findet, zeigt nur, dass der große Mehrwert, der in einer integrierten Bildverarbeitung steckt, langsam, aber sicher erkannt wird. Das war vor knapp 25 Jahren nicht viel anders, als B&R den Weg ging, die Antriebstechnik vollständig in die Automatisierungswelt zu integrieren. Der Performancegewinn einer Maschine durch die Integration, aber auch die Freiheitsgrade beim Zusammenspiel der unterschiedlichen Disziplinen bilden zusammen den entscheidenden Wettbewerbsvorteil moderner Produktionsmaschinen.

Welche weiteren Neuheiten in Richtung Bildverarbeitung dürfen wir am B&R-Stand in Nürnberg noch erwarten?

Zum einen präsentieren wir neue Funktionen und Entwicklungstools, die unsere Visionsysteme noch leistungsfähiger und flexibler machen. Zudem stellen wir auch unseren ersten integrierten Flash Controller für externe LED-Beleuchtung aus, der so in der Branche bisher einzigartig ist. Mit am Markt unerreichten Stromanstiegszeiten von bis zu 150ns ermöglicht B&R hier 3rd-Party-Anbietern von Beleuchtungen nahezu die gleiche Performance wie sie B&R bietet. Unsere Kunden können aus einer Vielzahl am Markt befindlichen Beleuchtungsvarianten, die für ihre Anwendung geeignetste auswählen.

Nahezu die gleiche Performance wie B&R? Wie meinen Sie das?

Licht ist der entscheidende Faktor einer Bildverarbeitung. Gehe ich hier Kompromisse ein, gehe ich diese auch bei der Qualität der Aufnahme und damit der Qualität der Bildverarbeitung ein. B&R geht mit seinem Flash Controller konsequent den Weg der vollständigen Integration weiter. 1µs-Lichtimpulse, echtzeitfähig und absolut synchron zu Steuerung, Sensorik oder Aktorik. Insofern unterscheidet sich eine 3rd-Party-Beleuchtungseinheit in Verbindung mit einem B&R-Flashcontroller nicht von einer B&R-Beleuchtung. Features, wie die echtzeitfähige Umschaltbarkeit von Leuchtfarben, der Diagnosemöglichkeit der Leuchte und insbesondere die Factory-Kalibrierung, sind am Markt nach wie vor kein Standard. Die Fertigung von Serienmaschinen ohne Parametrieraufwand und minimale Stillstandszeiten beim Endanwender im Servicefall, sind nur einige der Systemeigenschaften, die Automatisierung mit B&R nach wie vor auszeichnet.

www.br-automation.com

Das könnte Sie auch Interessieren

Bild: ©Ryan/stock.adobe.com
Bild: ©Ryan/stock.adobe.com
Potenziale des Quantencomputings für die Bildverarbeitung

Potenziale des Quantencomputings für die Bildverarbeitung

Das Versprechen des Quantencomputings, komplexe Probleme mit bisher unerreichter Geschwindigkeit zu lösen, eröffnet neue Horizonte in zahlreichen Bereichen. Auch in der Bildverarbeitung könnten die Prinzipien der Quantenmechanik und deren Anwendung in Quantenalgorithmen zu signifikanten Fortschritten führen. Doch während die theoretischen Grundlagen vielversprechend sind, steht die praktische Umsetzung noch vor einigen Herausforderungen.