Ansichtssache

Ansichtssache

Deep Learning: Hype oder Zukunft der Bildverarbeitung?

Deep Learning ist eines der Themen, mit denen sich die Bildverarbeitung gerade intensiv beschäftigt. Allerdings stellt sich die Frage, ob neuronale Netze wirklich helfen können, um die Bildverarbeitung auf die nächste Entwicklungsstufe zu bringen, oder ob es möglicherweise ein kurzfristiger Hype ist. InVISION hat bei verschiedenen Experten nachgefragt, was diese dazu meinen.

(Bild: Matrix Vision GmbH)

Uwe Furtner, Geschäftsführer, Matrix Vision GmbH (Bild: Matrix Vision GmbH)

Fehlende Nachvollziehbarkeit

Im Bildverarbeitungskontext versteht man unter Deep Learning ein Lernverfahren, das mehrere, meist Tausende, Gut- und Schlechtbilder trainiert und anschließend automatisch entscheidet, was gut oder schlecht ist. Der Rechen- und Speicheraufwand ist enorm und für eine intelligente Kamera nicht zu bewältigen. Daher sollen hierfür neuronale Netze eingesetzt werden. Diese werden von Supercomputern errechnet und dann auf die intelligente Kamera gespielt. Doch wer bezahlt die entstehenden, immensen Kosten? Abgesehen davon kann niemand nachvollziehen, was bei neuronalen Netzen intern passiert und welcher Aspekt zur Klassifizierung ausschlaggebend war. Folgendes Szenario verdeutlicht den Nachteil: Beim Einlernen hatten alle Gut-Teile zufällig einen leichten Grünstich, dann wird dies als Entscheidungsgrundlage benutzt. Dies führt dazu, dass auch Gut-Teile, sobald etwa der Grünstich fehlt, als Schlecht-Teile erkannt werden. Ferner kann weder nachgesehen werden, weshalb das so ist, noch das Fehlverhalten einfach korrigiert werden. Wir verfolgen mit unserer Smart Camera einen neuen Ansatz auf der Basis einer selbstlernenden Software. Anhand weniger Beispielbilder wählt diese die passenden Parameter und Algorithmen aus – ganz ohne Cloud und neuronale Netze. Der Anwender kann jedoch jederzeit Parameter und Algorithmen anpassen.

Johannes Hiltner, Produktmanager Halcon, MVTec Software GmbH (Bild: MVTec Software GmbH)

Johannes Hiltner, Produktmanager Halcon, MVTec Software GmbH (Bild: MVTec Software GmbH)

Deutlich erhöhte Erkennungsraten

Mit Deep Learning oder Convolutional Neural Networks (CNN) beschäftigen wir uns schon seit langem. Beispielsweise konnten wir damit die Robustheit von Anwendungen wie der optischen Zeichenerkennung (OCR) signifikant verbessern: Durch neue, mit Deep Learning trainierte Fonts und einen darauf basierenden Klassifikator erhöht sich die Erkennungsrate von Schriften deutlich. Auch Dot-Print-Schriften werden dabei automatisch und robust identifiziert. CNN als Klassifikationstechnologie wird voraussichtlich auch einen Mehrwert für andere Anwendungen liefern, beispielsweise um Objekte, Texturen und Defekte in Produkten zu klassifizieren und damit verlässlich zu erkennen. Für uns ist Deep Learning also kein Hype. Während andere Anbieter die Technologie noch als Trend diskutieren, können unsere Kunden diese bereits heute mit unseren Softwareprodukten für ihre Machine-Vision-Anwendungen nutzen. Aktuell etwa im neuen Major Release von Halcon 13, in dem wir Deep-Learning-Algorithmen für die Zeichenerkennung einsetzen.

Prof. Dr. Christoph Heckenkamp, Optotechnik und Bildverarbeitung (OBV), Hochschule Darmstadt (Bild: Prof. TU-Darmstadt)

Prof. Dr. Christoph Heckenkamp, Optotechnik und Bildverarbeitung (OBV), Hochschule Darmstadt (Bild: Prof. TU-Darmstadt)

Auswirkung von Parameteränderungen nicht vorhersagbar

IBV in der laufenden Produktion bedeutet konstante Prüftiefe auf der Basis definierter Prüfkriterien. Das wird auch in Zukunft ein wesentlicher Anwendungsbereich bleiben. Wenn regelbasierte Ansätze an Grenzen stoßen, ist die Versuchung groß, statistische Klassifikatoren einzusetzen. Nichts anderes sind neuronale Netze. Die quantitativen Zusammenhänge, die zur Klassifikation führen, sind in der Komplexität eines tiefen neuronalen Netzes verdeckt. Die Basis für Entscheidungen ist dann nicht mehr Kausalität, sondern Korrelation. Das ist riskant. Wenn die Auswirkung von Parameteränderungen nicht mehr modellbasiert vorhersagbar ist, kann nur noch empirisch getestet werden. Die Klassifikationsleistung neuronaler Netze hängt stark vom Trainingsdatensatz ab. Der gesamte Parameterraum der im Echtbetrieb auftretenden Fälle soll signifikant abgedeckt sein. Ist das überhaupt grundsätzlich möglich, ist es wirtschaftlich, und können Fehlklassifizierungsraten von 10-3 bis 10-6 erreicht werden? Jeder Bildverarbeiter weiß: Fehlklassifikationen sind unvermeidbar. Die Wahrscheinlichkeit von Fehlklassifikationen muss jedoch belastbar quantifiziert werden. Nur dann kann das Risiko (das Produkt aus Eintrittswahrscheinlichkeit und Schadenshöhe) seriös bewertet werden. Alles andere ist im industriellen Umfeld fahrlässig. Und im Straßenverkehr meiner Meinung nach ebenfalls. Und potentielle Anwender werden in Zukunft nicht nur sagen ‚Aber das sieht man doch!‘, sondern ‚Mein Handy kann das doch auch!‘.

Dr. Michael Volk, Entwicklung und Projektleitung, I-mation GmbH (Bild: I-mation GmbH)

Dr. Michael Volk, Entwicklung und Projektleitung, I-mation GmbH (Bild: I-mation GmbH)

Wertvolle Ergänzung

Die industrielle Bildverarbeitung hat in den letzten Jahren stark vom Fortschritt der Halbleiterindustrie profitiert: Sensoren mit 10MP oder mehr in Kombination mit der heute verfügbaren Rechenleistung ermöglichen Inline-Inspektionen mit hoher Präzision und Geschwindigkeit sogar mit Smart-Kameras. Im Gegensatz dazu sind die grundlegenden Algorithmen zur Auswertung der Bilder prinzipiell dieselben wie vor 20 Jahren. Aufgaben wie z.B. optische Vermessung, Codelesen, Positionserkennung, etc. lösen diese extrem zuverlässig. Geht es jedoch darum, Muster auf einem irregulären (texturierten) Hintergrund zu erkennen oder Fehler auf einem Bauteil zu finden deren Aussehen im Voraus nicht bekannt ist, wird auch der beste Pattern-Matching-Algorithmus von der Leistung des menschlichen Gehirns in den Schatten gestellt. Das Ziel von Deep-Learning-Systemen ist es, diese Fähigkeiten auf einem Rechner nachzubilden. Lange Zeit waren solche Systeme mehr akademische Machbarkeitsstudien denn industriell anwendbare Programme. Mittlerweile sind jedoch erste Systeme auf dem Markt, die speziell für die Anforderungen der industriellen Bildverarbeitung entwickelt, getestet und optimiert wurden. Wir haben Deep-Learning-Systeme bereits mehrfach erfolgreich für Aufgaben eingesetzt, die mit klassischer Bildverarbeitung nicht lösbar waren. Der Schlüssel zum Erfolg dieser Systeme liegt in ihrer Zuverlässigkeit, ihrer Geschwindigkeit und nicht zuletzt in der einfachen Bedienbarkeit sowohl für den Integrator als auch für den Endkunden. Zusammenfassend sind wir der Überzeugung, dass Deep-Learning-Systeme eine extrem wertvolle Ergänzung im Baukasten der Bildverarbeitungswerkzeuge sind. Alleine oder in Kombination ermöglichen sie Lösungen für bisher unlösbare Herausforderungen.

Thematik: Allgemein
Matrix Vision GmbH

Das könnte Sie auch Interessieren

Anzeige

Anzeige

Anzeige

Anzeige

Anzeige

Anzeige

Anzeige