Gegen das Vergessen

Mit der Technologie Continual Learning lässt sich das Nachtrainieren von Deep Learning Modellen schneller und einfacher realisieren, auch auf Standard-CPUs und direkt in der Anlage.
Mit der Technologie Continual Learning lässt sich das Nachtrainieren von Deep Learning Modellen schneller und einfacher realisieren, auch auf Standard-CPUs und direkt in der Anlage.Bild: MVTec Software GmbH

Die Produktionsumgebungen in Industrieunternehmen unterliegen ständigen Änderungen: So können beispielsweise die Lichtverhältnisse variieren, wenn eine neue Beleuchtung installiert oder die Produktionslinie an einen anderen Ort verlegt wird. Im Laufe der Zeit ändern sich häufig auch die Eigenschaften und Merkmale von gelieferten Bauteilen. Diese können bei einem Lieferantenwechsel etwa eine leicht abweichende Farbe oder Oberfläche aufweisen. Manchmal kommt es auch zu kleinen Unterschieden bei den Produkten, die aber dennoch als OK gelten. Beispiele hierfür finden sich auch in der Lebensmittelindustrie. So können Äpfel aus einer neuen Ernte eine etwas andere Färbung haben. Solche Modifikationen im Produktspektrum wirken sich auf die Fehlerinspektion aus: Ändern sich die zu prüfenden Teile auch nur geringfügig oder kommen neue Klassen hinzu, kann dies die Fehlererkennungsrate massiv beeinträchtigen. Ein Beispiel hierfür ist die Klassifizierung von 2 und 3cm langen Schrauben. Auch kann die Fehlerklassifizierung während der Produktion erweitert werden. Dies ist möglich, sobald ein neuer Defekttyp auftritt und etwa zusätzlich zu Kratzern nun auch Brüche auf einem Bauteil erkannt werden sollen.

Nachtraining mit wenigen Bildern

All diese Veränderungen sollten bei der Modellierung der Produktionsparameter 1:1 abgebildet werden. Kommen Vision-Systeme in Kombination mit Deep-Learning-Technologien zum Einsatz, müssen die entsprechenden Modelle nachtrainiert werden, um die neuen Anforderungen abzudecken. Es ist jedoch technologisch nicht trivial, eine neue Klasse in das Training zu integrieren. Die Gründe sind vielfältig: Das Nachtrainieren erfordert eine hohe Rechenleistung, die direkt auf der ausführenden Maschine häufig nicht möglich ist. Zudem ist eine hohe Anzahl von Bildern erforderlich, die ad hoc nicht zur Verfügung stehen und erst mit Aufwand generiert werden müssen. Hinzu kommt ein Phänomen, das beim Nachtraining häufig auftritt: das sogenannte ‚katastrophale Vergessen‘. Dies ist dann der Fall, wenn ein neuronales Netz während des Nachtrainings die Fähigkeit verliert, die ursprünglich gelernten Klassen eines bereits trainierten Modells korrekt zu erkennen. Die Identifikationsrate für die bisherigen Klassen kann dabei drastisch sinken, z.B. auf nur noch 30 bis 50 Prozent.

Mit der neuen Version Halcon 25.11 stellt MVTec u.a. das neue Feature Continual Learning zur Verfügung. Damit lassen sich Modelle flexibel und schnell an neue Anforderungen und veränderte Bedingungen in industriellen Produktionsumgebungen anpassen. Der größte Vorteil: Für das Nachtraining oder das Hinzufügen neuer Klassen sind nur wenige Bilder erforderlich. So genügen für einfachere Anwendungen fünf bis zehn Aufnahmen pro Klasse, was den Aufwand und die Kosten für die Bereitstellung der Daten erheblich reduziert. Dabei kann das Modell effizient nachtrainiert werden, ohne die zuvor gelernten Eigenschaften zu vergessen.

Trainingsprozess auf

Standard-CPU

Darüber hinaus gestaltet sich der Trainingsprozess sehr schnell und nimmt oft nur wenige Sekunden in Anspruch. Ein weiterer Vorteil ist, dass statt einer teuren GPU lediglich eine reguläre Standard-CPU benötigt wird. Dies ermöglicht das Nachtraining direkt an der Anlage und auf Embedded-Geräten wie Smart-Kameras, ohne dass Daten auf einen PC übertragen werden müssen. Mit Continual Learning lassen sich nicht nur bestehende Klassen anpassen, sondern auch neue Klassen einfach zu einem Modell hinzufügen. Erkennt das Modell beispielsweise nur eine bestimmte Sorte Schrauben kann es erweitert werden, sodass es auch andere Spezifikationen klassifizieren kann. Das Nachtraining ist so konzipiert, dass es grundsätzlich möglich ist, das Nachtrainieren direkt an der Anlage auch ohne tiefgehendes Bildverarbeitungs-Know-how durchzuführen. Dabei kann ein von MVTec auf einem sehr großen und breiten internen Datensatz vortrainiertes, generisches Netz verwendet werden. Dieses lässt sich mithilfe von Continual Learning sehr schnell und mit geringem Aufwand an eine konkrete Problemstellung anpassen.

www.mvtec.com