Wo liegen derzeit (noch) die Probleme beim Deep Learning?

inVISION: Wie sieht es mit den ’30 Bilder für das Training‘-Ansätzen aus, bei denen die Anzahl der Bilder dann doch oft weit darüber liegen?

T. Manthey: Wer mit solchen Versprechen an den Markt geht hat sich als ernsthafter Anbieter von Deep Learning Anwendungen bereits disqualifiziert. Der Informationsgehalt (Entropie) der Trainingsdaten kann grundsätzlich nicht kleiner sein, als der Informationsgehalt der zu erkennenden Objekte. Mit 30 Bildern lässt sich vielleicht ein weißer Würfel auf einem schwarzen Band bei konstanten Lichtbedingungen in einer definierten Position erkennen. Ernsthafte Anwendungen benötigen meist wesentlich mehr Daten. Dank einem hohen Grad an Automatisierung ist dies jedoch für spezialisierte Anbieter kein Problem.

C. Scheubel: Wir sehen in unseren PoC Projekten eher 1.000 Bilder. Für Produktivsysteme eher Richtung 10.000 Bilder. Mit 30 Bildern haben wir noch keine funktionalen Systeme bekommen.

M. Bohnacker: Die 30 Bilder für das Training sind oftmals ein Werbeversprechen, das bei einigen wenigen optimalen Beispielanwendungen oder einfachen Problemstellungen durchaus funktioniert. Diese Problemstellungen lassen sich aber oft auch mit herkömmlicher BV und geringem Aufwand realisieren. Echte Problemstellungen, die für klassische BV-Algorithmen schwer oder nicht zu lösen sind, werden auch zukünftig mit lediglich 30 Bildern nur schwer adressierbar sein. Allerdings gibt es einzelne Ansätze für spezielle Applikationsfälle, die mit sehr wenigen Bildern nachtrainiert werden können. Ein Beispiel hierfür ist Halcons Anomaly Detection (demnächst auch für Merlic verfügbar) oder Halcons Edge Extraction. Diese Modelle lassen sich mit wenigen Bildern auf spezifische Anwendungen anpassen. Allerdings sind sie vom Funktionsumfang jedoch eingeschränkt, z.B. rein auf die Erkennung von Kanten bzw. Anomalien, und können nicht so flexibel eingesetzt werden, wie z.B. vortrainierte Bildklassifikations- oder Object-Detection-Modelle.

F. Weihard: The number of images required for model training is in fact dependent on a variety of external factors including but not limited to the different ‚looks‘ or variations in the object / defect to be identified, the ambient lighting conditions, the variety in positioning and orientations of the parts, the variety in the parts itself such as prints or coloring differences. All of these contribute to a variation in the number of images required for different applications. While guidelines and intuition do help, in the end model training is definitely as much an art, as it is a science.

Seiten: 1 2 3Auf einer Seite lesen

Tedo Verlag GmbH

Das könnte Sie auch Interessieren