Vom Vision Entwickler zum Deep Learning Einsteiger – Teil 2/2

AI for Beginners

Vom Vision Entwickler zum Deep Learning Einsteiger – Teil 2/2

Für Deep Learning gibt es eine große Auswahl an Frameworks, Netzwerken und Tools. Der folgende Beitrag bietet einige Einstiegstipps. Im zweiten Teil der Serie geht es um Voraussetzungen und Konsistenz.

Bild 1 | Während Bilder, deren Größe mit verschiedenen Methoden geändert wurde (links Kantenglättung mit Antialiasing, rechts ohne), auf den ersten Blick gleich aussehen, reichen die in weiß hervorgehoben Unterschiede aus, um einen signifikanten Einfluss auf die Genauigkeit der Deep Learning Inferenzergebnisse zu haben. (Bild: Flir Systems GmbH)

BWährend Bilder, deren Größe mit verschiedenen Methoden geändert wurde (links Kantenglättung mit Antialiasing, rechts ohne), auf den ersten Blick gleich aussehen, reichen die in weiß hervorgehoben Unterschiede aus, um einen signifikanten Einfluss auf die Genauigkeit der Deep Learning Inferenzergebnisse zu haben. (Bild: Flir Systems GmbH)

Die Trainingsbilder müssen den später vorliegenden Bildern so ähnlich sehen, wie es nur irgendwie möglich ist. Wenn bei Projekten nur sehr wenige Daten für das Training verfügbar sind, können bereits minimale Unterschiede bei der Positionierung und Beleuchtung der Gegenstände eine gewaltige Auswirkung auf die Anwendungsleistung haben. Durch konsistente Positionierung und Beleuchtung des Ziels nimmt die Varianz zwischen den Bildern ab, wodurch weniger Trainingsdaten erforderlich sind. So ist 3D-Druck wie dafür geschaffen, in kurzer Zeit individuelle Befestigungen zu drucken und damit Muster zuverlässig zu fixieren. Die Beleuchtung sollte dabei die Unterschiede der verschiedenen Objekte hervorheben. Sie sollten unbedingt vermeiden, dass einzelne Bereiche zu hell oder zu schwach beleuchtet sind, dass so Feinheiten nicht mehr erkennbar sind. Viele Bildverarbeitungsprobleme mit Farbe sollten nicht mit einer Farbkamera, sondern einer monochromen Kamera und der richtigen Kombination aus Beleuchtung und Filtern gelöst werden. Eine hochwertige Kamera mit hoher Auflösung und einem großen Dynamikbereich erfasst detaillierte Trainingsdaten und bewährt sich schnell im Einsatz. Bei der Bildverarbeitung ist die Konsistenz zwischen den Trainingsdaten und den in der Praxis aufgenommenen Daten von entscheidender Bedeutung. So kann eine Kantenglättung bei der Anpassung der Bildgröße eine entscheidende Auswirkung auf die Netzwerkleistung haben. Zwei mit unterschiedlichen Methoden skalierte Bilder, die für das menschliche Auge identisch aussehen, können dennoch Unterschiede aufweisen, die zu Vorhersagen mit einer geringeren Wahrscheinlichkeit oder falschen Klassifizierungen führen. Um Vision-Entwicklern den Zugang und die Abläufe zu Deep Learning immer weiter zu erleichtern, erscheint in Kürze die neue Inferenzkamera-Serie von Flir. Neuronale Netzwerke können direkt auf diese Kameras geladen werden, wodurch der PC oder Einplatinencomputer wegfällt und die Inferenz direkt auf der Kamera stattfindet.

Überprüfung fehlerhafter Netzwerke

So wie zur Entwicklung von Machine-Vision-Systemen auf Deep-Learning-Basis neue Methoden und Strategien erforderlich sind, ist auch für die Fehlerbehebung ein neuer Ansatz notwendig. Bei der Überprüfung eines fehlerhaften Netzwerks ist es daher sinnvoll, zuerst nach Mustern bei den fehlerhaften Ergebnissen zu suchen. Unerwartete Ergebnisse und eine schlechte Leistung von neuronalen Netzwerken gehen häufig auf schlechte Trainingsdaten zurück. Die Zuverlässigkeit der Netzwerke kann oftmals mit einer Erweiterung der Trainingsdaten angehoben werden und mit einem systematischen Ansatz kann das erforderliche Ausmaß der Daten festgestellt werden. Häufig resultieren unerwartete Ergebnisse aus Grauzonen-Fällen, die bei den Trainingsdaten unterrepräsentiert oder falsch bezeichnet sind. Zwar kann die Zuverlässigkeit eines Netzwerks zusammen mit der Datenmenge erhöht werden, wird aber immer an einem bestimmten Punkt stagnieren. Wirklich erfolgreich ist eine Lösung, wenn diese die Zuverlässigkeitsgrenze erreicht.

Themen:

| Fachartikel

Ausgabe:

inVISION 5 2019
FLIR Systems GmbH

Das könnte Sie auch Interessieren

Bild: EMVA
Bild: EMVA
EMVA 1288 Standard Online Training

EMVA 1288 Standard Online Training

Am 18. Juni sowie am 3. Dezember findet ein dreitägiger Online-Kurs zur Norm 1288 der European Machine Vision Association (EMVA) statt. Ziel des Trainingskurses ist u.a. die vertiefte Kenntnis über die Grundlagen der neuen Version 4.0 sowie das Sammeln von praktischen Erfahrungen.

Bild: Mahr GmbH
Bild: Mahr GmbH
Mahr Innovation Days 2024

Mahr Innovation Days 2024

Am 12. bis 13. Juni findet in Göttingen bei Mahr die Innovation Days 2024 statt. Dabei stellt die Firma zahlreiche Neuheiten zur Oberflächenmessung und Messtechnik vor und gibt an beiden Tagen in zahlreichen Vorträgen einen Überblick über aktuelle Trends und Produkte.

Bild: Ing. Büro Roth GmbH
Bild: Ing. Büro Roth GmbH
KI und Siemens Industial Edge bei Krombacher

KI und Siemens Industial Edge bei Krombacher

Die Einsatzmöglichkeiten von KI sind enorm und betreffen viele Bereiche unseres Lebens. Entsprechend sind die Erwartungen im industriellen Sektor ebenfalls sehr hoch. Gleichzeitig steigen nicht nur die Einsatzmöglichkeiten, sondern auch die Anzahl der umgesetzten Projekte. Das solche Lösungen sehr zuverlässig und flexibel eingesetzt werden können, zeigt eine Anwendung aus der Abfüllung der Krombacher Brauerei.