10x schnelleres teil-automatisiertes Labeln von AI-Trainingsbildern

Deep-Learning-Verfahren zur Identifikation und Klassifizierung von Objekten erfordern im Regelfall eine große Anzahl von gelabelten Bildern als Trainingsdaten. Das Startup DataGym.ai bietet eine Online-Workbench, mit der das Labeln von Bildern teil-automatisiert bis zu 10x schneller durchgeführt werden kann.

Vortrainierte, AI-powered Label-Funktionen unterstützen den Anwender beim Labeln und Annotieren von Objekten in den AI-Trainingsern. Beispielsweise werden Umrisse von komplexen Objekten automatisiert mit einem Polygon umrandet. (Bild: DataGym.ai | eForce21 GmbH)

AI-basierte Bildverarbeitung hat in den letzten Jahren rasant an Bedeutung gewonnen. Grundlage solcher Lösungen bilden CNNs, die initial oft mit tausenden oder zehntausenden von gelabelten Bildern (mit sowohl Gut- als auch Schlecht-Fällen) trainiert werden müssen. Das manuelle Labeln einer solchen Vielzahl von Bildern ist ein aufwändiger, stupider und teurer Prozess, der teilweise bis zu 50% des Zeitaufwands in Machine Learning-Projekten beansprucht. Entsprechend können mit beschleunigenden Label-Tools große Einsparungen hinsichtlich Kosten und Time-to-Market erzielt werden.

Beschleunigtes Labeln mit AI

Das Startup DataGym.ai bietet hierfür eine Online-Workbench für Data Scientists und Machine Learning-Teams an, um Bilder (und zukünftig auch Videos) semi-automatisiert bis zu 10x schneller zu labeln als bei manuellem Vorgehen. Die Grundlage bildet der Einsatz von AI und Machine Learning: Vortrainierte, AI-powered Label-Funktionen unterstützen den Anwender beim Labeln und Annotieren von Objekten in den Bildern. Beispielsweise werden die Umrisse von komplexen Objekten automatisiert mit einem Polygon umrandet, der Anwender hat anschließend – falls notwendig – noch die Möglichkeit einzelne Polygonpunkte manuell nach zu justieren. Die Online-Workbench bietet darüber hinaus noch einiges mehr: Sie ist eine End-to-End Plattform zum Erstellen, Verwalten, Labeln, Annotieren, Klassifizieren und Exportieren von Trainingsdaten für AI-Bildverarbeitungssoftware. Die einfach zu bedienende Plattform ist für den Einsatz von Teams jeder Größe, als auch für einzelne Benutzer konzipiert. Typische Anwender sind Data Scientists, Machine Learning-Experten, Ingenieure, Entwickler und Team-Verantwortliche.

Truck aus der Vogelperspektive: Schritt 1 Auswahl des Trucks durch Einrahmen, Schritt 2: automatisches Labeln der Truck-Umrisse mit einem Polygon (Bild: eForce21 Gmbh)

Funktionen im Detail

Projekte und DataSets bilden die Grundlage der Datenverwaltung. Lädt ein Anwender Bilder in das Online-Tool hoch, so können diese in DataSets gruppiert werden. Ein DataSet umfasst eine Menge von Bildern und kann als Ausgangsmaterial in beliebig vielen Projekten verwendet werden. Somit können die Bilder beliebig oft gelabelt bzw. annotiert und für unterschiedliche Trainingsdatensätze verwendet werden. Die Grundlagen für das Labeln von Bildern und Objekten werden in einer sogenannten Label Configuration festgelegt. Diese umfasst sowohl Geometries, als auch Object Classes. Mit einer Geometry wird festgelegt, wie die zeichnerische Kennzeichnung bzw. Umrandung eines Objektes erfolgt. Beispiele hierfür sind: Polygon, Rectangle, Line, Point. Mit einer Object Class wird ein Objekt klassifiziert, d.h. einer Klasse zugeordnet. Damit erhält das Objekt eine Bedeutung bzw. einen Typ. Beispiele im Straßenverkehr könnten sein: Auto, Lkw, Motorrad, Fußgänger, etc. Die Klassifizierungen können bis zu mehreren Ebenen verschachtelt und damit mit Sub-Classes versehen werden. Beispielsweise könnten Autos durch ihre Bauweise subklassifiziert werden, also Sedan, SUV, Pickup, etc. Neben den Objekten können auch ganze Bilder annotiert und klassifiziert werden. Hierzu können in der Label Configuration Klassifizierungs-Fragen hinterlegt werden. Beispielsweise unter welchen Lichtverhältnissen oder zu welcher Tageszeit das Bild aufgenommen wurde.

Ist ein Projekt angelegt und sind diesem eine Label Configuration sowie ein oder mehrere DataSets zugeordnet, so kann mit dem Labeln begonnen werden. Zur einfachen Handhabung wird hierzu pro zu labelndem Bild jeweils eine Task angelegt. Eine Task entspricht also der Aufgabe, ein Bild und die darin enthaltenen Objekte zu labeln und zu klassifizieren. Eine Task ist mit einem Status (z.B. waiting, in progress, completed, skipped, reviewed) versehen und durchläuft je nach Bearbeitungszustand unterschiedliche Stati eines Life Cycles (State Machine). Die Tasks können unterschiedlichen Mitarbeitern eines Teams zugeordnet werden, sodass große Projekte parallelisiert und somit schnell und effizient abgearbeitet werden können.

Beim Labeln eines Bildes und der darin enthaltenen Objekte hat der Anwender in einem übersichtlichen Workspace die Möglichkeit, mit den AI-unterstützen Funktionen teil-automatisiert zu arbeiten oder Geometrien und Klassifizierungen händisch vorzunehmen. Die in einem Projekt erstellten Trainingsdaten können letztlich als JSON-Datei heruntergeladen und zum Training von Machine Learning-Modellen (CNN) verwendet werden. Darüber hinaus stellt die Online Workbench APIs bereit, über die die Funktionen der Plattform automatisiert genutzt und in z.B. Python Entwicklungs-Workflows von Anwendern integriert werden können. Die Online-Workbench wird in der Grundversion kostenfrei auf der Homepage angeboten. Über den aktuellen Funktionsumfang hinaus sind zukünftig weitere Ausbaustufen der Plattform mit interessanten Features geplant, z.B. die Funktionen Video-Labeling und 3D-Labeling.

Bild: TeDo Verlag GmbH

Qualitativ gut

Viel war im Vorfeld der Messe darüber gerätselt worden, wie die Control dieses Jahr ohne zahlreiche große Aussteller laufen würde. Mit 475 Aussteller in zwei Hallen – davon 38% aus dem Ausland – und 13.149 Fachbesuchern überraschend gut. Anbei einige der Messe-Highlight im Überblick.

Bild: Cognex Corporation

Cognex Zahlen Q1/24

Der Umsatz von Cognex stieg um +5% gegenüber Q1-23 (Q1/24: 211Mio. USD; Q1/23 201Mio. USD).

Bild: MIPI Alliance

MIPI Automotive Fachvortrags-Reihe

Die MIPI Alliance veranstaltet am 15. und 16. Mai die „MIPI Automotive Webinar Series“.

Bild: hema electronic GmbH

Hema Visioneers Award geht in die nächste Runde

Erstmals wurde bei der Embedded World der Hema Visioneers Award verliehen.

Bild: Hamamatsu Photonics Europe GmbH

Kooperation Hamamatsu und Quantum Machines

Quantum Machines (QM) kündigt die Integration seiner Hochgeschwindigkeitskamera-Schnittstelle Observe mit Hamamatsus ORCA-Quest-Kameras an.

Bild: TeDo Verlag GmbH

Robot Vision Webinar

Am Dienstag den 28. Mai findet ab 14 Uhr das inVISION TechTalks Webinar ‚Robot Vision‘ statt. Dort stellen IDS (Machine Vision for Robotics – Technologies & Applications) und Roboception (Intelligent 3D robot vision plattform for end-users and distributors).

Bild: EMVA

EMVA 1288 Standard Online Training

Am 18. Juni sowie am 3. Dezember findet ein dreitägiger Online-Kurs zur Norm 1288 der European Machine Vision Association (EMVA) statt. Ziel des Trainingskurses ist u.a. die vertiefte Kenntnis über die Grundlagen der neuen Version 4.0 sowie das Sammeln von praktischen Erfahrungen.

Bild: Mahr GmbH

Mahr Innovation Days 2024

Am 12. bis 13. Juni findet in Göttingen bei Mahr die Innovation Days 2024 statt. Dabei stellt die Firma zahlreiche Neuheiten zur Oberflächenmessung und Messtechnik vor und gibt an beiden Tagen in zahlreichen Vorträgen einen Überblick über aktuelle Trends und Produkte.

Bild: Edmund Optics Ltd