10x schnelleres teil-automatisiertes Labeln von AI-Trainingsbildern

Deep-Learning-Verfahren zur Identifikation und Klassifizierung von Objekten erfordern im Regelfall eine große Anzahl von gelabelten Bildern als Trainingsdaten. Das Startup DataGym.ai bietet eine Online-Workbench, mit der das Labeln von Bildern teil-automatisiert bis zu 10x schneller durchgeführt werden kann.

Vortrainierte, AI-powered Label-Funktionen unterstützen den Anwender beim Labeln und Annotieren von Objekten in den AI-Trainingsern. Beispielsweise werden Umrisse von komplexen Objekten automatisiert mit einem Polygon umrandet. (Bild: DataGym.ai | eForce21 GmbH)

AI-basierte Bildverarbeitung hat in den letzten Jahren rasant an Bedeutung gewonnen. Grundlage solcher Lösungen bilden CNNs, die initial oft mit tausenden oder zehntausenden von gelabelten Bildern (mit sowohl Gut- als auch Schlecht-Fällen) trainiert werden müssen. Das manuelle Labeln einer solchen Vielzahl von Bildern ist ein aufwändiger, stupider und teurer Prozess, der teilweise bis zu 50% des Zeitaufwands in Machine Learning-Projekten beansprucht. Entsprechend können mit beschleunigenden Label-Tools große Einsparungen hinsichtlich Kosten und Time-to-Market erzielt werden.

Beschleunigtes Labeln mit AI

Das Startup DataGym.ai bietet hierfür eine Online-Workbench für Data Scientists und Machine Learning-Teams an, um Bilder (und zukünftig auch Videos) semi-automatisiert bis zu 10x schneller zu labeln als bei manuellem Vorgehen. Die Grundlage bildet der Einsatz von AI und Machine Learning: Vortrainierte, AI-powered Label-Funktionen unterstützen den Anwender beim Labeln und Annotieren von Objekten in den Bildern. Beispielsweise werden die Umrisse von komplexen Objekten automatisiert mit einem Polygon umrandet, der Anwender hat anschließend – falls notwendig – noch die Möglichkeit einzelne Polygonpunkte manuell nach zu justieren. Die Online-Workbench bietet darüber hinaus noch einiges mehr: Sie ist eine End-to-End Plattform zum Erstellen, Verwalten, Labeln, Annotieren, Klassifizieren und Exportieren von Trainingsdaten für AI-Bildverarbeitungssoftware. Die einfach zu bedienende Plattform ist für den Einsatz von Teams jeder Größe, als auch für einzelne Benutzer konzipiert. Typische Anwender sind Data Scientists, Machine Learning-Experten, Ingenieure, Entwickler und Team-Verantwortliche.

Truck aus der Vogelperspektive: Schritt 1 Auswahl des Trucks durch Einrahmen, Schritt 2: automatisches Labeln der Truck-Umrisse mit einem Polygon (Bild: eForce21 Gmbh)

Funktionen im Detail

Projekte und DataSets bilden die Grundlage der Datenverwaltung. Lädt ein Anwender Bilder in das Online-Tool hoch, so können diese in DataSets gruppiert werden. Ein DataSet umfasst eine Menge von Bildern und kann als Ausgangsmaterial in beliebig vielen Projekten verwendet werden. Somit können die Bilder beliebig oft gelabelt bzw. annotiert und für unterschiedliche Trainingsdatensätze verwendet werden. Die Grundlagen für das Labeln von Bildern und Objekten werden in einer sogenannten Label Configuration festgelegt. Diese umfasst sowohl Geometries, als auch Object Classes. Mit einer Geometry wird festgelegt, wie die zeichnerische Kennzeichnung bzw. Umrandung eines Objektes erfolgt. Beispiele hierfür sind: Polygon, Rectangle, Line, Point. Mit einer Object Class wird ein Objekt klassifiziert, d.h. einer Klasse zugeordnet. Damit erhält das Objekt eine Bedeutung bzw. einen Typ. Beispiele im Straßenverkehr könnten sein: Auto, Lkw, Motorrad, Fußgänger, etc. Die Klassifizierungen können bis zu mehreren Ebenen verschachtelt und damit mit Sub-Classes versehen werden. Beispielsweise könnten Autos durch ihre Bauweise subklassifiziert werden, also Sedan, SUV, Pickup, etc. Neben den Objekten können auch ganze Bilder annotiert und klassifiziert werden. Hierzu können in der Label Configuration Klassifizierungs-Fragen hinterlegt werden. Beispielsweise unter welchen Lichtverhältnissen oder zu welcher Tageszeit das Bild aufgenommen wurde.

Ist ein Projekt angelegt und sind diesem eine Label Configuration sowie ein oder mehrere DataSets zugeordnet, so kann mit dem Labeln begonnen werden. Zur einfachen Handhabung wird hierzu pro zu labelndem Bild jeweils eine Task angelegt. Eine Task entspricht also der Aufgabe, ein Bild und die darin enthaltenen Objekte zu labeln und zu klassifizieren. Eine Task ist mit einem Status (z.B. waiting, in progress, completed, skipped, reviewed) versehen und durchläuft je nach Bearbeitungszustand unterschiedliche Stati eines Life Cycles (State Machine). Die Tasks können unterschiedlichen Mitarbeitern eines Teams zugeordnet werden, sodass große Projekte parallelisiert und somit schnell und effizient abgearbeitet werden können.

Beim Labeln eines Bildes und der darin enthaltenen Objekte hat der Anwender in einem übersichtlichen Workspace die Möglichkeit, mit den AI-unterstützen Funktionen teil-automatisiert zu arbeiten oder Geometrien und Klassifizierungen händisch vorzunehmen. Die in einem Projekt erstellten Trainingsdaten können letztlich als JSON-Datei heruntergeladen und zum Training von Machine Learning-Modellen (CNN) verwendet werden. Darüber hinaus stellt die Online Workbench APIs bereit, über die die Funktionen der Plattform automatisiert genutzt und in z.B. Python Entwicklungs-Workflows von Anwendern integriert werden können. Die Online-Workbench wird in der Grundversion kostenfrei auf der Homepage angeboten. Über den aktuellen Funktionsumfang hinaus sind zukünftig weitere Ausbaustufen der Plattform mit interessanten Features geplant, z.B. die Funktionen Video-Labeling und 3D-Labeling.