So wird künstliche Intelligenz industrietauglich – Teil 1/2

Bei vielen Vision Unternehmen gibt es immer noch Vorbehalte gegenüber künstlicher Intelligenz (KI). Es mangelt an Fachwissen und Zeit, um sich detailliert ins Themengebiet einzuarbeiten und oftmals auch an Akzeptanz und Erklärbarkeit. Können die KI-Hersteller die Transparenz erhöhen und die Einstiegshürden senken oder sind KI-Methoden noch nicht reif für den industriellen Einsatz?

 Um KI effektiv für verarbeitungsaufgaben einsetzen zu können, reicht die übliche Bereitstellung von Hardware allein nicht aus. Ein Umdenken ist notwendig. (Bild: IDS Imaging Development Systems GmbH)
Um KI effektiv für verarbeitungsaufgaben einsetzen zu können, reicht die übliche Bereitstellung von Hardware allein nicht aus. Ein Umdenken ist notwendig. (Bild: IDS Imaging Development Systems GmbH)


Das ist eine Frage, die momentan häufig diskutiert wird. Die Antwort liegt wie so oft im Auge des Betrachters. Die notwendige Hardware für den produktiven und effizienten Einsatz steht jedenfalls zur Verfügung. Viele Hersteller von Vision Hardware haben das bereits erkannt, wie das stetig wachsende Angebot von KI-Plattformen unterschiedlicher Leistungsklassen zeigt. Aber es gibt dennoch Startschwierigkeiten. Die übliche Bereitstellung von Hardware allein reicht nicht, ein Umdenken ist notwendig.

Es fehlt an Erfahrung

Wenig hilfreich ist, dass KI bzw. Machine Learning (ML) ganz anders funktioniert als regelbasierte Bildverarbeitung und sich damit auch die Herangehensweise und Bearbeitung von Vision Aufgaben unterscheidet. Die Qualität der Ergebnisse ist auch nicht mehr das Produkt von manuell entwickeltem Programmcode, sondern wird durch den Lernprozess mit geeigneten Bilddaten bestimmt. Was so einfach klingt, führt nur mit ausreichend Fachwissen und Erfahrung zum gewünschten Ziel. Ohne geschultes Auge für die richtigen Daten treten oft Fehler auf, die wiederum zu einer falschen Anwendung von ML-Methoden führen. Tests haben gezeigt, dass unterschiedliche Nutzer für die selbe Aufgabe sehr unterschiedliche Trainings-Qualitäten der künstlichen neuronalen Netze (KNN) erzielen, weil teilweise Bilder mit zu viel unwichtigem Inhalt, schlechter Belichtung, Unschärfe oder auch falschen Labels für das Training verwendet wurden.

Die Schlüsselkompetenzen für die Arbeit mit ML-Methoden sind nicht mehr dieselben wie bei der regelbasierten Bildverarbeitung und müssen gezielt aufgebaut werden. Wer bereits die Zeit und Ressourcen hatte, damit zu arbeiten, zu testen und zu spielen, sammelt diese Erfahrung und kennt die Fallstricke. Deshalb beschäftigen sich derzeit wohl eher neue Firmen und Startups mit KI. Sie haben keine Altlasten, sind nicht an bestehende Verfahren gebunden und wagen sich teilweise spielerisch und mit viel Forscherdrang an Aufgaben, wo die klassische Bildverarbeitung bisher ohne Lösung blieb. Doch solange die Big-Player die neue Technologie noch nicht flächendeckend beim Kunden einführen und sich dafür stark machen, fehlt das Wissen und das Vertrauen – auch beim Kunde. Um die alten Hasen aus ihrer Komfortzone zu locken, muss sich daher etwas ändern, denn die KI steht einem etablierten System gegenüber, für das in den vergangenen Jahren passende Umgebungsbedingungen geschaffen wurden. Wissen, Dokumentation, Trainings, Hardware, Software, Entwicklungsumgebungen, Akzeptanz und Nachfrage seitens der Kunden hatten lange Zeit zu reifen. KI kommt dagegen noch sehr roh und puristisch daher. Wer sie beherrscht erntet zwar Bewunderung und Anerkennung, aber auch fragende Gesichter und Unverständnis.

Ein weiterer Aspekt sind neue Zielgruppen. Dr.-Ing. Peter Ebert, Chefredakteur der inVISION und Kenner der Szene meint „Die Vision-Community der Zukunft besteht nicht nur aus klassischen Bildverarbeitungsexperten, sondern bekommt auch Zuwachs aus dem IoT-Bereich.“ Mit neuen Anwendergruppen ergeben sich zwangsläufig auch andere Use Cases und Anforderungen für die Nutzung vorhandener Technologien. Nicht immer reicht dort das klassische Programmier-SDK aus. Altbewährte Regeln müssen aufgebrochen werden.

 (Bild: IDS Imaging Development Systems GmbH)
Intelligente KI-Edge-Geräte reduzieren anfallende Sensor-/daten. Sie erzeugen on-the-edge verwertbare Informationen und kommunizieren diese zur Steuerungseinheit. (Bild: IDS Imaging Development Systems GmbH)

Software als KI-Wegbereiter

Es fehlt nicht an passender Hardware. Die Einsatzmöglichkeiten von ML werden durch effizient arbeitende KI-Beschleuniger vor allem interessant für kleine stromsparend arbeitende Embedded Vision Systeme bzw. vollintegrierte Inferenzkamera Plattformen, wie sie bereits von einzelnen Herstellern angeboten werden. Doch die Startschwierigkeiten der neuen Technologie in der Industrie löst das nicht. Die KI muss getestet, validiert, nachtrainiert und abschließend in einen produktiv arbeitenden Workflow (Anwendung) integriert werden. Aber wer macht das und wer kann das? Dafür sindKompetenzen notwendig, die über eine Prototypenentwicklung hinausgehen. Meist braucht es noch einen Systemprogrammierer, der in der Lage ist, diese Werkzeuge für eine spezielle Plattform zu programmieren.

IDS geht mit der NXT Plattform einen anderen Weg und ist überzeugt davon, dass mit den richtigen, aufeinander abgestimmten Werkzeugen jede Benutzergruppe das Potential einer KI-Vision-Plattform voll nutzen kann. Dies ohne viel Zeit und Kosten in den Aufbau neuer Kernkompetenzen zu stecken, die für die Umsetzung eigener KI-Anwendungen gar nicht zwingend nötig sind. Spezialwissen für das Trainieren neuronaler Netze undProgrammieren eigener Anwendungen lassen sich für viele einfache KI-Workflows in den Werkzeugen verpacken. So kann jeder Anwender seine individuellen Anforderungen umsetzen, ohne ein eigenes Spezialistenteam aufzubauen. Die Software ermöglicht dabei, dass jede Benutzergruppe, die für ihre jeweiligen Aufgaben und Arbeitsweisen passenden Werkzeuge verwenden kann.

Eine Bildverarbeitungsanwendung ist der Rahmen, der mehrere spezifische Einzelaufgaben in einen anwendungsspezifischen Ablauf bringt und fehlerfrei und effizient ausführen soll. Klassisch wird diese Aufgabe von Entwicklern in einem zur Plattform passenden Programmcode wie z.B. C++ programmiert. Wenig anders verhält es sich bei den neu auf den Markt kommenden KI-Plattformen. Ein SDK stellt die notwendigen Softwareschnittstellen zur hardwarenahen Programmierung der jeweiligen Plattform mitsamt der vorhandenen KI-Beschleuniger bereit. Meist steht den Anwendungsentwicklern damit eine weitgehend frei programmierbare Plattform für eigene Prozesslösungen zur Verfügung. Für denjenigen, der weiß was er tut, stellen lediglich die Hardwareperformance und die SDKs eine Grenze für die Kreativität dar. Auch die NXT Inferenzkamera ist durch ein ein entsprechendes SDK mit vielen C++ Sourcecode-Beispielen eine offene Plattform für Entwickler, die vollständig eigene Bildverarbeitungsanwendungen in Form von Vision Apps mit dem KI-Beschleuniger deep ocean entwerfen wollen.

Geführte Anwendungserstellung

Ein Großteil der Bildverarbeitungsanwendungen arbeiten jedoch mit relativ einfachen Abläufen: Bild aufnehmen Bild analysieren bzw. Merkmale extrahieren Prozessentscheidungen treffen Aktion einleiten. Das kann einfaches Erkennen und Klassifizieren von Produkten sein, mit anschließender Weiterleitung von Informationen über verschiedene Schnittstellen an eine Maschinensteuerung oder Sortieranlage. Das sind Basisfunktionalitäten, die sich nur in wenigen Details unterscheiden und deshalb nicht jedes mal neu programmiert werden müssten. Doch die Auswahl eines Deep Learning (DL) Use Cases, wie Klassifikation oder Objekt Detektion sind als Einstiegspunkt für ein Projekt oft bereits zu abstrakt, um die weiteren notwendigen Handlungsschritte für die Datenaufnahme und Vision App Konfiguration ableiten zu können.

IDS geht deshalb den Weg, die KI-Vision mit den NXT Inferenzkameras für die breite Masse einfach bedienbar zu machen. Die App-Erstellung soll für jede Anwendergruppen möglich sein, egal ob Programmierer, Visionprofi oder Maschinenbediener bzw. Facharbeiter. Zu diesem Zweck wird die cloudbasierte KNN-Trainingssoftware NXT lighthouse mit dem nächsten Update um einen Assistenten erweitert, der sich noch stärker an der eigentlichen Problemstellung des Anwenders orientiert und ihn mit entsprechenden Handlungsanweisungen unterstützt. Der Wizard erweitert den Aktionsradius der Zielgruppe und begleitet nun alle Einzelaufgaben einer Vision Anwendung. Angefangen mit der Frage „Was wollen Sie tun“ stellt IDS NXT lighthouse sehr anwendungsnahe Problemstellungen zur Auswahl, wie beispielsweise Objekte zählen, An-/Abwesenheit prüfen oder Prüfstellen kontrollieren. Der Assistent wählt damit im Hintergrund die App-Basis mit dem passenden DL Use Case und schlägt dem Anwender die weiteren Handlungen vor, um die notwendigen Informationen zusammen zu tragen. Darüber hinaus werden nützliche Hinweise, Videos oder Anleitungen angeboten, um dem Anwender das nötige Hintergrundwissen nahe zu bringen. Eine derart geführte Anwendungserstellung erinnert mehr an ein Tutorial, als an klassische App-Entwicklung. Am Ende steht eine vollständig kundenspezifische Vision App zum Download zur Verfügung, die der Anwender nur noch auf einer NXT Kamera aktivieren und starten muss.

Teil 2 stellt neue Methoden wie Attention Maps für die Erklärbarkeit von KI oder visuelle Editoren zur Programmierung vor, die KI-Anwendungen für die Anwender weiter vereinfachen.

IDS Imaging Development Systems GmbH

Das könnte Sie auch Interessieren