VisionGPT?

Die Idee, dass generative KI bald die Welt der maschinellen Bildverarbeitung revolutionieren könnte, ist verlockend – und nicht ganz abwegig. Die technologischen Fortschritte, die wir bereits erleben, versprechen viel, insbesondere durch Tools wie das hypothetische ‚VisionGPT‘. Diese Art von KI könnte tatsächlich dazu beitragen, dass komplexe Bildverarbeitungsaufgaben für eine breite Nutzerbasis zugänglich werden, ohne dass tiefgehende technische Fachkenntnisse erforderlich sind. Doch wie viel ist Hype, und wie viel Substanz steckt drin?

Bild 1 | Die Diskussionsteilnehmer (v.l.n.r): Eric Carey (Teledyne), 
Thies Möller (Basler), Donato Montanari (Zebra), Ronni Vuine (Micropsi), Olaf Munkelt (MVTec) und Moderator Peter Ebert (inVISION).
Bild 1 | Die Diskussionsteilnehmer (v.l.n.r): Eric Carey (Teledyne), Thies Möller (Basler), Donato Montanari (Zebra), Ronni Vuine (Micropsi), Olaf Munkelt (MVTec) und Moderator Peter Ebert (inVISION).Bild: Landesmesse Stuttgart GmbH & Co. KG

Risiken und Nebenwirkungen

Ein zentrales Problem der generativen KI, insbesondere im Bereich der maschinellen Bildverarbeitung, ist der Unterschied zwischen Wahrnehmung und Generierung. In Anwendungen, die eine hohe Präzision erfordern – etwa in der Qualitätskontrolle – kommt es auf exakte visuelle Wahrnehmung an, also darauf, was tatsächlich ‚da‘ ist. Generative KI jedoch ‚erfindet‘ Inhalte basierend auf Mustern und Wahrscheinlichkeiten, statt nur zu erkennen, was real vorhanden ist. Diese Schaffenslust der KI kollidiert daher oft mit den Anforderungen von Branchen, die spezifische, oft sicherheitsrelevante Präzision verlangen.

Auch führt der hohe Stromverbrauch, der mit dem Training und dem Betrieb solcher KI-Modelle verbunden ist, zu erheblichen Umweltbelastungen. Besonders in der Industrie, wo Rechenzentren oft rund um die Uhr laufen, kann dies die Betriebskosten steigern und die Nachhaltigkeitsziele gefährden.

Generative KI hat jedoch das Potenzial, die Benutzerfreundlichkeit in der Bildverarbeitung erheblich zu verbessern, vor allem für Anwender ohne umfangreiches technisches Wissen. Man stelle sich eine Zukunft vor, in der sich komplexe Bildverarbeitungsaufgaben allein durch einfache Sprachbefehle steuern lassen. Die KI könnte dann im Hintergrund die vielen Parameter eines Bildverarbeitungssystems einstellen und auf diese Weise eine Schnittstelle bieten, die für nicht-technikaffine Anwender leicht zugänglich ist. Die Fähigkeit, Code zu generieren oder spezifische Anleitungen zu geben, könnte darüber hinaus technische Supportprozesse optimieren und Entwicklungsteams entlasten.

Chancen und Nutzen

Die Verlockung, generative KI wahllos und ohne spezifische Anpassungen einzusetzen, könnte ineffizient oder sogar kontraproduktiv sein. Viele industrielle Anwendungen sind derart spezifisch, dass sie von konventionellen, bewährten Methoden effektiver und zuverlässiger bearbeitet werden. Die generative KI könnte hier zwar auf lange Sicht neue Möglichkeiten eröffnen, aber sie wird nicht zur universellen Lösung werden – zumindest nicht in naher Zukunft.

Das Versprechen der generativen KI liegt weniger darin, bestehende Systeme von heute auf morgen zu ersetzen, sondern darin, als ergänzende Technologie die Benutzerfreundlichkeit und Effizienz in der Bildverarbeitung zu steigern. Diese Technologie kann zwar eine wertvolle Unterstützung bieten, doch die hohen Anforderungen industrieller Anwendungen erfordern Geduld und maßgeschneiderte Lösungen. Bis die Vision einer echten KI-Revolution in der Bildverarbeitung Realität wird, steht uns also noch ein langer – aber spannender – Weg bevor.

Die Diskussionsteilnehmer (v.l.n.r): Eric Carey (Teledyne), Thies Möller (Basler), Donato Montanari (Zebra), Ronni Vuine (Micropsi), Olaf Munkelt (MVTec) und Moderator Peter Ebert (inVISION).
Die Diskussionsteilnehmer (v.l.n.r): Donato Montanari (Zebra Technologies), Moderator Peter Ebert (inVISION), Thies Moeller (Basler AG), Ronnie Vuine (Micropsi Industries), Eric Carey (Teledyne Imaging) und Olaf Munkelt (MVTec Software GmbH). – Bild: Landesmesse Stuttgart GmbH & Co. KG