placeholder

OCR mit KI, aber wie?

Faktoren für die Auswahl eines OCR-Systems

Im KI-Vision-Umfeld tummeln sich viele Anbieter von OCR-Lösungen. Für versierte Anwendende sind zudem viele Open Source Werkzeuge und öffentlich zugängliche Netzarchitekturen verfügbar. Doch ohne technischen Background bleiben viele OCR-Aufgaben dennoch ungelöst. Anders bei IDS: Mit der KI-Vision-Lösung Denknet können alle Bildverarbeitungskomponenten für schnelle, zuverlässige und wirtschaftliche OCR-Aufgaben aus einer Hand geliefert und einfach ausprobiert werden.

KI & Deep Learning

Bild 1 | Die Denknet OCR liest in vielen Anwendungsfällen auch ohne Feintuning schon sicher Buchstaben und Zahlen, z.B. Informationen auf Trennscheiben, trotz erheblicher Überdruckung. – Bild: IDS Imaging Development Systems GmbH

Die Erwartungen an eine OCR (Optical Character Recognition) sind hoch. Heutzutage erwarten Anwender, dass sie alle Zeichen out-of-the-box erkennt und richtig deutet. Darüber hinaus sollte die Genauigkeit konsistent bleiben, unabhängig von Veränderungen in der Lichtsituation oder anderen Umgebungsbedingungen. Regelbasierte Ansätze haben den Nachteil, dass ihnen der Interpretationsspielraum fehlt, der bei Ansätzen mit neuronalen Netzen durch das Training mit vielen verschiedenen Beispielen erworben wird. Alleine der Einsatz modernster Technologie ist jedoch nicht ausreichend für den Projekterfolg – vielmehr geht es auch darum, OCR einfach und performant nutzbar sowie benutzerfreundlich wartbar anzubieten. Allerdings schon die reine Vielfalt an möglichen Schriftzeichen und Verfahren, wie Zeichen auf den verschiedensten Oberflächen angebracht werden, vermittelt eine Vorstellung der Herausforderungen. Die Schwierigkeiten solche komplexe visuelle Daten in strukturierte Texte umzuwandeln, umfassen Schmutz, Reflexionen sowie Formfehler durch Ritzen, Prägungen oder Lasergravuren auf festen Materialien. Zudem können überlagerte oder unvollständige Zeichen, sowie eine niedrige Pixelauflösung der Bilddaten dazu führen, dass sich Zeichen kaum mehr voneinander unterscheiden lassen. So wird z.B. eine 8 schnell zu einer 3. Was sind daher die entscheidenden Faktoren für die Auswahl eines OCR-Systems?

Reproduzierbare Genauigkeit

Eine OCR muss von Anfang an einfach funktionieren und eine hohe Leseleistung bieten, um zu überzeugen. Dazu bedarf es einer gut entwickelten Netzarchitektur, die mit vielen variantenreichen Trainingsbildern vortrainiert wurde. Hier sind Situationen aus realen Anwendung genauso unverzichtbar wie der Einsatz synthetischer Daten. Damit können nicht nur viele Sonderfälle und Variationen gelernt werden, das sorgt auch für eine weitaus robustere Erkennung der relevanten Merkmale. An dieser Stelle setzt Denknet an, die KI Vision-Lösung für individuelle Bildanalysen. Dort steht Anwendern ein performantes und ständig weiterentwickeltes Deep-OCR-Modell zur Verfügung. Alle Entwicklungsschritte sind dabei streng versioniert, sodass Anwendungsentwicklungen auf definierte Versionen zurückgreifen können, aber auch die Möglichkeit haben, auf eine neue verbesserte Version zu aktualisieren. Zur Qualitätssicherung kann die Performance und Reproduzierbarkeit der trainierten Netze in einem Quality Center gegen Beispieldatensätze geprüft und verifiziert werden, bevor eine Produktionsanlage mit der neuen Software aktualisiert wird.

Transformer & Large Language Models

Eine weitere Eigenschaft eines guten OCR Modells liegt in der Fähigkeit, nicht nur einzelne Zeichen, sondern die Zusammenhänge – bei Zeichenfolgen, wie bspw. Seriennummern oder Worten – zu erkennen und dieses Wissen auch zu berücksichtigen. Je besser die OCR auch Folgezeichen vorhersagen und das Leseergebnis damit gewichten kann, desto robuster und präziser können spezielle Anwendungsfälle gelöst werden. Die generativen und kombinatorischen Eigenschaften von Transformer-Netzen oder Large Language Modellen (LLM), wie sie ChatGPT verwendet, könn(t)en solche Vorhersagen und damit auch die Lesequalität positiv beeinflussen. Doch dabei sollte man bedenken, dass diese Architekturen in der Ausführung eher langsam sind und viele Systemressourcen benötigen. Gerade im Automatisierungsbereich sollte sich eine Bildverarbeitung nicht im Sekunden-, sondern eher im niedrigen Millisekunden-Bereich bewegen. Ein trainiertes neuronales Netz sollte deshalb schnell und leichtgewichtig bleiben, um es auch auf ’normaler Hardware‘ ausführen zu können.

Thematik: KI & Deep Learning Ausgabe: inVISION 2 (April) 2024

IDS Imaging Development Systems GmbH

Zur Firmenwebsite

MEHR ZUM THEMA

Wenn Plasma sichtbar wird

Bild: Leibniz Institut für Plasmaforschung und Technologie e.V. (INP) / IDS Imaging Development Systems GmbH

Event Partner: Control und EMVA

Bild: EMVA European Machine Vision Association / P. E. Schall GmbH & Co. KG

Kostenfreie Anmeldung & Video-on-Demand

Bild: TeDo Verlag GmbH

Bild: ©Ametek GmbH – Creaform Deutschland

Session 2: Automated Metrology

Weiter geht es zur zweiten Session ‚Inline Metrology‘ um 11:10 Uhr u.a. mit Vorträgen von Kistler & AIT Goehner (Industrial Dimensional Measurement made easy with KiVision), sowie Eleven…

Weiterlesen: Session 2: Automated Metrology
Bild: ©Polytec

Session 3: Surface Inspection

Um 12:30 Uhr startet Session 3 mit dem Thema ‚Surface Inspection‘.

Weiterlesen: Session 3: Surface Inspection
Bild: ©Volume Graphics GmbH

Session 4: NDT & CT/X-Ray

In der vierten Session (ab 13:40 Uhr) dreht sich alles um ‚NDT & CT/X-Ray‘.

Weiterlesen: Session 4: NDT & CT/X-Ray
Bild: EMVA European Machine Vision Association

Innovations selected by EMVA

Auch in diesem Jahr präsentiert der europäische Bildverarbeitungsverband vier innovative Firmen.

Weiterlesen: Innovations selected by EMVA
Bild: Werth / AT Sensors / Zeiss / Creaform / Visiconsult / Fraunhofer IPM

Diskussionsrunde ‚The Future of Metrology‘

Ab 15:30 Uhr steht im Rahmen der Podiumsdiskussion das Thema ‚The Future of Metrology‘ im Mittelpunkt.

Weiterlesen: Diskussionsrunde ‚The Future of Metrology‘

Keynote: The Filter Toolbox ISO16610

Die Keynote ‚The Filter Toolbox ISO16610 for Surface Topography – Theory & Application Examples‘ wird…

Weiterlesen: Keynote: The Filter Toolbox ISO16610
Session 1: 3D Scanning

Zur ersten Session ‚3D Scanning‘ (Start 10:00 Uhr) begrüßen wir u.a. AT Sensors (Boosting Time-to-Market…

Weiterlesen: Session 1: 3D Scanning

Erfolgreiche Neuauflage der CHII

Die diesjährige CHII (Conference for Hyperspectral Imaging in Industry) brachte am 20. und 21. Mai in Graz 121 Fachbesucher von 68 Unternehmen…

Weiterlesen: Erfolgreiche Neuauflage der CHII
Welcome Note & Programm

Der inVISION Day Metrology 2026 bietet ein abwechslungsreiches Programm!

Weiterlesen: Welcome Note & Programm

Locus Robotics übernimmt Nexera Robotics

Locus Robotics übernimmt Nexera Robotics, um die Greiftechnologie NeuraGrasp in die Plattform Locus Array zu integrieren.

Weiterlesen: Locus Robotics übernimmt Nexera Robotics
Mythic übernimmt Videantis

Mythic hat die deutsche Prozessor-IP-Firma Videantis GmbH übernommen, um eine hybride KI-Rechenplattform zu entwickeln, die nach Unternehmensangaben gegenüber klassischen GPU-Systemen eine hundertfache…

Weiterlesen: Mythic übernimmt Videantis
Finanzierung für Hellbender

Hellbender hat eine Finanzierungsrunde in Höhe von 12,5Mio.$ abgeschlossen.

Weiterlesen: Finanzierung für Hellbender
B.I.G. akquiriert Escarda Technologies

Die Berlin.Industrial.Group. (B.I.G.) hat das Berliner Agritech-Startup Escarda Technologies vollständig übernommen.

Weiterlesen: B.I.G. akquiriert Escarda Technologies

Klostermann erhält Sales-Award von OGP

OGP hat die Klostermann 3D Messtechnik GmbH für 25 Jahre Zusammenarbeit und den Verkauf von 200 Messsystemen mit dem Outstanding Sales Achievement…

Weiterlesen: Klostermann erhält Sales-Award von OGP
Nanosystec verlegt Produktionsstätte

Die Nanosystec GmbH verlegt ihre Produktionsstätte innerhalb von Groß-Umstadt an die Adresse Landwehr 12, 64823 Groß-Umstadt.

Weiterlesen: Nanosystec verlegt Produktionsstätte
Eleven Dynamic Expo 2026

Vom 24.-25. September findet in Rosenheim die Eleven Dynamic Expo 2026 statt. An den beiden Tagen stellen zahlreiche Messtechnik-Firmen die neuesten Branchen-Trends…

Weiterlesen: Eleven Dynamic Expo 2026
AMB 2026: Ausstellerverzeichnis online

Das Ausstellerverzeichnis der AMB ist ab sofort online verfügbar.

Weiterlesen: AMB 2026: Ausstellerverzeichnis online
ISO16610-Keynote für inVISION Day Metrology

Am 10. Juni findet der inVISION Day Metrology 2026 – die digitale Konferenz für Messtechnik & ZfP – statt. Die Keynote „The…

Weiterlesen: ISO16610-Keynote für inVISION Day Metrology
Panel Discussion: The Future of Metrology

Am 10. Juni beginnt um 15:30 Uhr (MEZ) die Online-Podiumsdiskussion ‚The Future of Metrology‘, die den inVISION Day Metrology 2026 abschließt.

Weiterlesen: Panel Discussion: The Future of Metrology
IO-Link Forum auf der AAA Straubing

In Straubing präsentieren am 10. und 11. Juni über 150 Aussteller aus Automatisierung, Robotik und Digitalisierung ihre Produkte, Systeme und Lösungen auf…

Weiterlesen: IO-Link Forum auf der AAA Straubing
Stemmer Imaging gründet SIS-TA

Die SIS-TA, eine Tochtergesellschaft von Stemmer Imaging, wurde in dieser Woche offiziell gegründet.

Weiterlesen: Stemmer Imaging gründet SIS-TA

Faktoren für die Auswahl eines OCR-Systems

Reproduzierbare Genauigkeit

Transformer & Large Language Models

MEHR ZUM THEMA

Wenn Plasma sichtbar wird

Event Partner: Control und EMVA

Kostenfreie Anmeldung & Video-on-Demand

Session 2: Automated Metrology

Session 3: Surface Inspection

Session 4: NDT & CT/X-Ray

Innovations selected by EMVA

Diskussionsrunde ‚The Future of Metrology‘

Keynote: The Filter Toolbox ISO16610

Session 1: 3D Scanning

Erfolgreiche Neuauflage der CHII

Welcome Note & Programm

Muybridge sichert sich 16Mio.$ Series-A-Finanzierung

Vielversprechender Start der Control Expert Days

Locus Robotics übernimmt Nexera Robotics

Mythic übernimmt Videantis

Finanzierung für Hellbender

B.I.G. akquiriert Escarda Technologies

Klostermann erhält Sales-Award von OGP

Nanosystec verlegt Produktionsstätte

Eleven Dynamic Expo 2026

AMB 2026: Ausstellerverzeichnis online

ISO16610-Keynote für inVISION Day Metrology

Panel Discussion: The Future of Metrology

IO-Link Forum auf der AAA Straubing

Stemmer Imaging gründet SIS-TA

das könnte sie auch interessieren

Pixargus und Comercial Douma kooperieren in Spanien

Balluff erweitert Chengdu-Standort

Maschinenbildverarbeitung übertrifft Erwartungen in 2025

Präzision für die KI-Ära

Pyrometer im neuen Design

SWIR-Beleuchtungen

RGB & Depth together

No more Compromises