Einrichten der Software
Es gibt unzählige Deep-Learning-Tools: wo fangen Sie also am besten an? Für Machine-Vision-Entwickler, die mit OpenCV vertraut sind, ist TensorFlow der ideale Einstieg. TensorFlow ist ein flexibles und leistungsstarkes Framework zum Entwickeln und Trainieren von neuronalen Netzwerken. Damit können komplexe Aufgaben mit Python-Code automatisiert werden. Auch eine große Community steht hinter dem Framework. Vielfältige Beispiele, Tutorials und Foren erleichtern zudem die Anwendung des Tools. Dazu kann eine Grafikkarte mit Nvidia Cuda das Trainieren von Netzwerken mit TensorFlow beschleunigen, wenn die Komplexität oder Dringlichkeit Ihrer Aufgabe es erfordert. Grafikkarten beschleunigen zwar das Trainieren von großen Netzwerken, sind aber anfangs nicht unbedingt erforderlich. Die meisten Beispiele und Tutorials laufen auch problemlos mit einer herkömmlichen Desktop-CPU. Viele Deep-Learning-Tools sind ausschließlich für Linux verfügbar. Ubuntu 18.04 ist die Standard-Distribution von Linux. Für die meisten aktuellen TensorFlow-Tutorials wird dieses Betriebssystem verwendet. Ein Docker-Image (www.tensorflow.org/install/docker) kann die Installation und Konfiguration von TensorFlow und seinen Abhängigkeiten erleichtern. Achten Sie darauf, das richtige Docker-Image auszuwählen, da es verschiedene Versionen gibt, je nachdem, ob nur die CPU oder auch die Grafikkartenbeschleunigung genutzt werden soll.
Vision Vorkenntnisse sinnvoll
Bei der Entwicklung eines Vision-Systems auf Deep-Learning-Basis steht mit der Software nur die Hälfte der Lösung. Auch die Positionierung des Ziels, die Art und Ausrichtung der Beleuchtung, die Optik und die Kamera müssen berücksichtigt werden. Wenn Sie die physischen Faktoren eines Deep-Learning-Systems optimieren, nehmen die Komplexität, die Menge der erforderlichen Trainingsdaten sowie die zur Problemlösung erforderliche Größe des Netzwerks ab. Daraus ergeben sich ein schnelleres Training vor und eine höhere Zuverlässigkeit und Geschwindigkeit nach der Bereitstellung