Eine geringere Anzahl an Trainingsbildern, kürzere Trainings- und Ausführungszeiten sowie der Einsatz einer Standard-CPU sind entscheidende Vorteile, verglichen mit den meisten anderen Werkzeugen, die auf dem Ansatz des „Convolutional Neural Network“ (CNN) aus dem Deep-Learning-Bereich basieren. In CVB2019 wird CVB Polimago auch für Embedded-Anwendungen verfügbar sein.
CVB Polimago gehört zum Bildverarbeitungs-Toolkit Common Vision Blox (CVB) und liefert eine ähnliche Genauigkeit wie Ansätze mit neuronale Netzwerken. Dabei wird die Ridge-Regression eingesetzt, eine „Supervised Learning“-Methode zur Suche und Klassifizierung in industriellen Bildverarbeitungsanwendungen. Dieses überwachte Lernen bedeutet, dass der Anwender in den Trainingsbildern typische Klassifizierungsmerkmale mittels einer ROI markiert hat. Dadurch ist der Algorithmus in der Lage, eine Funktion zu erzeugen, die das gewünschte Ergebnis liefert.
Ein entscheidender Faktor ist, dass das Tool in der Regel nur 20 bis 100 Trainingsbilder benötigt, während neuronale Netzwerke 500 Bilder pro Klasse erfordern sowie 500 zulässige Referenzbilder (Gut-Bilder). Ein CNN braucht für eine OCR-Anwendung mit alphanumerischen Zeichen (A-Z und 0-9) 36 x 500 = 18.000 Trainingsbilder.
Das Tool benötigt beispielsweise 5 bis 20 min Zeit zum Antrainieren, während ein CNN Stunden dafür braucht. Zudem brauchen neuronale Netzwerke wesentlich länger, die erforderlichen Klassifizierungsmerkmale in ihren großen Traningssets zu kennzeichnen. Muss ein Trainingsprozess wiederholt werden, um verschiedene Parameter auszuwerten, arbeiten neuronale Netzwerke noch umständlicher. ■
Hier finden Sie mehr über: