Objekte in Echtzeit erkennen
YOLO ist ein System, das die Objekte in Echtzeit erkennt. Über das Open Source-Framework Darknet kann es genutzt werden. Zumindest ist dies die offizielle Implementierung. Beides ist auf GitHub für die Anwender verfügbar.
Nicht nur die Großen der Branche wie Google oder Facebook entwickeln sie, neuronale Netzwerke zur Objekterkennung auf Bildern oder in Filmen. Besonders an einem System kommen die Anwender seit 2018 nicht mehr vorbei. Seine Abkürzung ist zwar der Jugendsprache entnommen, aber sein Ansatz ist schneller als alle anderen.
Bei dieser Deep Learning-Methode müssen vorab keine bestimmten Merkmale, die erkannt werden sollen, definiert werden. Für YOLO wurde das künstliche, neuronale Netz mit Datensätzen aus der COCO-Datenbank von Microsoft “trainiert”. In dieser Form ist es als Datei verfügbar.
Funktionweise von YOLO: “You Only Look Once”
Hier bedeutet YOLO “You Only Look Once”. Und darin unterscheidet sich diese Methode von anderen Methoden bei der Objekterkennung. Während traditionelle Convolutional Neural Networks “CNN” mehrmals ausgeführt werden müssen, wenn sie mehr als ein Objekt erkennen sollen, kann YOLO alle Objekte bei einem einzige Durchlauf erkennen.
Es wendet nämlich sein “trainiertes” neuronales Netzwerk auf das Bild oder den Film an. Dafür wird z.B. die Software OpenCV lokal installiert. Mit ihren Methoden aus dem dnn-Modul können Bilder oder Film-Sequenzen dann in Echtzeit untersucht werden. Auf diese Weise konnten bereits 40-90 fps verarbeitet werden (getestet mit einer Titan X-Grafikkarte).
Vorteile YOLO
- Die größten Vorteile von YOLO sind sicher seine Schnelligkeit bei der Erkennung und die Einfachheit seiner Nutzung.
- Zudem ist YOLO und sein Framework ja auf GitHub für jeden verfügbar.
- Darüber hinaus kann es aber auch mit anderen Frameworks genutzt werden, z.B. OpenCV oder auch TensorFlow, PyTorch etc.
- Die Average Precision lag bei Tests über dem von anderen Methoden.
Nachteile von YOLO
Allerdings gibt es bei der Genauigkeit von YOLO auch ein großes Problem. Das System kann ausgetrickst werden. 2019 haben Forscher aus Belgien gezeigt, dass YOLO jene Menschen, die ein buntes Schild vor den Bauch gehängt hatten, nicht erkannte.
Der Entwickler von YOLO verbessert sein System aber weiterhin. Die aktuelle Version ist bereits YOLOv4. Man kann also davon ausgehen, dass es auch in Zukunft weiterhin unterstützt wird.
Anwendungsgebiete von YOLO
YOLO kann wie jedes andere Objekterkennungssystem für eine Vielzahl von Arbeiten im Bereich Computer Vision, also dem computerbasierten Sehen, eingesetzt werden.
In jenem Grenzbereich zwischen Informatik und Ingenieurswissenschaft, wo versucht wird, die von Kameras aufgenommenen Bilder zu verarbeiten und vor allem zu analysieren.
So wird YOLO also unter anderem für Gesichtserkennung eingesetzt bzw. für die Erkennung und Unterscheidung von Menschen und Objekten. Ebenfalls ist der Einsatz als Überwachungstechnik möglich. Diskutiert wird, ob diese Art der Verbrechensbekämpfung nicht aber auch die Freiheitsrechte von Bürgern einschränken würde.
Fazit
Auch im Bereich der Objekterkennungssysteme macht sich also der Trend bemerkbar, dass Open Source-Lösungen leistungsfähiger sind als die von großen Konzernen. YOLO ist akkurater und schneller als seine Konkurrenten. Spannend bleibt zu beobachten, wofür dieses System in der Zukunft eingesetzt wird und welche weiteren Optimierungen in dem Bereich stattfinden.