YOLO – Objekterkennung leicht gemacht

Das Titelbild des Beitrages zeigt eine Spielzeugfigur in Form einer Giraffe. Um sie herum befindet sich ein Rahmen mit der Information, dass sie von YOLO zu 94% als Giraffe erkannt wird.

Objekterkennung in der Produktion

Das Erkennen von Objekten ist ein großes Thema in der Produktion. Ein Anwendungsfall ist zum Beispiel, dass Kameras eine Qualitätskontrolle auf Förderbändern durchführen und so die Gesamtqualität und den Produktionstakt verbessern. Wir bei ATR Software bringen solche Kameralösungen in die Produktion.


Für die Umsetzung solcher Anwendungen kann man auf verschiedene Weise vorgehen. Neben der Verwendung von klassischen Algorithmen aus der Bildverarbeitung bieten sich vortrainierte Neuronale Netze aus dem Bereich des maschinellen Lernens an. Diese Netze werden zuerst mithilfe zahlreicher Beispielbilder trainiert, sodass bei einer Anwendung vortrainierte Elemente wie zum Beispiel Personen sehr schnell erkannt werden können. Heute im Fokus: Das YOLO Modell.

Was ist das Yolo Modell?

YOLO (You Only Look Once) ist ein weitverbreitetes Modell im Bereich des maschinellen Lernens, das für die Objekterkennung in Bildern und Videos entwickelt wurde. Im Gegensatz zu traditionellen Ansätzen teilt YOLO das Bild in ein Raster auf und prognostiziert gleichzeitig Bounding Boxes (Begrenzungsrahmen) und Klassen für Objekte in jedem Rasterbereich. Dies ermöglicht eine schnelle und effiziente Echtzeit-Objekterkennung.

Die Hauptmerkmale von YOLO sind:

  1. Echtzeit-Verarbeitung: YOLO ist in der Lage, Bilder und Videos in Echtzeit zu analysieren, was es für Anwendungen wie autonomes Fahren, Videoüberwachung und Augmented Reality geeignet macht.
  2. Single-Shot-Erkennung: YOLO benötigt nur einen Vorwärtsdurchlauf des Modells, um Bounding Boxes und Klassen für Objekte vorherzusagen, im Gegensatz zu anderen Ansätzen, die mehrere Schritte erfordern.
  3. Hohe Genauigkeit: YOLO kann eine hohe Genauigkeit bei der Objekterkennung erreichen, insbesondere in Versionen wie YOLOv3 und YOLOv4, die verbesserte Architekturen und Techniken verwenden.
  4. Vielseitigkeit: YOLO kann in verschiedenen Anwendungsgebieten eingesetzt werden, darunter Bilderkennung, Gesichtserkennung, Tiererkennung und mehr.

Insgesamt ist YOLO ein leistungsfähiges Modell für die Objekterkennung, das sich durch seine Geschwindigkeit und Genauigkeit auszeichnet und in vielen praktischen Anwendungen erfolgreich eingesetzt wird.

Selbst ausprobieren?

Das Digitalisierungszentrum Ulm | Alb-Donau | Biberach stellt über die Plattform Gitlab ein Repository zur Verfügung. Wir haben damit mal ein kleines Fotoshooting gemacht. Im blauen Rahmen ist markiert, wo das jeweilige Objekt erkannt wurde. Die Schrift gibt dann in Prozent die Erkennungswahrscheinlichkeit an. Sämtlichen Tieren wurde während den Aufnahmen kein Schaden zugefügt. Außerdem wurden sie ordnungsgemäß ihrem 3-jährigen Besitzer zurück ausgehändigt.

Das Bild zeigt einen kleinen Teddy Bär, der von dem Yolo-Modell zu 83 Prozent als solcher erkannt wurde.