Objekterkennung in Echtzeit ist ein anderes Spiel als Batch-Klassifizierung. Hier zählt jede Millisekunde.
Du lernst die Architektur-Landschaft kennen – von YOLO über SSD bis zu neueren Modellen wie EfficientDet. Wichtiger noch: Du verstehst die Trade-offs. Warum ist YOLOv5 schneller als Faster R-CNN, aber manchmal weniger genau? Wann lohnt sich der Wechsel zu YOLOv8?
Der Kurs ist projektbasiert. Du entwickelst ein System, das in einem Videostream Objekte erkennt – mindestens 30 Frames pro Sekunde, auch auf begrenzter Hardware. Das bedeutet:
Ein wichtiger Teil behandelt praktische Probleme. Was machst du, wenn dein Modell kleine Objekte übersieht? Wie gehst du mit Occlusion um? Wie reduzierst du False Positives in komplexen Szenen?
Du arbeitest auch mit verschiedenen Frameworks – TensorFlow, PyTorch, ONNX Runtime – und lernst, wie man Modelle für verschiedene Plattformen konvertiert. Am Ende kannst du ein Modell nehmen und es so optimieren, dass es auf einem Raspberry Pi läuft, ohne dass die Genauigkeit zusammenbricht.
Der Kurs setzt voraus, dass du bereits grundlegende Kenntnisse in Computer Vision und Deep Learning hast.