Objekterkennung und -verfolgung mit KI
Unter unserer Rubrik KI-Use Cases stellen wir konkrete KI-Anwendungen für den Mittelstand vor. Sie sollen vorwiegend zur Überlegung anregen, ob und wie KI auch Ihr Business fit für die Zukunft machen könnte. Hier geht es heute um Objekterkennung und Objekttracking.
Durch die Identifizierung und Verfolgung von Objekten wird es ermöglicht, komplexe Aufgaben zu automatisieren und vieles einfacher und sicherer zu gestalten.
Ein prominentes Anwendungsbeispiel für Objekterkennung ist autonomes Fahren. Kameras und andere Sensoren in autonomen Fahrzeugen nutzen Objekterkennungstechniken, um Verkehrszeichen, Fußgänger:innen, Fahrradfahrer:innen und andere Fahrzeuge zu erkennen. Dadurch können autonome Fahrzeuge Hindernisse erkennen und entsprechend reagieren, um Unfälle zu vermeiden.
Viele von uns kennen Objekterkennung und -verfolgung aber auch aus der Sportanalyse. In Sportarten wie Fußball oder Tennis können Kameras eingesetzt werden, um die Bewegungen der Spieler:innen und des Balls zu verfolgen und wichtige Statistiken zu generieren. Dies kann unter anderem Trainer:innen helfen, das Spiel ihrer Mannschaften zu analysieren und taktische Entscheidungen zu treffen.
Was bedeuten Computervision, Objekterkennung und -verfolgung?
Bevor wir zu den Anwendungen an sich kommen, hier eine kurze Begriffserklärung.
Computervision
Computervision setzt künstliche Intelligenz ein, um Computer in die Lage zu versetzen, visuellen Input zu verstehen, zu analysieren und darauf basierende automatisierte Maßnahmen zu ergreifen. Durch den Einsatz von maschinellem Lernen kann Computervision Objekte in Bildern und Videos identifizieren und klassifizieren.
Objekterkennung und -verfolgung
Mit Objekterkennung und -verfolgung (object detection, object tracking) werden in Echtzeit die im Bild einer Livekamera erscheinenden Objekte selbst und von woher nach wohin sie sich bewegen erkannt. Durch Sensoren, die zusätzliche Daten parallel erfassen, kann der Prozess präzisiert und sicherer gemacht werden.
Inklusion und Exklusion
Bei Inklusion und Exklusion werden ganz bestimmte Bildausschnitte ausgespart oder nur ein gewisser Bildausschnitt erfasst, z. B. weil bestimmte Bereiche unwichtig sind oder Objekte erkannt und verarbeitet, die nicht erfasst werden sollen – z. B. Personen – oder schlicht, um die Rechenleistung niedrig zu halten.
Dieses Problem lässt sich oft auch mit dem Einstellungswinkel oder der Anordnung der im Bild erfassten Bereiche lösen: Eine Kamera wird so aufgestellt, dass beispielsweise ein Geldautomat, an dem Kund:innen ihre PIN eingeben, sich außerhalb des Bildes befindet.
Einige Anwendungen für den Mittelstand
Automatisierte Qualitätskontrolle in der Fertigungsindustrie
Kameras und Sensoren in der Produktionslinie können Objekte in Echtzeit überwachen und defekte Teile identifizieren. Dabei wird die Exklusion von Bildbereichen außerhalb des Fließbandes ausgespart, um keine Personen zu erfassen.
Früher gab es entlang der gesamten Fertigungsstrecke eine durchgehende Leine, an der alle Mitarbeitenden bei erkannten Fehlern (und natürlich bei Unfällen) ziehen und Band und damit die gesamte Produktion zum Stillstand bringen konnten. Dann wurde geprüft, ob der aufgetretene Fehler eine Einzelerscheinung war oder bei allen einzubauenden Teile vorlag, und ob die fehlerhaften Teile einfach am Ende ausgetauscht werden konnten, damit die Produktion weiterlaufen konnte.
Computervision ermöglicht heute, automatisiert zu entscheiden, eine KI kann Relevanz und Regelmäßigkeit eines Fehlers erkennen, die Produktion stoppen und idealerweise die Lösung des Problems einleiten.
Robotik
Objekttracking findet auch Anwendung in der Robotik. Roboter mit Objekttracking-Fähigkeiten können bestimmte Objekte in einer Umgebung verfolgen und manipulieren. Dies ist besonders nützlich in Industrien, wo Roboter eingesetzt werden, um repetitive Aufgaben wie das Sortieren und Stapeln von Objekten zu übernehmen. Objekttracking ermöglicht es den Robotern, die Objekte genau zu lokalisieren und ihre Bewegung zu verfolgen, um ihre Aufgaben effizienter zu erledigen.
Verkehrsüberwachung und -steuerung
Kameras an Kreuzungen oder von Brücken erkennen und klassifizieren Fahrzeuge und Fußgängerinnen: Lkw, Bus, Pkw, Motorrad, Scooter, Fahrrad oder Person?
Aus Gründen der statistischen Erfassung wird nur eine bestimmte Spur erfasst: Wie viele Fahrzeuge und welche kommen von Norden und biegen ab nach Leipzig? Ausgespart im Blickfeld werden die Spuren geradeaus, weil sie dafür irrelevant sind, und der Fußweg, um personenbezogene Daten gar nicht erst zu erfassen, abgesehen von der Reduktion unnötiger Rechenleistung.
Welche Lkw mit welcher Ladung verlassen und befahren unser Firmengelände?
Eine Kamera erkennt und liest die Ladungsaufschriften der ein- und ausfahrenden Lkw sowie deren Nummernschilder. Der Rechner vergleicht die Daten mit denen aus der Datenbank der digitalen Frachtpapiere, um Versehen oder Straftaten zu entdecken.
Datentransfer und Datenschutz
Wie schnell müssen Daten wohin und über welche Bandbreite übertragen werden? Je mehr bit/s und je geringer die Bandbreite, desto größere Latenzzeiten treten auf.
Werden personenbezogene Daten erfasst, ist es zudem aus Datenschutzgründen problematisch, sie in die Cloud zu verlagern.
Diese Fragen werden technisch gelöst, durch CPU (Central Processing Unit, „Hauptprozessor“) vs. GPU (Graphics Processing Unit, „Grafikprozessor“). Entscheidend ist die Verortung der GPU direkt an oder in der Kamera, sodass gar nicht erst personenbezogene Daten zum Zentralrechner oder in die Cloud übertragen werden oder Latenzzeiten auftreten.
Stattdessen werden Objekterkennung und Tracking am Ort der Datenerfassung vorgenommen. Der Nachteil ist natürlich dennoch die verbliebene Notwendigkeit, die errechneten Ergebnisse am Ende dorthin zu übertragen, wo sie gebraucht werden, erst recht, wenn sie in Echtzeit vorliegen sollen.
Fazit zum Thema Objekterkennung und -verfolgung
Objekterkennung und Objekttracking sind spannende Ki-Technologien, die in einer Vielzahl von Anwendungen bei KMU eingesetzt werden können. Sie ermöglichen es, Informationen über die Welt um uns herum zu gewinnen und auf innovative Weise zu nutzen.
Mit der Weiterentwicklung dieser Technologien können wir mit Sicherheit bald noch mehr Anwendungen entdecken, die wir hier listen bzw. die dabei helfen, effizienter und sicherer zu arbeiten.