Projekt 45: Simulink Bildverarbeitung

Autoren: Asaad Al-Suleihi, Tim Salinski
Betreuer: Prof. Schneider
→ zurück zum Hauptartikel: Angewandte Elektrotechnik (WS 15/16)

Aufgabe

Simulink Bildverarbeitung mit einem Raspberry Pi 2

Erwartungen an die Projektlösung

Lesen Sie den Mathworks Artikel
Planen Sie den Aufbau
Beschaffen Sie die Bauteile
Realisierung des Aufbaus
Zählen Sie in Echtzeit, die Personen, die an der Kamera verübergehen
Machen ein spektakuläres Video, welches die Funktion visualisiert
Test und wiss. Dokumentation
Live Vorführung während der Abschlusspräsentation

Schwierigkeitsgrad

Anspruchsvoll (***)

Einleitung

Diese Aufgabe wurde im Rahmen der Lehrveranstaltung "Angewandte Elektrotechnik" im Masterstudiengang "Business & Systems Engineering" vergeben und bearbeitet. Dieser Wiki-Artikel stellt das Vorgehen dar und zeigt den Lösungsweg auf. Dabei wird darauf eingegangen welche Hard- und Software benötigt wird, wie der Algorithmus zur Bildverarbeitung funktioniert und welche Möglichkeiten zur Verbesserung oder Weiterentwicklung bestehen.

Aufgabenstellung

Die Aufgabe bestand im Wesentlichen darin mit Hilfe von Simulink einen Algorithmus zur Bildverarbeitung zu entwickeln mit dem es möglich ist Personen im Bild zu finden und zu zählen. Dieses Programm sollte dabei auf einer Zielhardware,in diesem Fall ein Raspberry Pi 2, ausgeführt werden können. Die zu verarbeitenden Videodaten stammen von einer Kamera, die per USB-Verbindung an den Pi angeschlossen wird. Auf diese Weise können Live-Bilder in Echtzeit verarbeitet werden. Der mit dem Pi verbundene PC dient lediglich zur Darstellung der Ergebnisse.

Als Vorlage^[1] für diese Aufgabe wurde ein Projekt von MathWorks verwendet. Wie in Abbildung 2 zu erkennen ist, war dabei das Ziel Fahrzeuge auf einer Straße zu erkennen und so Aussagen über das Verkehrsaufkommen machen zu können.

Abb.2: Ergebnis des Vorlageprojektes - Gefundene PKW werden im Bild markiert (Quelle: http://makerzone.mathworks.com/blog/counting-cars-and-analyzing-traffic-raspberry-pi-thingspeak/)

Bei der Entwicklung der Software für dieses Projekt wurde sich zu Nutze gemacht, dass die Fahrzeuge auf der beobachteten Straße sich mit der vorgeschriebenen Geschwindigkeit bewegen. Unter dieser Vorraussetzung konnte ein Zeitintervall bestimmt werden, das ein Fahrzeug benötigt, um vollständig durch das Bild zu fahren. Bei langsamen PKW bestand die Möglichkeit diese doppelt zu zählen, weil die Fahrzeuge nicht getrackt wurden und in einem fixen Intervall von 15 Sekunden Daten ausgewertet wurden. Außerdem konnten Autos, die z.B. durch Stau zum Stillstand gekommen sind, Teil des Hintergrundes werden, wodurch beim Wiederlosfahren diese Fahrzeuge als neue Objekte behandelt wurden.

Ziel des Personen-Zählers ist es, dass Personen, die in mehr als nur einem Bild zu sehen sind, nicht mehrfach gezählt werden. Der Algorithmus funktioniert also unabgängig von Geschwindigkeit mit der sich jemand durch das Bild bewegt. Darüber hinaus soll es möglich sein im Bild stehenzubleiben ohne, dass es dadurch zu Fehlern am Zählerstand kommt.

Benötigtes Material

Neben ein Entwicklungsrechner mit MATLAB/Simulink wird folgendes benötigt:

Raspberry Pi 2
MicroUSB-Netzteil 5V und mindestens 1A
MicroSD-Speicherkarte mit mindestens 4GB Speicherplatz
CAT-5 Netzwerkleitung zur direkten Kommunikation mit dem Raspberry Pi. Alternativ kann das Raspberry Pi an einem Netzwerk angebunden werden, an dem der Entwicklungsrechner auch hängt.
Webcam mit V4L2-Unterstützung, z.B. Logitec C310
Optional ist ein HDMI-Kabel, falls man das Programm auf dem Raspberry Pi als Stand-Alone ohne Rückkopplung an dem Entwicklungsrechner betreibt bzw. die Video-Ausgabe direkt aus dem Raspberry Pi abzweigt.

Systemaufbau

Das System besteht aus 3 Hauptkomponenten. In dem Entwicklungsrechner wird mithilfe von MATLAB/Simulink die Bildverarbeitung entwickelt und zu einem lauffähigen Programm (Binäre Daten) kompiliert. Die Programme können zum Raspberry Pi übertragen werden, wo sie als eigenständige Programme laufen. Für die Bildverarbeitung werden die benötigten RGB-Bilder aus einem USB-Kamera gelesen. Diese ist an dem Raspberry Pi angeschlossen und kann durch das entsprechende Simulink-Block adressiert werden.

Raspberry Pi 2 einrichten und Verbindung aufbauen

Support Package für Raspberry 2 installieren und konfigurieren

Damit Simulinkmodelle für den Raspberry Pi kompiliert und auf der Hardware aufspielt werden können wird eine zusätzliche Toolkette - ein Hardware Support Package - benötigt. Um den Support Package für den Raspberry Pi zu installieren wählt man in MATLAB auf der Home-Oberfläche die Option Get Hardware Support Package. Im folgenden Fenster wählt man die Installationsquelle Internet. Aus der Übersicht aller verfügbaren Paketen wird das Paket:

Raspberry Pi

ausgewählt. Nach der Installation kann die Einrichtung des Raspberry Pi vorgenommen werden.

Einfügen von Hardware Support Packages unter MATLAB
Auswahl des Hardware Support Package für Raspberry Pi

Einrichtung des Raspberry Pi

Nach der Installation des Support Package für Raspberry Pi lädt Simulink ein fertig eingerichtetes Linux-System auf der SD-Karte des Raspberry Pi. Dazu stellt Simulink eine Reihe von Konfigurationsdialogen bereit.

Zunächst wählt man das entsprechende Raspberry Pi Modell. In diesem Fall ist es das Raspberry Pi 2 Model B. Im nächsten Schritt wählt man die Verbindungsart zwischen dem Entwicklungsrechner und dem Raspberry Pi. Es stehen 3 Verbindungsarten zu Auswahl:

Local Area or Home Network: Hier sucht der Entwicklungsrechner den Raspberry Pi in einem lokalen Netzwerk. Diese Verbindungsart empfiehlt sich nicht an der Hochschule. Da der Raspberry Pi zuvor durch den Sachgebiet IT-Infrastruktur an dem Netzwerk eingebunden werden muss. Ohne diesen Schritt besteht die Gefahr, dass Netzwerkports im Labor durch die Sicherheitsrichtlinien stillgelegt werden.
Direct Connection to Host Computer: In dieser Art wird der Entwicklungsrechner direkt mit dem Raspberry Pi über ein CAT-Kabel verbunden. Für das Projekt wurde diese Verbindungsart ausgewählt.
Manually enter Network Settings: Hier kann der Nutzer die Netzwerkeinstellungen selbst vornehmen. Empfohlen für Nutzer mit Netzwerkkenntnissen.

Nachdem man die Einstellungen vorgenommen hat, kann das Betriebssystem eingerichtet werden. Dazu muss die Mikro-SD-Karte des Pis an dem Rechner angeschlossen werden, z.B. mit einem Adapter oder Lesegerät. Simulink formatiert die Karte in das Linux-Dateisystem und schreibt das Betriebssystem auf der Karte.

Am Ende der Schreiboperation muss der Raspberry Pi an dem Rechner angeschlossen und eingeschaltet werden. Zum Schluss wird die Konfiguration angezeigt und die Verbindung zum Raspberry Pi kann getestet werden.

Auswahl des richtigen Raspberry Pi Modells
Einstellung der Verbindungsart zwischen Entwicklungsrechner und Raspberry Pi
Aufspielen des Betriebssystems auf der SD-Karte
Anschliessen und Einschalten des Raspberry Pi
Abschluss der Installation und Verbindungsdaten

Übertragung von Programmen von Simulink zu Raspberry Pi

Eigenständigen Ausführen des Modells auf dem Raspberry Pi

Ausführen des Modells auf dem Raspberry Pi mit Rückkopplung zu Simulink

Es stehen zwei Möglichkeiten der Programmausführung auf dem Raspberry Pi zur Verfügung.

Ausführung auf dem Raspberry Pi als eigenständiges Programm ohne Rückkopplung zu Simulink. Dazu klickt man in Simulink auf dem Knopf Build Model. Das Programm wird kompiliert und auf dem Raspberry Pi ausgeführt. Eine Möglichkeit zur Betrachtung der Programmausführung von Simulink aus besteht in diesem Fall nicht.

Ausführung auf dem Raspberry Pi mit Rückkopplung zu Simulink. Dazu wählt man das Simulationsmodus External und dann auf Run. Das Programm wird auf dem Raspberry Pi übertragen und ausgeführt. In diesem Modus können Daten zu Simulink zurück überführt werden. So ist es z.B. möglich, Display-Blöcke zu nutzen und die Werte auf dem Entwicklungsrechner zu beobachten oder auch die Video-Ausgaben vom Modell auf dem Entwicklungsrechner zu sehen.

Bildverarbeitung

Die Bildverarbeitung erfolgt mit Simulink in mehreren Phasen. Bevor das Modell gestartet wird, muss der Modus festgelegt werden, der ausgeführt werden soll. Das geschieht mit Hilfe der Funktion "StarteBildverarbeitung.m". Es lässt sich dabei zwischen der Online-Version, die die Live-Kamerabilder verwendet, und der Offline Variante, die ein aufgenommenes Video nutzt, wählen. Außerdem wird in dieser Funktion das Hintergrundbild bestimmt, das später dazu dient Personen zu entdecken, die sich von diesem abheben. Alle weiteren Schritte sind im Programmablaufplan aufgelistet, der in Abbildung 3 zu sehen ist. Im Folgenden wird jede der aufgeführten Phasen kurz erläutert.

Vorverarbeitung

Die Vorverarbeitung befasst sich im Wesentlichen damit, die Bilddaten in das richtige Format zu konvertieren. Von der Kamera werden Bilder im RGB-Format mit einer Auflösung von 320x240 Pixeln empfangen. Eine geringe Auflösung steigert hierbei die Anzahl der Frames, die pro Zeiteinheit verarbeitet werden können und wirkt sich somit positiv auf die Echtzeitfähigkeit aus. Um noch mehr Rechenzeit zu sparen, werden im ersten Schritt die drei Farbkanäle zu einem im Graubild-Format zusammengefasst. Dieser dient jedoch nur als Zwischenschritt, um daraus ein Schwarz-Weiß-Bild zu erzeugen. Das Hintergrundbild, das mit Hilfe der oben genannten Funktion erzeugt wurde, liegt ebenfalls in diesem Format vor. Daher kann im nächsten Schritt ein Vergleich des aktuellen Bildes mit dem Hintergrund stattfinden. Dies geschieht über eine einfache XOR-Verknüpfung jedes Pixels mit dem entsprechenden Bildelement aus dem Hintergrundbild. Bereiche, ohne Personen sind in beiden Bildern gleich, sodass diese Regionen schwarz im Ergebnis werden. Nur dort wo Personen den Hintergrund überdecken, sind diese als weiße Umrisse sichtbar. Abbildung 4 zeigt ein Zwischenergebnis, nachdem die Vorverarbeitung abgeschlossen wurde.

Rauschunterdrückung

Wie sich in der obigen Abbildung schon direkt erkennen lässt, ist nicht nur die Person als weiße Fläche zu sehen, sondern auch einige Elemente des Hintergrunds. Damit diese nicht während der nachfolgenden Schritte als Personen erkannt und fälschlicherweise gezählt werden, ist eine Rauschunterdrückung notwendig. Natürlich ließe sich dieser Effekt auch vermindern, indem die Kamera noch besser fixiert wird, jedoch stellen einige Maßnahmen in Software eine wesentlich robustere Lösung da. Im ersten Schritt der Rauschunterdrückung findet ein Erodieren statt. Dabei verringert sich die Größe aller Elemnte im Bild. Strukturen, die dabei eine Mindestgröße unterschreiten, werden durch Verwenden eines Median-Filters entfernt. Anschließend wird durch eine Dilatation die ursprüngliche Größe der einzelnen Elemente wiederhergestellt. Dies gilt jedoch nur, falls das betroffene Bildelement durch die vorrangegangenen Schritte nicht gänzlich verschwunden ist. Kleinere Strukturen, wie die schmalen Linien, die in Abbildung 4 zu sehen sind, können auf diese Weise aus dem Bild entfernt werden. Wie in Abbildung 5 zu sehen ist, sind Personen hingegen groß genug, um nicht durch die Rauschunterdrückung entfernt zu werden.

Blob-Analyse und Auswertung

Nachdem die Rauschunterdrückung alle ungewollten Strukturen beseitigt hat, enthält das Bild nur noch dort geschlossene weiße Elemente, wo sich Personen befinden. Um diese zählen und auch zuordnen zu können, ist es notwendig zu jedem dieser Elemente die Abmaße und den Mittelpunkt zu kennen. Diese Information können in Simulink leicht mit Hilfe einer Blob Analyse gewonnen werden. Unter der Voraussetzung, dass sich die Personen aufrecht durch das Bild bewegen, kann eine Zuordnung der gefunden Blobs zu den Personen stattfinden. Die Zentren jener Blobs, die zu einer Person gehören, haben die Eigenschaft, dass ihre x-Koordinate mit einer gewissen Toleranz gleich ist. Sollte ein Blob außerhalb dieser Toleranz liegen, so wird er zu einer neuen Person gezählt. Auf diese Weise kann die Anzahl der Personen in im aktuellen Bild bestimmt werden. Liegt die so ermittelte Anzahl einige Frames lang über der zuvor bestimmten Anzahl, ist mit großer Sicherheit eine neue Person ins Bild getreten und der Zähler wird inkrementiert. Die Abmaße der einzelnen Blobs, die durch die Blob Analyse ermittelt wurden, werden dazu eingesetzt, die Blobs in das Originalbild einzuzeichnen. In Abbildung 6 ist das Endergebnis der Bildverarbeitung dargestellt. Hierbei ist ebenfalls zu erkennen, dass eine Person durchaus durch mehrere Blobs repräsentiert werden kann.

Fazit

Betrachtet man das Endergebnis dieses Projektes und vergleicht es mit der Vorlage von MathWorks, lässt sich von einem erfolgreichen Projekt sprechen. Zwar lässt sich der Zähl-Algorithmus noch weiter verbessern, um in bestimmten Fällen Fehler zu vermeiden, aber die Funktionalität ist grundsätzlich gegeben. Gegenüber der Vorlage besteht bei dieser Arbeit sogar der Vorteil, dass nicht nur in einem bestimmten Intervall von mehreren Sekunden Länge gezählt wird, sondern jeder Frame genutzt wird.

Ausblick

Um den Zähl-Algorithmus weiter zu verbessern, wären folgende Maßnahmen denkbar:

Implementieren eines Kalman-Filters für jede Person im Bild
Entwicklung einer Logik, die es ermöglicht zeitweise verdeckte Personen nicht mehrfach zu zählen
Entwicklung einer Logik, die ein Verlassen des Bild nur an den Randbereichen zulässt
Aufteilung der Zählung in Personen die von links nach rechts und ungekehrt durch das Bild gelaufen sind

Gerade mit der Umsetzung des letzten Punktes ergäben sich vielfältige Einsatzmöglichkeiten für dieses Projekt. Es wäre beispielsweise möglich, zu zählen wie viele Studenten die Mensa zu einer bestimmten Zeit betreten und verlassen haben. Solche Daten könnten anschließend für die Planung eingesetzt werden, um lange Warteschlangen zu verhindern.

Youtube-Video

Zu diesem Projekt wurde ein Ergebnisvideo angefertigt. Dieses lässt sich unter dem folgenden Link abrufen [2].

Quellen

↑ [1]Vorlage MathWorks. Website von MathWorks. Abgerufen am 02. Januar 2016.

→ zurück zum Hauptartikel: Angewandte Elektrotechnik (WS 15/16)

[1] [1]Vorlage MathWorks. Website von MathWorks. Abgerufen am 02. Januar 2016.

[1]