Kittydar: Gesichtserkennung für Katzen

Kittydar steht kurz für Kitty Radar. Dafür muss der Nutzer ein Bild in den Analysebereich hineinziehen. Kittydar stellt dann fest, ob und wo sich in dem Bild eine Katze befindet. Allerdings steht die Katzenerkennung noch recht am Anfang.

Allerdings muss auch gesagt werden, dass Kittydar noch mit dem einen oder anderen False Positive zu kämpfen hat. Manchmal übersieht die Lösung auch eine Katze.

Kittydar unterteilt ein Bild in verschiedene Vierecke. Dafür extrahiert das Programm zunächst die Informationen des Histogramms of Orient Gradients. Darin wird beschrieben, in welchen Richtungen die Kanten in einem Bild verlaufen und wo die Übergänge von Hell zu Dunkel sind. Diese Vektor-Daten werden dann in ein neuronales JSON¬-Netz überspielt und hier wird dann in einer Skala von 0 bis 1 festgelegt, mit welcher Wahrscheinlichkeit es sich bei dem Dargestellten um eine Katze handelt.

Das neuronale Netz sei laut harthur dem Schöpfer dieser maßgeblichen Anwendung, mit “Tausenden” von Katzenaufnahmen gefüttert worden. Aber auch Aufnahmen, die keine Katzen zeigen wurden für das Training herangezogen.

Am besten könne Kittydar Katzen identifizieren, die aufrecht sitzen und in die Kamera blicken. Nach wie vor sehe harthur, der seine Schöpfung auf github veröffentlicht, “viel Raum für Verbesserungen” und er ruft die Entwicklergemeinde dazu auf, sein Werk zu verfeinern.

harthur empfiehlt dazu auch ein wissenschaftliches Paper von Weiwei Zhang, Jian Sun und Xiaoou Tang, die darin am Beispiel eines Katzenbildes darlegen, wie sich Formen in einem Bild am besten erkennen lassen.