Objekterkennung mit Deep Learning

Suche von Objekten anhand eines Bildes

Herausforderung

Auf Basis eines Fotos eines Objekts soll dieses in einer Menge an Objekten wiedergefunden werden. Beispielsweise soll ein weißer Stift von Stiften anderer Farbe und Marke unterschieden werden.
Die besondere Herausforderung hierbei ist, dass nur ein Foto des Objektes vorliegt. Mit diesem Bild soll ein Klassifikator trainiert werden, der dieses Objekt zuverlässig wiedererkennt. Dabei kann das Objekt aus verschiedenen Positionen, mit unterschiedlicher Belichtung und verschiedenen Hintergründen aufgenommen werden.

Lösung

Mithilfe von Verfahren aus der Bilderkennung, des Maschinellen Lernens und insbesondere des Deep Learnings entwickeln wir einen One-shot Learning Klassifikator. Dieser ist in der Lage anhand nur eines einzigen Bildes ein Objekt wiederzuerkennen. Wir verwenden dazu Keras und Tensorflow um ein Convolutional Neural Network zu trainieren. Die Umsetzung erfolgt mit Python. Das Hinzufügen von neuen Objekten sowie die Suche nach einem Objekt kann mithilfe einer REST API durchgeführt werden. Die Anwendung wird plattformunabhängig in einem Docker-Container betrieben.

Ergebnis

Das entwickelte Verfahren erlaubt die Suche nach Objekten anhand eines Bildes. Aufgrund des verwendeten One-shot Learner benötigt das Verfahren nur ein einziges Bild pro Objekttyp zum Training. Durch die zugehörige REST-API ist eine einfache Integration in bestehende Systeme möglich. Die Paketierung als Docker-Container ermöglicht ein einfaches Deployment.

Nutzen

Daten

Technologien