You are here: Home Proceedings
Document Actions

Proceedings

Estimating the Pose of a Euro Pallet with an RGB Camera based on Synthetic Training Data

Posenschätzung einer Europalette mit einer RGB-Kamera basierend auf synthetischen Trainingsdaten

  1. B.Sc. Markus Knitt Institute for Technical Logistics, Hamburg University of Technology
  2. M.Sc. Jakob Schyga Institute for Technical Logistics, Hamburg University of Technology
  3. M.Sc. Asan Adamanov Institute for Technical Logistics, Hamburg University of Technology
  4. Dr. Johannes Hinckeldeyn Institute for Technical Logistics, Hamburg University of Technology
  5. Prof. Dr.-Ing. Jochen Kreutzfeldt Institute for Technical Logistics, Hamburg University of Technology

Abstracts

Estimating the pose of a pallet and other logistics objects is crucial for various use cases, such as automatized material handling or tracking. Innovations in computer vision, computing power, and machine learning open up new opportunities for device-free localization based on cameras and neural networks. Large image datasets with annotated poses are required for training the network. Manual annotation, especially of 6D poses, is an extremely labor-intensive process. Hence, newer approaches often leverage synthetic training data to automatize the process of generating annotated image datasets. In this work, the generation of synthetic training data for 6D pose estimation of pallets is presented. The data is then used to train the Deep Object Pose Estimation (DOPE) algorithm [1]. The experimental validation of the algorithm proves that the 6D pose estimation of a standardized Euro pallet with a Red-Green-Blue (RGB) camera is feasible. The comparison of the results from three varying datasets under different lighting conditions shows the relevance of an appropriate dataset design to achieve an accurate and robust localization. The quantitative evaluation shows an average position error of less than 20 cm for the preferred dataset. The validated training dataset and a photorealistic model of a Euro pallet are publicly provided [2].

Posenschätzung einer Palette und anderer Logistikobjekte ist von entscheidender Bedeutung für verschiedene Anwendungsfälle, wie automatisiertes Handling oder Tracking. Innovationen in der Bilderkennung, Rechenleistung und maschinellem Lernen eröffnen kamerabasierten Ansätzen auf Basis neuronaler Netze neue Möglichkeiten für die gerätelose Lokalisierung. Hierfür werden große Trainingsdatensätze mit annotierten Posen benötigt. Die manuelle Annotation, insbesondere von 6D-Posen, ist ein äußerst arbeitsintensiver Prozess, weshalb neuere Ansätze oftmals auf synthetischen Trainingsdaten basieren. In dieser Arbeit wird die Generierung synthetischer Trainingsdaten für die 6D-Posenschätzung von Paletten vorgestellt. Anschließend werden die Daten verwendet, um den Deep Object Pose Estimation (DOPE)-Algorithmus [1] zu trainieren. Die ex¬perimentelle Validierung des Algorithmus belegt, dass die 6D-Posenschätzung einer Europalette mit einer Rot-Grün-Blau (RGB) Kamera möglich ist. Der Vergleich der Ergebnisse von drei variierenden Datensätzen unter verschiedenen Lichtverhältnissen zeigt die Relevanz eines geeigneten Datensatzdesigns, um eine genaue und robuste Lokalisierung zu erreichen. Die quantitative Auswertung zeigt für den bevorzugten Datensatz einen durchschnittlichen Positionsfehler von weniger als 20 cm. Der validierte Trainingsdatensatz und ein fotorealistisches Modell einer Europalette sind öffentlich zur Verfügung gestellt [2].

Keywords

Fulltext

License

Any party may pass on this Work by electronic means and make it available for download under the terms and conditions of the free Digital Peer Publishing License. The text of the license may be accessed and retrieved at http://www.dipp.nrw.de/lizenzen/dppl/fdppl/f-DPPL_v1_de_11-2004.html.

Number of citations

Visit Google Scholar to find out, how often this paper is cited.