Wissenschaftliche Berichte - FZKA 5987

Kurzfassung

Ein Problem bei der autonomen Navigation mobiler Roboter besteht darin, die aktuelle Position eines Roboters innerhalb bekannt strukturierter Umgebung zu bestimmen. Die Positionsbestimmung aufgrund interner Sensoren wie Kreisel oder wegmessender Systeme weist allerdings eine mit der Zeit wachsende Drift auf. Interne Sensoren müssen daher von Zeit zu Zeit mit Hilfe externer Sensoren an die Umgebung angepasst werden. Andere Verfahren zur externen Positionsbestimmung können durch Erkennung dreidimensionaler Objekte anhand ihrer Form sinnvoll ergänzt werden. Da bei der Navigation auch die Positionsbestimmung Echtzeitanforderungen erfüllen muss, sind insbesondere gut parallelisierbare Verfahren von grosser Bedeutung.

Zur Erfassung der Form von Szenen sind vor allem 3D-Laserscanner geeignet. Aufgrund bestimmter Vorteile bei der Bildaufnahme werden hier hochauflösende Abstandsbilder von 3D-Laserradarscannern verwendet.

Unter Verwendung des a-priori Wissens, dass Szenen aus starren und statischen Polyedern bestehen, in deren Polyederecken sich genau drei Ebenen schneiden, wird eine kantenbasierte Szenenbeschreibung des Abstandsbildes generiert. Zu erkennende Objekte werden als charakteristische Ansichten repräsentiert werden, wobei charakteristische Ansichten und Szenenbeschreibung gleiche Struktur besitzen.

Zunächst werden mittels eines speziellen Krümmungsmasses potentielle Kantenpunkte verschiedenen Typs extrahiert. Die Position der Kantenpunkte wird in einer Lokalisierungsphase so verfeinert, dass bestimmte Kantenpunkte trotz eines für das Radarmessverfahren typischen Sensoreffekts extrahiert werden. Aus den Kantenpunkten wird eine Szenenbeschreibung aus 3D-Kanten aufgebaut, die sich vor allem durch geeignet gewählte Attribute fr Polyederecken auszeichnet.

Die Erkennung von Objekten anhand der Szenenbeschreibung besteht darin, Korrespondenzen zwischen 3D-Objekt- und 3D-Szenenkanten zu finden. Zur Lösung des Korrespondenzproblems werden künstliche neuronale Netze und verwandte Ansätze vorgeschlagen und innerhalb eines einheitlichen Rahmens gegenübergestellt. Qualitative Erkennungsresultate werden für künstliche neuronale Netze bestimmten Typs aufgezeigt. Anhand eines Benchmarks wird ein Vergleich mit einem verwandten Verfahren durchgeführt.

Parallelizable recognition of trihedral, rigid and static polyhedrons in single high-resolution range images

Abstract

A key problem in the field of autonomous robot navigation is to determine the current position within a known environment. But the position determined by internal sensors is affected by an over the time increasing inaccuracy. Internal sensors have to be adapted from time to time by external sensors with respect to the environment. Other methods of external position determination can be supported by recognizing three-dimensional objects by shape. Because the position determination has to meet some real-time requirements, well parallizable methods are of great importance.

Especially 3D laser scanners are suitable to grasp the shape of scene surfaces. Because of an advantage over other types of laser scanners, high-resolution range images of 3D time-of-flight laser range scanners are used.

By using a-priori knowledge, that scenes consist of rigid and static polyhedrons, where exactly three planes are intersecting each other in every vertex, edge-based descriptions of range images are generated. The objects to be recognized are represented by characteristic views, whereas characteristic views and the scene description have the same structure.

First, by a special curvature measure potential edge points of different type are extracted. Within a localisation phase the edge point position is so refined, that certain edge points are extracted in spite of a typical property of laser radar range images. From the edge points a scene description consisting of 3D-edges is generated, which distinguishes in suitably chosen attributes for polyhedron vertices.

The recognition of objects in the scene description consists in finding correspondences between 3D-object and 3D-scene edges. To solve the correspondence problem artificial neural networks and related methods are proposed and opposed to each other within an uniform framework. Qualitative recognition results are presented for artificial neural networks of certain type. The neural network is compared with a related method by using a benchmark.