Numerik » Faltung in der Bildverarbeitung

Mini-Leitprogramm

Beispiel

Was es bedeutet, ein Bild mit einer Maske zu falten, soll hier an einem Beispiel gezeigt werden. In diesem Beispiel ist das Bild 5x5 Pixel gross, die Maske umfasst 3x3 Einträge und ist orange dargestellt. Die Pixelwerte (z.B. Grauwerte zwischen 0 und 255) des Bildes werden durch die Buchstaben a bis y symbolisiert.

Betrachten Sie das Bild nach diesem Abschnitt, wo das Beispiel Schritt für Schritt dargestellt ist.

Die Maske wird in Gedanken über das Bild gelegt, und zwar zuerst in der oberen linken Ecke, dem «Anfang» des Bildes. Nun multipliziert man jeden der 9 Maskenwerte mit dem Wert des darunterliegenden Pixels, also:

-1*a, 0*b, 1*c, -2*f, 0*g, 2*h, -1*k, 0*l, 1*m

Diese Produkte werden dann aufsummiert:

-a + c - 2f + 2h - k + m

Die Maske besteht eigentlich aus einem Mittelpunkt und einem Rand der Breite 1. Das Augenmerk richtet sich immer auf diesen Mittelpunkt. Durch die zuvor beschriebene Bildung der Summe wird er neu berechnet.
Dem entsprechenden Pixel im Ausgabebild wird deshalb die berechnete Summe zugewiesen:

g' = -a+c-2f+2h-k+m

Nun verschiebt man die Maske um einen Pixel nach rechts und wiederholt das Bilden der Produkte und deren Summe. So schiebt man die Maske über das gesamte Bild und berechnet jeweils den neuen Wert des Masken-Mittelpunktes.

Kürzer formuliert: Der berechnete Wert ist eine gewichtete Summe der 9 Pixel die unter der Maske liegen. Als Gewichte dienen die 9 Maskenwerte.